文档库 最新最全的文档下载
当前位置:文档库 › 聚类分析及相关分析在卓越班学生管理中的应用

聚类分析及相关分析在卓越班学生管理中的应用

·

问题研究

摘 要:高等教育是社会可持续发展的强大动力,随着高校的扩招,高校的教学管理面临着新的机遇与挑战。本文首先简要介绍了统计学中常用的聚类分析与相关分析的原理,接着将聚类分析与相关分析应用于首批卓越班学生的管理工作中,实践经验表明了其科学高效性。

关键词:聚类分析 相关分析 卓越班 相关系数

基金项目:国家统计局一般项目,大数据情景下的政府跨部门联合决策研究——以安庆市为例(2013595);安徽省高等学校省级自然科学研究项目,基于Clifford支持向量机的循环经济发展预警模型的研究(KJ2013Z188)

DOI:10.3969/j.issn.1674-537X.2014.11.012

引言

为贯彻落实建设创新型国家、人力资源强国等国家发展战略,教育部于2010年6月启动了卓越工程师教育培养计划。我校计算机专业于2011年成功获批该项目,成为省首批卓越工程师教育培养计划学校。2012年9月计算机卓越班如期开班,为科学高效的做好卓越人才的培养工作,计算机与信息学院的全体师生倾注了极大的热情与辛勤的汗水,并引入聚类分析及相关分析等统计分析工具辅助强化学生学习管理,这是我院为培养高端卓越型人才所做出的积极探索。笔者通过对这二年的工作进行总结,得出以下结论:借助统计学中常用的聚类分析与相关分析进行教学管理达到了事半功倍之效。

一、聚类分析

(一)聚类分析简介

聚类分析(Cluster Analysis)是依据“物以类聚”的原理,对指标数据进行分类的一种多元统计分析方法,它们讨论的对象是大量的数据样品,要求能合理地按各自的特性,在没有先验知识的情况下来进行合理的分类。根据分类对象不同聚类分析分为Q型与R型,Q型是对样本进行分类处理,R 型是对变量进行分类处理。常用的聚类分析方法有系统聚类法、动态聚类法、模糊聚类法及图论聚类法等。其中系统聚类法以其简单高效在实际应用中使用最多。

(二)系统聚类法

系统聚类法的基本思想如下:令n个样品自成一类,计算出相似性测度,此时类间距离与样品间距离是等价的,把测度最小的两个类合并;然后按照某种聚类方法计算类间的距离,再按最小距离准则并类;这样每次减少一类,持续下去直到所有样品都归为一类为止。聚类过程可做成聚类谱系图(Hierarchical diagram)。

系统聚类法实现步骤:

Step 1.构造n个类,每个类包含且只包含一个样品。

Step 2.计算n个样品两两间的距离,构成距离矩阵,记作D0。

Step 3.合并距离最近的两类为一新类。

Step 4.计算新类与当前各类的距离。若类的个数等于1,转到步骤(5),否则回到步骤(3)。

Step 5.画聚类图。

Step 6.决定类的个数,及各类包含的样品数,并对类作出解释。

(三)系统聚类法在卓越班学生选拔中的应用

2012年我院首批计算机专业卓越班拟招生人数为55人,该专业实际录取180人,对学生的入学成绩进行聚类操作,学生入学成绩中含数学、语文、英语及理综共计4门课程,考虑到计算机专业特点及学生今后发展前景,对高考数据库中去除语文及英语,只保留数学及理综,并算出这2者的总分用以聚类。在Matlab7.1实验平台下实现该操作。 命令代码如下:

[x,textdata]=xlsread(‘chengji.xls’);%读入学生入学成绩数据

x=zscore(x);%数据标准化处理

obslabel=textdata(4:end,1);%提取学生姓名,准备聚类

Taverage=clusterdata(x,’linkage’,’average’,’maxclu st’,3);%采用欧式距离,利用类平均法将学生聚为3类,在实际使用中可以根据第一类结果数加以适当调整,Taverage 为类编号

Obslabel(Taverage==1);%观察第一类所包含的学生

通过聚类得到第一类学生数为45人,为验证该结论,我们对新入学的学生进行一次突击小测试,内容为数学及物理,按结果选出45人,对照聚类的结果仅有4人的差异,这表明了聚类分析的科学与高效,也为以后的卓越班招生指明了新路。

二、相关分析

(一)相关分析简介

变量间相互依存的关系常表现为不确定的统计关系,称为相关关系。相关分析是研究变量间不确定性统计关系的重要方法,主要是判断两个或两个以上变量间是否存在相关关系,并分析相关关系的形态与程度。较常用的是简单线性相关系数与Spearman等级相关系数。

简单相关系数度量的工具主要是皮尔逊的相关系数ρ,)

var(

)

var(

)

,

cov(

Y

X

Y

X

?

=

ρ(1)

聚类分析及相关分析在卓越班学生管理中的应用

冯学军 徐 波

式(1)中)

var(X与)

var(Y分别是变量X与Y的方差,

),

cov(Y

X是变量X与Y的协方差。简单相关系数因方便理解、

容易计算等一系列的优点,在数理统计应用中起着一个举足

轻重的作用。相关系数以数值的方式很精确地的反应了两个

变量间线性相关的强弱程度。利用相关系数可以进行变量间

线性关系的分析,具体步骤如下:

数,用式(2)计算。

Step 2.

计推断。

(1)提出原假设,即两总体无显著的线性关系;

(2)选择检验统计量;

(3)计算检验统计量的观测值。

Step 3.根据计算结果进行统计推断。

(二)相关分析在学生学习管理中的应用

教学质量是高等教育的生命线,对大学生而言,学习是

其主要任务,学习成绩的高低是衡量学习质量的重要指标。

在当前高等教育已从精英教育发展到普及教育的背景下,如

何高效地管理学生的学习情况尤为重要。为促进卓越人才的

培养,在卓越班的教学过程中,我院精选一批业务能力强、

教学经验丰富且教学工作认真负责的教师承担该班级的教

学,并采用小班教学的方式以便随时掌握学生的学习状况,

在管理中采用相关分析法了解学生的入学成绩与进入大学后

学习成绩之间的关系,以及大学期间同一门课程在不同学期

间的相关关系,以此为依据做好学生的工作。

(三)入学成绩与进入大学后成绩之间的关系

我校自1978年开始招收普通本科学生,现在在校生规

模接近三万,我校这类老牌二本院校是我国实现高等教育

大众化的主要力量,因此研究结果具有普遍意义。计算机

专业的录取线为安徽省本科二批分数线以上25分,入学成

绩是衡量生源质量的重要依据,高校扩招后,部分学生学

习态度不端正,学习兴趣不浓从而导致学业成绩不理想,

进而影响以后的升学和就业。因此,研究学生的入学成绩

与大学的学业成绩是否有显著性关系,以及大学各学期成

绩间是否有相关关系,对做好学生的管理具有十分重要的

指导意义。

数据采用高考数学成绩与大学第一学期高等数学成绩,

其中高考数学成绩来源于安徽省高校统考成绩表。在SPASS

中完成实验。也在EXCEL中计算出相关系数,做法如下:

将高考数学成绩与高数成绩输入到EXCEL表中的x与y列,

在“工具”中选“数据分析”,再选“相关系数”,“确定”

后在“输入区域”选中x与y列的高考数学成绩与高数成绩,

在“分组方式”选择“逐列”,在“输出区域”输入相关系

数输出位置,“确定”后即可得到高考数学成绩与高数成绩

的相关系数。本例中是0.462491,见图1。说明两者之间存

在正的弱相关性。

α,查t分布表得到2/α,若≥t2/αt,说明高考数学成绩与

高数成绩线性相关性显著,否则认定高考数学成绩与高数成

绩线性相关性不显著。在本例中可以直接用EXCEL计算t统

计量, 取显著性水平α=0.05,统计量t=0.462491*SQRT(43)/

SQRT(1-POWER(0.462491,2))=3.4205665,查表得临界值为

1.6811,即高考数学成绩与高数成绩线性相关性显著。

按照上述方法同理可得学生高考英语成绩与大学英语成

绩间的相关性,以及大学期间不同学期间相近课程的相关性。

较有趣的是分析结果表明学生高考英语成绩与大学英语成绩

间的相关性不显著;有的相近课程显著性强,而有的相近课

程相关性不显著,如高等数学与线性代数的线性相关性不显

著;高等数学与概率论的线性相关性不显著;程序设计课程

在各学期成绩的线性相关性显著。

三、结论

我们将统计学工具聚类分析与相关分析应用于学生的管

理中达到了事半功倍之效,在实际操作中只需有MATLAB及

EXCEL软件即可完成,经分析我们有以下结论:

1、聚类分析可以用于对学生的分班管理。

2、数学作为一门逻辑性强、各环节密切相关的基础学

科,学生的前期学习基础对以后的学习影响较大。而英语

作为一门语言,学生的学习态度比学习基础更显得重要。

3、高等数学与线性代数以及高等数学与概率论作为不

同的课程体系,彼此之间的线性相关性不显著,学生的学习

兴趣及考试的难易程度直接关系到学生考试成绩。而程序设

计虽然在不同学期开设不同课程,如C++、JAVA等,但

因算法语言相同,故各学期间线性相关性显著。

4、相关分析可以方便高效的得出学生成绩间的相关性,

有利于因材施教。

参考文献:

[1]谢中华.MATLAB统计分析与应用40个案例分析[M].

北京航空航天大学出版社,2011.4.

[2]袁卫等.统计学(第三版)[M],高等教育出版社,2012.2.

[3]于波等.大学高考数学成绩与高数成绩的弱相关性分

析[J].滁州学院学报,2011(10).

(作者单位:安庆师范学院计算机与信息学院 安庆技师学院)

相关文档
相关文档 最新文档