Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 教育论文 > 正文

因子分析法在学生成绩分析中的应用论文

发布时间:2019-11-29 11:22:58 文章来源:SCI论文网 我要评论














SCI论文(www.scipaper.net):

摘要:对38名学生考试成绩用R语言进行因子分析,发现可以将物理、化学、历史和政治四门课的成绩分为理科因子和文科因子。通过计算因子得分可以算出每名学生在理科、文科因子上的得分以及综合得分,然后根据得分进行排序,找出了在文科因子、理科因子和综合评价上得分较高与较低的同学,并提出相应建议。

关键词:R语言;因子分析;测评

本文引用格式:沈光辉.因子分析法在学生成绩分析中的应用[J].教育现代化,2019,6(09):189-192.

       目前中小学教师在对学生成绩进行分析时,只关注单科成绩或者总成绩,很少去通过学科之间的联系去挖掘学生在某一类学科上存在的问题,同类学科往往在学习思维上存在共同点,而因子分析法可以根据学生成绩将有着同样特性的学科归为一类。因子分析已成为教育实证研究中重要的分析方法,教育研究者常用SPSS软件来做因子分析[1],由于SPSS软件是窗口软件,每换一批数据都需要重复所有的工作,而R语言是统计分析最常用的软件之一,当更换一批数据时只需要更改代码参数即可,会为教育研究者节约大量的时间,为此,本文采用R语言来对学生成绩进行R型因子分析。

\

 
一 因子分析理论

        因子分析是利用降维思想,从研究原始变量相关矩阵出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量的统计分析方法。研究变量之间的相关关系,称之为R型因子分析;研究样品之间的相关关系,称之为Q型因子分析。[2]


\

 

        其中X1,X2,···XP为实测变量,aij为因子载荷,Fi(i=1,2,···,m)为不可测变量即公共因子,εi(i=1,2,···,p)为特殊因子。因子分析步骤[5,6]如下。

(一)检验原始变量是否适合作因子分析

         常用的检验原始变量是否适合作因子分析的方式有四种:变量间相关系数矩阵、巴特利特球体检验、反映像相关系数检验、KMO检验。对于变量间相关系数矩阵,如果大部分相关系数都大于0.3时,认为变量间存在较强的相关性,适合作因子分析;对于巴特利特球体检验,当P值小于给定显著性水平时,拒绝原假设,认为原始变量之间存在相关性,数据就适合作因子分析,若未通过检验,数据就不适合作因子分析;对于反映像相关系数检验,如果反映像相关系数矩阵中主对角线外的元素大多绝对值较小,对角线上的元素绝对值越接近1,表明这些变量相关性越强,越适合作因子分析;对于KMO检验,当KMO值大于0.9时非常适合作因子分析,KMO值介于0.8~0.9之间时适合,KMO值介于0.7~0.8时一般,KMO值介于0.5~0.7时不太适合,KMO值小于0.5时不适合。

(二)判断提取的公共因子数

         公因子提取方法主要有:最大似然法、主成分分析法、主轴因子法、加权最小二乘法、广义最小二乘法、α因子提取法等等,常用最大似然法和主轴因子法。常用特征根大小、因子的累计方差贡献率、碎石检验和平行分析这四种方法确定公因子个数。根据特征根的大小确定公因子个数存在两种情况:用主成分分析法(PCA)提取公因子个数时,选择特征根大于1的主成分;用主轴因子法(EFA)提取公因子个数时,选择特征根大于0的主成分。此外,
因子的累计方差贡献率通常需要达到70%以上,碎石图趋于平稳所对应的公因子数即确定的公因子个数。平行分析通过模拟的方式,依据与初始矩阵相同大小的随机数矩阵来判断要提取的特征值,若基于真实数据的某个特征值大于一组随机数据矩阵相应的平均特征值,那么该主成分可以保留。

(三)使公因子具备可解释性

        为了便于公因子的重新命名,通常需要对因子进行正交旋转或斜交旋转。正交旋转和斜交旋转的方法有很多,而常用的正交旋转法为方差最大法,常用的斜交旋转法为斜交旋转法。如果斜交旋转公共因子之间相关系数较大则可以采用斜交旋转,较小时选择正交。

(四)计算因子得分并进行结果阐释

      计算出每个样本在不同因子上的具体得分,对得分进行分析。

二 实例分析

(一)数据来源


        样本数据来自某校内地西藏高中班(后文再次出现简称“A班”)高一学生的一次测试成绩,共有38名学生,本次测试只考了物理、化学、历史和政治四门课,令物理、化学、历史和政治四个变量分别为X1、X2、X3和X4。

(二)分析结果

(1)A班学生四科成绩适合作因子分析。



\


         四个变量的相关系数矩阵见表1,可以看到变量间的相关系数都不小于0.3,并且大多大于0.5,初步认为变量间存在一定的相关性。此外,进行了巴特利特球形检验、KMO检验和反映像相关系数检验。巴特利特球形检验的p值小于0.01,统计量chisq=72.0033,从在统计学意义上来说,学生四门课成绩之间存在相关性;KMO值为0.72,介于0.7~0.8之间,认为可以进行因子分析;反映像相关系数值见表2,从表2可以看出反映像相关系数矩阵主对角线上的元素值都超过0.7,物理为0.71、化学为0.72、历史为0.71、政治为0.72,并且主对角线外的元素大多绝对值较小,认为可以进行因子分析。综合四种判断方法,认为A班学生四门课成绩之间存在相关性,适合进行因子分析。

(2)确定选取两个共因子。

        为了确定学生四科成绩数据需要的主成分数,进而做出能进行平行分析的碎石图,其中平行分析进行了100次模拟,结果见图1。根据主成分分析法选择一个主成分,根据主轴因子法提取两个公因子,碎石检验也是提取两个公因子。高估因子数通常比低估因子数好,综合考虑选取两个公因子。

\
 


(3)模型的确定。

         采用最大似然法提取公共因子,发现不管是未做因子旋转还是做了正交或斜交旋转,结果都显示两因子解释了四个变量74%的方差,再次验证了可以采用两个公因子。从因子载荷矩阵中我们发现,未进行因子旋转时,第一个因子在四门成绩上的载荷差不多,第二个因子在四门成绩上的载荷也差不多,无法明确解释各公因子的含义即无法对因子进行命名,而正交旋转和斜交旋转后的结果能够很明确的分出每个因子所对应的变量。斜交旋转后物理和化学成绩在第一个因子ML1上的载荷分别为0.89和0.79,远远大于历史和政治成绩在第一个因子ML1上的载荷,政治和历史成绩在第二个因子ML2上的载荷分别为0.88和0.75,远远大于历史和政治成绩在第二个因子ML2上的载荷,正交旋转后的结果与斜交旋转的结果差不多,详细情况见表3。由于采用斜交旋转后ML1与ML2两个公因子的相关系数为0.65,相关性较大,比较适合作斜交旋转。通过因子载荷矩阵数据(见表3)和因子模式矩阵数据(见图2)可以发现,样本数据更适合采用斜交旋转来确定因子。斜交旋转后因子1主要解释物理和化学变量,可以看成理科因子;因子2主要解释历史和政治,可以看成文科因子。


\



(4)计算因子得分。

       斜交旋转后因子得分权重为:理科因子ML1为0.38,文科因子ML2为0.36。学生成绩综合得分:

\


          学生各门成绩在文理科因子上的得分权重见表4。那么,学生成绩在因子1上的得分为:PC10.37 X1+0.53X 2-0.02 X 3+0.14 X 学生成绩在因子2上的得分为:PC1-0.02 X1+0.14 X 2+0.38X 3+0.53X 4在理科因子上,ID为26、27、24、8、25的同学得分较高,理科成绩较好,ID为11、16、5、4、12的同学得分较低,理科成绩较差;在文科因子上,ID为26、19、14、27、21的同学得分较高,文科成绩较好,ID为34、6、13、4、12的同学在文科因子上得分较低,文科成绩较差;ID为26、19、27、22、21的同学的综合得分最高,综合成绩较好,ID为6、11、16、4、12的同学的综合得分最低,综合成绩较差。详细情况见表5。

        综合成绩排在前五的同学情况有所区别:ID为26和27的同学,文科和理科得分都在前五,说明这两位同学成绩优异,而且不偏科;ID为19和21的同学,综合成绩排在前五,成绩较好,但是理科成绩并没有进前五,可以把理科成绩再提高提高;ID为22的同学文理科因子得分都没进前五,说明成绩均衡,文理科成绩都有一定的提升空间。同样,综合成绩排在后五的同学情况也有所不同:ID为4和12的同学,文科和理科得分都在后五,说明这两位同学文理科成绩都差,需要引起注意;ID为11和16的同学理科因子得分都在后五,可以把理科成绩再提高提高;ID为6的同学,综合得分在后五,但是文科成绩拖了后腿,可以把文科成绩再提高提高。详细情况见表5。


\

\
 

三 建议

(一)关于分析结果的建议


        通过对A班四门成绩进行因子分析,把四门成绩分为了两个因子,即文科因子和理科因子。发现38个学生的成绩情况存在一定的区别,有的学生文科成绩薄弱,有的学生理科成绩薄弱,针对不同的情况需要给出不同的建议。对于文科较弱的同学,可以花较多的时间训练阅读、记忆、表达等能力;对于理科较弱的同学,可以花较多的时间训练空间想象、逻辑思维、计算等能力。通过学科群分析学生的情况并针对性的提出建议,这样才能使学生取得更大的进步。

(二)其他建议

        近几年,核心素养的话题讨论的比较多,有谈中小学语文核心素养的[7,8],也有谈小学数学核心素养的[9],各个学科都在提自己的核心素养。如果每个学科都提核心素养,会使得指标太多,进而导致指标重复。而针对学科群去提学科群核心素养,会使学生需要具备的核心素养指标少而精,更有益于学生的发展,更有利于学生一类学科成绩的提高。

          另外,中小学教师由于绩效考核的原因,任课教师常常只关注本门课的成绩,即使学生本门课的成绩已经很优异了,也希望学生花大量的时间在本门课上。甚至是班主任,有时候也只看总成绩跟自己所带课程的成绩。建议中小学管理层教师,优化教师绩效考核方案,让各科教师更加关注学生学习成绩的健康发展,尽量不要偏科,督促班主任和任课教师找出学生存在短板的学科群,有针对的进行训练。同时,班主任和任课教师之间需要多交流,这样更加有利于找出每个学生在学习过程中存在的具体问题。学生各科成绩的全面发展,关乎国家科技强国之路,关乎中华民族伟大复兴中国梦的实现,不容忽视。

四结语

         如今能进行教育实证分析的软件有很多,如R、SPSS、SAS、STATA、MATLAB等等软件。R语言拥有大量开源的统计方法包,由全世界大量的统计学家共同维护,对数据分析很友好。初次使用某一种方法时需要编写好代码,当再次使用时,只需要更改数据和代码中的相应参数即可,所以,也希望更多的教育研究者去使用R语言进行实证分析。

       研究不足:本文重在应用R语言去实现因子分析,在样本数据的选择上存在着样本量偏少以及选取的学科不全等不足,结果可能存在一定的偏差。

参考文献

[1]孙晓军,周宗奎.探索性因子分析及其在应用中存在的主要问题[J].心理科学,2005(06):162-164+170.
[2][3]王斌会.多元统计分析及R语言建模[M].广州:暨南大学出版社,2016.
[4]唐林俊,杨虎.因子分析法在区县经济综合指标评析中的应用[J].数理统计与管理,2003(05):24-29.
[5]汪东华.多元统计分析与SPSS应用[M].上海:华东理工大学出版社,2010.
[6][美]Robert I.Kabacoff.王小宁,刘撷芯,黄俊文等译.R语言实战(第二版)[M].北京:人民邮电出版社,2016.
[7]李作芳.浅谈阅读教学中小学语文核心素养的培养[J].教育理论与实践,2017,37(14):60-61.
[8]郭大芳.试论阅读教学中小学语文核心素养的培养[J].教育现代化,2018,5(11):334-335.
[9]李奎,马丽君.小学数学学科核心素养建构初探[J].现代中小学教育,2017,33(04):36-39..

关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.scipaper.net/jiaoyulunwen/8074.html
本文标签: R语言 ,因子分析 ,测评

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 豫ICP备2022008342号-1 | 网站地图xml | 百度地图xml