免费论文查重: 大雅 万方 维普 turnitin paperpass

探讨基于决策树全日制生英语四级考试通过

最后更新时间:2024-02-19 作者:用户投稿原创标记本站原创 点赞:19466 浏览:84423
论文导读:ofalocalengineeringuniversityasanexample,thepapercollectedthecoursegradedataoffull-timecollegestudentsinfourschoolsoftheselecteduniversity,andthenanalyzeditbydecisiontreemethod.TheexperimentalresultsillustratedthatthemostinfluentialfactorofpassingCET-4ist
摘 要:我国大学生为通过大学英语四级考试需要付出很大的时间代价,分析影响大学英语四级考试通过的理由,对于采取针对性措施通过英语四级考试作用重大。以某特色地方工科高校教学管理系统为研究对象,从中提取了四个学院的学生成绩数据,采用决策树策略进行了分析。数据分析结果表明:大学英语课程成绩对大学英语四级考试通过影响最大,毕业设计成绩、高等数学课成绩、专业基础必修课成绩也会影响大学英语四级考试的通过,基础必修课成绩对大学英语四级考试通过的影响不大。
关键词:教育数据挖掘;大学英语四级考试;决策树
:A
Data Mining on the Influential Factors of Passing CET-4 for Full-time College Student
YI Xinhe1,WEN Yimin2,CHEN Xiongwei2
(1.College of Computer Science and Engineering,Guilin Univ of Electronic Technology,Guilin 54004,China;
2.Higher Educational Research Institute,Guilin Univ of Electronic Technology,Guilin 54004,China)
Abstract:For the higher cost of passing CET-4,it is very important to take strategies to direct the college students of China to pass CET-4 by analyzing its influential factors.Taking the teaching management information system of a local engineering university as an example,the paper collected the course grade data of full-time college students in four schools of the selected university,and then analyzed it by decision tree method.The experimental results illustrated that the most influential factor of passing CET-4 is the grade of college English course, and next are the grade of graduation thesis,higher maths,basic required courses for specialty.However there was little influence of the general basic required courses.基于决策树的全日制本科生英语四级考试通过由专注毕业论文与职称论文的www.7ctime.com提供,转载请保留.
Keywords:educational data mining;CET-4;decision tree
1 引言(Introduction)
《国家中长期教育改革与发展规划纲要》中对新时期人才培养提出了新的要求,即培养“适应国家经济、社会对外开放的要求,培养大批具有国际视野,通晓国际规则,能够参与国际事务与国际竞争的国际化人才”。随着经济全球化的加剧,高校英语教育的重要性日益提高。大学英语四级,即CET-4(College English Test Band 4)。它是由国家教育部高等教育司主持的针对大学生或研究生开展的全国性英语水平考试。1987年正式实施。目的是推动大学英语教学大纲的贯彻执行,对大学生的英语能力进行客观、准确的测量。不容置疑,大学英语四级考试极大地推动了我国大学生英语水平的提高,为我国国际化人才的培养做出了巨大贡献。然而,大学英语四级考试也使得我国大学生付出了巨大的时间代价。分析影响大学英语四级考试通过的因素,对于采取针对性措施通过英语四级考试作用重大。
文秋芳等使用调查法和统计分析法对影响大学英语四级考试通过的因素进行了分析,发现“高考英语成绩”“性别”“母亲受教育程度”“母语策略”“形式操练策略”“深层动机”和“努力程度”,对大学英语四级考试成绩具有明显的预测能力[1];胡啸等使用调查法和统计分析法证明了英语学习策略与大学英语四级考试成绩相关[2];叶瑞娟等使用调查法和统计分析法证明了学生英语平时成绩、学习时间、性别、高考英语成绩、教师授课态度等均是大学英语四级考试通过的影响因素[3]。
教育数据挖掘[4]是数据挖掘在教育领域的应用。近年来,教育领域积累的数据迅速增长,国内外(尤其是国外)学者对教育数据(尤其是远程教育的数据)挖掘展开了广泛的研究[5]。然而,这些研究主要针对远程教育开展。如何利用每个学校积累的全日制本科数据进行数据挖掘?如何使用数据挖掘策略对影响大学英语四级考试通过的因素进行分析?王娜等使用广义线性回归法对同年级不同专业的39名在校大学生的年龄、高考分数、籍贯、性别、民族、是否为独生子女、中教英语类课程成绩、外教英文类课程成绩、数学类课程成绩、政治理论课程成绩、计算机类课程成绩、专业课课程成绩、体育课程成绩、实践类课程成绩等14项数据指标与是否首次通过大学英语四级考试之间的关系进行了研究[6];郑培钿等使用调查法和决策树策略分析了大学生的英语基础、努力程度、学习策略、学习兴趣、社会压力和英语氛围与大学英语四级考试通过之间的关系[7]。曹丹阳等使用决策树策略分析了专业、学生性质(定向、非定向)、性别、科类、民族、地区、学生班主任、学生英语教师、大学英语一、大学英语二、大学论文导读:模型的泛化能力不好。本文尝试使用决策树策略对某特色地方工科高校教学管理系统中2007级和2008级学生的成绩数据进行深入分析,利用决策树容易解释的优点分析影响大学英语四级考试通过的因素。2数据准备(Experimentaldata)本文中使用了某特色地方工科高校教学管理系统中机械工程学院、信息与通信工程学院、计算机科
英语三、大学英语四与大学英语四级考试通过的关系[8]。以上研究的不足在于:第一,样本量太小,数据挖掘得到的结果不一定可靠;第二,模型的泛化能力不好。本文尝试使用决策树策略对某特色地方工科高校教学管理系统中2007级和2008级学生的成绩数据进行深入分析,利用决策树容易解释的优点分析影响大学英语四级考试通过的因素。
2 数据准备(Experimental data)
本文中使用了某特色地方工科高校教学管理系统中机械工程学院、信息与通信工程学院、计算机科学与工程学院及电气与自动化学院2007级和2008级学生的成绩数据。其中数据基本情况见表1。根据数据挖掘的需要,提取了学号、大学英语课程平均成绩、高等数学课平均成绩、基础必修课平均成绩(不包括高等数学)、专业基础必修课平均成绩、毕业设计课程成绩、大学英语四级考试成绩。
表1 数据基本情况
Tab.1 The data for experiments
学院2007级
学生人数2007级学生
四级通过率2008级
学生人数2008级学生
四级通过率
机械工程学院5177

3.89%48470.45%

信息与通信工程学院5217

1.98%513809%

计算机科学与工程学院43870.09%48266.88%
电气与自动化学院3077

1.01%32866.16%

总 计17837

1.9%18077

2.27%

3 数据分析(Data analysis) 数据分析采取了两种方案。第一种方案是区分学院,也就是分别对机械工程学院、信息与通信工程学院、计算机科学与工程学院及电气与自动化学院这四个学院的学生数据进行分析;第二种方案不区分学院,也就是将四个学院的学生成绩数据合并在一起进行数据分析。如表1和表2中的“总计”。以上两种方案又分别先使用2007级学生数据作为训练集,2008级学生数据作为测试数据,然后再交换。使用从训练集学习到的决策树对测试集进行分类,统计准确率。实验结果如表2所示。
决策树的训练算法采用.5算法,.5算法选择具有最大信息增益率的属性作为分裂属性。剪枝采用了降低错误率的“后剪枝”策略。剪枝时使用随机抽取训练集中1/10的样本进行剪枝,使用训练集中其他样本进行训练。实验重复50次。对测试集的准确率的均值和方差如表2所示。
表2 实验结果
Tab.2 The experimental results
学院以2007级学生成绩数据为训练集,以2008级学生成绩数据为测试集的准确率以2008级学生成绩数据为训练集,以2007级学生成绩数据为测试集的准确率
机械工程学院7

1.21%±3.20% 76.21%±9%

信息与通信工程学院69.87%±6.83%7

4.41%±3.19%

计算机科学与工程学院70.02%±

2.72% 75.45%±17%

电气与自动化学院7

2.73%±5.31% 80.00%±

3.51%

总 计70.48%±82% 78.21%±2.18% 表2中以2007级为测试集的准确率都比表1中对应的2007级大学英语四级考试通过率都要高。表2中除掉带下划线的结果外,以各学院2008级为测试集的准确率要比2008级的大学英语四级考试通过率要高。一般情况下,2007级的学生成绩数据分布不见得与2008级学生成绩数据分布相同。因此,采取上述的交叉测试的策略仍然能得到上述结果,这说明得到的决策树具有较大合理性。
50次实验中得到测试准确率最高的决策树如图1—图8所示。
图1 以机械工程学院2007级学生成绩数据为
训练集得到的决策树
Fig.1 The decision tree trained by the grade data of
the students registered in 2007 who major in
mechanical engineering
图2 以机械工程学院2008级学生成绩数据为
训练集得到的决策树
Fig.2 The decision tree trained by the grade data of
the students registered in 2008 who major in
mechanical engineering
图3 以信息与通信工程学院2007级学生成绩数据为
训练集得到的决策树
Fig.3 The decision tre基于决策树的全日制本科生英语四级考试通过论文资料由论文网www.7ctime.com提供,转载请保留地址.e trained by the grade data of the
students registered in 2007 who major in
information and communication engineering
图4 以信息与通信工程学院2008级学生成绩数据为
训练集得到的决策树
Fig.4 The decision tree trained by the grade data of the
students registered in 2008 who major in
information and communication engineering
图5 以计算机科学与工程学院2007级学生成绩数据为
训练集得到的决策树Fig.5 The decision tree trained by the grade data of
the students registered in 2007 who major in
computer science and engineering
图6 以计算机科学与工程学院2008级学生成绩数据为
训练集得到的决策树
Fig.6 The decision tree trained by the grade data of
the students registered in论文导读:王海啸.学习者因素与大学英语四级考试成绩的关系.外语教学与研究,1996,(4):33-39.胡啸,唐霞.大学生英语学习策略与英语四级考试成绩相关性研究.硅谷,1999,(22):165.叶瑞娟,梁波,周舒冬.大学英语四级考试成绩影响因素的分析及深思.广东药学院学报,2008,24(4):429-43

1.葛道凯,张少刚,魏顺平.教育数

2008 who major in
computer science and engineering
图7 以电气与自动化学院2007级学生成绩数据为
训练集得到的决策树
Fig.7 The decision tree trained by the grade data of
the students registered in 2007 who major in
electrical engineering and automation
图8 以电气与自动化学院2008级学生成绩数基于决策树的全日制本科生英语四级考试通过论文资料由论文网www.7ctime.com提供,转载请保留地址.据为
训练集得到的决策树
Fig.8 The decision tree trained by the grade data of
the students registered in 2008 who major in
electrical engineering and automation
通过分析50次随机实验得到的这50颗决策树可以知道:英语平均成绩出现在决策树第一层和第二层的次数占绝对多数;出现在决策树的第二层和第三层次数最多的属性是毕业设计成绩、其次是专业基础必修课平均成绩、再次是高等数学课平均成绩;基础必修课几乎在决策树的前三层不出现。这说明了:工科大学生的大学英语成绩的好坏对大学英语四级考试通过的影响最大,其次是毕业设计、专业基础必修课和高等数学课。大学英语四级考试通过与基础必修课成绩的好坏关系不大。
显然,大学英语成绩的好坏会直接影响到大学英语四级考试的通过。但是,决策树分析表明:大学英语成绩较好时才能确保大学英语四级考试通过。这可能是因为大学英语四级考试的难度比平常的大学英语课程考试的难度要大。毕业设计成绩也与大学英语四级考试的通过相关,可能是因为毕业设计成绩和大学英语四级考试成绩都会影响到学生的就业质量。专业基础必修课和高等数学课会影响到大学英语四级考试的通过可能是因为这两门课的成绩的好坏体现着学生的学习态度和学习习惯,因此会影响到大学英语四级考试的通过。基础必修课成绩由于与就业、考研直接关系不是很强,因此对大学英语四级考试的通过的影响最小,以上分析有待通过调查证实。
4 结论(Conclusion)
本文以一所特色地方工科高校的教学管理系统中的数据为研究对象,使用决策树策略分析影响英语四级考试通过的因素。发现工科学生的大学英语课程成绩对其大学英语四级通过影响最大,毕业设计成绩、高等数学课成绩、专业基础必修课成绩也会影响大学英语四级考试的通过,基础必修课成绩对大学英语四级考试通过的影响不大。根据此特点,可以根据学生大学英语课成绩、高等数学课成绩、专业基础必修课成绩采取有效措施推动学生通过大学英语四级考试。
未来的工作包括:通过大规模学生调查验证数据挖掘的结果;使用更多的学生信息来分析影响大学英语四级考试通过的因素;建立利用大学生第一、二学年的数据来进行大学英语四级考试通过的预测,以尽早采取措施帮助学生更高效率地通过大学英语四级考试。
参考文献(References)
[1] 文秋芳,王海啸.学习者因素与大学英语四级考试成绩的关系
[J].外语教学与研究,1996,(4):33-39.
[2] 胡啸,唐霞.大学生英语学习策略与英语四级考试成绩相关性
研究[J].硅谷,1999,(22):165.
[3] 叶瑞娟,梁波,周舒冬.大学英语四级考试成绩影响因素的分
析及深思[J].广东药学院学报,2008,24(4):429-431.
[4] 葛道凯,张少刚,魏顺平.教育数据挖掘[M].北京:教育科学出
版社,2012.
[5] Romero C,Ventura S.Educational data mining:a review of
the state of the art[J].IEEE Transactions on Systems,Man,and
Cybernetics-Part C:Applications and Reviews,2010,40(6):
601-617.
[6] 王娜,李关民.广义线性模型在大学英语四级考试通过率研究
中的应用[J].沈阳工程学院学报(自然科学版),2010,6(3):281-
284.
[7] 郑培钿,等.基于ID3算法的英语四级考试条件结论信息数据
挖掘[J].信息与通信,2012,(2):121-122.
[8] 曹丹阳,等.基于决策树的英语四级成绩分析[J].北方工业大
学学报,2007,19(1):38-41.
作者简介:
易新河(1969-),女,学士,助理研究员.研究领域:合作教
育,教育数据挖掘.
文益民(1969-),男,博士,教授.研究领域:高教管理,教育
数据挖掘.
陈雄伟(1975-),男,硕士,讲师.研究领域:高教管理,教育
数据挖掘.