试议语言测试信度与效度

最后更新时间：2024-03-12 作者：用户投稿原创标记

本站原创点赞:3978 浏览:12633

论文导读：行认真深思和选择。如阅读测试的内容应依据其教学内容或大纲的要求，所选阅读材料内容应反映教学内容的特点，被测试的技应明确并具有代表性。同期效度是指测试结果是否或在多大程度上与一些外在标准相关，如在同期举行的被认为具有效度的另一次相同性质的考试或教师评价等。预期效度是指考试的结果和预言是否有效。例如，要选拔
摘要：语言教学的重要环节是语言测试，而语言测试的重要标准是信度与效度。本文从两者的定义出发，试析两者的关联性及在语言测试中的不同影响力。
关键词：语言测试信度效度关联
一、引言
语言测试在教学中的主要目的是对学生所掌握的知识和所具有的能力进行客观、公正地评价。然而，测试能否达到预期效果，却直接取决于测试的质量。谈到测试的质量，就必定涉及到测试的四个标准：效度、信度、实用性和区分度。其中信度和效度是测试最重要、最为关键的两个指标。如果一个测试失去了信度和效度，那其他标准就无从谈起。但信度和效度两者在本质上又是相互冲突的，如何正确理解把握两者间的关系并加以运用，对语言测试作用的充分发挥至关重要。

二、信度与效度的概念

信度与效度原是计量学中的两个重要概念， 20世纪30 年代被引入语言测试领域。60 年代，以Lado等为代表的结构主义测试学家对这两个概念进行了系统的阐述和论证，标志着语言测试已形成科学的体系，成为一门独立的学科。可以说，语言测试理论及实践的发展和纷争都是以信度与效度为主线的。信度与效度是语言测试永恒的话题。
（一）信度
1. 定义
Bachman（ 1996）把信度定义为测试的一致性（ consistency of measurement ）。简言之，信度是指语言测试结果的可靠程度，即同一套题的测试结果是不是稳定。若使用同样一套试题，在两种不同的场合、环境中，在较短的时间间隔内，在相同的学生群进行反复施考，测试结果大致相同，那么就证明该测试较真实的反映了受试者的语言水平，测试是有信度的。一份试卷的测试结果如果缺乏信度，就没有使用价值，同时也减弱了考试的客观性、公正性。当然，绝对的准确也是不可能的，我们能做的是尽量把影响不一致性的不利因素制约在最低程度，以便于提高测试的信度。

2. 影响信度的因素

（1）考生水平的差异。考生水平越接近，测试的信度越低。反之，考生水平差异越大，测试的信度越高。
（2）题目数量的差异。试题数量越少，测试的信度越低。反之，试题数量越多，测试的信度越高。
（3）题目的区分度。试题的难易程度应当有所区分，试题太难或太易、考试分数集中于某一点或某一区域，测试失去信度。区分能力强的题目越多，测试的信度越高，反之亦然。
实际情况中，试题编写者常采用增加题目数量和提高题目的区分度来增加测试的信度。但考试时间是固定有限的，且考场纪律，考场周边环境、测试要求等等因素均会影响测试的信度，因此还需将信度与效度结合深思。
（二）效度
1.定义
所谓效度指的是测试达到其预期测试意图的程度。一个测试如果考了它所要考的就是有效度的，否则就是没有效度的（Lado ，1961）。效度是一个相对的慨念，这主要是因为个人或群体的语言能力特征，只能通过其行为样本间接推测，而不可直接测得。由此，推测的结果只能是相对有效，而不是绝对有效。从这个作用上讲，效度是一个程度的概念，它反映了根据考试分数做出推论或预测的准确性程度。

2. 效度的分类

效度的内涵十分丰富，一般认为效度可分为五种：结构效度（construct validity）、内容效度（content validity）、同期效度（concur rent validity）、预测效度（predictive validity）和表面效度（face validity）。
结构效度也称观念效度或理论基础效度，是指测试所检测的能力是否符合语言、语言学习和语言行为理论中所假设的能力。结构效度是语言测试的主要效度，是一切其他效度的基础。与之密切相关的是内容效度。内容效度是指测试的内容（包括材料、题材、题目等）是否具有代表性或综合性。一份试卷不可能涵盖到所有要考内容，这就要求出题者进行认真深思和选择。如阅读测试的内容应依据其教学内容或大纲的要求，所选阅读材料内容应反映教学内容的特点，被测试的技应明确并具有代表性。同期效度是指测试结果是否或在多大程度上与一些外在标准相关，如在同期举行的被认为具有效度的另一次相同性质的考试或教师评价等。预期效度是指考试的结果和预言是否有效。例如，要选拔优秀学生参加大学生英语竞赛，该考试是否选拔了应该选拔的学生，有没有选错或者选漏？这就要看考试是否起到了较有效的预测作用。再如：将学生高考的英语成绩和大学一年级第一学期末的英语成绩作比较，观察其相关性，就可以了解高考英语试卷的预测效度。表面效度是指测试的表面可信度或公众的可接受度。一个测试看上去测试了预定的技能和能力范畴，那么它就具有表面效度。如旨在测试学生口语能力的测试，学生能够开口说英语，这类让学生直接运用被测试能力的测试就属于表面效度很高的测试。

3.影响效度的因素

（1）题目和试卷的指令不清楚。这样考生会因为考试要求不明确而降低成绩。
（2）题目的难度水平不合适。换言之，一份过易或过难的试卷会把中等和上等的考生放在同一水平上。
（3 ）选择项目模棱两可，含糊不清。这与上述（1）中的影响一样会使考生不明确作用而降低成绩。
（4）题目与测试目的不符或没有足够的题目数量来代表要测试的内容。
（5）题目开始就很难，致使考生一开局就严重受挫，从而导致后面的题目也放弃了。
（6）在多项选择里，正确答案很容易被认出来。

三、信度与效度的关联

语言测试以语言能力为测量目标，而语言能力是抽象的，是通过具体的语言行为表现出来的，难以直接测量。另外，任何语言测试都不必要也不可能测量所有的语言行为，因此，要实现语言测试的目的，信度与效度缺一不可。首先，信度确保测试的一致性或稳定性，效度确保测试的目的；其次，信度是效度的前提条件。一个有效度的考试一定有信度，而一个信度很高的考试不一定有效度，这是信度与效度的最基本的关系。第三，信度是效度的必要条件。有效度就肯定有信度，因为任何一个考试最终是通过分数来表述其结果的。如果分数不可信，那么我们就无法说试卷有效地评估了学生的语言技能或能力。

四、语言论文导读：

测试效度重于信度
信度与效度既对立又统一的特征决定了同时具有高信度和高效度的语言测试是不存在的，信度与效度难以兼得，任何语言测试都必须在二者之间进行平衡和折衷。
因此，语言测试应首先考虑效度要求，在此基础上尽可能地追求信度。首先，从理论上讲效度是比信度更重要的一个属性，在语言测试中占有中心地位。其次，从信度与效度的关系来看，语言测试如果首先保证了高信度则必定效度很低或没有效度；反之，如果首先考虑效度，信度虽然会受到一定的损害，但决不是不可获得。第三，语言测试以效度为主导有助于改善其对外语教学的影响。语言测试给外语教学带来的影响即人们常说的反拨效应（backwash effect），它是衡量语言测试的重要标准之一，因此也被许多测试学家称为反拨效度（backwash validity）。著名学者李筱菊（1997）曾对此有过精彩论述：一个语言测试的真正价值不在于它能用多少数据去说明什么，而在于它能否给人们带来好的快乐的结果，有助于使人变得更完美。这好的快乐的结果主要是指良好的反拨效应。如果为通过某一个重要考试，教学双方花费大量时间和精力而学生并没有获得相应的语言能力，这种结果是无论如何不能让人愉快的。
五、结论
信度与效度是语言测试的两大基本要求，信度与效度的关系理由是语言测试的根本理由。在实际编写试题的过程中，编写者应努力做到测试的信度和效度相对平衡的统一，提高效度与信度方面的互补性，努力使测试更具科学性与合理性。但测试的最终目的还是服务于教学，因此还应当充分考虑它对教学的影响，并服务于教学目标的最终实现。
参考文献
[1]邹申. 语言测试. 上海外语教育出版社，2005.
[2]刘润清. 韩宝成. 语言测试和他的策略. 外语教学与研究出版社，1991.
[3] 桂诗春 . 标准化考试 —— — 理论、原则与策略 [ M] . 广州：广东高等教育出版社，1986.
[4]赵成发. 谈语言测试的信度和效度[J]. 西安外国语学院学报， 2000.

快捷导航：

推荐正文相关热门排行榜猜你喜欢

排行榜