2018-04-24 | 文章来源:
在设计和编制任何一种测验时,都必须在效度、信度、复杂度和区分度等方面满足一定的要求,即至少必须是有效可信的,具有一定的复杂度和区分度。这部分知识点,考察的比较少,但是理解起来比较难。
一.可靠性
信度是指测试结果的稳定性或可靠性,即一项测试经过反复测试后所得分数的稳定程度和一致性。它不仅包括时间上的一致性,还包括内容和不同评分者之间的一致性。与信度相关的一个概念是效度,信度是效度的前提。可靠性只受随机误差的影响,随机误差越大,可靠性越低。比如,如果用同一张数学试卷测量同一组学生,昨天和今天的测量结果是一样的,说明这张数学试卷的可靠性高;如果同样一张数学卷子测的是同一组学生,昨天和今天的测量结果是不一样的,说明这张数学卷子的可靠性很低。
(1)重测信度
也叫稳定系数,是统考。同一组在不同时间测试两次,两次测得分数的相关系数为复试系数。比如性格测试,这个班的学生在学期开始前测试,学期结束时再测试一次,求两次测得的分数之间的相关系数。相关系数越大,重测信度越高。
(2)副本可靠性
它用两个测量复本对同一组进行测量,然后得出考生在这两次测试上成绩的相关系数。副本的可靠性反映了两个测试副本在内容上的等效性。比如一个语文单元测试,有两份。对班里的学生进行两份测量,最后计算两次测试成绩的相关系数。相关系数越大,两个副本的内容越等价。
(3)评分者的可靠性
它是指不同评分者对同一对象进行评分时的一致性。最简单的估算方法是随机抽取几份试卷,由两个独立的评分员进行评分,然后计算每份答题卡的两个评价分数的相关系数。
二。有效期
效度指的是测量的正确性,即一个测试能够测量出它想要测量的东西的程度。有效性是指测量结果反映被检查内容的程度。测量结果与被测内容越一致,效度越高。否则,有效性越低。就测试而言,效度是比信度更重要的指标。
(1)内容有效性
内容效度是指测验问题对相关内容或行为样本的适用性,从而确定测验是否是待测行为领域的代表性样本。比如用体重秤测身高,测不出你想要的。由于数学卷子主干过长,难以理解,学生答题时得分较低,是内容效度较低的一种表现。
(2)概念效度
检验是指一个理论观点或特质能够被测量的程度,即检验结果能否证实或解释某一理论的假设、术语或观点,以及在何种程度上。比如在语言方面,女性的口语比男性发展得早,在语言流利性、阅读、写作、拼写等方面都有优势,但男性在语言理解和言语推理方面比女性强。如果通过测量发现有明显符合这一理论的测量,则说明该测验具有较高的结构效度。
(3)标准效度
效标效度,也称为经验效度,反映了在一定情境下测试短跑个体行为的有效性。比如,一次测试表明,学生的抽象逻辑思维占优势,sprint在后续的物理、化学相关抽象内容的学习中可以取得很好的效果。如果学生在物理化学学习中表现出优势,这意味着该测试的效标效度较高。
第三,信度和效度的关系
是信度和效度的基础。只有信度高,效度才能高。
(1)信度高,但效度不一定高。我想用体重秤来测量我的身高。我发现测了很多次结果都差不多,说明信度很高,但是我没有测到我想要的,说明效度很低。
(2)信度低,效度必然低。它是信度和效度的基础。
(3)较高的效度和信度。如果一个测试已经能够测量它想要测量的东西,那么这个测试的可靠性也必须非常高。举个例子,如果一个数学考试测量一个学生的四种算术能力,经过多次测量,分数相对稳定。
(4)效度低,信度不一定低。使用数学试卷进行测试,但主要考察学生的语文理解能力,测试的效度很低,但很多测量的结果相对稳定,说明测试具有较高的信度。
更多教师招聘教育考点请查看智朗教师网-教育频道。
智朗教育浅析
扫描二维码 middot关注微信微信官方账号——智朗教师考试
回复 教育理论 可以查看两个学习的每一章老师的习题。
回复 我要面试 获取试讲方案(含音频)+回复+结构化解题思路。
注:本文为访客个人学习、研究或欣赏,版权为 智朗教师网 未经本网站授权,不得转载或摘抄。本网站授权的作品应在授权范围内使用,并注明“来源:智朗教师网”。任何违反上述声明的人将被本网站追究责任。
微信咨询
微信中长按识别二维码 咨询客服