心理测量学

第三节 测验的信度

知识点1 信度的定义和指标

信度的定义

信度指同一被试在不同时间内用同一测验重复测量,所得结果的一致程度,即可靠性稳定性

信度只受随机误差的影响,随机误差越大,信度越低,系统误差不影响信度。

信度的指标

信度系数 信度指数 测量标准误 SE 信度越高,标准误越小。

知识点2 信度的种类和估计方法

重测信度

又称稳定性系数,采用重测法,指用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。

一般是两周到四周较宜,间隔时间最长不超过六个月。

复本信度

又称等值性系数, 它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关。
如果两个复本的施测相隔一段时间,则称重测复本信度稳定与等值系数

内部一致性信度

内部一致性信度主要反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。
(1)分半信度:指测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分的相关系数。
(2)同质性信度:代表测验内部所有题目间的一致性。

评分者信度

随机抽取若干份测验卷,由两位评分者按评分标准分别给评分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的

知识点3 信度和测验分数的解释

解释真实分数与实得分数的相关

信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也可以告诉我们测量的误差比例是多少。

确定信度可以接受的水平

当$r_{xx}<0.70$时,不能用于个人预测,也不能作团体比较。

当$0.70\le r_{xx}<0.85$时,可用于团体比较。

当$r_{xx}\ge 0.85$时,才能用来鉴别或预测个人成绩或作为。

一般能力测验和成就测验的信度系数都在$0.90$以上。

新编的测验信度应高于原有的同类测验或相似测验。

解释个人分数的意义

一是估计真实分数的范围;

二是了解实得分数再测时可能的变化情形。

知识点4 影响信度的因素

样本特征

一般而言,样本团体异质高估测验的信度。样本团体的平均能力水平不同信度也不同。

测验的长度

一般来说,增加测验长度提高信度。但需要注意增加测验长度的效果应遵循报酬递减率原则

测验的难度

通常难度的平均水平为$0.50$时,信度最高。

时间间隔

时间间隔只对重测信度重测复本信度有影响。两次测验相隔时间越短信度越高