测量标准误差 :
测量标准误差反映的是个体测验分数与个体真分数之间的差异。其计算公式为:
式中为测量标准误;代表一次使用测验得分的标准差,为信度系数。
从理论上讲,一个人的真分数是用同一个测验对他反复施测所得的平均值,其误差则是这些实测值的标准差。然而,这种做法是行不通的。因此,可以用人数足够多的一个团体两次施测的结果来代替对同一个人反复施测,以估计测量误差的变异数。此时,每个人两次测量的分数之差可以构成一个新的分布,这个分布的标准差就是测量的标准误,它是此次测量中误差大小的客观指标。可见,测量的标准误是测量误差分布的标准差,表示测量误差的大小。它可以:①反映个体测验分数的变异量。②估算个体的真分数范围。
因为任何一个测验都存在误差,这种误差的大小是以测量标准误来表示的,所以在对测验结果进行解释时,就必须考虑到测量标准误的大小。若将测验所得的分数用表示,那么,其真分数T落在下述区间内的概率为95%,即:。
包含真分数的数值范围为置信区间,区间的极限为置信限。测验分数中,68.26%的范围是真分数的正负1个标准误范围之内;95.44%的范围是真分数的正负2个标准误范围之内;99.74%的范围是真分数的正负3个标准误范围之内。选用95%或99%的概率水平称为置信度。因此,的分数范围称为真分数的95%置信区间,的分数范围称为真分数的99%置信区间。测量标准误能够用于构想一个测验分数的置信区间,它能提供真分数最可能落入的估计范围。比如,如果一个学生在拼写测验中得了50分,该测验的测量标准误是4,那么使用50分作为分数的估计点,我们将会得到如下结果:
在68%(精确地说是68.26%)的可信水平上,真分数的范围是在46~54分;
在95%(精确地说是95.44%)的可信水平上,真分数的范围是在42~58分;
在99%(精确地说是99.74%)的可信水平上,真分数的范围是在38~62分。
测量的标准误和信度系数很像,它是表示测验信度的一种方法。如果测验的标准差是恒定的,越小,测验信度越大;随着的增长,将会降低。与信度系数不同的是,测量的标准误差不受团体的变异性的影响。测量的标准误差以个体分数来表示,无论是同质团体还是异质团体,所得标准误差保持不变。另外,测量的标准误差以分数单位来报告,在测验之间不能直接比较。因此,如果要比较不同测验的信度,信度系数比测量标准误差好;而解释个体分数,测量标准误差则较为合适。解释个体测验分数时应该以“一段分数”来表示被试的表现,而不是以某一个“特定的分数”来对被试进行描述。测量标准误越大,则“一段分数”的范围也越大,所测得的分数的可靠性就越低;测量标准误越小,则“一段分数”的范围也越小,所测得的分数的可靠性就越高。
估计要求每个人要有成对的分数,每个人成对的分数由复份法、再测法、分半法获得。计算公式为:
在评价两个分数之间的差异时,考虑测验信度和测量标准误差尤为重要。考虑到每个分数可能波动的分布范围,就可以避免过分重视分数之间的微小差异。不论比较不同个体的测验分数,还是比较同一个体在不同能力上的分数,或是对于指导语或其他实验变量引起的分数变化,都需要按测量标准误差来解释。需要注意的是,两个分数之间差异的标准误差要大于其中任何一个分数的测量标准误差。这是由于这种差异受到两个分数中存在的偶然误差的影响。根据两个分数的测量标准误差,用下列公式可以计算出两个分数之间差异的标准误差:
式中为两个分数之间差异的标准误差;和分别为两个分数的测量标准误差。
该公式可以转换为如下形式:
式中为测验1和测验2使用的相同的标准差;和分别为测验1和测验2的信度系数。