划界分数

2024-01-26

    划界分数 :

依据划界分数可以实现对被试进行分类决策,判断被试在相应的测验表现上是否“达标、未达标”或“及格、良好、优秀”。

在中国的考试体制中,以学业成就测验为例,通常将60分作为判断考生水平是否及格的划界分数。但实践和理论证明:60分并非判断考生合格的金标准,它较适用于预先设置通过率(常模参照测验)的以选拔为目的的测验类型。因此,依据“达标定等级”的教育考试评价原则,将60分作为标准参照测验的划界分数是主观性的划定,在许多情形下并不适用。

经典测验理论中,划界分数的设置有3种方法。第一种为专家判断法,由专家进行评估,要求专家根据对测验内容的整体印象或逐个就题目作出判断,以此来划定测验的划界分数。常见的专家判断法包括:整体判断法、Nedelsky法、Angoff法、Ebel法等。专家判断法主要依靠专家的主观判断,在使用专家判断法时,必须选择具有测量知识储备、熟悉临界考生的相关专家,以降低主观性的影响。此外还应采取多位专家评定的方法,综合多位专家的意见,从而提高划界分数的信度与效度。第二种划界分数设置方法为实证法,以被试的应试表现为基础来划定划界分数。常见的实证法包括教育效果法、通过率法等。实证法通过客观作答数据而不是专家主观判断来划定划界分数,可以有效避免主观判断的影响,但会受到抽样误差的影响。第三种方法为综合法,综合法将专家判断法和被试应试表现结合起来,既考虑专家的主观判断,又考虑被试的实际测试数据。常见的综合法包括临界组法、对照组法、Jaeger法等。

由于项目反应理论中被试能力与项目难度在同一度量系统上,且正确作答比例值与能力值之间存在定量函数关系,因此有研究者将项目反应理论与传统的Angoff法相结合提出了Bookmark法。Bookmark法要求专家进行评判的次数较少,精简了专家的任务量;Bookmark法适用性较强,它既适合于两级计分题,也适用于多级计分题;在题量很大的考试中,Bookmark法的优势更加明显。