第一计算机化自适应测验理论基础项目反应理论第1页_计算机化自适应测验进行测试的各个环节包括涂冬波等著

第一节计算机化自适应测验理论基础：项目反应理论

一、项目反应理论

项目反应理论（IRT）也被称为潜在特质理论（LatentTraitTheory，LTT），它假设被试观察的项目反应结果由被试潜在特质（或潜在能力）与测验项目共同决定，被试在某项目上答对或答错是受被试潜在能力和项目特征（如项目难度）等共同影响；项目反应理论采用项目反应函数（ItemRespoion，IRF）来模拟、解释、预测被试潜在能力及项目特征是如何影响被试在特定项目上的作答反应结果，同时综合被试在所有测验项目上的作答反应结果以及项目反应函数来估计被试的潜在能力和项目参数。

经典测量理论（ClassigTheory，CTT）中，测验总分常被用于估计被试的潜在能力，也即CTT一般把可观察的测验总分作为被试潜在能力的估计值，并根据测验总分的高低来判定被试能力水平的高低。CTT假设，被试观察分数（X）主要受两个因素影响，一个是被试的能力真值（T，即真分数，相当于被试的潜在能力），另一个是误差分数（E，即测量误差），它们之间的数学函数表达式为

从式（2。1。1）中可以看出：第一，CTT假设被试的观察分数与被试真分数及测量误差分数存在简单相加的函数关系。第二，CTT是在测验整体层面解释被试潜在能力是如何影响被试测验总分结果的。第三，CTT没有直接考察测验项目特征（如项目难度）是如何影响被试在项目以及测验上的得分的，即公式（2。1。1）没有项目参数。显然，测验总分即观察分数（X）作为被试潜在能力的估计值是比较粗糙的，它并没有深入分析不同测验项目对观察分数的影响，并会导致不同测验下的分数无法比较。第四，CTT一般只能对所有被试计算一个笼统的测量误差（E），也即一个笼统的测量信度，从而无法深入分析测验对不同被试测量误差的不同。而项目反应理论则试图突破CTT的以上不足。

二、项目反应模型

与CTT一样，项目反应理论也采用数学函数来解释、预测被试的潜在能力与被试作答反应间的关系。但与CTT不同的是，IRT是基于更为细致的项目层面来进行建模，同时深入考察项目特征这一重要影响因素。在IRT中，这种用来描述、解释被试在测验项目上的作答反应的数学函数被称为项目反应模型（ItemResponseModel，IRM）。心理测量学者们根据测验项目记分方式、测量的维度等特征开发出了不同类型的项目反应模型，如二级评分模型、多级评分模型、多维模型等。

（一）二级评分IRT模型

二级评分项目是指被试在项目上的观察反应得分只有两种，答对或答错，即被试在该项目上要么得0分，要么得满分；而用于分析二级评分项目的数学模型（项目反应模型）则称为二级评分项目反应模型。这种模型适合分析单项选择题、填空题等二级评分的题型。较为常用的三参数Logistic模型（3PLM）如下：

其中Xij指被试i在项目j上的观察得分；

Pij指被试i在项目j上的答对概率；

θi指被试i的潜在能力值，即能力参数；

aj指项目j的区分度参数；

bj指项目j的难度参数；

cj指项目j的猜测度参数；

D是一常数，取值1。702。

若假设项目不存在猜测度，即可以简化为两参数Logistic模型（2PLM），即

若在2PLM基础上，假设所有项目区分度相等，则2PLM可以简化为单数Logistic模型（2PLM）或拉希模型（RaschModel），即

根据3PLM，可得不同能力被试在项目j上的答对概率曲线，即项目特征曲线（ItemCharacteristicCurve，ICC），如图2-1-1所示。

图2-1-13PLM的项目特征曲线（ICC）

（二）多级评分IRT模型

多级评分项目是指被试在项目上的观察反应得分超过两种，即被试在该项目上的得分可以是0分或满分，也可以是介于0分和满分之间的分数，即被试在项目上的得分形式多于两种；而用于分析多级评分项目的数学模型（项目反应模型）称为多级评分项目反应模型。这种模型适合分析简答题、证明题、作文题、Likert型量表等多级评分的题型。IRT领域中常用的多级评分IRT模型主要有：

·等级反应模型（GradedResponseModel，GRM）（Samejima，1968）；

·分部评分模型（Partial）（Masters，1982）；

·拓广分部评分模型（Geial）（Muraki，1992）；

·评定量表模型（RatingScaleModel＜R**）（Andrich，1978）；

·称名反应模型（NominalResponseModel，NRM）（Bock，1972）。

在IRT领域，基于多级评分IRT模型的开发主要有两大思路（Thissen＆Steinberg，1986）：一种是离差模式（DifferenceModel），另一种是除总模式（Divided-by-totalModel）。

第一 计算机化自适应测验理论基础 项目反应理论（第1页）

第一计算机化自适应测验理论基础项目反应理论（第1页）