第一计算机化自适应测验理论基础项目反应理论第2页_计算机自适应测验原理涂冬波等著

1。基于离差模式的多级评分IRT模型

离差模式中，被试得T分的概率表现为两个累积概率（CumulativeProbability）的离差，如Samejima（1968）的等级反应模型（GRM）属于离差模式。

在GRM中，被试得T分的概率被定义为被试得T分及T分以上的概率减去被试得T+1分及T+1分以上的概率，即

其中

bjt指被试在项目j上得T分的难度。显然GRM中，如果项目j满分值为mj，则该项目有mj个难度值。比如mj=3时，则该项目有3个难度，分别为得1分的难度bj1，得2分的难度bj2和得3分的难度bj3。GRM中的难度参数满足

即被试得越高分的难度是越大的，难度是单调递增的。

为了保证概率P（Xij=t）不为负，GRM限定

即被试得0分及0分以上的概率为1，以及限定

即被试得（满分+1）分以上的概率为0。这时，GRM满足

当mj=1时，则由公式（2。1。5）和（2。1。6）可得

即当项目满分为1分（或项目为二级评分）时，GRM可以简化为2PLM，也就是说2PLM是GRM的一个特例。

与Logistic模型一样，GRM也可在二维坐标轴上描述不同能力被试在项目各个分数上的概率曲线，即运算特征曲线（CharacteristicCurve，OCC），如图2-1-2所示。

图2-1-2是一个满分为3分的项目，被试在该项目上的得分有四种类型，即T=0、1、2和3分。图2-1-2可知，能力越高的被试得0分的概率越低，而得满分3分的概率越高；能力越低的被试得0分的概率越高，得满分3分的概率越低；而对于中间段能力的被试，得2分和3分的概率倾向越高。

图2-1-2等级反应模型的运算特征曲线（OCC）

2。基于除总模式的多级评分IRT模型

除总模式中，被试得T分的概率被定义为部分除以总体的关系，如Masters（1982）的分部评分模型（PCM）属于除总模式。在PCM中，被试得T分的概率表现为部分与整体的比值，即

第一步，7。50。3＝25

………1分

第二步，25-16＝9

………2分

用δjt来表示项目第T步的难度，记住δjt的含义与GRM中的bjt的含义不同，bjt指得T分的难度。PCM中，δjt不一定满足单调递增性，因为有的项目第一步非常难，而最后一步可能非常容易，因此PCM强调的是项目每个步骤的难度，而GRM强调的是被试得各个分数的难度（满足bj1≤bj2≤bj3≤…≤bjmj），图2-1-3和图2-1-4为两个模型难度的区别。

图2-1-3分步评分模型PCM项目步难度（ItemStepDifficulties）参数

图2-1-4等级反应模型GRM项目难度（ItemDifficulties）参数

记被试从第（t-1）步正确跳到第T步的概率为Φ（t），记被试得T分的概率为P（t），则有

即被试答对第T步的概率Φ（t）只受到被试能力θ和项目第T步的难度δjt影响，而与其他步骤的难度δjk（k≠t）无关。

则根据公式（2。1。13）可得

求解上式方程组，可分别求解出P（0）、P（1）、P（2）和P（3）的数学表达式，即

上式即为分部评分模型的项目反应函数，同时限定∑0v=0（θ-δjv）≡0。

需要指出的是，分部评分模型只考虑了项目难度参数对被试反应概率的影响，并没有考虑区分度在项目反应过程的作用。鉴此，Muraki（1992）对分部评分模型进行拓广，把项目区分度也加入项目反应函数中，提出了拓广分部评分模型（GPCM），GPCM项目反应函数为

第一 计算机化自适应测验理论基础 项目反应理论（第2页）

第一计算机化自适应测验理论基础项目反应理论（第2页）