日排行周排行月排行日推荐周推荐月推荐

笔下小说>计算机自适应测验原理>第一 计算机化自适应测验理论基础 项目反应理论

第一 计算机化自适应测验理论基础 项目反应理论(第2页)

1。基于离差模式的多级评分IRT模型

离差模式中,被试得T分的概率表现为两个累积概率(CumulativeProbability)的离差,如Samejima(1968)的等级反应模型(GRM)属于离差模式。

在GRM中,被试得T分的概率被定义为被试得T分及T分以上的概率减去被试得T+1分及T+1分以上的概率,即

其中

bjt指被试在项目j上得T分的难度。显然GRM中,如果项目j满分值为mj,则该项目有mj个难度值。比如mj=3时,则该项目有3个难度,分别为得1分的难度bj1,得2分的难度bj2和得3分的难度bj3。GRM中的难度参数满足

即被试得越高分的难度是越大的,难度是单调递增的。

为了保证概率P(Xij=t)不为负,GRM限定

即被试得0分及0分以上的概率为1,以及限定

即被试得(满分+1)分以上的概率为0。这时,GRM满足

当mj=1时,则由公式(2。1。5)和(2。1。6)可得

即当项目满分为1分(或项目为二级评分)时,GRM可以简化为2PLM,也就是说2PLM是GRM的一个特例。

与Logistic模型一样,GRM也可在二维坐标轴上描述不同能力被试在项目各个分数上的概率曲线,即运算特征曲线(CharacteristicCurve,OCC),如图2-1-2所示。

图2-1-2是一个满分为3分的项目,被试在该项目上的得分有四种类型,即T=0、1、2和3分。图2-1-2可知,能力越高的被试得0分的概率越低,而得满分3分的概率越高;能力越低的被试得0分的概率越高,得满分3分的概率越低;而对于中间段能力的被试,得2分和3分的概率倾向越高。

图2-1-2等级反应模型的运算特征曲线(OCC)

2。基于除总模式的多级评分IRT模型

除总模式中,被试得T分的概率被定义为部分除以总体的关系,如Masters(1982)的分部评分模型(PCM)属于除总模式。在PCM中,被试得T分的概率表现为部分与整体的比值,即

第一步,7。50。3=25

………1分

第二步,25-16=9

………2分

用δjt来表示项目第T步的难度,记住δjt的含义与GRM中的bjt的含义不同,bjt指得T分的难度。PCM中,δjt不一定满足单调递增性,因为有的项目第一步非常难,而最后一步可能非常容易,因此PCM强调的是项目每个步骤的难度,而GRM强调的是被试得各个分数的难度(满足bj1≤bj2≤bj3≤…≤bjmj),图2-1-3和图2-1-4为两个模型难度的区别。

图2-1-3分步评分模型PCM项目步难度(ItemStepDifficulties)参数

图2-1-4等级反应模型GRM项目难度(ItemDifficulties)参数

记被试从第(t-1)步正确跳到第T步的概率为Φ(t),记被试得T分的概率为P(t),则有

即被试答对第T步的概率Φ(t)只受到被试能力θ和项目第T步的难度δjt影响,而与其他步骤的难度δjk(k≠t)无关。

则根据公式(2。1。13)可得

求解上式方程组,可分别求解出P(0)、P(1)、P(2)和P(3)的数学表达式,即

上式即为分部评分模型的项目反应函数,同时限定∑0v=0(θ-δjv)≡0。

需要指出的是,分部评分模型只考虑了项目难度参数对被试反应概率的影响,并没有考虑区分度在项目反应过程的作用。鉴此,Muraki(1992)对分部评分模型进行拓广,把项目区分度也加入项目反应函数中,提出了拓广分部评分模型(GPCM),GPCM项目反应函数为

书友推荐:配种(1V1,SC)在言情文里撩直男男主【快穿/np】掌握催眠之力后的淫乱生活房客(糙汉H)回归之美母俏姐娱乐圈的不正常系统(修正版)妈妈的欲臀(重生之我的美艳教师妈妈)催眠系统让我把高冷老师变成性奴肉便器签到十年,我成圣了斗罗大陆之极限后宫(无绿改)仙子的修行·美人篇可怜的社畜端庄美艳教师妈妈的沉沦无绿修改版神女逍遥录神豪的后宫日常债务偿还系统被我催眠的一家人(无绿修改版)四方极爱后宫催眠日记韵母攻略
书友收藏:影综:人生重开模拟器高冷的丝袜女总裁妈妈被混混同学屈辱玩弄巨根正太和家族美熟女赛博经纪人仙子的修行叶辰风流(幻辰风流)原来,她们才是主角(加料版)端庄美艳教师妈妈的沉沦无绿修改版我的人渣指导系统(加料版)斗破之淫荡任务恶魔大导演美母的诱惑妈妈陪读又陪睡神豪的后宫日常影视大世界之美女如云智娶美母女神攻略调教手册韵母攻略带着美艳医母闯末世堕落的冷艳剑仙娘亲(大夏芳华)