日排行周排行月排行日推荐周推荐月推荐

笔下小说>计算机自适应技术>第一 计算机化自适应测验理论基础 项目反应理论

第一 计算机化自适应测验理论基础 项目反应理论(第2页)

1。基于离差模式的多级评分IRT模型

离差模式中,被试得T分的概率表现为两个累积概率(CumulativeProbability)的离差,如Samejima(1968)的等级反应模型(GRM)属于离差模式。

在GRM中,被试得T分的概率被定义为被试得T分及T分以上的概率减去被试得T+1分及T+1分以上的概率,即

其中

bjt指被试在项目j上得T分的难度。显然GRM中,如果项目j满分值为mj,则该项目有mj个难度值。比如mj=3时,则该项目有3个难度,分别为得1分的难度bj1,得2分的难度bj2和得3分的难度bj3。GRM中的难度参数满足

即被试得越高分的难度是越大的,难度是单调递增的。

为了保证概率P(Xij=t)不为负,GRM限定

即被试得0分及0分以上的概率为1,以及限定

即被试得(满分+1)分以上的概率为0。这时,GRM满足

当mj=1时,则由公式(2。1。5)和(2。1。6)可得

即当项目满分为1分(或项目为二级评分)时,GRM可以简化为2PLM,也就是说2PLM是GRM的一个特例。

与Logistic模型一样,GRM也可在二维坐标轴上描述不同能力被试在项目各个分数上的概率曲线,即运算特征曲线(CharacteristicCurve,OCC),如图2-1-2所示。

图2-1-2是一个满分为3分的项目,被试在该项目上的得分有四种类型,即T=0、1、2和3分。图2-1-2可知,能力越高的被试得0分的概率越低,而得满分3分的概率越高;能力越低的被试得0分的概率越高,得满分3分的概率越低;而对于中间段能力的被试,得2分和3分的概率倾向越高。

图2-1-2等级反应模型的运算特征曲线(OCC)

2。基于除总模式的多级评分IRT模型

除总模式中,被试得T分的概率被定义为部分除以总体的关系,如Masters(1982)的分部评分模型(PCM)属于除总模式。在PCM中,被试得T分的概率表现为部分与整体的比值,即

第一步,7。50。3=25

………1分

第二步,25-16=9

………2分

用δjt来表示项目第T步的难度,记住δjt的含义与GRM中的bjt的含义不同,bjt指得T分的难度。PCM中,δjt不一定满足单调递增性,因为有的项目第一步非常难,而最后一步可能非常容易,因此PCM强调的是项目每个步骤的难度,而GRM强调的是被试得各个分数的难度(满足bj1≤bj2≤bj3≤…≤bjmj),图2-1-3和图2-1-4为两个模型难度的区别。

图2-1-3分步评分模型PCM项目步难度(ItemStepDifficulties)参数

图2-1-4等级反应模型GRM项目难度(ItemDifficulties)参数

记被试从第(t-1)步正确跳到第T步的概率为Φ(t),记被试得T分的概率为P(t),则有

即被试答对第T步的概率Φ(t)只受到被试能力θ和项目第T步的难度δjt影响,而与其他步骤的难度δjk(k≠t)无关。

则根据公式(2。1。13)可得

求解上式方程组,可分别求解出P(0)、P(1)、P(2)和P(3)的数学表达式,即

上式即为分部评分模型的项目反应函数,同时限定∑0v=0(θ-δjv)≡0。

需要指出的是,分部评分模型只考虑了项目难度参数对被试反应概率的影响,并没有考虑区分度在项目反应过程的作用。鉴此,Muraki(1992)对分部评分模型进行拓广,把项目区分度也加入项目反应函数中,提出了拓广分部评分模型(GPCM),GPCM项目反应函数为

书友推荐:可怜的社畜掌握催眠之力后的淫乱生活人生如局回归之美母俏姐美母如烟,全球首富签到十年,我成圣了被健身房教练秘密调教后妈妈的欲臀(重生之我的美艳教师妈妈)婚后心动:凌总追妻有点甜女神攻略调教手册吾弟大秦第一纨绔两小无猜端庄美艳教师妈妈的沉沦无绿修改版配种(1V1,SC)娱乐圈之风流帝王亮剑:开局拿下鬼子据点房客(糙汉H)租赁系统:我被女神们哄抢!仙子的修行·美人篇红颜政道
书友收藏:斗破苍穹之后宫黑人恶堕推母之道宗主母亲与巨根儿子的淫乱性事重生之娱乐圈大导演娱乐圈的无耻统治者豪乳老师刘艳熟女记父债子偿重生少年猎美肥宅肏穿斗罗大陆女神攻略调教手册无限之生化崛起众香国,家族后宫被我催眠的一家人(无绿修改版)蛊真人之邪淫魔尊美母如烟,全球首富巨根正太和家族美熟女我丰乳肥臀的瑜伽教练母亲和保守的翘臀长腿女友被得到催眠APP的猥琐大叔调教成了专属肉便器影综:人生重开模拟器智娶美母