日排行周排行月排行日推荐周推荐月推荐

第一 双因子IRT模型简介(第1页)

第一节双因子IRT模型简介

尽管项目反应理论(IRT)实现了对被试潜在特质的精确估计,提高了测量的效率,解决了CTT模型的不足,但传统的单维IRT理论也存在一定的不足。传统的IRT模型对测量变量的维度有所限制,模型一般会假设欲测量的心理特质是单维的,但实际上大量研究表明,这种假设在一些情况下是难以保证的,在数据不满足单维的条件下,强行使用单维的模型,可能会造成很大的测量误差,这种误差不仅在使用IRT模型的纸质测验中存在,在CAT中也同样存在。Folk和Green(1989)把单维模型用在了两维数据上,比较了这种模型误用对CAT测验和传统测验造成的影响。结果表明:当次要因子对测验的影响不显著时,传统测验下可以通过假设测验单维,从而采用单维模型;两个潜在维度不相关,且都对数据有显著的影响,使用任何一个维度的参数,均会引起特质参数估计的巨大差异;将单维模型用于多维数据引起的偏差在CAT上更加明显,因为单维模型的参数不仅会用于选题过程中,还会用来进行特质水平估计。因此,建立被试反应与多种能力及项目特征之间的多维项目反应理论(MIRT)模型成了IRT近40年来研究较为活跃的领域之一(杜文久,肖涵敏,2012)。

正是基于上述的现状,在过去的几十年时间中,许多测量学研究者已经将IRT理论从单维的模型扩展到了多维的模型,并逐渐形成了多维项目反应理论。例如,Bo(1981)基于以往的研究,将EM算法(EMAlgorithm)扩展到了多维情况中,形成了全息项目因素分析(FIIFA)的雏形。在接下来的研究中,Bouraki(1988)在Bo的研究基础上正式地提出了全息项目因素分析的方法,从而将IRT模型扩展到了多维的数据中。与以往的基于单维的IRT模型不同的是,在MIRT模型下,对于被试的潜在特质定位并不是在一个一维的连续体上进行的,而是在多维的空间中进行的(ReIRT能同时估计被试在测验每个维度上的能力水平,实现测验的认知诊断功能;另一方面,MIRT比项目反应理论更适用于分析许多新形式的测验,如认知诊断测验、公务员考试、表现性评估以及写作测验的项目和被试特征(毛秀珍,辛涛,2015)。

虽然多维IRT能够实现对多个维度的测量与评估,但在维度之间存在相关时,人们除了希望了解被试在各个维度上的潜在特质上的水平外,还希望获得对被试整体水平的评估,在这种情况下,如果同时考虑所有维度的信息,就可能会使得测验的估计精度下降。为了解决这个问题,可以采用双因子模型拟合数据,在这个基础上,Gibbons等人进行了一系列的研究,并提出了全息项目双因子分析(Full-InformatioorAnalysis,FIIBFA),用以解决二值计分、多级计分的双因子数据的参数估计问题(Gibbons&Hedeker,1992)。全息项目双因子分析将传统的因素分析与项目反应理论相结合,分析所采用的模型可以看成一种多维的IRT模型,或是多维IRT模型的一个特例。

与传统MCAT相比,基于双因子模型开发的计算机自适应测验(BifaputerizedAdaptiveTesting,BCAT)具有一些天然优势:双因子IRT模型通过一般因素和特殊因素的设定,使得待估计参数大大减少,在一定程度上降低了参数估计的难度;同时由于模型本身的特点,不仅可以得到被试在某一具体维度上的表现,同时还能够获取被试在欲测心理品质上的总体水平。但是总体看来,目前对双因子IRT以及双因子CAT的研究还非常薄弱,当前研究主要是集中在模型的构建以及参数估计方面,部分的研究将双因子IRT的模型用到了CAT中,但这些研究大多是从单维视角来进行的,即一般因素和特殊因素的选题过程及其特质参数估计是分开进行,而不是同时考虑多个维度的信息选题和估计,从这个角度上来看,这一类的双因子CAT并不算是完全意义上的多维CAT。

一、基于探索性因素分析模型的研究现状

传统的项目因素分析方法是基于经典线性因素分析(ClassiearFaalysis,CLFA)进行的,在这种模型下,是从观测变量间的线性相关矩阵或协方差矩阵出发来进行因素分析的。但是这种方法存在的问题是,当“项目—特质”回归线不一致,也就是难度、猜测度等项目参数不一致时,会产生虚假因素、高估维度数、低估因子负荷(俞宗火,戴海琦,唐小娟,2006)。但在实际的心理测验中,项目的难度不一致,往往是一个不可避免的问题,在线性因素分析方法下,可能会产生虚假因素,即使能够估计出恰当的因素,也会导致有偏的因子载荷;除此之外,基于经典线性因素分析在对数据的使用方面也存在不足,由于只采用相关矩阵或协方差矩阵,并没有充分使用到被试的所有作答数据信息,因此,数据信息使用不充分。

针对经典线性因素分析中存在的不足,Bouraki(1988)在前人研究的基础上详细论述了一种基于IRT的题目因素分析方法,即前文提到的全息项目因素分析,这种方法是一种非线性的因素分析,相较于经典线性因素分析,这种方法的优势体现在以下三点。

第一,不需要计算题目之间的相关系数,并且不会受到题目数量的影响。

第二,作为一种非线性的因素分析方法,更符合心理研究中的实际数据非线性的情况。

第三,直接采用被试的作答结果进行估计,因此充分运用了被试作答的所有数据信息。

Bo(1981)在其论文中,根据Thurstoiple-Factor)模型,假设,存在一个由m个因素组成的模型,即

Xji:表示的是一种没办法观测到的“反应过程”,也就是被试j在做第i题的过程中所需要的各种主要能力或潜在特质相互作用的过程;

θjk:表示的是被试j的第k种能力或是第k中潜在特质;

λik:表示的是第i题在第k种能力或是第k种潜在特质上的因子载荷;

εji:表示不能观测到的随机变量,服从正态分布均值为0,方差为σ2i的正态分布。

公式(8。1。1)反映的是一个补偿型的模型,即在一个维度上有较高的特质水平,能够对其他的特质水平低的维度起到补偿的作用。除了补偿型的模型,还有其他的模型。例如,存在交互作用的模型等,具体可以查阅文献。

根据上面的模型,可以得到二级计分题目的FIIFA模型。被试j答对第i题的概率为

其中τi是第i题的阈限。

这里以二级计分的题目作答为例,当Xji≥τi时,被试j在第i题上做出正确作答,记为uji=1;而当Xji<τi时,被试j在第i题上出现错误作答,记为uji=0。

σ2i的计算分两种情况:

如果特质不相关,则

如果特质相关,则

为了简化似然函数的表达式,可以将反应函数中的载荷和阈限转换为截距和斜率,即

根据公式(8。1。5),全息项目因素分析模型下的因子载荷(λi)和阈限值(τi)与两参数Logistic(2PL)模型下的区分度参数(ai)和截距参数(di)就被关联起来了,两套参数之间可以相互转化,以二级计分的数据为例,即

其中

因为在FIIFA模型中参数计算相对复杂一些,因此在一些实际应用中,会计算IRT模型下的ai参数和di参数,从而能够获得全息项目因素分析模型下的λi参数和τi参数。

相较于国内的研究,国外对FIIFA模型的研究要更多也更早一些。Bo(1981)最早对全息项目因素分析模型进行了描述。他们采用的数据为二值计分的数据,构建了全息项目因素分析的模型。除此之外,他们还探索和比较了极大似然估计、最大后验估计和期望后验估计三种估计潜在特质水平的方法。这个研究算是此类研究中比较早的种子研究,Bock和Mislevy(1982)也进行了后续的研究,并且表明了相对于其的估计方法——期望后验估计具有更好的特性。Muraki和Engelhard(1985)介绍了EAP算法在全息项目因素分析中的应用,并将全息项目因素分析用到了美国士兵职业倾向成套测验中(ArmedServicesVoalAptitudeBattery,ASVAB);Bouraki(1988)也进行了扩展性的研究,在他们的研究中,研究者采用了边际极大似然估计和EM算法并实现了该模型,丰富和扩展了全息项目因素分析模型。当然有关全息项目因素分析模型研究还不止于此。

国内也有学者对这个领域展开了探索。例如,王权和李金波(2002)就对全息项目因素分析模型进行了比较全面的介绍,从数学模型到相应的参数估计方法都有所涉及。除了王权以外,俞宗火等人也对这个模型进行了简要的介绍,并就其在心理学中的应用提出了一些思路。例如,在其后续的研究中,以EPQ为例,比较了传统法的经典线性因素分析和全息项目因素分析,为全息项目因素分析在心理学研究中的应用提供了实证支持(俞宗火,戴海琦,2005)。

书友推荐:美母如烟,全球首富婚后心动:凌总追妻有点甜在言情文里撩直男男主【快穿/np】债务偿还系统一屋暗灯人间政道回归之美母俏姐被健身房教练秘密调教后迟音(1v1)我的教授母亲(高冷女教授)长安春亮剑:开局拿下鬼子据点全家桶书记妈妈倪楠斗罗大陆之催眠武魂配种(1V1,SC)催眠系统让我把高冷老师变成性奴肉便器小欢喜之群芳乱欲母上攻略续(白虎版)可怜的社畜
书友收藏:租赁系统:我被女神们哄抢!韵母攻略端庄美艳教师妈妈的沉沦无绿修改版神豪的后宫日常带着美艳医母闯末世赛博经纪人巨根正太和家族美熟女女神攻略调教手册恶魔大导演妈妈陪读又陪睡穿越影视万界之征服推母之道影视大世界之美女如云仙子的修行重生少年猎美智娶美母我的道家仙子美母冷艳美母是我的丝袜性奴美母的信念熟女记