日排行周排行月排行日推荐周推荐月推荐

笔下小说>计算机自适应技术>第二 计算机化测验

第二 计算机化测验(第1页)

第二节计算机化测验

计算机化测验指的是以计算机为平台,向考生呈现考题的形式。计算机化测验有广义与狭义之分:广义的计算机化测验叫作基于计算机的测验(puter-BasedTesting,CBT),狭义的计算机化测验叫作计算机化自适应测验(CAT)。CBT包括所有以计算机为呈现平台的测验,例如,把纸笔测验的内容直接转化为计算机呈现,那么它就是一种计算机化测验。但是显然这样简单照搬纸笔测验内容的计算机化测验只是单纯的考试平台变化,不具备自适应的智能化特点。与此不同的是,CAT不仅有测验平台的变化,还包括在第一部分描述的自适应特点(不同初始题、自动终止等),因此成为目前最受欢迎的测验形式之一,也是本书的研究对象。在这一部分中,我们将简要地描述CBT的发展与特点,为以后各章提供一些背景信息。

信息技术的蓬勃发展给现代社会带来了深刻的影响。心理测量领域也被打上了现代信息技术的烙印,正在经历一场技术革命。心理测量的任务是在有关的量尺上给出测量对象的准确位置。这个任务非常复杂,需要耗费大量的人力与物力。现代电脑信息技术可以大幅提高测量中的工作效率,甚至使原来不可想象的任务变得轻松简单。一个简单的例子就是使心理测量可以变得快捷。由于计算机计算能力的大幅提升,它可以轻松地实施测验,包括呈现考题、收集作答、自动评分等,考生在信息化时代已经可以马上得到考试成绩甚至有关的诊断报告。

计算机信息化的巨大变化至少可以体现在两个方面。第一,计算能力的巨大提高。现在,一台个人计算机或平板电脑、智能手机等小型手持设备的计算能力已经远远超过20世纪的大型主机。著名的EroegratorAndCalcula)可以占据一个很大的房间,可是它的计算能力却比不上一台普通的台式个人电脑。而更令人诧异的是,由于云计算的发展,在网络的帮助下,普通的智能手机或平板电脑也具有实施教育测量的能力。第二,各种个人计算机与简易手持设备的大量普及。计算机发展的早年,它以大型主机(Mainframe)的形式存在,是只有大型研究机构和企业才能负担的“奢侈品”。但是,目前个人计算机已经非常普及,甚至已经慢慢被更加便捷的智能手机与平板电脑取代,成为非常普通的日常消费品。

信息技术的革命性变革也不可避免地带来了心理教育测量的变革。早在个人计算机出现的初期,研究者就开始注重这些技术在测量中的应用。计算机化测验的研究始于20世纪70年代。自20世纪80年代以来,陆续诞生了一批大型计算机化测验的实际考试项目,包括美国士兵职业倾向成套测验(ArmedServicesVoalAptitudeBattery,ASVAB),美国教育考试服务中心(EdualTestiS)的研究生入学考试(GraduateReiheTestofEnglishasaFuage,TOEFL)等。目前各种基于计算机技术的测验已经在教育、职业资格考试中大量涌现。计算机化测验已成为测量领域不可忽视的一个潮流。有关的研究者已经建立了一个专门的国际性组织——国际计算机自适应测试协会(IionalAssoputerizedAdaptiveTesting,IACAT),定期举办学术年会。

本节将借鉴Bunderson等人(1988)提出的计算机化测验发展阶段划分框架,系统梳理计算化测验的发展脉络,提供一个完整的历史视角。他们根据心理教育测量与计算机系统的重要特征,提出了一个计算机化考试测评的分类标准,在此基础上区分出了四代计算机化测验技术:

计算机化测验(puterizedTesting);

计算机化自适应测验(CAT);

连续测量(easurement,CM);

智能测量(IMeasurement,IM)。

下面我们会详细描述他们提出的划分标准,然后介绍四代计算机化测验系统的特点。详细介绍划分标准的原因是,计算机信息化技术日新月异,给计算机测验系统的变革带来了太多的可能性,对计算机化测验系统的描述也有可能很快过时,而划分的标准具有跨时间的稳定性,是心理教育测量研究者需要掌握的重要工具。例如,Bunderson等人描绘的四代计算机测验系统在今天看来仍然具有很强的借鉴意义,但是具体系统的描述已经显得内容陈旧,因为在心理教育测量与计算机信息化技术两个方面也都发生了重大的变革。只有掌握了这种划分的思维方式,才能更加准确地把握计算机化测验系统发展的脉搏与趋势。

一、划分标准

这个框架是由计算机化测评在测量与计算机系统在不同维度上的特点确定的。本部分详细地描述了这些维度,是了解计算机化测验系统的重要背景信息。

(一)教育测量的主要特征

教育测量可以定义为在规定的条件下,为达成某个教育目的,而为某些个体、情境或者事件确定在某个量尺上的位置的过程。这个具体定义的作用是提供了一个描述测量的六个要素:教育测量过程、确定位置、测量目的、测量对象(个体、情境与事件)、教育相关的量尺、规定的条件。

1。教育测量过程

教育测量是一个过程,这个过程又包含了多个并行同步或者前后相继的几个子过程。主要的过程有:①测量工具的研发,具体有制定测试蓝图、编写试题、预试与组卷;②考试实施,包括获取作答、评分、报告成绩、解读结果等;③考试分析与研究,包括等值、效度研究、项目功能差异(Differeioning,DIF)等。计算机技术已经对这三个过程都产生了巨大的影响。

2。确定位置

测量的任务是在一个教育相关的量尺上为测量对象确定一个恰当的位置。这个确定的过程可以是静态的,只涉及测量对象在某个时间点的位置;也可以是动态的,确定测量对象在多个时间点的变化情况。监测某个省某个学校学生在某个时间点的总体学业水平就是一种静态测量;而测量学生在接受某个教学计划前后的学业成就变化就是一种动态测量。第一、二代计算机化考试是静态测量,第三、四代计算机化考试属于动态测量。

3。测量目的

长久以来,教育测量的目的是提供一个团体或者个体在某个教育相关的量尺上的相对位置,帮助教育决策,因此教育测量的主要服务对象是机构。教育机构利用教育测量的结果来提高录取分班的准确性,评估教育目标的达成情况,评价教师、教育项目以及组织的效率,用来激励学生。

个体也是教育测量的服务对象之一,包括基于测量结果的指导与治疗、监控个体的进步情况,支持教学决策。但是正式的测量还是过于昂贵,一般只能用于选拔等重大的决策中,个人服务仍然处于次要的地位,而提供个人服务的测验大多是非正式与非标准化的。因此,教育领域对成本低的、服务于个体的新型测量有较大的需求。除了指导与治疗,教育测量还可以用于描绘学习的成长曲线:它可以详细描述学习问题的程度与变化,为及时地干预教学提供信息;也可以用于指导解读学生的状况,提供建设性的意见。教育测量在监控、描述与解读学生进展中的功能与教学紧密相关,因此教学活动可以与测量紧密结合,包括教学内容的选择与顺序、学习中的教学指导方法、选择个性化的练习题等。测量的服务重点从机构到个人的转变是第一、二代与第三、四代计算机化考试的重大区别。而这个区别也与从静态测量到动态测量的转变息息相关。

4。测量对象(个体、情境与事件)

测量的对象包括个体、情境与事件。在社会科学中,行为往往被看作个体与情境交互的结果;教育事件(如学习)也可以用同样的视角来看待,它是能力水平与教学计划交互的结果。在第一、二代计算机化考试中,标准化的任务情境是标准化试题。观察到的行为一般是考生正确作答与否;更复杂的考题会给出多个等级的分数。在第三、四代计算机化考试中,情境任务会更加复杂多样,更加接近现实生活。

计算机技术的变革对测量对象产生了重大的影响。第一,原本非常耗时费力成本高昂的测量大大降低了成本。例如,需要一对一施测的智力测验可以通过计算机施测,并且不需要专家的指导。原来需要人工模拟的任务在计算机上施测后,可以不需要耗费高昂的人工成本,因此可以更加普遍的施测,从而获得考生的学习曲线。第二,实现了很多原来不可能实施的测验。例如,心理能力时间的度量。在传统的考试中,个体的几何图形空间旋转速度是无法测量的,但是在计算机施测中,我们可以通过记录有关的时间来进行有关的测量。

5。教育相关的量尺

教育测量中首先需要确定人们关心的测量内容,它们指的是理论构念(structs)等。在实施教育测量之前,需要确定这些重要的理论构念,如智力、数学能力等。

6。规定的条件

规定的条件指的是测量发生的条件。条件的差异会导致测量结果与解读的差异。如果测量条件能够被控制,那么我们就可以称之为“标准化”的。在标准化的条件下,测量结果的外部影响被严格控制,因此测量的结果是可重复的。四代计算机化考试在控制条件中存在一定的差异,但是比较理想的标准化测试,保证了多次测量之间、不同测试对象之间的可比性。

(二)计算机施测系统

计算机化考试不仅仅需要先进的理论来构造构念,需要测量理论与技术来保证测量的可靠性与科学性,而且还需要现代信息技术来收集处理报告测量中的信息。下面我们会简略描述计算机化考试中涉及的信息技术。计算机化考试中的计算机信息技术总称为“计算机施测系统(puterizedMeasuringSystem)”,它涵盖了硬件、软件、考试系统与测量、教学中需要的专家。现只对硬件和软件做简要说明。

硬件。一个独立工作站的硬件包括:可与外部网络连接的电脑、足够大的内存、存储系统、输入设备、显示设备、打印设备、与中心站点联络的设备。目前信息技术高度发达,智能手机与平板电脑已经能够满足这些硬件的要求。

软件。硬件必须与软件结合才能发挥作用。施测系统的软件要求包括操作系统(用于分配系统资源,提高施测系统效率)与应用软件(测试系统,用于施测、评分、记录、汇报成绩,甚至进行结果解读)。软件是指挥施测系统的“智能中心”,发挥着至关重要的作用。计算机化测试的软件有了长足的进步,能够实现多种不同的计算机化测试与计算机化自适应测验。为了适应计算机化自适应测验的需要,新的在线标定系统也陆续诞生了。软件最重大的发展是人工智能的发展,在教育测评中具体表现为知识库计算(Knouting)。它是大数据挖掘的重要技术之一,为第四代智能化测评提供了可能。

书友推荐:一屋暗灯迟音(1v1)小欢喜之群芳乱欲我的道家仙子美母吾弟大秦第一纨绔可怜的社畜债务偿还系统伏特加与曼特宁神豪的后宫日常配种(1V1,SC)戏里戏外(1v1)H斗罗大陆之催眠武魂仙子的修行·美人篇婚后心动:凌总追妻有点甜重生之娱乐圈大导演娱乐圈的曹贼娱乐圈的不正常系统(修正版)端庄美艳教师妈妈的沉沦无绿修改版房客(糙汉H)影视大世界之美女如云
书友收藏:女神攻略调教手册韵母攻略冷艳美母是我的丝袜性奴租赁系统:我被女神们哄抢!娱乐圈的无耻统治者蛊真人之邪淫魔尊我的教授母亲(高冷女教授)我丰乳肥臀的瑜伽教练母亲和保守的翘臀长腿女友被得到催眠APP的猥琐大叔调教成了专属肉便器邪恶小正太的熟女征服之旅妈妈又生气了斗罗大陆之极限后宫(无绿改)无限之邪恶系统掌中的美母娱乐圈的不正常系统(修正版)众香国,家族后宫人妻调教系统随心所欲神豪系统赛博经纪人我的冷艳教师美母和明星校花女友变成同学们的性奴竟是一个熊孩子的策划四合院之啪啪成首富