您的位置: 专家智库 > >

教育部“新世纪优秀人才支持计划”(NCET-07-0097)

作品数:16 被引量:172H指数:9
相关作者:辛涛陈平张淑梅李珍田伟更多>>
相关机构:北京师范大学四川师范大学江西理工大学更多>>
发文基金:教育部“新世纪优秀人才支持计划”国家自然科学基金教育部人文社会科学重点研究基地度重大研究项目更多>>
相关领域:哲学宗教文化科学理学自动化与计算机技术更多>>

文献类型

  • 16篇中文期刊文章

领域

  • 9篇哲学宗教
  • 5篇文化科学
  • 2篇理学
  • 1篇自动化与计算...

主题

  • 4篇计算机
  • 3篇自适
  • 3篇自适应
  • 3篇计算机化
  • 3篇计算机化自适...
  • 2篇等级反应模型
  • 2篇缺失数据
  • 2篇教育
  • 2篇Q矩阵
  • 2篇RSM
  • 2篇测验
  • 1篇等值
  • 1篇新课程背景
  • 1篇信度
  • 1篇学成
  • 1篇知识
  • 1篇知识状态
  • 1篇数学
  • 1篇数学成绩
  • 1篇题库

机构

  • 16篇北京师范大学
  • 2篇四川师范大学
  • 1篇江西理工大学

作者

  • 16篇辛涛
  • 4篇陈平
  • 3篇李珍
  • 3篇张淑梅
  • 2篇田伟
  • 2篇高慧健
  • 2篇毛秀珍
  • 2篇邹舟
  • 2篇孙佳楠
  • 1篇汪金晖
  • 1篇李峰
  • 1篇王烨辉
  • 1篇黄慧静
  • 1篇包钰
  • 1篇曾莉
  • 1篇李凌艳
  • 1篇谢敏

传媒

  • 4篇心理学报
  • 2篇心理科学
  • 2篇北京师范大学...
  • 2篇心理发展与教...
  • 1篇北京师范大学...
  • 1篇应用概率统计
  • 1篇清华大学教育...
  • 1篇心理科学进展
  • 1篇心理与行为研...
  • 1篇教育学报

年份

  • 2篇2012
  • 10篇2011
  • 4篇2010
16 条 记 录,以下是 1-10
排序方式:
认知诊断CAT中选题策略的改进被引量:7
2011年
计算机化自适应测验(CAT)的选题策略是影响测量准确性的主要因素之一.针对认知诊断CAT初期知识状态估计不准确的问题,改进后验加权Kullback-Leibler信息量,得到了2种平均后验加权Kullback-Leibler信息量选题指标.然后运用DINA(the deterministic inputs,noisy"and"gate)模型模拟作答反应,在不同测验长度下比较了6种选题策略的优劣.结果表明,新指标能极大地提高测量准确度,当测验长度为15时,知识状态的判准率提高了10%以上;除随机方法外,其他方法的项目曝光率没有明显差异.
毛秀珍辛涛
关键词:计算机化自适应测验
新课程背景下的课程测量:框架与途径被引量:7
2010年
课程测量是进行课程评价的前提与基础之一,但由于课程体系自身的复杂性及诸多特点,使得对其量化比较困难。在借鉴国外课程量化研究方法与成果的基础上,结合我国课程体系的自身特点,通过对课程的分层研究与分析,初步建立了我国课程量化的框架和指标体系。框架确立了以课程标准、教材、教师和校长分别作为课程目标、潜在的实施课程与实施课程三个层面的量化点,以学生知识、情感、态度、价值观为整个课程系统的效标,并确定了各个指标对应的量化途径与方法。通过对课程的量化,保证了课程评价的科学性,能为课程改革、教育决策等提供更多的有力依据。
辛涛王烨辉李凌艳
关键词:课程评价
教育结果公平的测量及其对基础教育发展的启示被引量:13
2010年
基础教育质量均衡发展是教育公平的最终体现,如何对教育质量公平状况进行科学测量是教育研究中需要解决的一个问题。教育结果公平的测量起源于经济领域,常用的方法有计算绝对差异量数、相对差异量数以及对相对差异量数进行分解,其中核心的方法是相对差异量数分解,它深刻反映教育的不同侧面对教育结果的影响。本文以实际数据为例计算了这三种统计指标,结果表明,学生个体差异是造成教育结果不公平现象的主要原因。
辛涛田伟邹舟
关键词:教育结果公平GINI系数
2PL模型的EM缺失数据处理方法研究被引量:6
2011年
项目反应理论(IRT)模型是教育统计与测量中一种十分重要的模型,它包含项目参数和能力参数.目前一种常用的估计IRT模型项目参数的方法是由Woodruff和Hanson(1997)应用EM算法给出的,它用于完全反应数据,而把能力参数看作缺失数据.本文将Woodruff的方法推广到处理缺失反应的情况,基本思想是把能力参数和缺失反应均看作缺失数据,再运用EM算法估计参数.通过模拟研究,在不同被试人数和不同缺失比例的情况下,本文比较了我们给出的方法和BILOG-MG软件的缺失数据处理方法的参数估计效果.结果表明,在大多数情况下,本文提出的方法能得到更好的估计.
张淑梅辛涛曾莉孙佳楠
关键词:项目反应理论缺失数据EM算法
矩阵取样设计中的似真值能力估计方法被引量:2
2012年
矩阵取样是大规模教育评估中最有效的一种数据收集方式。本研究采用模拟数据考察在均衡的不完全分块(BIB)矩阵取样设计中,似真值(PV)与传统的MLE、WLE和EAP方法对学生能力总体参数估计的精确性和稳健性。结果表明,PV对总体平均数和标准差的估计最为精确和稳健;EAP倾向于低估,MLE和WLE倾向于高估,且精确性和稳健性远远不如PV。同时,总被试量对估计结果的影响很小,而每个题本中的项目数量对估计结果的影响较大。
黄慧静辛涛李珍
认知诊断计算机化自适应测验中的项目增补被引量:26
2011年
项目的增补对认知诊断计算机化自适应测验(CD-CAT)题库的开发与维护至关重要。借鉴单维项目反应理论(IRT)中联合极大似然估计方法(JMLE)的思路,提出联合估计算法(JEA),仅依赖被试在旧题和新题上的作答反应联合地、自动地估计新题的属性向量和新题的项目参数。研究结果表明:当项目参数相对较小且样本量相对较大时,JEA算法在新题属性向量和新题项目参数估计精度方面表现不错;而且样本大小、项目参数大小以及项目参数初值都影响着JEA算法的表现。
陈平辛涛
计算机化自适应测验选题策略述评被引量:21
2011年
计算机化自适应测验(computerized adaptive testing,CAT)是基于测量理论和计算机技术的一种测验模式。它根据考生的作答反应自适应地选择测验项目。选题策略是CAT的重要组成部分之一,关系到测量效率、测验安全和测验信、效度等重要问题。根据CAT是否具有非统计约束对传统CAT和认知诊断CAT的选题策略进行了分类介绍,未来研究应进一步提高选题策略的综合表现、深入探讨多级评分项目和认知诊断CAT的选题策略。
毛秀珍辛涛
关键词:计算机化自适应测验
认知诊断计算机化自适应测验中在线标定方法的开发被引量:27
2011年
项目增补对认知诊断计算机化自适应测验(CD-CAT)中的题库维护至关重要。在传统CAT中,在线标定方法经常用于估计新题的项目参数。然而直到现在,在CD-CAT领域还没有任何关于在线标定的论文公开发表。为将传统CAT中3种有代表性的在线标定方法(MethodA、OEM和MEM)推广至CD-CAT(CD-MethodA、CD-OEM和CD-MEM)建立分析基础,并采用模拟方法对这3种方法进行比较。研究表明:CD-MethodA方法在项目参数的返真性方面优于其它两种方法;自适应标定设计较随机标定设计可以提高项目参数的返真质量。
陈平辛涛
关键词:计算机化自适应测验
缺失数据下等级反应模型参数MCMC估计被引量:4
2011年
项目反应理论(IRT)是教育测量中的重要模型.在被试的项目反应存在缺失的情况下,曾莉等给出了0、1评分的IRT模型参数估计的2种MCMC算法.本文将这2种算法推广到等级反应模型(GRM),并将估计结果与传统的Multilog软件(将缺失统一替换为0)的估计结果进行比较.通过模拟研究,比较了在不同缺失机制、不同参数先验分布、不同被试人数和不同缺失比例下2种MCMC参数估计的结果,为实际应用中GRM的参数估计方法的选择提供参考.
汪金晖张淑梅辛涛
关键词:等级反应模型缺失数据GIBBS抽样
标准参照测验决策一致性指标研究的总结与展望被引量:9
2011年
决策一致性指考生在两次平行测验中被一致归类的程度,是衡量标准参照测验质量的重要指标。到目前为止,基于经典测量模型和项目反应模型,研究者已经提出了数十种估计决策一致性指标的方法,并对这些方法的优劣进行了比较。由于模型基础和对分数分布的假设不同,各种方法适用于不同的测验情境。未来的研究应当对已有方法进行验证,并探讨决策一致性在教育测量中的应用途径,为教育和心理测量工作者估计测验的决策一致性指标提供凭据。
陈平李珍辛涛高慧健
关键词:信度
共2页<12>
聚类工具0