基于题目属性与文本的试题难度预测研究

来源 :江西财经大学 | 被引量 : 0次 | 上传用户:angelcaoxian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于选拔性考试受到社会的广泛关注,对试题难度的调控的研究有着非常重要的意义。本文以数学试题为例,对某省市某重要选拔性测验数据采用项目反应理论估计试题的难度参数。考虑到不同测验由不同被测者组成,导致不同测验估计的题目难度不具可比性,本文通过等值实验设计,将所有测验合并建立题库矩阵,把所有不同测验形式上的分数都转换到同一个分数量表上,达到统一评价的目的。本文采用人工编码,从试题中分离出18个题目属性。从基础-发展、题型、知识、能力四个维度出发,经t检验筛选得到对试题难度有显著影响的题目属性9个,分别是基础-发展、题型、算法、数列、运算求解、数据处理、抽象概括、分析与解决问题、推理论证与创新能力。基于提取的题目属性、33个文本词向量、66个文本词向量及题目属性与文本词向量结合为自变量提出多元线性回归模型,为降低过拟合风险进一步提出支持向量回归模型,通过惩罚函数来降低模型复杂度已达到解决过拟合的问题。实证发现,基于题目属性与33个文本词向量的支持向量机模型较优。其在测试集上有更小的均方误差,且模型拟合良好。另外,由于难度本身就是一个模糊的概念,因此将试题难度由易到难划分为4个等级,分别对题目及答案文本和题目属性采用支持向量机对其难度等级进行分类。结果表明,两种预测模型中,基于题目属性的支持向量机模型预测的准确率较高,为75%。也证实了用支持向量机预测试题难度等级的可行性。
其他文献
现代编辑出版的工匠精神可以概括为胸怀理想、爱岗敬业,一丝不苟、认真负责,注重细节、追求完美,精益求精、奉献精品。中国编辑出版历史和实践中彰显了工匠精神,工匠精神也映
唐朝作为史上最为开放的时代,在文化交流和碰撞中,中国的音乐、诗歌文化呈现出一派欣欣向荣的景象。音乐中的笛跨越了演奏的范围,在诗歌中频频出现。在唐诗中,笛的身影随处可
斑须蝽广泛分布于我国和其它古北区的各国,是多种农作物的害虫,以成虫滞育越冬,越冬成虫是翌年的虫源。因此研究斑须蝽发育历期和滞育的影响因素,对分析其种群动态、预测预报和综合防治有着重要意义。本文对斑须蝽内蒙古呼和浩特种群的发育历期、光周期和温度对滞育的影响等进行了研究,主要结果如下:1.对不同温度和光周期条件下的发育历期进行了观察对不同温度和光周期条件下的从卵到成虫的发育历期进行了观察。在温度20℃
以兰渝铁路大断面黄土隧道工程为背景,采用数值计算和模型试验对黄土围岩压力拱效应进行分析,可得结论:(1)由于荷载传递路线发生偏转,拱部围岩切向应力因承担径向传来的荷载
唐楷在总结前代楷书的基础上,经过从唐太宗开始的历代帝王的提倡和士大夫的广泛参与,得到了巨大的发展,成就了"尚法"的风尚,达到了时代的巅峰。梳理唐代楷书辉煌成就的背景因
硅藻土是以硅藻遗骸为主的一种生物沉积岩,是一种重要的非金属矿产,由于其特殊的结构构造,广泛应用于各行业。它的形成受古地理环境及岩浆活动等多方面因素的影响。长白地区
针对车辆燃油机燃用含氧燃料的燃烧、排放以及发动机适应性的问题,基于CFD软件建立了柴油机燃用柴油和B20D10(70%柴油+20%生物柴油+10%DMC)含氧燃料的数值仿真模型,计算了柴
无源雷达无需自配辐射源,仅靠间接地利用第三方发射的电磁波信号探测和识别目标,具有反隐能力强、系统成本低和易于部署等比较突出的优势,可极便利地组建多站无源雷达以提高
论文研究了无损信源编码中两个重要的问题 第一个问题是通用信源编码中的整数编码问题。论文分析了任意分布下Golomb码的性能,并在Golomb码的基础上构造了一类通用的扩展
<正>国有企业应该是也必须是一潭活水。这其中,薪酬这块"蛋糕"怎样切是关键。2018年5月25日,国务院发布了《关于改革国有企业工资决定机制的意见》,以此为契机,新一轮国企薪