一种新的分层自适应选题策略研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户：ssgriian

【摘要】

：

【作者】

：

刘霖戴经国袁辉勇

【出处】

：

电脑知识与技术

【发表日期】

：

2019年32期

【关键词】

：

自适应策略信息量随机抽样法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘要：当前，在线测评系统得到广泛应用，选题策略成为发挥系统效能的关键，传统的选题策略存在检验精度不够、试题曝光不均衡，题库安全性差等不足，论文提出一种新的自适应选题策略，先对题库进行基于难度的分区，区内再按区分度二次分层，建立相应选择量模型，通过反馈机制，选出信息量最大的试题。实验表明新策略在保证检测效能的前提下有效地降低了试卷重复率，保证了题库的安全性。
　　关键词：自适应策略;信息量;随机抽样法
　　中图分类号：TP393 文献标识码：A
　　文章编号：1009-3044（2019）32-0007-04
　　目前，计算机教学中广泛采用在线训练平台与个性化随机测试相结合。测试过程中，如何有效地进行试题选择成为考评检验学生学习效果的关键，然而传统的自适应试题生成策略存在着试题曝光率過高、试卷重复、检验效果不佳等不如人意的地方，影响到系统的有效利用及学生学习效果检验。因此，提出一种改进的选择策略成为在线训练平台的关键。
　　1经典的试题选择策略
　　选题策略是计算机自适应测验中最关键的部分。自适应测验过程中，系统会根据使用者的表现从测验题库中选择最合适的项目进行。广泛应用的在线选题策略主要有：最大信息量法和a分层法。
　　其中a代表了试题的区分度，c用于对不确定因素的估值，称为猜测因子，b用于表示试题的难度。从以上模型提示项目正比于区分度，反比于猜测因子，试题难度越高越能检验使用者的真实能力。最大信息量策略的核心是通过收集使用者的能力信息，然后再在未选择的试题中选择最大信息量试题。此策略过程为收集使用者的相关测试结果，如果初次使用则可以预设定一个能力初值，依能力值对未选择的试题计算信息量，选出最大信息量的试题供测试者使用，再依据使用试题的结果进行反馈，重新估计能力值，按新的能力值再对选定的试题进行排序，选择直到满足结束条件为止。
　　此策略应用十分广泛，在此基础上，研究者也对策略进行了进一步的改善，主要有极大加权信息量法、最大全局信息量法，贝叶斯法等。此类策略试题区分度与试题信息量成正比，在难度与猜测因子确定的条件下，此策略会优先选择高区分度的试题。实际使用过程中试题的利用率不均衡，过多使用的试题容易过早暴露于后继使用者面前，造成检验结构失真。
　　1.2 a分层法
　　a分层策略先对试题按区分度等级进行划分区间。策略对试题的选择过程是：由先验数据估计使用者的能力值（即使用者的能力特征），无先验数据者可以预估一个值;由使用者的检测步数值从对应的分层中选择试题。依据选择的试题难度与使用者能力值的匹配度，并把此匹配度反馈给使用者。由反馈结果再调整选择合适的分层再选出试题。反复循环，直到满足停止条件。a分层可以避免高区分度试题过度选中，有利于较好的检测出使用者的能力。另外，使用过程中，每次要对题库中没使用的试题计算信息量，增加了资源消耗。
　　a分层策略在进行层次划分时没考虑试题参数之间的相关性，它对试题理想化为每个分层中均会有不同难度的试题供选择，但实际应用中高区分度分层中通常高难度试题较多，高区分度区间中难找到低难度试题，无法保证检测试题的平衡控制，检验精度比最大信息量法差，同时实际使用过程中，由于计算量大，a分层策略效率更低。
　　2一种新的自适应选题策略
　　2.1设计思想
　　选题策略中，信息量能较好地反映出使用者的能力，最大信息量法具有较好的能力检验度，但高区分度的试题过度使用，不利于题库的安全。a分层策略降低了测试精度。随后研究者提出了信息量分层法与渐近信息量法（GMIR）作为改进策略.渐进信息量法和信息量分层法是自适应选题策略的变种。
　　M表示模型中测试总步数，已经完成的步数用m表示，θ^m-1对应测试步数为m-1时反映出来的能力得分，a、b、c分别代表试题的区分度、难度和猜测因子。每次使用时总是计算模型左侧值最大的试题作为被选试题提供给使用者。
　　为了进一步优化使用效果，研究者在a分层基础上提出试题信息量分层，每次试题难度和使用者能力值最吻合的试题被选中。以上的思想均是在测评准确度与选题曝光率上进行改进。
　　受此启发，新方法基于难度与区分度进行多级分层，信息量（精度）正比于试题区分度，试题难度与使用者能力如果吻合越好，信息量（精度）会越大;对于题库，统计上有如下规律：试题呈现正态分布，在（-3，3）区间内使用者的能力与难度相吻合，信息量最大，测试最准确，但通常试题题库较大，每次匹配会耗费大量时间。因此，使用分层的方式，依据难度进行题库分层，即先按难度进行一级分层以优化选题效率，并有利于使用者的能力值与难度进行匹配，然后再依据区分度进行二次分层，通过二次分层保证试题处于合理的曝光次数下，有效的提升选题测验的精度。
　　2.2策略设计
　　新方法在使用过程中先基于难度分层，可记为难度b分层，能使难度均匀分布，二次分层考虑曝光率，解决了题库的安全暴露问题，提高了题库的安全性，同时也保证了低区分度试题的有效利用性。再通过策略模型选择合适的试题。
　　依托反应理论中定义的选题策略信息量，精度可由信息量体现，自适应选题策略信息量可以用每个试题的信息量与其概率积的累加和表示，如公式（5）。
　　此模型中项目i的信息量用Ii（²）表示，试题（项目）的￡越大，越有可能被抽中，因子的引入用以调节高区分度试题的曝光率，使其在合理范围内，也让低区分度的试题能合理利用，同时保证了试题形成的检验有效性。
　　2.3算法实现
　　使用时先对试题题库进行两级分层，先按难度分层，检验步数设为N，则难度分层数k满足N

其他文献

Kafka分布式消息队列的高性能研究

摘要：消息代理的使用有多种原因（将处理与数据生成器分离，缓冲未处理的消息等）。Kafka作为一个分布式消息队列，可以替代更传统的消息代理，与大多数消息传递系统相比，具有更好的吞吐量，内置分区，高性能，复制和容错功能，这使其成为大规模消息处理应用程序的理想解决方案。Kafka对外使用topic的概念，生产者往topic里写消息，消费者从各个top-ic中读取消息。每个topic是由多个partiti

期刊

KafkaTOPICPARTITION高性能分布式消息队列

分布式数据库在湖南电信IT架构转型中的探索和应用

摘要：随着4G网络和移动互联网业务的迅猛发展，面对海量数据处理、高并发交易的压力，传统的集中式数据库如Oracle基本不支持大规模自动扩展，逐渐表现出其局限性。中国电信基于开源的Mysql数据库和Mycat分布式数据库中间件，结合企业实际，自主研发的分布式数据库系统在湖南电信IT系统中得到广泛应用，解决了海量交易型业务数据的存储和高效访问的难题，实现了低成本、高性能、高可用、高扩展，有利的支撑了企

期刊

MYSQLMycat分布式数据库

基于Android的江门市移动地理信息系统开发

基子移动技术的地理信息系线,改变了传统GS的工作模式,该文对江门市移动地理信息系线开发进行了详细的系统需求分积、系统总体设计、系统详细设计,采用ESRI公司推出的ArcGIs Kunti移动开发包,基于A0 S API fH Android的移动GBs开发技术,实现了在线切片服务和要素服务下载、本地要素服务编辑和上传,地图放大缩小全图操作,GFS定位,图层控制,地图标绘,附近查询、数据查询。

期刊

移动地理信息系统ANDROIDARCGISAPIforAndroid江门市

大数据时代计算机信息管理应用

摘要：随着我国科学技术水平的不断提升，电子信息化、现代化技术研究的不断深入，国家对于计算机及其网络得要求也越来越高。在人们不断进行上网活动，不断获取网络信息并进行信息浏览和发送的过程中，其产生的计算机信息量令国家进入了大数据时代。在大数据时代背景下，计算机如何进行更好的系统研究、如何进行更新换代、如何处理相关的信息数据成为科研工作者共同研究的问题。对此，本文基于大数据时代的相关背景及特点，对于计算

期刊

大数据背景计算机信息计算机信息管理

基于综合指数和可视化分析的红学热门主题及核心作者研究

摘要：针对目前红学研究主题繁多且学术成果数量庞大，对核心作者及其文献筛选工作困难的问题，该文提出了一种基于综合指数和可视化分析的红学热门主题及核心作者研究方法，筛选出九大热门主题，并从多方面分析了评估红学核心作者的因素，从多个角度分析了红学研究文献的特性，研究其特征和主旨。该文采用Python语言进行了详细的实验，分析了红学核心作者与其作品的联系，挖掘出作品研究价值高且适用性广的核心作者。实验结果

期刊

红学核心作者综合指数PYTHON普赖斯定律

数据挖掘技术在高校精准资助路径探析中的应用

摘要：高校学生资助工作是脱贫攻坚工程的重要内容，以资助促进学生发展，切断贫困代际传递，才是学生资助工作的本意所在。在大数据时代背景下，利用数据挖掘技术实现高校精准资助路径，打造资源共享、精准认定的资助新模式，建立实时动态监管体系，完善管理思路，对提高高校精准资助水平具有重要意义。本文通过分析高校学生资助工作的现状，构建高校精准资助实施路径模型，对高校学生进行信息数据采集、集成、变换、挖掘、模式评估

期刊

数据挖掘技术高校精准资助路径对策建议

浅析“金墙”病毒隔离墙的功能及应用

摘要：该文简要介绍了金墙病毒隔离墙的系统模式、原理、特点及在电视制作网络中的实际应用。　　关键词：电视制作网;隔离墙;使用方法;网络安全　　中图分类号：TP393 文献标识码：A　　文章编号：1009-3044（2019）32-0043-02　　如今数字化、网络化技术的飞速发展，国内各家电视台都投人大量资金建设电视节目制作网络和电视节目播控网络，最大限度地实现资源共享，提高节目制作和播出效率。然而

期刊

电视制作网隔离墙使用方法网络安全

社会网络影响力最大化问题研究

摘要：社会网络影响力最大化是社会网络分析领域的一个重要研究问题，该问题旨在寻找出社会网络中具有最大影响力的节点集合。从社会网络影响力最大化问题产生背景出发，介绍影响力最大化问题的求解过程与求解过程中用到的基础模型，归纳总结了现有的几种主要传播模型、影响力最大化算法及研究现状。最后，讨论了该研究存在的问题和对未来的展望。　　关键词：社会网络;传播模型;影响力最大化算法　　中图分类号：TP393 文献

期刊

社会网络传播模型影响力最大化算法social networkdiffusion modelsinfluence maximization algori

校园一卡通系统介绍及优缺点

伴随着国家信息化进程的不断加快,信息技术对我国人民日常生活的影响也越来越大。大学作为国家培养人才的重要地点,自然也要跟紧信息化的步伐。如今,越来越多的高校加入了校园一卡通的行列,校园一卡通已经成了我国大部分高校学生日常生活中不可缺少的一部分。伴随着校园一卡通在高校的不断普及,其可能存在的安全性问题也越来越受关注。本文将从校园一卡通的所要实现的目标及其整体结构总结和讨论校园一卡通的好处及其可能存在的

期刊

校园一卡通信息化高校

大数据及云计算技术在智慧校园中的整合与应用研究

摘要：高校智慧校园是在数字信息化校园基础上，所建构的智能化网络服务评价架构，其主要用到大数据、云计算及物联网技术。当前大数据及云计算技术，在智慧校园体系建设中的应用，通常会利用Hadoop分布式平台、HDFS文件系统、Ma-pReduce虚拟计算等大数据技术，以及云计算平台及其服务器，来完成高校信息管理系统的部署与建设，并实现对数据资源的挖掘、整合处理与存储，以满足不同学校成员的教学、科研、管理决

期刊

大数据云计算技术智慧校园应用

一种新的分层自适应选题策略研究

与本文相关的学术论文