基于数据挖掘的教育考试数据资源分析与违规行为检测

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:flybear
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
海量教育考试数据资源的数据挖掘与分析研究工作,对于充分发掘教育考试数据的潜在价值,更加科学地进行教育管理及决策具有非常重要的意义。   论文以北京教育考试数据资源系统和北京教育考试远程电子巡查指挥系统为实际应用背景,研究教育考试信息技术应用中的关键技术,主要内容如下:   (1)系统综述和分析了数据挖掘现状、数据挖掘在教育行业中的应用、教育考试数据资源应用现状、视频检测应用现状,指出教育考试信息技术应用中需要解决的重点和难点问题。   (2)进行基于数据挖掘的教育考试数据资源系统研究。论文构建了面向数据挖掘的教育考试数据资源系统体系结构,分析了系统的ETL工作流,设计并实现了数据转换平台,构建并实现了基于组件技术的智能型综合数据分析平台。   (3)研究设计了教育考试数据仓库/集市多维数据模型。论文对数据仓库逻辑建模方法进行分析,首先对两类基本数据仓库逻辑建模方式进行分析对比,并指出两类逻辑建模方式的不足。在此基础上,设计出面向教育考试数据仓库/集市的雪花模型。雪花模型能够解决数据仓库/集市的大维度问题,并能有效降低数据仓库的数据冗余度,减少数据量,保证数据一致性;此外,雪花模型在建立聚集事实表方面优势明显,能够实现基于灵活粒度的数据挖掘。   (4)研究设计了多种聚类方法及聚类验证技术的混合聚类应用模式。采用实证研究方法对聚类技术、主流聚类算法以及聚类验证技术、聚类验证方法进行了深入分析与比较,在此基础上,提出混合聚类应用模式。混合聚类模型中将数据理解、自组织特征映射SOM聚类、层次聚类、模糊聚类、聚类验证、聚类质量反馈、聚类调整等一系列过程混合应用,以实现最佳聚类结果。并对北京地区高等学校教育资源数据,应用混合聚类方法,生成北京地区普通高等学校资源状况分类,并进行了分析。   (5)关联规则挖掘算法研究。论文对几种典型关联规则挖掘算法进行分析,并针对Apriori算法没有充分利用先验知识有效缩减遍历事务数据库规模的不足,提出了基于大项集迭代的关联规则挖掘算法IR-Apriori,仿真试验显示,IR-Apriori算法能有效缩减遍历数据库的规模,大大提高算法性能。   (6)进行基于视觉模式分析与挖掘技术的违规监控行为检测研究。论文根据考试监控的需求和试卷的特点,提出了基于视觉模式分析和挖掘技术的层次型泄密试卷检测算法。该算法基于自适应高斯混合模型进行像素检测并使用区域增长算法实现区域分割,通过形状判定与分类实现最终检测,算法具有快速性和准确性的特点,实验证明,算法能够快速有效检测出泄题试卷。   (7)进行基于运动信息的作弊事件检测研究。论文针对考试过程中的违规违纪事件进行智能视频分析,提出了基于运动信息的作弊事件检测算法。算法采用高斯背景建模技术来统计分析出视频中的运动像素特征值,再使用决策树模型分析运动对象的描述特征来检测出作弊事件。实验证明,算法能准确识别出考试过程中站立、传递试卷、离开考场的作弊事件。
其他文献
软件质量一直是软件工程所关注的重点之一。长期以来,软件质量的保证、控制和提高也一直是众多学者所研究的热点。但是,目前行业内对软件质量的保证手段通常是在软件开发的中后
移动机器人是一种集环境感知、动态决策与规划、行为控制与执行等多项功能于一体的高智能化机器系统,移动机器人导航是移动机器人研究的重要方向,而路径规划是移动机器人导航
军用机器人即将成为战场上的重要突击和防御武器。军用机器人也是我军在未来信息战争中达成技术优势的重要武器装备。在未来战场上,如何指挥和合理配署种类繁多的军用机器人,并
近年来以实体搜索为特点的专业搜索引擎的竞争在如火如荼的上演,实体搜索技术的研究与应用已成为信息检索领域一个新的关注焦点。作为这种新搜索模式的典型代表,给出一个搜索关
互联网时代信息技术推动健康领域革命性的变革使得人们不但对生活质量的要求越来越高还对个人和家庭的健康也越来越重视;人们不再满足于不生疾病,而到更关注预防疾病和保健。
机器学习一直是人工智能中受关注的热点领域之一。尤其是面对海量数据中的不确定数据,更需要机器学习算法的参与。因此,本文主要针对动态模糊数据,提出了一类动态模糊机器学
传感器(传感器和执行器)在今天已经无处不在。它们被应用在人们日常生活的各个方面,从工业自动化到环境监测到国土防卫。目前,传感器发展的趋势之一是智能传感器。智能传感器
目前,随着计算机和网络技术的迅速发展,实时系统已越来越广泛地应用于国防工业、航空航天工业、交通运输业、制造加工业、流程生产行业、电讯业等领域。典型的实时系统有现代化
在对目标进行识别时,通常目标相对摄像机系统会因为方位的变化,产生投影畸变,这将给正确的识别带来困难。对于人脸图像的识别同样存在这样的问题,严重的投影畸变可能会导致脸部特
车牌识别广泛用于电子收费、出入控制、交通监控等重要场合。车牌定位作为车牌识别中的重要环节,对系统识别精度有重要的影响。目前的车牌定位方法主要是针对所监视的区域只