基于Apriori PM算法的高校大数据挖掘研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:qifasoft2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高校信息化建设的快速发展,各类高校管理系统中所存储的数据量也成几何级增长,高校大数据正在形成。面对高校大数据,高校迫切期望能对其进行分析挖掘,发现其中蕴藏的教学规律、规则,进而改进教学过程,提升学校教学质量。本文研究内容就是在这样背景下提出的。论文主要针对高校大数据特点及客观需求,提出了一种改进的Apriori算法,提高了挖掘效率;提出了一种混合规则衡量标准,解决了传统规则衡量标准准确性低的缺陷;最后结合改进后算法和新的规则衡量标准,构建了高校学生成绩挖掘系统原型,并给出了大数据分析的结论。本文具体工作内容如下:  (1)提出了一种基于并行矩阵的Apriori算法(An Apriori Algorithm Based on Parallel Matrix简称Apriori_PM)。该算法通过对挖掘数据进行矩阵化,将整个挖掘过程中数据库的扫描次数缩减到两次,同时为提高算法并行挖掘能力,将算法的挖掘过程进行并行化改进,使算法更适用于分布式系统,大大的提高了挖掘效率。为了进一步提高算法的效率,本文针对挖掘过程中所产生的候选项集数量进行研究,提出了分阶段挖掘方式。  (2)改进了支持度-置信度规则衡量标准。为提高算法挖掘结果的准确性,本文提出了一种混合规则衡量标准,新标准中加入了作用度、有效度等标准,有效的弥补了原衡量标准挖掘准确性低的缺陷,并通过实验进行对比证明。  (3)基于MapReduce构建了高校学生成绩挖掘系统原型。系统以高校大数据中学生成绩作为挖掘数据源,基于上述数据挖掘算法和规则衡量标准,实现了一个成绩预测系统,用于挖掘高校学生成绩背后隐藏的规则,并对数据挖掘结果进行分析。  应用实验结果表明,本文所提算法在挖掘性能上优于Apriori_MR算法;所提出的混合规则衡量标准在规则的筛选上,相对于传统衡量标准而言准确性更高;所建系统针对不同的高校角色提供不同的数据挖掘服务,有益于高校教学水平的提升。
其他文献
随着人类社会的高速发展,汽车已经成为人类的重要代步工具。但是随着汽车的广泛使用,车祸的出现也给人类带来了很大的损失。据统计,在我国每年因交通事故造成的人员伤亡高达1
某风电场人员在风机现场勘查发现外围基础(5-8m范围左右)有呈弧状分布且朝向一致的规律性地面裂缝现象.随后组织人员对全场机组进行排查并扩大对标排查范围至周边区域所有风
我国的甲醇生产企业多,随着我国经济由高速增长阶段向高质量发展阶段的转变,提高产品质量和服务质量是一个企业持续健康发展的基础,产品质量是市场争夺的关键因素.因此,一定
从煤矿开发的角度来说,掘进机在采矿的整个系统内占有十分重要的位置,这是因为掘进机可否具有良好的性质,在本质上决定了煤矿开挖的整体效益.针对煤矿掘进机展开故障诊断,要
地震是一种破坏性大的自然灾害,对核电厂有着十分显著的安全威胁.本文对地震信息快速获取系统原理及构成进行介绍,并重点阐述了其与核电厂地震监测系统的联系以及在地震灾害
为贯彻“安全第一,预防为主”的安全生产方针,严格执行《煤矿安全规程》,防止伪、劣、次产品混入煤矿生产过程,引发事故,保障矿工的安全与健康,促进经济持续、快速、健康发
车辆平顺性虚拟仿真是集虚拟现实和车辆工程等领域为一体的交叉方向。它的基本任务包括:建立车辆和路面模型进行平顺性仿真,确保仿真结果接近于实车实验结果;在虚拟环境下利用
研究电能表现场校验方法以及提高电能表精确度的相关方式,全文通过对电能表现场校验的特点进行分析,制定出一系列有效的校验方案;通过对影响电能表计量准确度的因素进行观察
随着近年来人们生活水平的不断提高,一些火灾事故逐渐受到了人们的广泛关注,在此过程中,消防监督工作也开始受到人们的重视.本文主要针对消防监督工作开展的难点进行分析,首
伴随着医疗卫生事业及医药科技的快速发展,临床医疗活动中的药物使用问题也逐步成为公众关注的焦点。而随着药物的广泛使用,药源性疾病对人类健康的危害也越来越大,合理使用