Apriori算法在学生成绩管理系统中的应用

来源 :电脑迷·上旬刊 | 被引量 : 0次 | 上传用户:zhaoyangfei1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系。本文利用数据挖掘技术中关联规则的Apriori算法对我校计算机课程的学生成绩进行了分析,分析结果供学校各教学单位参考。
  关键词:数据挖掘;Apriori算法;学生成绩
  1 关联规则的Apriori算法
  关联规则(Association Rules)的概念首先由R.Agrawal等于1993年提出的,是反映一个事物与其他事物之间的相互依赖性或相互关联性。Apriori算法是Agrawal等人在1993年提出的一种最具影响力的基于两阶段频集思想的关联规则挖掘方法,是挖掘布尔关联规则频繁项集的算法中最成功的一类算法。在实现过程中,Apriori算法使用一种逐层搜索的迭代方法,K-项集用于搜索(K+1)-项集。Apriori算法将关联规则挖掘算法分解为两个子问题:
  (1)求出事务集D中满足最小支持度minsup的所有频繁集;
  (2)利用频繁集生成满足最小可信度minconf的所有关联规则。
  其中第一个问题是算法的关键,Apriori算法是基于频繁集理论的递推方法来解决这一问题。根据上述两个关键步骤,Apriori算法具体可以理解为:
  定义最小支持度和最小置信度。
  Apriori算法使用候选项目集的概念,若候选项目集的支持度大于或等于最小支持度,则此候选项目集称作频繁项目集。
  首先由事务数据库读入所有的事务,得出候选1项目集合的支持度,再找出频繁单项目集合,并利用这些频繁单项目集合的结合,产生候选2项目集合。
  再次扫描事务数据库,得出候选2项目集合的支持度以后,再找出频繁2项目集合,并利用这些频繁2项目集合的结合,产生候选3项目集合。
  重复扫描事务数据库,与最小支持度比较,产生频繁项目集合,再结合产生下一级候选项目集合,直到不再结合产生出新的候选项目集合为止。
  在利用Apriori算法挖掘出数据库的频繁项集后,通过给定的最小置信度,就可由它们产生强关联规则。
  2 Apriori算法在学生成绩分析中的应用
  挖掘的数据来源于我校青果教务管理系统。下面以2015年到2018年全校大一学生的计算机基础课程成绩为例来说明。
  为了简化分析,假设将数据进行抽象和离散化处理。学生专业服装设计与工程用S1标识,物联网工程用S2标识,会计学用S3标识,物流管理用S4标识,环境设计用S5标识,制药工程用S6标识……教师职称正高用C1标识,副高用C2标识,中级用C3标识,初级用C4标识。学生上课课时数离散化为:>=48用D1标识,>=40用D2标识,>=32用D3标识,<32用D4标识。学生作业根据得分情况离散化为:90-100为优秀用E1标识,80-89为良好用E2标识,70-79为良好用E3标识,60-69为良好用E4标识,低于60分为不合格用E5标识。考试成绩离散化为:90-100为优秀用F1标识,80-89为良好用F2标识,70-79为良好用F3标识,60-69为良好用F4标识,低于60分为不合格用F5标识。经过处理的信息表如表所示:
  下面我们来进行关联挖掘。第一步,用Apriori算法來找出频繁项集,运用Apriori算法找出具有最小支持度阈值的数据(设定最小支持度为0.35,取最小置信度为0.65)。由频繁项集产生强关联规则,在上述数据库中,经扫描,筛选,连接,剪枝的过程,最后得到所需要的频繁2-项集和频繁3-项集,如图
  从表中看任课教师的职称对于学生的成绩并没有什么直接影响。但是从S2,C3,D1→F1、S3,C2,D2→F1、S5,C3,D4→F5这些关联规则中我们可以推导出,最终考试成绩和前面的基础数据存在着很强的关联性,课时少的、艺术类专业的学生课程通过率较低;课时数40课时以上、计算机类专业、会计学专业的学生课程通过率较高。因此,针对此类情况,学校应适当增加课时,对课时少的专业中作业成绩较差的学生教师应在课堂上给予更多关注,以利于提高课程的考试成绩。此外,学校要严格执行人才培养方案中规定中的课时数,若因教师自身原因影响学生的上课课时,教师应自觉履行补课程序,完成课程的教学任务,提高教学质量和教学效果。
  3 结论
  本文利用数据挖掘技术中的关联规则分析对计算机课程的成绩进行了分析,分析的结果和课程结束后学生成绩的分布结构相类似。学生所在专业以及教师的职称对课程成绩影响不明显,两者之间基本上不存在符合设定阀值的关联。而学生专业、授课时数、作业成绩和最终成绩存在着很强的关联性。其分析结果可以帮助学生发现自己的薄弱环节,对于以后学习提供针对性的帮助。同时对教师教学方法的改进和学院对不同专业的课程学时分配也有一定的指导意义。
其他文献
期刊
一、国外发展现状rn建筑垃圾资源化已成为发达国家的共同研究课题.发达国家对建筑垃圾处理总体上施行源头削减策略,即在建筑垃圾形成之前,通过科学管理和有效控制措施将其减
摘 要:在知识经济时代下,大多数学者倾向于研究引文数量、域名分布等指标,而在引文资源类型方面的研究却有待进一步深入。为全面提高资源利用率,优化信息检索与资源利用行为,本文就图书情报领域学术深网资源利用开展简要分析和研究,仅供相关人员参考。  关键词:图书情报;学术深网;资源利用  1“看不见的网站”的内涵及及学术深网简介  所谓“看不见的网站”,是指产生于互联网领域的“Invisible Web”
摘 要:本文通过文献资料法,试图从需求、供给二方面来优化青少年基本公共体育服务。得出结论:互联网+时代下以政府供给为主导,市场供应为辅,大力倡导志愿者供给;不断扩大和改进智能化体育场地设施,适当加大培养社会体育指导员数量和提高社会体育指导员质量,逐渐增设社区体育网络系统;加强青少年基本公共体育政策法规的制定力度,保障青少年享有基本公共体育均等化权利,改善青少年基本公共体育政策法规的评价机制。  关
对东北羊草草地土壤-植物间锌含量的动态研究结果表明:土壤中全锌含量较低,有效锌含量中等,植物体不缺锌.在生长季各时期,全锌和有效锌含量在土壤剖面分布从上向下呈下降趋势
通过医疗设备获得的DICOM标准医学图像无法在普通电脑中打开并查看病人信息,目前,PC端有很多解析并打开医学图像的软件,但随着移动终端的普及,开发在移动平台打开DICOM格式的医学图像为数不多。本文基于Android平台开发一个读取DICOM医学图像的系统,主要功能有:对DICOM标准图像进行解析并显示,把DICOM格式的医学图像转换成BMP格式的通用图像文件,并可对文件进行保存和手工标注,方便医
期刊
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
摘要:本文介绍了一个基于PLC的小型立体仓库自动控制系统的组成,从硬件网络连接到硬件选型,软件配置,程序结构和触摸屏组态都做了阐述,该控制系统通过运行调试,应用于实际教学比赛中,为小型立体仓库运用于物流工业中提供了借鉴和技术基础。  关键词:硬件网络连接;硬件选型;PLC;系统软件设计  现代物流信息的高速发展使得自动化立体仓库得到大规模应用,自动化立体仓库实现了搬运、存取机械化、自动化。在自动化
定莜9号是1992年以大莜麦为母本、7633-112-1为父本组配杂交,再经系谱法多代选育而成的高产、耐旱、抗病、适宜加工的高蛋白莜麦新品种,原代号为9227-3。该品种于2009-2013参
期刊
通过踏查和定点调查的方法,对贵州花榈木主要害虫种类对其危害程度、危害规律进行了调查观测,结果表明危害花榈木的害虫有4目、8科、8种害虫。其中对花榈木危害最为严重是鳞