关联规则在课程相关性分析中的应用

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:kalagou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:关联规则是数据挖掘的一个研究方向,它可以通过对大量数据中数据项相关性的分析,挖掘各数据项之间的内在联系。高校各个专业课程既相互独立,又存在一定的先后顺序,课程的学习彼此之间也会有一定的影响。一门课程的学习情况可能会影响其他相关课程的学习。运用关联规则技术对学生专业课程成绩进行分析,揭示各专业课程之间的内在联系,为学生专业课程的选择和学习提供指导意见,为人才培养方案的制定及课程的合理设置提供有价值的参考依据。
  关键词:数据挖掘;关联规则;课程相关性;分析
  中图分类号:TP301.6 文献标识码:A
  文章编号:1009-3044(2019)35-0253-03
  近年来随着高等教育的不断发展与普及,为确保教学质量,很多高等院校完善和加强教学管理,在具体的教学管理过程中,聚集了海量的原始教学信息,但是目前对这些原始教学信息的使用,仅仅停留在简单的查询和统计阶段,没有更深层次地挖掘其内在的更有价值的信息。这些原始的教学信息往往蕴藏着一定的教学规律和模式,而有一些教学规律和模式往往是隐含在这些原始教学信息的背后,因此为了充分发挥这些原始教学信息的作用,需要运用数据挖掘技术的分析方法,对它们进行更加深入的分析和研究。
  数据挖掘是从数据库的大量数据中挖掘出有用的信息,即从大量的实际应用数据中,发现人们之前未知的、有规律的信息和知识的非平凡过程[1][2]。关联规则是据挖掘中运用极其广泛的研究方法之一,主要是探究各个数据项之间联系规则。高校各个专业课程不仅存在一定先后顺序,而且设置不同的专业方向,这给学生在选择和学习专业课程上带来一定的困扰。关联规则技术可以通过对学生专业课程成绩进行分析,发现隐藏在学生专业课程成绩背后的各专业课程之间的内在联系,为学生专业课程的选择和学习提供指导意见,为人才培养方案的制定及课程的合理设置提供有价值的参考依据。
  1 关联规则
  关联规则最初用于购物篮的分析,缓过对交易数据库中不同商品的分析,发现数据库中不同商品之间的联系规则,这些规则有可能是人们之前未知的或者被隐含的[3]。
  1.1关联规则的定义
  设I= {I1,I2,…,Im)是一个项目集,事务数据库D={t1,t2,…,tn},其中事务数据库每个事务ti(i=l,2…,n)都是I上的一个子集[5]。
  1)支持度:设I1∈I项目集I1在事务数据库D上的支持度support(I1)=‖{t∈D|I1∈t}‖/‖D‖;
  2)频繁项目集:若support(I1)不小于用户指定的最小支持度minsup,I1即是频繁项目集,如果I1不被其他的项目集所包含,I1就是最大频繁项目集;
  3)关联规则:设I1、I2是最大频繁项目集中的互不相交两个子集,则I1→I2称为关联规则;
  4)置信度:I1→I2的置信度就是包含I1、I2的事务数与包含I1的事务数的比值,conf(I1→I2)=support(I1∪I2)/support(I1)
  1.2关联规则的基本思路[5]
  关联规则的经典算法是Apriori算法,它是根据事先指定的最小支持度,运用逐层扫描的方法,发现最大频繁项集。Aprio-ri算法可以分为两个子问题[6]:
  1)发现最大频繁项目集:根据事先指定的最小支持度min-sup,运用逐层扫描的方法,依次产生不小于最小支持度的各个频繁项目集,最终遴选出最大频繁项集。
  2)生成关联规则:根据事先指定的最小置信度minconf,在每个最大频繁项目集中,遴选出满足最小置信度的关联规则。
  1.3频繁项目集的产生过程[7]
  1)频繁项目集L1:根据事先指定的最小支持度minsup,第一次扫描事务数据库,遴选出不小于最小支持度的1频繁项目集L1;
  2)频繁项目集L2:自连接L1中所有项目,形成2-候选项C2,第二次扫描事务数据库,遴选出不小于最小支持度的2频繁项目集L2;
  3)重复上述过程,直到没有新的候选项集出现时,算法终止,最终遴选出最大频繁项集。
  1.4 Apriori核心算法[4]
  Ll={large 1-itemsets}
  for(k=2;Lk一1≠Φ;k )do begin
  Ck=apriori-gen(Lk-1)//新的候选集
  for all transactions∈D do begin
  Ct=subset(Ck,t)//事务t中包含的候选集
  for all candidateS∈Ct do c.count
  end
  Lk={c∈Ck|c.count
其他文献
摘要:本文先对电子电工实验中模拟仿真技术的意义进行简析,然后在保障安全、控制成本与培养人员创新能力等相关方面,总结模拟仿真技术在电子电工实验中的作用,进而在试验内容与实际应用相关基础上,阐述电子对电子电工实验中模拟仿真技术的实际应用。  关键词:电子电工;模拟仿真;作用  中图分类号:TP3 文献标识码:A  文章编号:1009-3044(2019)35-0243-02  在电子电工专业中,实验是
以图书馆深化创新、提高服务水平为目的,对数字图书馆应用做了深入的探讨。对数字图书馆进行概要性地分析,提出了数字图书馆应用的需求分析,并从信息资源系统、管理系统、移
摘要:AHTS多用途工作船具有动力定位功能,主要用于海上打捞救助、海洋石油平台供应、散液货供应及远洋拖带功能等。基于船舶作业的安全需要和多功能化发展,一个可靠性高、功能齐全的船舶电站自动化控制系统是很有必要的。本文以具有DP2定位的AHTS船舶的电力系统(440V/60Hz)为平台,详细地阐述了船舶电站的设计过程和实现方法,采用西门子公司S7-200型可编程控制器和丹麦DEIF公司生产的多功能控制
摘要:在线课程不受时空限制,使得课堂教学得以时空延伸,是目前最高效的学习途径之一,推动了现代化教育事业的发展。在建设在线课程的过程中,遵循在线课程的建設原则,就授课对象、课程内容、授课终端、课程监督考核机制等做了详尽的介绍,以达到课程的教学目的。  关键词:NCRE;在线课程;微课;项目驱动;主题专项  中图分类号:G424文献标识码:A  文章编号:1009-3044(2019)36-0212-
摘要:一直以来,《大学计算机基础》教学的一个共同问题就是新生入校时所具有的计算机基础知识和计算机应用水平参差不齐,这给计算机基础教学带来很大的困难。以“应用为目的,以实践为重点,提高大学生的信息素养”是大学计算机基础的教育观念。而正因为此问题无法解决,导致其目标实现非常困难。为了解决此问题,大学计算机基础教学引入了分层次教学模式,效果非常有效。  关键词:大学;计算机基础;分层次教学  中图分类号
该文以《解斜三角形》为课题,探讨如何以业速云平台为基础,搭建学生课前、课中、课后的学习平台,以任务为导向,帮助学生进行高效数学专题知识复习。
摘要:函数极限是极限的一个重要内容,求函数极限的方法多种多样,本文主要通过例题来阐述了几种求函数极限的方法。求极限的方法不可能全部列举出来,希望通过这几种求解方法的介绍展现极限思想的本质。  关键词:函数极限;四则运算法则;洛必达法则  中图分类号:TP393 文献标识码:A  文章编号:1009-3044(2019)35-0247-02  极限是数学中一个非常重要的概念,广义上的极限是指无限接近
摘要:“互联网 教育”的出现使学生除了正常的课堂学习之外,还能利用互联网技术和设备随时随地积累自己的知识和技能。本文以《信息与网络安全技术》课程为例,从在线教学资源、线上与线下有机融合、综合应用多种教学模式和变革课程考核方法4个方面阐述了基于“互联网 ”的创新教学模式。经过近几年的实践,课程教学效果和学生实践动手能力明显提升。  关键词:互联网 ;教学模式;开放  中图分类号:G642 文献标识码
摘要:智能手机改变了几代人的生活方式,引领着新技术潮流,准大学生市场成为手机厂家的必争之地。笔者通过Chrome浏览器开发者工具采集某电商网站上高考后三个月互联网中手机销售数据,利用Hadoop技术生态组件对数据进行清洗过滤、分析存储、可视化呈现,分析准大学生购买手机的倾向,通过品牌、颜色、屏幕尺寸三个方面分析其购买行为,预测目标群体网购趋势,引导手机厂家提升产品技术水平,从而更好促进手机市场更好
摘要:近年来,随着社会经济发展速度的不断加快以及现代网络科技在教育中应用的普及,国家对信息化、专业化人才培养工作提出了更高的要求,与此同时,高职教育信息化教学也得到了来自社会各界的广泛重视。然而,从整体结构来看,信息化教学模式在教育实践尤其是高职教育实践中发展的时间较短,尚未形成系统、完善的理论支持和经验积累,在实际应用中还存在着诸多问题,一定程度上限制了当前高职教育的进一步改革。该文即着眼于高职