多维关联规则数据挖掘研究及其在学生信息系统中的应用

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:chaofree900521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文通过在学生信息管理系统中的具体实践和运用,对多维关联规则数据挖掘技术进行了探索,实现了基于多维频繁项集进行多维关联规则数据挖掘的一种实用高效的方法,并建立了一个高效的学生信息关联规则挖掘系统。 对于群体的特征与行为的数据挖掘是关联规则挖掘的一种重要的也是复杂的挖掘方向。例如在学生系统中的学生个体自然信息与他们的选课行为倾向之间的关联倾向,商业领域中的顾客基本信息与购买倾向也属于这类情况。许多通用的数据挖掘工具,基于对更通用的挖掘需要的考虑,而没有能对上述的挖掘需求给予足够的满足。 本文中基于多维的频繁项集的挖掘算法主要分为两个步骤。第一步是对群体特征进行维间关联规则挖掘,本文中借助数据立方体工具实现这一过程。第二步是求基于多维的频繁项集的算法的实现及关联规则生成。这时需要以第一步生成的多维规则结果为约束条件,对群体行为的关联倾向进行挖掘。本文中对基于多维的频繁项集的算法进行了探索和算法优化,尤其是通过采用了维搜索和散列的技术方法而使得系统的挖掘性能大大提高。 同时通过在学生信息系统中的具体挖掘实践,也得到了许多有价值的信息,这些知识在帮助校方更好地进行学生的培养、对学生表现情况的掌握以及课程的安排等方面无疑具有重要的指导意义。 兴趣度是关联规则挖掘中经常要考虑的一个问题。本文通过相关度的概念对含有负属性项的关联规则生成方法进行了探索,并给出了相应算法。
其他文献
随着经济全球化的发展,越来越多的软件组织发现竞争越来越激烈.因此,需要寻找到一个提高产品质量,增加竞争力的办法.于是,开始采用了一种由爱德华·戴明提出的管理方法,这种
软件设计在传统上遵循“黑箱”(black-box)抽象的原则,即一个模块应该呈现其功能而隐藏其本身的实现,这一点已成为处理计算机领域中许多重要问题,如可移植性、可重用性等的基本对
社交网络中的文本具有随意性和非正规性等特点,其中一种常见现象是变体词在社交网络中大量存在。人们往往为了避免审查、表达情感、娱乐等将原来的词用变体词替代,替换成相对不
随着Internet的发展,基于Internet的B2B电子商务也不断发展.Internet为各种实体提供了前所未有的机会,使他们利用Internet获得了空前的经济回报,体现了Internet的巨大价值.然
随着Internet的发展,越来越多的嵌入式产品能够连入互联网.通过为现有嵌入式系统增加Internet接入能力来扩展其功能,这就产生了嵌入式Internet技术.嵌入式Internet技术涉及的
序列比对是生物信息学中一个基本的问题。在序列比对中广泛使用的三种算法有Needleman-Wunsch算法、Hirschberg算法和FastLSA算法,而FastLSA算法是这三种算法中效率最高的算法
针对目前电子邮件系统中垃圾、反动邮件所引起的安全性问题,提出一种邮件过滤系统的模型。该模型采用CORBA/IIOP体系结构,在服务器端进行基于地址、基于内容的邮件过滤,其中
日志来源于用户上网行为、应用系统、操作系统、网络设备等,具有体量大、异构、价值密度低的特点。日志系统在各种应用系统中均作为基础组件存在,产生的日志数据蕴含着丰富的内
中医脉象自动分类识别技术是一种将现代信息处理技术与传统的中医理论相结合,根据人体的脉象图谱自动进行对脉象种类判断的技术,从而为中医辨证论治提供有价值的信息。中医脉诊
本课题主要研究数值模拟RTM工艺中的树脂充模流动过程,并实现了树脂充模流动过程在普通Windows窗口下模拟显示。在研究过程中做了以下工作: 首先针对特定的三维编织物进行树