基于粒度计算的数据挖掘方法的研究

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:hwwacm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一门新兴的技术,它涉及到多个学科领域的知识。数据挖掘能从大量的数据中发现一些人们事先未知的、潜在的、有趣的知识,因此又被称为数据库中的知识发现。数据挖掘有很多研究方向,关联规则是其中重要的一个。关联规则挖掘能发现大量数据中项集之间的关系,可广泛应用于购物篮分析、相关分析、分类、网络个性化服务等领域。 本文讨论了挖掘关联规则的经典算法—Apriori算法和它的一些变形算法。针对Apriori算法存在的一些问题,即在求项集的支持度时需要多次扫描数据库,以及在生成候选项集时会浪费大量的时间和内存空间,本文提出了一种基于粒计算的关联规则挖掘算—AR-GrC算法。该算法AR-GrC引入了粒计算的思想,即把事务数据库中每一个项看成一个信息粒,通过扫描一次数据库得到所有项的二进制表示,利用信息粒的“与”和“或”运算求项集的支持度。该算法的优点在于只需扫描一次数据库,利用粒计算求项集的支持度,减少了时间耗费和空间占用,从而提高了规则挖掘的效率。 但是对于许多应用,由于多维数据空间数据的稀疏性,在低层或原始层的数据项之间很难找出强关联规则。于是本文在最后提出了一种基于粒计算的多层次关联规则挖掘算法—ML-GrC算法,该算法在多层次结构中使用基于粒计算的关联规则挖掘方法来挖掘每一层上的关联规则,并且在计算高层次上项的支持度时应用了粒的层次关系。它可以发现各个层次上的强关联规则,通过提高每一层次上挖掘规则的效率来改善整体挖掘效率。
其他文献
航空影像分割是对航空影像进行分析和理解的关键步骤。近年来,基于偏微分方程的航空影像分割方法由于其能有机结合图像本身的低层次视觉属性与待分割目标的先验知识从而受到了
本论文主要利用人工智能、神经网络自适应控制、寻优策略和基于Bang-Bang控制的智能开关预测控制理论对电气设备辐射电磁骚扰自动测试控制系统进行了较全面和深入的研究,取得
在计算机视觉领域,从二维图像中重建出物体的三维模型一直是学者们研究的热点,它综合了众多的学科知识,且在航空测绘、视觉导航、医学诊断、电子商务、虚拟现实等领域都有着
运动估计的研究对象主要分为刚性物体、连接刚体和非刚性物体等。计算机视觉中的运动分析研究均主要集中在对刚体运动的研究,且学者们已取得了一系列的成果,并建立了较为完善的
近年来,随着编解码技术的发展和中国移动GPRS网络,中国联通CDMA网络,以及中国电信、中国网通的WLAN无线宽带接入系统的开通,利用它们作为承载网络,进行低码率的无线视频监控
学位
发酵过程是生物领域最具潜力的分支,生物发酵技术在现代食品、医药等高附加值加工业中所发挥的作用越来越大,在未来几年内,生物发酵将成为我国国民经济的支柱产业之一。但技术的发展是一把双刃剑,发酵技术的快速发展在为我们的生产生活带来显著改观的同时,其存在的诸多安全性问题也逐一凸显,这迫使人们对生产过程的安全性和可靠性越来越重视。因此,为了提高发酵过程的安全性和可维护性,同时提高产物质量,急切地需要对发酵过
随着信息时代的到来和Internet的发展,“信息爆炸”成为信息处理领域迫切需要解决的问题。如何实现快速准确的信息获取,成为目前国内外研究人员关注的热点课题。文本信息抽取就
精对苯二甲酸(PuriedTerephthalicAcid,PTA)生产过程涉及汽液固三相反应,工艺机理复杂,生产过程具有大滞后、强耦合、非线性等特点。对于这样复杂的大型PTA生产过程,系统的可靠性
本文以鲹科鱼类仿生研究对象,根据鱼类的身体结构特征、实际元器件和实现方法的约束,开发了一个可以对机器鱼机械参数进行自动优化的仿生机器鱼设计与仿真软件平台。文章对机器