聚集类型数据中频繁模式挖掘的研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:zhuliner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文的工作在关联规则挖掘的范畴以内,对从聚集类型数据中的频繁模式挖掘问题进行了研究.该文的主要贡献在于:●提出了针对有序标号树的Chopper算法和XSpanner算法.这两个算法不仅在性能上要优于同类算法,更重要的是它提出了树的序列化表示和先同分后异构的思想.通过先区分出形式上一致的模式,再进行结构上的鉴别的思想就可以缩小需要进行同构判定的对象范围,使同构判断的难题被限制在一定区域内,从而改善算法的整体性能.●提出了针对唯一标号图的AMGM算法和SFP算法.我们可以将唯一标号图能转换为项集的形式,但是需要在连通性的进一步考虑上.AMGM算法是基于Apriori思想的,而SFP算法则充分利用了FP-Growth的特点.这两个算法可以高效地挖掘唯一标号图库中频繁出现的连通子图.●频繁模式操作对象类型从原来的原子类型数据拓广为聚集类型数据.对频繁模式操作对象的推广将有助于关联规则分析应用的拓展.从最初的购物篮分析到现在的互联网、XML等半结构化数据、化学分子结构分析,关联分析的应用范围日益广泛,这不仅为频繁模式分析提供一个个崭新的舞台,也对其本身提出了更高的要求.
其他文献
该论文的研究内容是属于江苏网上远程教育试点工程的一部分:在线考试系统的设计与实现.旨在探讨在远程教育当中,在线考试这一部分的技术研究和实现.希望在利用现有的远程教育
随着科技的进步,许多无线和移动设备相继涌现,如PDAs,laptops,掌上电脑等,这些设备给我们的生活带来了极大的便利。但是由于这些设备的本身特点,使得这些设备一般只拥有极少的本地
学位
随着三维扫描技术的不断深入发展,点云数据的获取变得简单快捷。目前,通过各类机载、车载、手持扫描仪等设备均可高效地获取高精度大范围的点云数据,这为点云的分析和重建创造了
在分子生物学和基因组分析中,蛋白质序列和DNA序列的比对是一种重要的分析工具.多序列比对问题是NP完全问题,这就是说,任何研究快而完全算法的企图都将面临极大困难.求解多序
该文在考察了目前的一些XML存储查询技术、OODB的研究工作以及关系代数的技术后,重点集中在使用对象集合与关系结合方式对于标准的关系代数进行扩展,定义一个新的代数系统并
随着现代计算机系统的发展,分布式实时仿真系统日益成为培训系统和工程控制领域关注的研究热点.由于计算机硬件的快速发展,使得通过控制硬件来提高系统性能的软件处理技术相对
随着大数据时代的到来,全球数据存储量呈爆炸式增长,面对如此海量的数据,如何有效地从这些数据中挖掘出有价值的信息显得尤为重要。为了应对大数据的挑战,以Spark为代表的大数据
该文通过对Web服务计费以及相关问题的深入研究,结合了Web服务在中国的发展现状,提出一种三方参与的Web服务计费模型,将Web服务计费功能以公共服务的形式出售给广大Web服务提
随着车联网(Internet of Vehicles, IOV)的快速发展,无人驾驶、智慧交通等新技术层出不穷。人们希望能够泄露尽可能少的隐私信息获取更好的车联网服务。车载自组织网络(Vehicula