基于位运算的闭频繁项集挖掘算法的研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:ricky1281214
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息技术高度发达的今天,现实生活和商业应用中积累了大量历史数据,而且这些数据正呈爆炸式增长。海量的历史数据既蕴含着大量宝贵资源,同时也把我们淹没在数据和信息的汪洋大海里。为了从中找到潜在的、有价值的信息,数据挖掘技术应运而生,并显示出强大的生命力和巨大的发展潜力。频繁模式挖掘在数据挖掘任务中一直充当着重要的角色,频繁模式挖掘是一个相对耗时的过程,而且可能会产生大量的频繁模式项,挖掘频繁闭模式比频繁模式数量上要少,但是却能表达相同的信息。频繁项集挖掘做为关联规则产生的首要步骤,其挖掘效率的高低直接关系着关联规则产生的总体效率。本文将位处理技术运用到二维闭频繁项集挖掘和三维闭频繁项集挖掘过程中,对数据集和项集按位存储,通过充分利用计算机每次处理32位数据的特性,最大限度的提高每次运算处理数据集的数据量,从而提高闭频繁项集挖掘的效率。本文在对现有的各种二维频繁项集挖掘算法和三维频繁项集挖掘算法优缺点进行分析比较的基础上,对枚举策略和剪枝策略进行优化,设计出更加高效的基于位运算的二维闭频繁项集挖掘算法BD-Miner和基于位运算的三维闭频繁项集挖掘算法BD-Peeler,使得算法既继承了现有算法的优点,又能更高效的完成挖掘任务。本文使用VC++6.0实现了算法BD-Miner和BD-Peeler,在多个数据集上做了大量实验,并与现有算法进行了比较,实验结果表明:在相同数据集上完成相同约束条件的闭频繁项集的挖掘任务,二维数据集上BD-Miner算法能提升挖掘效率6-7倍,三维数据集上BD-Peeler算法能提升挖掘效率3倍。
其他文献
伴随着计算机技术、特别是网络技术的飞速发展,XML作为一种可扩展标记语言,凭借其跨平台、可扩展的优势,被广泛地用于实现异构信息和异构平台的数据交换和共享。为了标准化XML数
学位
随着网络技术的发展和信息技术的进步,人们对网络的依赖性日益突出,同时信息安全问题也越来越重要。虽然众多学者们在信息安全领域的研究中取得了巨大的成果,但随着理论研究
学位
P2P流媒体直播系统在互联网中已得到广泛应用。在直播系统中,节点选择机制直接影响系统的拓扑结构,是系统中的核心问题。目前主流的节点选择机制是将系统作为一个整体考虑,注重
学位
近年来,随着网络的普及与发展,大批P2P流媒体的应用开始涌现,P2P流媒体直播技术作为其中一个重要分支已经成为流媒体研究的热点问题之一本文在PeerCast的基础上开发出了P2P大
动态目标路径规划问题是游戏人工智能中极具挑战性的研究内容之一,其研究成果可广泛应用于机器人导航、军事仿真等众多领域,具有较大的研究价值和实用价值。本文在人工智能搜
车牌识别技术是智能交通系统的重要组成部分,在现今社会具备越来越重要的作用。车牌识别系统通过对车牌的自动识别,实现了车辆管理的规范化,科学化,具有广泛的应用前景。车牌
随着科学技术的迅猛发展,全球网民数量的急剧增加,互联网几乎普及到人们日常生活中的方方面面,随之而来的是信息量的爆炸式增长,尤其是在电子商务方面。大量的数据引起的“信
中文信息处理是一个繁琐而庞大的信息处理工程,中文分词的处理则是整个工程当中的一个基础且重要的环节。计算机对汉语的理解,首先要对句子能够进行有效而正确的识别,要正确
近几年来,随着网络带宽的不断提高和应用层组播技术的快速发展,视频直播已经成为了互联网的主要应用之一。为满足视频直播系统对实时性、稳定性和资源利用等方面的要求,有效地适
学位
在基于生物特征的认证技术中,以人脸面部为处理对象的研究成为近年来计算机图形图像处理技术的研究热点。对人脸面部的研究主要涉及到以下几个方面:人脸检测、面部特征提取、人