基于遗传算法的关联规则挖掘研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:SnailHou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是指从大型数据库的数据中提取出隐含的、事先未知的、潜在有用的信息的非平凡过程。而关联规则是数据挖掘中一个重要的技术,也是在无指导学习系统中挖掘本地模式的最普通形式。遗传算法则是一种基于生物进化论和分子遗传学的全局随机搜索算法。 本文对遗传算法和关联规则分别进行了阐述和研究。并在此基础上,进一步研究了基于遗传算法的关联规则数据挖掘。首先对遗传算法的关键技术进行了分析,其中包括适应度函数的设计、遗传算子的操作等,尤其是在染色体编码中应用了实数编码,从理论上解释了如何应用遗传算法解决实际问题。其次在分析遗传算法的基础上阐述了如何和关联规则结合起来,对数据库进行挖掘。而且为了更好挖掘关联规则,提出了一种增加关联规则属性的计算方法,即从原有的支持度、置信度属性之外再添加一项规则---关注规则的方法,改进了通常以往关联方法中仅依靠规则的支持度和置信度来评价关联事物的特点,从而使得到的关联规则包含有更多的信息,更加有助于用户的理解。 本文采用遗传算法和关联规则相结合的算法来寻找最优解,提高了通常关联规则算法(如APRIORI算法)处理大型数据库的效率,避免了资源浪费。通过实验表明,这种算法切实可行、可操作性好、得到的结果也易于理解。
其他文献
随着计算机技术、多媒体技术和国际互联网的飞速发展,包括图像在内的各种多媒体数据的数量正在快速增长。在人们拥有了对海量信息共享机会的时候,如何有效地、快速地从大规模的
随着科学技术的飞速发展和市场、经济的全球化,市场竞争形式从企业间的竞争逐渐演进为商业智能之间的竞争。在这种新环境下,EDW(Enterprise Data Warehouse)分析系统作为一种辅
IP电话(Voice over IP,VoIP)是用于互联网上的传输语音的一项技术,随着互联网络的发展和普及,这项技术作为传统的基于公用电话交换网络(PSTN)的通信技术的一种替代品,得到了
随着网络技术的飞速发展和计算机应用的广泛普及,基于网络的多媒体远程教育不断发展,给传统的教育方式带来了深刻的变革。流媒体课件点播系统作为远程教学实现的一部分,实现
实体连接是数据挖掘领域中一个非常热门的课题,这个任务的目的是将给定文本中提到的实体,也就是一些概念如人物时间地理等,连接到给定的目标知识库中。它和传统的命名实体识别不
iSCSI(Small Computer System Interface over IP)标准定义了一种基于TCP/IP网络的存储系统,它利用现有的网络基础设施组建存储区域网络。与传统的SCSI系统不同的是其传输子
虚拟专用网(VPN Virtual Private Network)技术是指在公共网络中建立专用网络,数据通过安全的“加密通道”在公共网络中传播的技术。IPSec (IP Security)协议是目前构建VPN的主流
本文实现了一个通过把电极置于前额的采集眼电信号的新方法并且用采集到的前额眼电信号进行人的疲劳检测,然后证明了这一方法的正确性。与传统的将电极置于眼睛四周的采集眼电
蓝牙技术规范提供了一种开放的无线语音和数据通信标准,是移动通信技术和计算机网络技术结合的产物。蓝牙作为一种低成本、低功耗的无线接入方式,在现代通信技术和应用发展中有
本文的研究背景是中山大学软件研究所与广州威腾网络科技有限公司合作开发的数据备份与恢复系统NetBunker。本文分析和比较了目前国内外著名备份管理系统优缺点。针对此类产