【摘 要】
:
随着信息时代到来,数据库存储信息量急剧增大。面对庞大的数据资源,人们需要功能强大的工具来“挖掘”其中有用的知识。数据挖掘(Data Mining,DM)正是在这个背景下而提出的新
论文部分内容阅读
随着信息时代到来,数据库存储信息量急剧增大。面对庞大的数据资源,人们需要功能强大的工具来“挖掘”其中有用的知识。数据挖掘(Data Mining,DM)正是在这个背景下而提出的新技术。数据挖掘又称为数据库知识发现,是从大量的数据中抽取未知的、新颖的、有效的及潜在有用的知识或模式的高级处理过程。关联规则挖掘是数据挖掘领域研究与应用的热点之一。Apriori算法是挖掘关联规则的经典算法。但Apriori算法仅仅考虑数据库中项出现的频率,没有考虑到数据库项属性及记录具有不同的重要性,所以挖掘的规则具有一定的局限性。针对这一问题,本文重点研究了加权关联规则,提出一种挖掘水平加权与垂直加权相结合的加权关联规则模型及实现算法。本文研究主要内容包括:①介绍了数据挖掘的发展和相关概念,研究了数据挖掘的过程、技术及应用,对其今后的发展进行了探讨。②研究了关联规则,讨论了Apriori算法,分析不产生频繁项集的FP-growth算法。③全面研究了加权关联规则,深入研究加权关联规则算法—MINWAL(O)算法,分析了水平权值归一化处理方法。④提出水平加权与垂直加权相结合的改进加权关联规则算法—MWAL算法,详细阐述了该算法的实现。这是本文的重点。
其他文献
数字图像抠图技术是指把任意形状的前景物体从图像中分割出来的一种技术,如今它己经成为影视特效等多媒体制作中不可或缺的关键技术,因此该技术具有巨大的商业价值。但是,现
虚拟化技术已被广泛应用于云计算、数据中心和物理网络系统等。然而随着系统规模不断扩大、业务种类持续增长,如何保证系统稳定高效地持续运行,如何经受严酷特殊环境、无法预
近十几年来,因特网上的各种信息以呈指数级的速度增长,使得互联网用户想要快速找到其真正所需要的资料信息变得越来越困难。在海量因特网信息带来信息过载和信息迷失问题而人
电子邮件是互联网上最成功的应用之一,它已经成为人们生活工作学习中不可缺少的部分。人们在享受电子邮件提供简单快捷服务的同时,也在忍受着它的副产品所带来了的痛苦,就是
随着计算系统的资源规模不断扩展、处理能力快速增强、资源种类日益丰富、应用需求灵活多样,寻求新型的计算机理论与模式已成为未来信息技术领域面临的重大挑战。计算系统虚
本文利用RSS(RDF Site Summary)作为信息的采集源和发布单位,通过改造向量空间模型算法,在ASP.NET平台以及AJAX等技术支持下,实现面向用户的、轻量级动态信息采集与发布系统
珍珠产业是中国的传统产业和民族产业,我国是世界第一的珍珠大国。目前,珍珠的等级评判主要靠人工依据珍珠的颜色、光泽、形状、纹理等进行大致估计。这种估计在很大程度上受
虚拟现实技术是二十世纪末兴起的一门综合性信息及计算机应用技术,它融合了计算机图形学、三维实时动画技术、计算机接口技术、传感技术,人工智能等多个信息及计算机应用技术
随着我国海军的日益强大和海运的日趋繁荣,船行波的研究引起人们越来越多地关注。随着对船行波研究的深入,船行波的三维可视化研究成为新的研究课题。船行波的三维可视化仿真
医学体数据场可视化是从由医学切片(如CT、MRI等)组成的三维医学体数据场中获得人体的有用信息,并将其重构为三维模型,从而清晰地显示出人体器官或组织的复杂特征和空间定位