可拓学在关联规则数据挖掘中的应用研究

来源 :西安工业大学 | 被引量 : 0次 | 上传用户:lszh2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘,又称为数据库中的知识发现(简称KDD),是从大量数据中提取可信的、新颖的、有效的并能被人们理解的模式的处理过程。它是一门新兴的交叉学科,汇集了来自机器学习、模式识别、数据库、统计学、人工智能等各领域的研究成果。关联分析就是从给定的数据集中发现频繁出现的项集模式知识(又称为关联规则)。可拓学是用形式化的模型研究事物拓展的可能性和开拓创新的规律与方法,并用于解决矛盾问题的科学。 Apriori算法是挖掘布尔关联规则一个很有影响的算法。它以一个频繁项集的任意子集也应该是频繁项集为原理,利用一个层次顺序搜索的循环方法来完成频繁项集的挖掘工作。Apriori算法利用支持度一信任度的基本结构进行关联规则的挖掘。尽管利用最小支持阈值和最小信任阈值可以帮助消除或减少无意义的规则,但其所获得的关联规则仍含有较多无价值的规则。因此,论文在以下3点进行了的研究: 首先,论文在分析基于置信度获取关联规则的基础上,利用统计学的理论对关联规则进行检验,通过兴趣因子对关联规则进行度量,以删除冗余规则。 然后,利用可拓学知识通过两种方法对关联规则进行分析和拓展:a对数据库中的记录和频繁项集建立物元集合,利用由物元和关系元导出的复合元,对关联规则建立复合元集合;b将所得到的关联规则建立二维物元可拓集合,利用可拓集合作为关联规则拓展的定量化工具。通过对关联规则可拓化,利用可拓变换和可拓推理,对关联规则进行拓展,获得新的信息与知识。 最后,本文在对关系数据库上的数据进行关联分析的基础上,在ibuilder2005平台上开发了关联规则数据挖掘系统,并利用可拓学对所获得的关联规则进行拓展。从定性的方面论证了规则拓展的有效性。
其他文献
信息技术的发展对全世界来说都产生了极大的影响,是当前高技术发展中的主流技术,因为信息在人类生活中无处不在,无时无刻的不影响着人类的生活,对信息的获得和挖掘成为科学界关注
无线传感器网络作为一种新型的具有广泛应用前景的无线自组网络,其有效路由协议是目前研究的热点。随着研究和应用不断深入,对传感器网络提出更高的要求:为不同的业务提供有
虚拟现实技术是由计算机生成的人机交互的三维空间环境构成,它不仅能构建高度逼真的复杂虚拟环境,而且用户还可以和虚拟环境进行互动,增强系统的交互性和沉浸感。随着虚拟现实技
聚类在模式识别、系统建模、图像处理及数据挖掘等工程领域扮演着重要的角色。其基本算法广泛应用于生命科学、医学、社会科学、地理科学、工程科学等领域。聚类就是将数据对
专利文本由于包含有产品的组成结构、设计目标、组件功能原理等相关内容,一直是创新方法和产品革新最首要的信息源泉。专利是相关领域下的具有革新理念的解决方案,专利包含有
无线传感器网络是由大量低成本、低功耗、具备感知、数据处理、存储和无线通信能力的微型传感器节点通过自组织方式形成的网络。无线传感器网络技术将是21世纪最有发展前景的
在数据挖掘的分类应用中,决策树算法是最为广泛的一种分类算法,具有算法简单高效、分类精准度高的特点,但是在建立分类模型的过程中将所有的误判分类平等对待,导致不同成本值
一种基于互联网技术产生、发展的新式计算模式一一云计算正在不断改变人们的传统网络计算的理解。云计算这一技术很好地解决了对海量数据处理的需求,其可以认为是未来新一代
学位
随着会议智能化程度的普遍提高,几乎所有行业的正式会议都会使用PPT来进行辅助展示。演讲人在进行展示过程中需要借助双手对电脑进行操作,或者利用终端设备进行翻页操作等。为