基于概念格的多值属性关联规则可视化挖掘

来源 :河北师范大学 | 被引量 : 0次 | 上传用户:xamalong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多值关联规则可视化挖掘是借助可视化技术来描述数据库中多值数据项(属性、变量)之间存在的潜在频繁模式和相关关系。可视化技术能够无缝的集成到关联规则发现过程中,将挖掘结果直观清晰地展现出来,用户能够更快、更容易地识别出隐藏在数据内部的有用信息,提高决策效率。作为知识的一种可视化表现形式,概念格已经被人们应用到数据挖掘领域。文章利用概念格理论提出了多值属性关联规则可视化挖掘解决方案,通过数据源可视化、交互式参数调整与可视化挖掘过程、多值属性关联规则挖掘算法、频繁项集与关联规则的可视化以及关联规则的知识表示等机制,使用户可不依赖领域专家直接进行关联规则可视化挖掘。该方案在提高挖掘效率的同时,提高了挖掘结果的可用性。论文以研究和实现基于概念格的多值属性关联规则可视化挖掘为核心,主要做了以下几方面工作:1.运用概念格理论给出了适合关联规则可视化挖掘的多值属性数据分类,并建立了较为完善的挖掘过程参数调整机制。根据某省全员人口数据的特点,结合概念格理论给出了适合多值属性关联规则可视化挖掘的多值背景定义,将其分为数值型多值属性、区间型多值属性和类别型多值属性三类;建立了以支持度、置信度、关键属性因子和概念层因子为基础的参数调整机制,在整个挖掘过程中通过调整相关参数的大小来挖掘相应的频繁项集和关联规则,方便用户选择关键属性值进行规则挖掘分析,提高算法运行速度和挖掘效率。2.提出了基于关键属性因子和概念层因子的Apriori改进算法。针对传统关联规则挖掘算法用户无法选择关键数据进行分析、不利于处理多值属性数据及效率低下等问题,提出了基于关键属性因子KAF因子和概念层因子CHF因子的Apriori改进算法进行多值属性关联规则挖掘。同Apriori算法相比,改进后的挖掘算法在执行速度和挖掘效率上具有更好的性能表现。3.给出了基于概念格的多值属性关联规则可视化方法。由于传统关联规则可视化方法无法展现数据间的频繁模式和关系、缺乏多模式展现形式等,提出了一种新的多值属性关联规则可视化算法。通过引入概念格把多值属性数据项有机地组织起来,使数据之间的关系通过概念格节点的泛化与特化关系直观地体现出来,不仅便于用户对频繁项集进行可视化展示和动态分析,而且实现了一对一、一对多、多对一、多对多以及概念分层的多模式关联规则可视化展示。4.给出了基于概念图的关联规则知识表示方法。鉴于传统关联规则表示方式无法展现领域知识、数据项间的关系及规则中所隐含的信息等问题,提出了一种基于概念图的关联规则知识表示方法,包括模式定义和模式解析,结合概念图理论将关联规则转换成概念图的知识表示形式,使数据项之间的关系利用概念节点和关系节点表现出来。展示结果接近自然语言形式,具有较强的可读性,有助于用户对关联规则进行深入分析和研究。
其他文献
集体备课,就是教师合作备课,其目的是让教师发挥集体的智慧,理解教材、探索教法。通过集体备课达到课堂教学的高效,同时提高教师的整体专业水平。
武术,是中华民族的优秀传统文化之一,经过长时间的沉淀,我国武术形成了自身的特点。武术,不仅具有增强体质的功用,而且它还会在一定程度上起到陶冶情操,培养良好道德意识的一项体育
负激励是指当组织成员的行为不符合组织目标或社会需要时,组织将给予惩罚或批评,使之减弱和消退,从而来抑制这种行为。负激励的具体表现主要为:警告、纪律处分、降级、淘汰等。
通过对小麦矮腥黑穗病菌(TCK)及其近似种小麦网腥黑穗病菌(TCT)和小麦光腥黑穗病菌(TFL)的rDNA序列ETS区间测序比较分析,找出了TCK相对于TCT和TFL的特异性序列,并根据TCK的特
本文简要介绍了装饰保温承重(三合一)砼空心砌块的块型设计、物理力学性能、试点建筑的实测结果。为了推广应用编制了建筑通用设计图集。这对我国在“九五”期间实现节能住宅的
为解决秦岭柳梢沟矿区深部找矿问题,在柳梢沟金矿区开展了电化学找矿研究,利用衬度异常法等地质统计学方法对地电提取数据进行处理。结果表明,在3个不同矿区的已知矿体上方集
笔者近期听了一些历史学科的常态课和研究课,最大的感受是:很多时候,教师的“教”和学生的“学”并没有实现和谐统一。学生的积极性没有被充分调动起来。一堂真正精彩的历史课,不仅能够实现知识的高效传授,而且能让学生在心旷神怡中得到人文素养的提高。笔者认为,精彩的历史课堂具备以下三个因素。  教是为了不教  中国古代教育理论给我们提供了种种借鉴。《易经》指出,“匪我求童蒙,童蒙求我”, 即教师要尊重学生求学
随着移动互联网浪潮的席卷,人们习惯了通过智能移动终端随时随地的享受互联网带来的便捷。为了应对由此引发的设备多样性问题,服务商不得不针对每一类型的移动终端单独研发产