不完整关系数据库中关联规则挖掘问题的研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:snmydmyd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是数据库、人工智能、机器学习等领域结合而产生的是一个新兴的、具有广泛应用前景的研究领域,其目标是从海量数据中智能、自动地提取有价值的信息和知识以支持决策。关联规则挖掘是数据挖掘的重要研究内容。对关联规则挖掘问题的研究是由Agrawal等人在1993年提出来,最初的动机是希望通过分析超级市场的商品销售数据来发现有关顾客购买行为的知识以指导商业决策。在超级市场的事务数据库中,保存着顾客每次购物的商品项目信息,发现顾客购物行为中不同商品项目之间的影响和联系对于商业决策意义重大。对关联规则挖掘问题的研究可以帮助我们正确的发现这些联系。 关联规则挖掘问题的提出引起了众多研究人员的重视,他们对该问题展开了深入的研究;同时,关联规则挖掘问题也被进一步扩展和改进,应用到更广泛的领域。目前,关联规则挖掘技术已经被应用到除商业领域外的其它领域,如电讯业、金融业等,均取得了良好的效果。 关联规则挖掘问题最初仅涉及事务数据库,由于事务数据库中不存在属性值丢失的问题,值丢失问题在关联规则挖掘的研究中也一直没被重视。然而,当我们尝试去发现关系数据库中的关联规则时,就可能经常要面对属性值丢失的问题。怎样从不完整的关系数据库中计算关联规则至今仍没有明确的方法。 文中详细介绍并比较了AIS算法、SETM算法、Apriori算法、DIC算法等典型的布尔关联规则挖掘算法,研究了其各自的效率和适用范围;详细介绍了数值关联规则挖掘的一般思路和关键技术,包括连续属性离散化、数值关联规则的兴趣度和挖掘过程中候选项目集支持率的计算方法;基于粗糙集理论中的等价类思想,本文提出了一种在关系数据库中进行关联规则挖掘的新方法,重新定义了关系数据库中的关联规则,及其支持率和置信度等概念,给出了通过搜索项目集的等价类来发现频繁项目集的新思路;深入研究了不完整关系数据库的重要性质,并在此基础上介绍了不完整关系数据库中的关联规则,以及它的支持率和置信Iz辇霎弓爿 茄半壹a井寸Y“-/M托工ER S 工肛SIS 度的评估方法,并定义了它的期望支持率和期望置信度,这些定 义保证了关联规则挖掘的某些必需的性质;研究了以往的丢失值 处理方法并分析了其不足之处,最后结合前面的定义给出了不完 整关系数据库中关联规则挖掘问题的新的定义和解决方法。/
其他文献
ⅠK型小麦雄性不育系六倍体及相应单倍基因表达的差异分析   K型小麦雄性不育系由于核质互作会产生一定频率的单倍体。前人研究了单倍体的产生频率,从细胞学角度和遗传角
汽车前照灯反射器的设计是一个系统的工程,把计算机辅助设计技术引入到汽车前照灯反射器设计这一领域,将有力地促进其设计方法的发展.首先,该文介绍了一般的灯具设计概论,在
汽车灯具(配光镜)的设计是一个系统的工程,把计算机辅助设计引入这个领域,将有力地促进其设计方法的发展.该文主要介绍了汽车灯具配光镜仿真设计程序的开发,这套软件对汽车灯
随着人类社会生产力的大幅提高及人口压力的不断增大,全球范围的淡水水体富营养化现象日趋严重,由此引起的蓝藻水华在世界范围内频繁暴发,伴随其产生的毒素与动物及人类健康
在语音合成的研究中,基于HMM的统计参数语音合成近些年在汉语等成熟语种中的广泛应用的同时,也逐渐开始应用在藏语等少数民族语言在内的语言学的研究中,文本分析对合成语音的自
近40年来,中国快速经济发展引发较为严重的大气污染,PM2.5是主要的空气污染物之一,掌握其时空分布规律及影响因素是对其进行防治的重要前提。本研究基于遥感反演出的PM2.5浓度数
对于个体的人而言,传情达意除了惯用的口述、文字之外,还可借助表情语言和肢体语言来落实,相对于五官表情语言的局限性,肢体语言的优势不言而喻,从绘画(如古代早期人物画、汉
期刊
视频点播系统是指给用户提供一种交互型的多媒体业务员,综合了计算机、通信、多媒本和电视等多荐技术.研究人员成功开发了基于HFC网络的视频点播系统并投入使用;在此基础上,
随着数码相机的普及,更多的数字处理技术应被应用到该项产品中,传统的对图像传感器的控制方法具有一定的局限性,该文在模糊控制理论的基础上提出了一种适用于图像传感器的曝
目的:IκB家族成员是RELA的一组重要转录靶基因。早期研究认为,RELA的失活是因为新合成的IκB进入细胞核中与RELA-DNA复合体中的RELA结合,使RELA从顺式作用元件上解离,回到细胞质