数据挖掘中基于兴趣度的关联规则研究

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:yinjie340
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘作为是人工智能的一个分支,正逐步的被应用到各个方面,从初级应用到目前的大量而广泛的应用,人们对此学科的发展,耗费了许多努力,提出了许多研究方法,极大的发展了这门学科。在发展的过程中,数据挖掘针对不同应用,分别发展出聚类、分类、关联规则等不同的挖掘方法。在初期的关联规则的研究过程中,大部分集中在支持度-置信度阈值的研究上,但在实际应用过程中,易产生许多虚假误导的规则。为此关联规则的生成在考虑支持度和置信度阈值的同时,还需引入兴趣度度量,来检验结果是不是具有价值。目前许多人提出了不同的兴趣度度量方法,但并没有被广泛接受的兴趣度度量标准,在此研究的方面仍需要完善。因此,针对传统支持度-置信度这一框架不足这一问题,结合对部分已有兴趣度度量进行分析研究,提出了新的兴趣度的度量,并用实例证明了该度量的有效性。同时在利用兴趣度挖掘有价值的正负关联规则时,负关联规则的有效挖掘面临着规则爆炸问题,虽然人们已经从不同方面提出了挖掘正负相关关联规则的算法,但对减少负关联规则爆炸性问题仍有许多问题未解决。文中从减少非频繁项的角度,结合新的兴趣度度量,引入了最大支持度模型,提出了一种挖掘正负关联规则的算法,并通过Mushroom数据集上的实验证明具有减少无关规则和误导规则的有效性能。由于负关联规则不仅需要规则有意义而且还应具有可读性,因此本文在已有挖掘算法上更进一步提出了一种新的负关联挖掘算法,不仅可以大幅减少无关和误导的规则,而且通过实验与已有算法相比还具有良好的可读性。在最后,本文将改进的算法应用到股票间涨跌联动的研究之上,研究股票个股与个股之间涨跌之间的正负关联关系,一方面通过此实例验证验证算法的实用性,另一方面也在研究中获得了一些有价值的关联规则。
其他文献
突触传递是神经信息处理的重要环节,主要通过突触前神经终末的囊泡释放神经递质诱发递质受体介导的突触后兴奋性或抑制性反应而实现。在神经突触上,囊泡有自发释放和突触前的动
1 案例背景rn热源站是城市供热节点的热源场所.它的作用是根据热网工况和不同的条件,调节热源,向热用户系统分配热量以满足用户采暖需求,并根据需要,进行集中计量、检测供热
期刊
本论文主要就颈眩宁胶囊的质量标准进行研究,建立了合理的薄层鉴别及含量测定方法。采用薄层色谱法对制剂中天麻、白芷、川芎、延胡索、葛根进行了鉴别。按照《中华人民共和国
以太无源光网络(EPON)技术以光纤到户(FTTH)为目标,是信息高速公路最初一英里的最终解决方案之一,可以最终实现电话、电视、数据三网合一。作为一种新型的综合业务宽带接入网,其
随着全球光伏电站的数量急剧增多,为了提高发电率,光伏电站已由大规模发展向大规模运营转变.光伏电站建成并网后,发电量便成为衡量其价值的重要标准.如果电站没有专业化运维,
期刊
高电源效率、高电源电压抑制比、高精度、输出负载工作范围广等高性能的低压降电压调整器(LDO)的设计与实现是本论文的核心。本文以介绍最新的文献提出的几种LDO及其补偿方式为切入点,分析其优缺点后,提出本文的核心思想,自适应的零点补偿方式,用可变电阻实现的nulling resistor的两级放大器作为LDO中的误差比较电路,大大提高了LDO的各项性能指标。在LDO的主电路的设计和辅助电路的设计中,都
中国南海蔚蓝的水面下蕴藏着丰富的石油资源.中国海洋石油总公司(中海油)湛江分公司最新的油田开发建设项目位于中国南海北部湾的涠洲岛附近,并已于2015年底全部建成投产.这
期刊
香薷属(Elsholtzia Willd.)是以中国为主要分布区的类群,本属大多数种类属于药用植物。香薷属(ElshoItzia Willd.)现被置于荆芥亚科香薷族,本族是一个单系类群,但香薷属是否
随着模式识别相关理论的发展,有关人脸识别的产品逐步走入了应用市场。但在应用中,由于人脸存在着各种非可控条件,如光照、表情、姿态等,这些条件可能导致在可控条件下识别性
本论文包括两部分相互独立的内容。第一部分主要内容是使用光纤进行活体荧光记录技术的开发和应用。随着基因技术的发展,基因转染技术已广泛应用于动物实验和临床研究。病毒作