基于混合策略的关联分类方法研究

被引量 : 0次 | 上传用户:6ri
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息数据的高速增长,数据挖掘已经成为一个活跃的研究领域,用来从海量数据中快速高效地获取有用的信息。在数据挖掘领域中关联规则挖掘和分类挖掘技术是两个重要的分支,其应用遍及社会各个领域。关联分类方法是将关联规则挖掘与分类挖掘技术相结合的新方法,其具有分类精度高、扩展性好等特点,备受很多研究人员的关注,是分类研究领域中一个十分具有研究价值和应用前景的研究方向。现有的关联分类方法主要有Eager关联分类方法和Lazy关联分类方法两种。Eager关联分类方法是针对全部的样例进行总体分析,但当类样本较少时会出现small disjunction问题,如果通过降低最小支持度和最小置信度的阈值来解决该问题,又会导致更大的挖掘开销;Lazy关联分类方法则是针对当前具体样例进行分析,其能够避免small disjunction问题,但是当待分类样本很多时,又会出现分类效率低下的问题。本文首先针对关联规则挖掘的相关理论和算法进行介绍,并分析了Eager关联分类方法和Lazy关联分类方法所存在的优点与不足,然后针对这两类算法所存在的不足,并结合各自的优点,提出了一种新的分类方法—基于混合策略的关联分类方法,并研究分析了该方法对缺失数据集的分类情况,最后通过在18个UCI数据集上所做的大量实验验证了本文方法的有效性。本文所提出的方法的主要贡献如下:①针对两类关联分类方法所存在的不足,提出了将Eager方法与Lazy方法相结合的基于混合策略的关联分类新模型。②在算法方面,采用Lazy方法解决Eager方法中存在的small disjunction问题,并针对Eager方法与规则匹配进行改进,实验结果表明本文方法与CBA算法和LAC算法相比,其分类准确率更高。③本文方法在算法整体执行效率方面较Lazy方法有很大的提高,使得关联分类方法更具有实用性。④为了验证本文方法在缺失数据集上的分类情况,本文分别针对本身有缺失的数据集和通过人为对数据集作5%、10%、15%、20%缺失处理的数据集进行了实验,实验结果表明在直接对缺失数据集进行分类时本文方法比朴素贝叶斯方法的分类准确率更高。
其他文献
目的 观察脑缺血后,针刺对脑缺血大鼠额叶皮质Bcl-2、Bax表达的影响,为揭示针刺治疗脑缺血的机制提供实验依据,也为临床针刺治疗脑缺血提供参考。 方法 用雄性SD大鼠采
随着序列模式挖掘技术的不断发展,加权序列模式已被广泛应用到生物医学、经济、网络等领域,成为数据挖掘领域中的一个研究热点。而在一般的加权序列模式挖掘算法中通常使用预先
目的:探讨高压氧综合治疗在神经性耳聋中的应用价值。方法:将63例诊断为神经性耳聋的患者随机分为两组,两组均使用常规药物治疗。治疗组在药物治疗基础上又加高压氧(HBO)治疗
<正>2012年考研试卷的阅卷工作仍然参照去年的新模式,对试卷先扫描,再在电脑上进行批阅。该模式省时高效,也方便了各级阅卷组长对阅卷质量、进度的监控。作为参加过近10年考
目的观察中医辨证论治对功能性消化不良(FD)患者焦虑、抑郁状态的影响。方法采用随机、双盲、多中心、安慰剂对照临床研究。收集273例FD患者,根据中医辨证论治将FD患者分为湿
:从病名、病因病机、辨证分型、治疗规律等诸方面 ,对胆汁反流性胃炎的中医研究现状和进展进行了评述。认为今后应在胆汁反流性胃炎的中医病名研究 ,建立完整客观的诊断指标
本研究对全国2929名大学生进行问卷调查,考察大学生主动性人格对生涯适应力的影响机制。结果表明:大学生主动性人格可正向预测生涯适应力;大学生职业探索在主动性人格与生涯
目的:观察电项针与电针对成年雄性大鼠脑缺血后水通道蛋白4及脑水含量的影响,并比较电项针与电针之间的作用差别,探讨电项针治疗大鼠脑缺血后脑水肿的可能机制。方法:将大鼠随机
自20世纪80年代开始,全球经济一体化和现代物流业的高速发展极大程度地推动了港口物流业的发展。作为港口大国,我国的上海港、深圳港、舟山港、青岛港、天津港都已名列世界级大
目的:(1)研究颈椎前路手术术式所取髓核组织中髓核细胞生物学特性,及用于椎间盘髓核组织工程学种子细胞的可行性。(2)探讨适合组织工程学种子细胞的髓核细胞的代次。(3)研究冻存复苏