基于贝叶斯网络的多类标分类算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:abczxhzxh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的迅速发展,数据的分析与利用已成为研究的热点。数据挖掘是从数据中获取有用知识的学科,其重要的任务之一就是分类,而现实生活中数据则常用多类标分类模型。在现阶段的研究中,针对多类标分类问题中类标之间依赖关系的研究,存在两个方面的问题:(1)大多数多类标学习算法在利用类标间的依赖关系时,缺乏一个统一明确的类标间依赖关系的描述模型和确定的利用方法,且构建其依赖关系的策略相对简单;(2)贝叶斯网络是一个典型的模型,然而构建完整的贝叶斯网络模型是及其复杂的,其被证实是一个NP-hard问题。因此如何通过现有的理论,构建合理的限制性贝叶斯网络是研究的重点。针对以上两个问题,本文在贝叶斯网络模型的基础上研究了如何合理地描述类标之间的依赖性来提高多类标分类模型的性能。本文主要包括以下研究工作:(1)研究如何用合理的策略构建类标之间的依赖关系,减少类标之间的错误和冗余信息,以提高分类模型的性能。本文的研究中结合了特征选择中常用的属性相关性的算法理论和遗传算法的启发式搜索理论,优化类标之间依赖关系。首先,根据属性相关性的理论综合考虑类标之间的相关性,类标和条件属性之间的相关性,给类标之间相关性大的类标子集赋予较高的评价值。然后,在传统遗传算法的全局搜索中,本文修改三个方面以适应多类标分类模型:1)修改属性相关性算法的理论计算公式,用于遗传算法的个体适应度评价函数;2)使用分类器链中部分链,以减少完整链携带的冗余和错误信息;3)修改了遗传操作中具有不同长度编码的个体的交叉和变异。(2)研究通过构建类标的限制性贝叶斯网络结构以表示类标之间的依赖关系,并提出一种贝叶斯分类器链模型。该模型中贝叶斯网络给出一种类标之间依赖关系的度量,其主要是利用多种策略构建类标之间的有向树型贝叶斯结构。本文在构建多类标的贝叶斯分类器链模型的过程中采用了两个基本策略:1)通过考虑类标之间的条件独立性,减少模型中类标的数量;2)尽可能地减少模型中链序列的数量。通过以上基本策略构建贝叶斯分类器链模型,并在五个具体的方面使用不同的算法研究和比较各个算法特点和分类性能。这五个方面具体为:训练策略,链中类标顺序,每个基分类器中的类标数(链复杂度),不同的基分类器,算法的集成。综上所述,本文对多类标分类问题中类标之间依赖关系的问题进行了研究和实验,提出了基于属性相关性的多类标分类算法和基于贝叶斯分类器链的多类标分类算法。并用实验验证了合理构建类标之间的依赖关系能提高分类模型的性能。
其他文献
通过对参加有氧搏击操训练18周的30名女大学生锻炼前后的各项身心指标进行测试与对比,结果显示:长期的有氧搏击操训练可使体型、体成分发生明显的改变,身体素质、心肺功能明
目的:观察自拟化湿宣肺清肠饮治疗溃疡性结肠炎的临床疗效。方法:将57例患者随机分为两组,治疗组29例予自拟方化湿宣肺清肠饮治疗,每日1剂,水煎服。对照组28例予柳氮磺胺嘧啶
目的:观察旋覆代赭汤及原方倍用甘补组方对反流性食管炎(RE)模型大鼠食管舒缩神经递质活力的影响。方法:将110只雄性Wistar大鼠随机分成正常对照组、假手术组和造模组。将造
德育在中小学教育中占据的比重非常大,并贯穿于中小学教育过程的始终。在小学音乐教学中渗入德育,能够使学生从内心感受到品德的力量,促进学生养成优良品质,为学生今后能够真
用航椒5号和2006D2与陇椒3号、陇椒5号进行了设施辣椒反季节一大茬栽培品比试验。结果表明:陇椒3号、陇椒5号的丰产性好,商品性佳;航椒5号和2006D2表现较差。
小学科学课是一门以培养学生科学素养的启蒙课程,通过学习科学,学生可以运用科学思维方式解决生活、学习中的一些问题,能够全面提高学生的科学素养。要想让学生爱上科学课,喜
目的观察紫杉醇联合不同铂类治疗晚期非小细胞肺癌的疗效及不良反应。方法120例初次确诊为非小细胞肺癌患者,随机分为4组。顺铂组:给予紫杉醇175 mg/m2,顺铂80 mg/m2;卡铂组:
目的比较对ETV应答不佳的乙型肝炎患者挽救方案的疗效。方法选取我院2011年10月至2016年10月收治的对ETV应答不佳的乙型肝炎患者96例,随机分为ETV+ADV组、TDF组和ETV(1mg)组,
通过对河北省部分设施茄子生产区的一线调查,汇总了茄子生产中存在的一些问题,利用文献资料查询及多年的生产经验总结了解决问题的对策,旨在为农民致富增收提供帮助。
<正>基于农村幼儿园班额大、材料匮乏、硬件条件差、教师文案工作多等情况,要想经常使用自制玩教具难度还是很大的。因此,我们要开展好保教活动,提高幼儿游戏的质量,就需要合