基于证据理论的分类方法研究

被引量 : 0次 | 上传用户:wzllh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对当前大量产生及累积的数据和信息人们已不再满足于对信息的查询和统计,对数据分析的智能化和自动化要求越来越高。数据挖掘和机器学习技术的发展已经使得人们可以从大量的、不确定的和有噪声的数据中智能的和自动的提取出隐含在其中的有价值信息和知识。分类方法作为数据挖掘、机器学习和模式识别中的一项重要方法,它可以有效的帮助人们对获取的数据实例进行预测分析、对未知的模式样本进行判断识别,以便做进一步的分析和利用。证据理论是一种对不确定性问题和知识进行表示和处理有力工具,将证据理论与分类方法的结合研究能够提高分类器对不确定数据的分析、处理和表示能力。同时,将证据理论中的证据处理机制和合成规则引入分类方法中也能有效的提高分类器的分类准确率。当前基于证据理论的分类方法研究主要有两种:一、将证据处理和合成机制与分类方法的设计相结合,即在单个分类器的设计中用证据理论的方法来提高分类器的性能;二、将证据理论的组合规则应用于多分类器集成,组合多个分类器的结果以获得更高的分类准确率。本文基于证据理论对分类方法进行了深入研究,论文主要工作和创新点如下:(1)在将证据理论的证据表示和合成方法与分类器设计相结合的研究方面,在基于证据理论的k-NN分类算法和局部平均向量分类算法研究的基础上,提出了一种子空间局部平均证据分类算法(Subspace Local Mean Evidence Classifier, SLMEC)。该方法将训练样本集中每个类别的相对于测试样本的局部平均向量视为是对测试样本进行分类的证据,同时该方法在多次随机均等划分得到的多个特征子空间中收集更多的有效证据,然后将所有收集到的证据基于证据理论的证据表示和合成方法进行处理,最终完成对测试样本的分类。SLMEC由于采用了局部平均向量作为分类决策中的证据,因而具有很好的抗噪声和处理不平衡数据的能力,并且由于使用了结合在子特征空间中收集到的证据进行分类决策的方法,使得该方法达到了更高的分类准确率并且在高维数据上具有更好的表现;(2)在基于子空间局部平均证据分类算法(SLMEC)研究的基础上,通过与k最近邻局部超平面分类算法相结合,进一步提出了一种随机子空间证据分类算法(RandomSubspace Evidence Classifier, RSEC)。RSEC仍然采用了在随机划分生成的子空间中进行证据的收集并用于辅助分类决策的方法,但该方法中采用了局部生成的超平面作为对测试样本进行分类的证据。实验结果表明,与SLMEC算法相似,RSEC在不平衡数据和高维数据上也具有很好的表现,并且在UCI基准数据、人工合成数据和高维人脸识别应用中的测试结果显示,RSEC具有很好的分类性能。该研究还进一步表明我们提出的结合原特征空间和子空间中收集到的证据共同进行分类决策的方法的有效性;(3)在将证据理论的组合规则应用于多分类器集成的研究方面,将基于证据理论的多分类器集成方法应用于随机森林算法的多分类器组合阶段,使用基于证据理论的多分类器集成方法取代传统随机森林算法中的简单投票法给出了两种基于证据理论改进的随机森林算法。一种方法为直接使用随机森林算法中决策树基分类器的度量层输出作为基本信任分配,然后使用证据理论合成规则进行多分类器组合;另一种方法是结合Rogova提出的基于证据理论的分类器集成方法来组合随机森林算法中的多个决策树基分类器结果。实验结果表明,两种基于证据理论方法改进的随机森林算法与基于简单投票法的随机森林算法相比泛化性能均有明显提升;(4)在基于证据理论改进的随机森林算法研究的基础上,通过研究集成学习中的两个基本问题,即“如何提高个体基分类器的性能和多样性”和“使用更好的组合多个基分类器的方法”,提出了一种基于证据理论集成的多样性森林算法。该方法中采用决策树分类器作为基分类器,利用了随机子空间方法、Bagging法和基于主成分分析的坐标轴旋转法的叠加效应来产生决策树基分类器算法的多样性;同时该方法采用了不同于传统投票算法的基于证据理论的多分类器集成方法进行多分类器的集成。在UCI基准数据、人工合成数据和语音情感识别应用中的测试结果显示,基于证据理论集成的多样性森林算法与随机森林,决策森林和旋转森林等基于决策树的多分类器集成算法相比具有更好的性能。
其他文献
质量成本是管理的经济表现,是衡量质量体系有效性的一个重要因素。对质量成本进行统计,分析,报告和控制,不但可以找到减低生产成本的途径,促进经济效益的提高,同时还可以监督和指导
改革开放以来,随着社会的深刻变革和多元文化的剧烈冲击,中国青年文化经历曲折的发展。如今,网络及媒体技术的新发展又将青年人带进了一个全新的时代——自媒体时代。在这样全新
介绍了液环真空泵工作原理、流程及应用情况。液环真空泵在8.0 Mt/a常减压蒸馏装置抽真空系统的应用结果表明,采用液环真空泵与蒸汽抽真空系统组合抽真空工艺,可发挥各自特长
汉字是中国文化的象征,有着数千年的历史,它作为一种标记文字,长时期在东亚文化圈内应用和发展下去。汉字虽然是属于语言学领域的概念,同时又作为一种文明的存续,与历史、政
能源自古以来就是人类赖以生存和社会进步以及经济发展的重要物质基础,社会发展进入工业化时代以来能源更是一跃成为实现经济增长的决定性生产要素。21世纪,能源不仅成为全球
车辙是沥青路面的一种损坏形式,表观表现为沥青路面轮迹带范围内路面的下凹,有时伴随轮迹带边缘的隆起,这种现象主要是由于路面沥青混合料被压密和剪切变形所致,并且通常发生在面
企业之间的竞争,归根结底是人才的竞争。众多国内企业对彼得·圣吉“学习型组织”的贯彻与实践,其作用在于锻炼队伍、培养人才,从而推动企业可持续成长。L公司作为一家民营企业,
环氧树脂是一种非常重要的热固性树脂,具有优异的耐化学腐蚀性、力学性能、黏结性、绝缘性等,广泛应用于工业中。环氧树脂由环氧预聚物和固化剂经固化反应而成,环氧树脂预聚物在
幼儿教育近年来日益受到国家和社会的重视,幼儿教育为个体的发展奠定了重要的素质基础,而幼儿教师在幼儿教育中起到重要作用。在幼儿教师专业化要求愈来愈高的社会背景下,对
丁玲(1904-1986)和姜敬爱(1907-1943)是中国和韩国现代文学史上最具代表性的女作家之一。她们都在近代到现代这一重大历史变革时期通过文学来表达自己的意愿和历史诉求,两人