基于标签预测与传播的鲁棒半监督分类算法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:hhttllzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
标签传播是一种基于图的半监督分类算法,具有效率高和比传统分类方法性能更好等优点,在机器学习领域吸引了广泛关注。但是现有的标签传播算法仍然具有如下不足:1)分类过程对数据中的噪音和异类数据比较敏感,即鲁棒性不够强,容易导致标签预测能力降低;2)传统方法一般将传播过程分为两个步骤:权重构造和标签传播,因而学习到的权重对于后续的标签预测并不是最优的,且近邻图的构造易受到近邻数或核宽度的影响;3)现存的大部分标签传播算法专注于处理单视图样本,没有考虑多视图数据,可能会导致标签预测结果不准确;4)现有方法大多基于原始输入空间和原始的软标签空间进行分类,然而原始数据和软标签通常包含大量的噪音和混合信号,会导致分类结果不够准确。鉴于此,本文提出了有效的解决方案和策略,并通过多种仿真实验验证了新算法的有效性。主要工作包括:(1)为了提升标签预测过程的鲁棒性和分类准确性、解决因原始数据和原始预测软标签中的噪音或异类数据对权重构造和分类结果的不利影响,同时解决由于权重构造与标签预测过程分开处理所导致的分类结果不够准确的问题,提出了一种基于双重矩阵分解的鲁棒自适应标签传播算法,可同时避免近邻数对权重系数的影响。新模型通过在干净的数据空间和干净的标签空间中进行权重构造和标签预测,有效提升了模型的预测能力。具体地,在学习过程中将原始数据和预测软标签进一步分解为干净的数据和软标签,可消除二者中的噪声和混合信号,进而基于干净的数据空间进行权重学习,最后利用干净的软标签矩阵估计出样本的硬标签完成分类。(2)为了进一步提高分类精度,在双重矩阵分解的基础上进一步将权重矩阵分解为干净的权重系数和噪音部分,去除权重矩阵中的噪声和原始数据空间中输入的错误标签信息,提出了基于三重矩阵复原的自动加权标签传播算法。通过三重矩阵复原机制,将原始数据、预测软标签和权重矩阵分解为干净的部分和噪声部分,协同复原得到干净的数据空间、软标签空间和权重空间。此外,基于最小化基于干净数据和干净软标签上的重构误差进行自适应的权重学习,以确保学习得到的权重对于数据的表示和数据分类都能取得最好的效果。(3)真实应用中的样本可能在各个子空间中具有多视图的表示形式,如果只考虑单视图信息易导致标签预测不准确的问题。因而如何充分挖掘多视图数据中的有价值信息进而增强样本标签预测能力是一个值得探讨的问题。为了解决这个问题,本文提出了一种基于多视图学习的自适应标签传播算法,将多视图标签传播和自适应多视图权重学习集成到一个统一的模型,利用样本的多个视图而非单个视图进行半监督学习,通过线性变换约束不同的权重对应不同的视图空间,基于多个视图空间确定样本的类别。此外,基于多个视图进行了自适应权重学习,也可避免因人工设置近邻数的难题。
其他文献
近些年,随着人工智能领域的技术不断发展,AI技术被逐步应用于各个领域,其中智能辅助驾驶系统便是AI技术在汽车行业中的一种应用,也是无人驾驶技术的基础。智能辅助驾驶系统利
某履带式驾驶教练车的电液式变速操纵装置,是以MC68376微处理器为核心,具有功能外围电路及控制部件的线控换挡系统,由于功能不够完善,需进行控制平台的升级。为减少开发时间,通过V模式开发流程,在原有功能上增加故障诊断技术与容错控制策略功能,开展相应的工作:基于教练车电液式变速操纵装置,分析电液式变速操纵装置的组成和各部件的工作原理,对部分硬件进行改进。结合教练车在不同的工作状态,对各状态下可能发生
养猪生产中常使用抗生素来维持健康和促进生长。然而,抗生素长期大量使用会造成畜产品抗生素残留、内源性感染、免疫力降低和耐药性等诸多问题。因此,开发新型抗生素替代品成
美国印第安文学是美国文坛不可小觑的分支。它的兴起一改印第安人在传统美国文学中的形象,真实地反映了印第安民族的风俗与信仰,历史和现状。詹姆斯·韦尔奇(1940-2003)是美国印第安文艺复兴时期四大巨匠之一,其作品重在刻画印第安人传统与现代生活的冲突。《血中冬季》讲述一个无名主人公疏离于印第安传统,游荡于印第安保留地和白人城镇之间,并最终建构杂糅身份;《吉姆·罗尼之死》则叙述主人公吉姆·罗尼,同样疏
背景:Mo/MΦ介导的固有免疫反应是导致AS脂质斑块进展、不稳定的主要因素;T淋巴细胞亚群介导的适应性免疫对其发挥了重要的调节作用。近年来研究表明,GABA_A能药物及其介导的GABA_A受体途径能够有效地调节单核/巨噬细胞(Mo/MΦ)等免疫/炎性细胞的活性。但GABA_A受体途径能否通过调节AS免疫/炎症反应来调节AS斑块的稳定性尚未证实。目的:研究GABA_A受体途径调节动脉粥样硬化斑块稳定
田间杂草给农田作物带来极大的威胁,杂草一般具有很强的生命力,在与作物争夺养分的同时还可能传播病毒,导致病虫害蔓延,极大降低农作物质量、产量,给粮食生产带来巨大经济损失。对于杂草的威胁,目前常用的方法是使用化学除草剂,传统施药方式是大面积喷施,既浪费了成本又污染了环境,精准农业可以很好的抑制这个问题的恶性发展。精确、变量、自动化是精准农业的宗旨,通过图像处理技术获得农田田间实际杂草分布情况,自动喷施
转Bt基因作物在害虫防控方面发挥巨大作用,同时其可能引发的环境风险,尤其是在生物多样性影响方面亦被广泛关注。以往相关研究多以地上部节肢动物为评估对象,评估对地下部土壤动物群落影响的研究较少;立足一个生态区,针对一种转基因玉米材料,综合全面评价其对地上、地表、地下部节肢动物群落影响的研究未见报道。本研究选址世界三大黄金玉米带之一,中国春玉米主产区吉林省公主岭市,“国家转基因玉米大豆中试与产业化基地(
随着混合动力汽车的普及速度越来越快,对其使用的电池提出的要求也越来越高。而钛铁系贮氢合金作为镍氢电池负极材料,因其理论放电容量高(放电容量是512 mAh·g-1)和原料廉价等
科技的快速发展可以让人们获得大量数据,这些数据中包含着重要信息以及各种噪声,如何从数据中获得有用知识是机器学习现阶段最重要的事情。在机器学习中,数学优化是基础之一,
随着机器人技术的不断发展,服务机器人越来越广泛应用于人们日常生活中。清洁机器人、助老服务机器人、餐饮机器人等服务机器人需求越来越大,这些机器人大多工作在室内复杂环