多视图偏多标记学习算法研究与实现

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:wjtezx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在传统的多标记学习框架中,通常假设用于训练的数据集中的每个示例都包含所有被精确标注的相关标签,但是由于实际应用中数据量的急剧增长,精确标注难以实现并且成本较高,最终获取的标签信息大多都含有噪声,偏多标记学习成为热点研究问题。在偏多标记学习框架的定义中,每个样本的候选标记集包含至少一个但数量未知的真实标记,以及部分噪声标记。偏多标记学习的主要任务是利用含有冗余标记的候选标记集合训练预测模型,筛选得到示例的真实标签。偏多标记学习的主要难点在于如何克服训练数据中错误标记带来的模型训练的偏置问题。近年来,多视图学习开始和偏多标记学习任务结合进行处理,目前仅有少量多视图偏多标记学习算法被提出,并且均基于完备视图的假设而设计。然而,由于多视图数据采集的困难性,在实际应用中某些视图可能不包含完整的特征信息,缺失视图的存在会影响传统偏多标记学习算法的性能。为解决该问题,本文首次提出了一种缺失视图下的多视图偏多标记学习框架,并且针对该框架分别提出了两种偏多标记学习算法。为了更好的利用含有缺失视图的多视图数据语义信息,本文提出了一个视图缺失下的多视图偏多标记学习算法。该算法在训练过程中利用不完备多视图特征表示,以及引入低秩稀疏分解去除噪声标签。具体来说,首先从异构不完备视图中学习获取共享子空间;其次,利用低秩稀疏分解获得真实标签;之后,引入图拉普拉斯正则化来约束真实标签,并对特征子空间之间的相关性施加正交性约束;最后,通过共享子空间和消歧后的标签学习预测模型。大量的实验结果表明,该方法在解决缺失视图下的多视图偏多标记学习问题上具有优越性。为了修复缺失的多视图信息,本文提出了一个基于特征补全的不完备多视图偏多标记学习算法。该算法在训练过程中设计模型以补全缺失视图,并学习所有视图的相似度图,同时利用低秩稀疏分解去除噪声标签。具体来说,该算法首先设计了一种新的地址表示模型,以实现缺失视图的补全,从而得到完备的多视图数据,之后,通过自表示方法学习得到所有视图上特征的相似性矩阵,最后引入7)1范数正则化约束视图补全噪声和标记噪声。在多种多视图数据集上设计大量实验,实验结果证明该方法在缺失视图下的多视图偏多标记学习中具有较好的性能。
其他文献
近年来由转向系统控制单元故障带来的车辆事故问题日益突出,而随着智能驾驶技术的不断发展,人们对汽车转向系统的安全性有了更高的需求,冗余转向系统以其高效、可靠性高、节能等优势成为汽车转向系统新的研究热点。相较于电动助力转向系统(Electric Power Steering,EPS),本文所设计的冗余转向系统通过对助力电机、控制单元等电子元器件的软硬件冗余设计,可以有效避免转向时某个部件发生故障而导致
学位
社会的不断进步和发展离不开快速的城市化和工业化,这带来了能源危机和环境问题。在众多的应对措施中,寻找清洁,安全,可再生的能源被普遍认为是解决这两大难题的最重要的途径之一。太阳能作为最清洁的能源,并且地球表面一小时内所接受到的总量就可以满足全球每年的能源总需求。然而,太阳能的转化和储存是一大难题,为了实现这一目的,已经提出并尝试了许多方案。在众多方案中,光催化技术脱颖而出。利用光催化技术能够实现太阳
学位
目的:探讨低频神经肌肉治疗用于妇科恶性肿瘤开腹术后快速康复治疗的效果。方法:选取2020年1月至2021年12月在江西省人民医院妇科确诊为妇科恶性肿瘤(子宫颈癌,子宫内膜癌,卵巢癌)并接受开腹手术的患者共150例,随机分为两组,研究组(75例),在常规快速康复外科理念(ERAS)的基础上给予低频神经肌肉治疗;对照组(75例),给予常规ERAS。比较两组患者术后第1(d1)、2(d2)、3(d3)、
学位
当前,我国正处于全面建成小康社会的关键时期。习近平总书记曾指出“全面建成小康社会,残疾人一个也不能少”。可以这么说,缺少残疾人的小康不是真正意义上的全面小康。如何让残疾人平等获得就业机会,助力残疾人实现就业创业成为摆在社会发展过程中的一项难题。就业是最大的民生,是社会稳定之源,是残疾人参与社会活动的重要方式。残疾人能否顺利就业直接关系到残疾人的生计、尊严、家庭稳定乃至整个中国社会的稳定发展。纵观学
学位
大数据时代的到来和不断的发展对当前数据处理提出了更高的要求。机器学习方法是近几年解决处理数据的主要方法,高斯过程是一种利用贝叶斯定理和核技巧的概率非参数数据处理机器学习方法,有着非参数,输出具有概率意义等优点。但由于高斯过程中核技巧的使用,导致核函数的选择和构造仍依赖于专家根据经验选取,同时高斯过程还有着计算复杂度大的缺点,这极大的限制了高斯过程的广泛应用。本文提出了一种自适应高斯过程核函数构造方
学位
工作记忆作为大脑的高级认知功能,在人们的日常学习、生活、工作等方面都有重要的参与。研究发现工作记忆系统的能力会伴随着年龄增长出现衰退现象。如何有效地恢复或者提升工作记忆能力,在临床研究上具有重要意义。神经调控技术已经被广泛的用在对大脑活动的干预上,常见的调控技术包括电刺激、磁刺激等,其中经颅电刺激作为一种无创、安全的技术,也将是神经调控技术的发展趋势。相关研究表明放松身心疗法、重复性认知训练、以及
学位
近年来,光纤传感器具有体积小、重量轻、耐腐蚀和抗电磁干扰的优势,已广泛应用于机械制造,能源开采、生物医疗和化学传感等领域。在海洋环境监测领域,海水的温度、盐度、深度是进行海洋研究的重要物理参数,光纤传感技术的应用在海洋物理参数的测量中受到了广泛关注,成为海洋环境监测领域的研究热点。本文分析了海洋物理量监测领域中光纤传感器的研究现状,在此基础上,设计了基于SNS-FBG-FBG级联结构的光纤温盐深传
学位
随着车路协同自动驾驶系统的迭代更新,交通路网呈现出复杂化和多样性的特点,交通参与主体也逐渐呈现出大规模、异构性的特点,异构交通环境下的交通流成为研究的重点。为进一步优化路网运行效能,群体智能控制算法应运而生,然而目前对混合交通环境车路协同综合效能评估的研究较少,评估目标较为单一,评估方法较为主观,评估结果不够直观,无法覆盖混合交通环境车路协同综合效能评估的全部需求。因此迫切需要一种直观的、可操作性
学位
田野调查方法是设计者进行设计实践的基本工具,在艺术设计学领域,田野调查方法的文本研究已相对成熟,能为设计者提供重要理据和实操指导。但与此同时,大量的文本信息并不利于设计者准确、快速地找到相关内容,也不利于设计者对田野调查本身的兴趣建立。因此探索文本信息的归纳和处理、探索视觉转化方法在田野调查中的应用,鼓励设计者深入田野挖掘设计素材,具有重要的现实意义。本文立足于我国新时代传统文化保护与更新的发展背
学位
伴随着知识经济时代的到来,我国的人力资本在我国的发展中占有越来越重要的位置,人力资源也在企业的长远发展中发挥了至关重要的作用,而其中对管理人员的培养在企业的战略发展中占据着不可替代的地位。对个体员工来说,通过公司的培训可以提升自己的知识与技巧,对公司而言,还可以增加员工对公司的认同感和归属感,实现人力资源价值的最大化。作为一家拥有70余年历史的压缩机及相关设备生产制造企业,ARK公司近年来经历前后
学位