【摘 要】
:
近年来,随着硬件计算能力的提升和有标注数据的增长,人工智能领域的相关研究迎来了新一轮的快速发展。多标记学习作为人工智能领域的重要分支成为了当下研究的热点问题之一。为了提升多标记学习的性能,学者们分别提出了标记相关性(Label Correlation)和类属属性(Label-Specific Features)。在真实世界中,标记之间往往具有相关性,例如“吸烟”和“肺癌”呈现强相关。标记相关性假设
论文部分内容阅读
近年来,随着硬件计算能力的提升和有标注数据的增长,人工智能领域的相关研究迎来了新一轮的快速发展。多标记学习作为人工智能领域的重要分支成为了当下研究的热点问题之一。为了提升多标记学习的性能,学者们分别提出了标记相关性(Label Correlation)和类属属性(Label-Specific Features)。在真实世界中,标记之间往往具有相关性,例如“吸烟”和“肺癌”呈现强相关。标记相关性假设相关性较高的标记有更高的几率同时出现在一个样本中,通过标记相关性约束多标记学习可以使模型捕获标记间潜在的关联信息。此外,不同的标记通常拥有不同的特征,如“花”和“绿叶”两个标记常常出现在同一个样本中,但两者的特征截然不同。为了充分考虑各标记的独有特征,学者们提出了多标记类属属性学习。现有的多标记学习算法大多考虑对称的标记相关性,部分类属属性学习算法也利用对称的标记相关性提取类属属性。然而,在真实世界中,相关性通常是非对称的。基于此,本文提出了基于因果推断的多标记学习改进算法,主要工作如下:(1)忽略非对称相关性会在模型中引入冗余信息,从而导致分类器的性能损失。针对这一问题,本文提出了一种基于因果推断的多标记学习算法,通过联合学习标记相关性和标记因果关系考虑非对称相关性,并利用非对称相关性构建多标记分类器,对比实验的结果表明考虑非对称标记相关性可以减少模型中的冗余信息并在一定程度上提升多标记分类器的性能。(2)常见的类属属性学习算法通过度量欧氏距离或使用7)-范数稀疏化权重矩阵提取类属属性。随着数据维度的不断增长,欧式距离的度量效果也在逐渐变差,导致基于欧式距离的类属属性学习算法无法有效区分不同特征的重要程度。使用7)-范数提取类属属性则依赖人工参数选择,过高或过低的稀疏性都会导致分类器性能不佳。为了解决上述问题,本文提出通过考虑特征与标记之间的因果关系提取类属属性,对比实验的结果验证了该方法的有效性。(3)因果推断算法对数据的分布较为敏感,且常见的因果推断算法仅适用于连续型数据或离散型数据。在多标记学习中,标记数据通常是离散且稀疏的,离散型的标记数据和连续型的特征数据之间存在较大的差异,直接推断标记和特征之间的因果关系往往效果不佳。为了更有效的推断标记和特征之间的因果关系,本文提出使用标记增强处理原始的离散型标记,并使用增强的连续型标记推断标记和特征之间的因果关系,实验结果验证了该方法的有效性。
其他文献
本文选取了一个经典的模型——分数阶时滞神经网络系统.首先利用Holder不等式提出了一个关于上升函数的不等式.然后在阶数1<α<2的情况下,为了使得驱动系统与对应的响应系统能在有限时间内达到同步,我们先定义一个误差系统,继而通过利用Jensen不等式、广义Gronwall不等式和线性反馈控制器,建立了一个充分判据,确保这类分数阶时滞神经网络系统能实现有限时间同步.最后再利用Matlab演练,验证这
随着集成电路制造工艺的不断变化,以及对测试效率和可靠性的需求,为集成电路行业在测试方面带来了新的挑战,如何改善芯片在测试时的效果并且有限度地降低芯片生产中的测试成本成为集成电路产业中的重要环节。不断增加的测试数据量和不断提高的电路功能复杂度,使得测试温度以及功耗不断增加,由于温度过高而损坏芯片的风险也随之增加。随着测试数据的日益增多,对自动测试设备的存储能力、I/O通道数、频率等方面有了新的技术要
从20世纪50年代左右开始,集成电路出现并蓬勃的发展,随着科技的发展集成电路制造工艺也越来越精湛,集成电路的内部结构也越来越复杂。更先进的设计和工艺让芯片有着更强的计算能力的同时也给测试带来了新的挑战,大量的测试数据带来了更长的测试时间和更高昂的测试成本,于是提出了测试集的重排序测试方法。重排序的目的是将高价值的测试向量优先测试,在保证故障覆盖率的同时缩短了测试时间。论文的研究内容围绕测试集重排序
三角函数是我国中学数学课程中非常重要的内容之一,根据《普通高中数学课程标准》,三角函数被编排在新教材的必修4中,主要包含数学的数形合一、转化、化归、代换、特殊化等重要的数学思想,学生通过学习三角函数来培养“四基”和“四能”以及提升数学抽象、数学建模等等数学学科核心素养。基于十余年来的教学改革和研究,在中学数学三角函数中,已有众多教师学者在不同角度有着不同见解,但是并没有对三角函数的教学和解题作出系
在多标签学习中,每个实例对应多个标签并拥有丰富的语义信息。不可否认的是,标签的缺省现象经常发生在多标签数据集。缺省标签会导致多标签学习算法获取错误的语义信息或者丢失重要的语义信息。标签空间的挖掘工作是多标签学习中研究热点,获取的语义信息可以提升算法的性能。因此,标签空间的挖掘方法及度量信息的方式是研究重点。基于此,本文研究工作如下:1)在多标签算法中,大多利用特征与标签嵌入等方法挖掘标签空间的语义
人工智能以及大数据时代的到来,如何使学生能够成为适应未来社会竞争的人是我国的教育改革聚焦的重点。实际教学中,由于我国应试教育的客观性,导致新课改偏离方向,停留在浅层学习的程度。深度学习是浅层学习的进一步拓展,指的是对知识的深层次理解,这种理解并不是单纯字面意思上的学习内容难度的“深”,也不仅仅是对知识的深刻记忆与熟练应用,更包含了学生在这整个过程的多维整合,其中包括低阶思维与高阶思维。深度学习理念
背包问题是一类经典的组合优化问题,属于NP-hard问题,其研究模型众多但均可转化为最基础的0-1背包问题。目前,针对0-1背包问题的研究内容主要包括算法的探索和扩展模型的研究,尤其是针对扩展模型的研究一直都是热点问题。本文结合实际需要,提出以下两类扩展模型:(1)将0-1背包问题中的约束条件与实际结合,形成两种不同性质的约束:主观需求与客观约束;(2)将0-1背包问题中物品信息(例如物品价值)不
在过去的二十年里,无信号控制的交叉口的行车安全与道路通行效率成为热点话题。在没有信号控制的交叉口,驾驶员对如何通过交叉口只能通过眼神交流或根据自己的经验做决定,驾驶员之间的相互作用直接影响到交叉口的行车安全以及道路的通行效率。本文从具有无信号控制的交叉口的平面道路出发,通过在交叉口加入理性的博弈规则研究交通过程中驾驶员行为的演变以及驾驶员决策对道路通行效率的影响。首先讨论了基于周期性边界的无信号控
传统的基于纸笔测试方法的教育评价,因其具有公平公正、公开透明的特点而在我国得到了广泛的应用。然而,基于纸笔测验的教育评价注重评估学生对所学知识的掌握、记忆、理解等能力,很难对学生的高阶思维能力进行精准的评估,例如学生的创新能力、合作能力等。而STEAM(Science Technology Engineering Arts Mathematics,STEAM)教育的核心正是培养学生的创新能力等跨学
车辆路径问题(Vehicle Routing Problem,VRP)是一种传统的组合优化问题,其广泛运用于物流、交通控制等领域。随着科技的发展以及交通、通信手段的日益丰富,该问题再度成为研究热点,焕发了新的生命力。一方面,人们不断尝试丰富各类约束条件,模拟现实中各种因素对模型的影响,使其更好的描述实际情况;另一方面,人们不断改进算法,以期能以更高的效率规划出最佳路径。车辆路径问题的求解涉及到较为