基于相关性的标记分布学习方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:element_wq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,标记多义性学习是机器学习和数据挖掘领域的一个热门主题。在传统的机器学习框架中,比较成熟的标记多义性学习范式是单标记学习和多标记学习。其中,单标记学习假设一个示例只和一个标记相关,而多标记学习假设多个标记可以共同描述一个示例。因此,多标记学习相比于单标记学习能解决更复杂的标记多义性问题。然而,上述两种学习范式实际上都只回答了“哪些标签可以对示例进行描述”,而并没有解答包含更广泛标记多义性的进一步问题,即“每个标签是怎么描述这个示例的”。因此,针对这类问题,学者们提出了标记分布学习范式。标记分布学习是对多标记学习范式的进一步拓展,适用于解决更复杂的标记多义性问题。并且,为了提升学习性能,如何挖掘并利用数据之中的相关性是标记分布学习的一个核心内容。基于此,本文通过挖掘并利用局部样本间的相关性和局部标记间的相关性,对标记分布学习方法展开进一步研究。第一,本文提出了基于局部样本相关性的标记分布学习算法。目前的标记分布学习方法一般通过考虑标记间的相关性进而提升算法性能,而未对局部样本与示例之间的相关性加以利用。为了利用局部样本与示例之间的相关性,本文在标记空间将示例聚类成不同的主题,即不同的局部样本。在每个局部样本中,所有示例共享相似的标记相关性。此外,为了体现局部样本对示例的影响,本文为每个示例增加了一个额外的特征向量,向量中的每个分量分别代表不同局部样本对该示例的影响。最后,本文同时利用示例的原始特征和增加的额外特征,对测试样本的标记分布进行预测。广泛的实验结果证明利用局部样本的相关性能更好地解决标记分布问题,并且能取得更好的效果。第二,本文提出了基于局部低秩标记相关性的面部表情情感分布学习算法。现存的面部表情情感识别方法一般假设一个表情能由多个情感标签进行描述,为了更精确地描述面部表情,本文采用标记分布学习来解决面部表情情感识别问题。此外,现存的标记分布学习方法一般假设利用标记间的全局相关性,即假设所有的示例共享相同的标记相关性。但是,在面部表情情感识别中,情感标记之间的相关性通常是局部的,不同的表情可能拥有不同的标记相关性。基于此,本文提出了一种基于局部标记相关性的标记分布学习方法。此外,考虑到标记之间相关性的复杂性,相比于现存工作显式地对标记间相关性加以利用,本文采用了一个局部的低秩结构,来隐式地利用标记间的局部相关性。实验结果表明,利用局部低秩结构考虑标记间的相关性,能更好地利用标记间的相关性,从而得到更好的性能。
其他文献
服役于水环境中的混凝土结构,如大坝、海岸及近海岸的结构物、渡槽、桥墩以及服役在浪溅区和水位变动区的海工建筑物,受到水位变幅的影响,结构物中湿度会呈现周期性变化,如结
金属扣合法作为一种独特的冷修复工艺,完美解决了铸铁件难以焊接的特点,波浪键作为这种工艺的核心,其制备问题即为本课题主要研究内容。本文的研究目的是为制作出具有良好性
各向异性导电膜由于其独特的导电性能已广泛地应用于柔性电子器件、存储器以及显示器件等领域中。随着科学技术的不断发展,要求开发新型的多功能各向异性导电膜。因此,设计并
采空区煤炭自然发火是矿井煤炭开采过程中经常发生的灾害之一,不仅严重威胁井下工作人员的生命安全,同时也造成了严重的资源浪费和财产损失。对煤自燃的发生发展过程的研究对
蒸汽发生器作为钠冷快堆二回路钠与三回路水的热交换器,是快堆核岛中的重要设备。热工水力特性作为其结构力学、材料、水化学等分析的基础,是蒸汽发生器最重要的研究内容之一
地处季节性冻土区的景电工程干渠由于建造年代久远、运行历时较长且无有效的防冻胀措施发生了强烈的冻融及渗漏破坏,造成了渠道输水效率低下,运行状态堪忧。开展景电干渠的典
安吉拉·卡特(1942-1992)是非常具有影响力的英国女性作家,她因独特新奇的写作风格和女性思想而闻名中外。卡特的第七部小说《新夏娃的激情》主要讲述了男性伊夫林被迫变性成
圆柱壳体振动陀螺是近年发展起来的一种新型金属振动陀螺,由于其具有结构简单、制造成本低、精度高等特点,在航空航天、武器装备等领域具有广泛的应用前景。圆柱壳体振动陀螺
金属铍以优异的物理性质在精度要求极高的惯性领域仪表级结构材料中占有重要地位。本文以国产牌号铍材Be-1为研究对象,采用透射电镜微观组织观察与第一性原理模拟计算相结合
面对干扰事件的发生,班轮公司需要采取干扰恢复计划来减少干扰事件对班轮运输网络产生的影响。干扰恢复计划除了对船期进行恢复外,还应考虑到对集装箱流的恢复。目前,班轮公