基于特征学习的多示例多标记学习研究

来源 :广西师范大学 | 被引量 : 1次 | 上传用户:guaitaidejiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和多媒体技术的迅速发展,每天都有海量的数据产生,其中就包含着海量的图像、文本等数据,如何有效地利用和管理这类图像、文本数据,日益成为科研和商业需要解决的一个问题。对于这些海量的图像、文本等数据,数据呈现出给我们的不再是简单的单一的内容形式,现实生活中呈现出的更多是具有复杂内容的多义性的样本数据,如何有效地处理这类多义性样本数据,是当前科研的一个难点。在处理具有复杂内容的多义性对象时,一种比较有效的处理方法是多示例多标记学习方法。在这种方法下,用多示例的方法来表示样本数据的复杂内容,用多标记的方法来表示样本数据的多个语义,通过提取示例的特征,对特征和标记之间建立模型,从而达到识别多语义样本数据的目的。然而,在建立算法模型时,提取什么样的特征,怎么来表示提取的特征,从根源上关系到多示例多标学习方法的识别效果。基于这一点,本文根据现有的底层特征提取方法、中层语义特征提取方法、特征学习如深度学习技术等,将这些技术融入到多示例多标记学习方法中,提出了一种通用的多示例多标记学习框架模型。本文的主要研究内容如下:(1)通过研究特征学习技术、多示例多标记学习技术等,挖掘算法中的不足,在现有理论方法的基础上,将特征学习技术融入到多示例多标记学习中,提出了一种通用的多示例多标记学习框架,该模型框架可以很好地改善现有多示例多标记学习方法中的不足。(2)在通用模型框架的基础上,提出了一种基于主题模型的多示例多标记学习方法(CPNMIML),在该方法中,算法的特征学习模型采用的是概率潜在语义分析模型(PLSA),该特征学习模型是一种浅层的特征学习模型,其特征学习的能力有限,因此,基于卷积神经网络的多示例多标记学习方法(CNNMIML)应用而生,卷积神经网络是深度学习的一种模型,具备良好的特征学习能力。在多示例多标记学习方法中,研究者已经提出了很多算法,而MIMLBOOST和MIMLSVN是两个比较典型的算法,因此,在进行实验结果对比时,本文将提出的方法和MIMLBOOST和MIMLSVN这两种方法分别进行了比较,在基准数据集上进行实验,结果表明,本文提出的方法在性能上都比MIMLBOOST和MIMLSVN好。
其他文献
自20世纪80年代以来,在微电子技术和计算机技术迅速发展的推动下,在人们应用需求的牵引下,无线通信和网络技术获得长足的发展。GSM, GPS等技术已经广泛应用人们生活之中,改变
随着网络技术的进步和Internet的迅速普及,网络正以前所未有的速度发展;然而,在网络规模进一步扩大,信息流量迅速增加的同时,网络已经变得非常拥挤,在这样的背景下,组播技术诞
随着信息化的深入和发展,各企事业单位的办公自动化建设的完善,在日常的办公流程中以数字形式保存和处理信息已经成为目前的主流。在这种情况下,对于这些包含着企事业单位的
随着科学技术的飞速发展,软件的涉猎范围在不断扩大,为人们提供了很大便利,所以人们对软件的依赖性越来越大。近年来,软件用户提出的需求在不断增多,使得软件变得很复杂,并且
随着信息时代的到来和计算机网络的蓬勃发展,数字签名在信息安全中扮演着越来越重要的角色,提出了越来越多的新需求。在面向团体或组织的密码体系中,要求某些指定人员的适当
由于P2P网络中任何网络设备可以为其他网络设备提供服务的固有优势,P2P计算已经在许多大型的分布式系统中得到了广泛的应用,对等P2P网络已经成为Internet中最重要的应用系统之
传统的J2EE应用服务器内核架构已经不能满足实时响应新需求、动态部署新模块、运行时刻服务动态管理等迫切的商业需求。针对这些需求,本文阐述了一个基于开放服务网关提议(Ope
目前大多数入侵防御系统都存在检测率较低、误报率较高、整体性能较低的问题。针对这些问题,给出了基于多步校正AdaBoost神经网络算法,并将其应用于入侵防御系统中,以提高该系统
LED显示屏在各领域的应用不断扩大,决定了其控制系统在未来将向着性能更高、架构更精简、操作更便利的方向发展。现今LED同步联机控制系统,以控制器与扫描器为核心功能器件,
随着Internet的发展和普及,电子邮件也得到了广泛的应用。电子邮件在给人们带来方便的同时也产生了一个新的问题,即大量垃圾邮件的出现。垃圾邮件不仅要消耗大量的网络资源,