论文部分内容阅读
随着互联网和多媒体技术的迅速发展,每天都有海量的数据产生,其中就包含着海量的图像、文本等数据,如何有效地利用和管理这类图像、文本数据,日益成为科研和商业需要解决的一个问题。对于这些海量的图像、文本等数据,数据呈现出给我们的不再是简单的单一的内容形式,现实生活中呈现出的更多是具有复杂内容的多义性的样本数据,如何有效地处理这类多义性样本数据,是当前科研的一个难点。在处理具有复杂内容的多义性对象时,一种比较有效的处理方法是多示例多标记学习方法。在这种方法下,用多示例的方法来表示样本数据的复杂内容,用多标记的方法来表示样本数据的多个语义,通过提取示例的特征,对特征和标记之间建立模型,从而达到识别多语义样本数据的目的。然而,在建立算法模型时,提取什么样的特征,怎么来表示提取的特征,从根源上关系到多示例多标学习方法的识别效果。基于这一点,本文根据现有的底层特征提取方法、中层语义特征提取方法、特征学习如深度学习技术等,将这些技术融入到多示例多标记学习方法中,提出了一种通用的多示例多标记学习框架模型。本文的主要研究内容如下:(1)通过研究特征学习技术、多示例多标记学习技术等,挖掘算法中的不足,在现有理论方法的基础上,将特征学习技术融入到多示例多标记学习中,提出了一种通用的多示例多标记学习框架,该模型框架可以很好地改善现有多示例多标记学习方法中的不足。(2)在通用模型框架的基础上,提出了一种基于主题模型的多示例多标记学习方法(CPNMIML),在该方法中,算法的特征学习模型采用的是概率潜在语义分析模型(PLSA),该特征学习模型是一种浅层的特征学习模型,其特征学习的能力有限,因此,基于卷积神经网络的多示例多标记学习方法(CNNMIML)应用而生,卷积神经网络是深度学习的一种模型,具备良好的特征学习能力。在多示例多标记学习方法中,研究者已经提出了很多算法,而MIMLBOOST和MIMLSVN是两个比较典型的算法,因此,在进行实验结果对比时,本文将提出的方法和MIMLBOOST和MIMLSVN这两种方法分别进行了比较,在基准数据集上进行实验,结果表明,本文提出的方法在性能上都比MIMLBOOST和MIMLSVN好。