跨媒体检索中的多模态数据相关性研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:hegang520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展和广泛应用,信息资源增长的速度越来越快,媒体数据的呈现方式也越来越丰富,由单一的文本表示扩展为文本、图像、音频、视频、3-D模型等多种表现形式。不同模态的媒体数据从不同的角度共同描述同一事件,表现能力更强。人们期望可以实现不同模态的媒体数据之间的交叉检索,即提交一种模态的媒体数据,通过查询检索出基于相同语义的不同模态的媒体数据。由于数据特征的表达方式不同,不同模态的媒体数据在原始底层特征上彼此异构,无法直接进行相互检索。如何深入地分析不同模态的媒体数据之间存在的联系,在不同模态的媒体数据之间建立关联,进而衡量不同模态的媒体数据之间的相似性,这就成了跨媒体检索的重点。本文主要从媒体数据的底层特征出发,充分分析媒体数据之间的相关关系,提出两种不同的跨媒体检索算法,并在几种常用的基准数据集上进行了实验,实验结果证明了所提出算法的有效性。本文的主要工作及创新点概括如下:1.提出一种基于联合图正则化和模态分析的跨媒体检索算法(A Cross-media Retrieval Algorithm via Joint Graph Regularization and Modal Analysis,JGRMA)。该方法主要是通过学习数据对之间的一一对应关系,相同模态媒体数据之间的相关性及不同模态的媒体数据之间的相关性,来构建一个统一的框架,通过学习映射矩阵,将不同模态的媒体数据投影到一个同构子空间中。在该过程中,区别对待不同的检索任务,只考虑查询对象的语义,使得学习到的映射矩阵更具有针对性。2.提出一种基于判别近邻和类别信息的跨媒体检索算法(A Cross-media Retrieval Algorithm via Discriminant Neighborhood and Class Information,DNCI)。该方法通过利用数据的类别信息来构建更多的相似数据对与非相似数据对。同时根据数据的语义和距离对近邻进行判断,从而区别对待类内近邻与类间近邻,并且为了更好的利用数据的全局信息,结合最大散度差原则,将基于近邻和语义的判别分析保持项加入目标函数中。将所有的媒体数据通过语义回归,映射到语义空间中,进行相似度度量,从而返回基于相同语义的不同模态的最相近的结果。
其他文献
遗传算法具有良好的全局搜索能力,但有过早收敛和过慢结束的缺点。K-Means算法具有很强的局部搜索能力,但算法有对初始聚类中心敏感而易陷入局部最优解。针对上述问题,提出了基
汉英广告语翻译中的模糊美有三种语际转换策略,即以精确译精确、以精确译模糊、以模糊译模糊,使译文具有与原文相同的审美品质。
当前,面对严峻的经济形势,公司上下正全面贯彻落实中盐总公司打好提质增效攻坚战动员会会议精神,各部门结合各自工作职责认真找差距、拿举措、付行动,进一步降本增效,提升管
据我省价格监测中心监测,6月中旬以来我省主要农产品市场供应正常,零售价格变化不大。与6月上旬相比,粮食和鸡蛋持平;食用油、猪肉、鸡肉和蔬菜分别微幅下降0.08%、0.02%,上升0.80%和0.64
电子记账是统计调查信息化建设在住户调查领域的具体应用,是顺应时代发展潮流的必然选择。国家统计局七台河调查队自2016年7月在全市试运行电子记账工作以来,对市县调查队电子
报纸
在公路的使用过程中,为了保证路面质量满足车辆通行要求,需要做好路面养护工作.在目前大部分的公路中,使用的路面主要以沥青路面为主,在对这种路面进行养护的过程中,可以使用
中山知名特产、被誉为“最贵的虫子”、“水中珍品”的神湾禾虫.今年迎来难得的丰收年,据神湾禾虫协会介绍.10月5日(农历九月初一)前后开始首轮集中收捕,全镇起产禾虫超1万公斤。第
目的:介绍复方苯丁胺/托吡酯缓释剂的研究进展,为其临床应用提供参考。方法:查阅近年来国外相关文献,对复方苯丁胺/托吡酯缓释剂的药理机制、药动学、临床研究、不良反应、禁
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
永磁发电机五相半波可控整流稳压器集稳压、整流于一体,电能消耗少,发电效率高,输出电压稳定的直流电,解决了汽车用永磁发电机在宽转速、宽负载范围内输出电压不稳定的问题。