基于DCGAN的图文跨模态检索系统设计与实现

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:myrost
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当今网络技术的成熟,互联网用户活跃于网络社交的同时产生了大量不同模态的多媒体数据(如图像、文本、语音、视频等),促进了与多媒体相关研究的发展,跨模态检索技术即是其中研究热点之一。跨模态检索是指图像、文本、音频等多模态数据之间的相互检索,如何度量多模态数据之间的相关性是该领域的研究难点。在公共子空间学习的基础上,本文利用极限学习机方法提高跨模态检索精度,挖掘更深层次的数据特征并最大化不同模态间的相关性,使得学习到的共享子空间更加具有判别性;同时提出通过深度卷积生成对抗网络实现跨模态检索,利用无标签样本进一步挖掘不同模态数据关联性,提升跨模态检索的性能。主要工作及创新点如下:1.提出基于极限学习机的跨模态检索方法。该方法通过单层神经网络计算语义之间的距离衡量相似度,在此基础上引入分类标签,使用有监督学习的方法提高模型自主学习能力,具有较好的泛化性能,能够自主学习到更具判别性的投影子空间。经在公开数据集的实验对比表明,本方法的跨检索准确率有所提升。2.提出基于深度卷积生成对抗网络的跨模态检索方法。该方法基于深度卷积生成对抗网络,融合深度典型相关分析方法,有效地提高了跨模态检索过程中不同模态数据关联性和无标签样本的利用率。在图像与文本两个单模态的表示层间增加深度典型相关分析约束,构建图文特征投影模型挖掘样本对的语义关联性;在此基础上,以DCGAN作为整个模型基本框架,利用无标签样本进行训练。同时,以图文特征投影模型作为生成器,以卷积神经网络建立模态特征分类器作为判别器;最后通过二者之间的相互对抗学习到样本的公共子空间表示。在公开数据集与其他主流方法进行对比实验,表明本方法获得了较优的性能。通过对现有跨模态检索方法的实验与对比,选用本文提出的基于深度卷积生成对抗网络的跨模态检索方法设计并实现了图文跨模态检索系统。该系统具有图像与文本互相检索的功能,提高了检索结果的准确率,满足了用户对于信息检索方式多样化的需要。
其他文献
地倾斜主要观测地平面与水平面之间的夹角(地平面法线与铅垂线之间的夹角)及其随时间的变化。地倾斜观测是我国地壳形变观测的重要部分,是研究地壳形变及固体潮的重要手段之
目的:研究肺泡灌洗液(bronchoalveolar lavage fluid,BALF)中SHOX2、RASSF1A甲基化及端粒酶活性检测对肺结节良恶性鉴别诊断的临床意义。方法:1、研究对象:选取从2018年09月-2020年01月之间于苏北人民医院诊断为肺结节且行纤维支气管镜检查患者,有确切病理患者共38例,包括恶性肺结节(肺癌)患者27例,良性肺结节患者11例,将良性肺结节患者作为对照组。2
微流控芯片技术是一种以亚毫米尺度的流体工程操作为特征的技术,在提高医疗诊断效率和生物学研究方面显示出相当大的前景。玻璃芯片的传统的加工方法如干法刻蚀、湿法刻蚀等所需的加工步骤多,成本高,难以实现高精度制备,限制了其大批量生产的可能性。模压成形技术工艺过程简单,能够模压具有微小结构的复杂表面,可实现高效复制以及批量化生产,这为玻璃微细流路成形提供了新的工艺方法。针对微结构模具加工困难、玻璃成形精度及
机库是机场的重要组成部分之一。快速准确的识别遥感影像中的机库目标具有重要的经济和军事意义。通过人工目视识别遥感影像中机库目标的方法已较为成熟,而如何利用计算机识别高分可见光遥感影像中的机库目标,是当前亟需解决的科学问题。本研究主要是在室内利用计算机进行相关图像处理实验。先是根据机库目标本身的性质特点分析得到目视识别特征,并从中选取出计算机识别特征。然后分别从计算机识别特征中的光谱特征和空间特征进行
偏沅巡抚第一次设立于明代万历二十七年(1599年),战争结束后很快就被废止,天启年间重新设立,在此期间内时而废止时而复设,在崇祯二年终于趋于稳定成为长期设立的官职。顺治元年(1644年)清代沿用明代制度设立偏沅巡抚,自明至清偏沅巡抚一方充当皇帝的“耳目”监视地方,另一方面充当联系地方和中央的重要信息渠道。一方面偏沅巡抚在中央和地方之间扮演的角色一直未变,另一方面清代统治者所面临的国内局势以及对于督
2016年,第十二届全国人大常委会表决通过了《全国人大常委会关于在北京市、山西省、浙江省开展国家监察体制改革试点工作的决定》,在北京市、山西省和浙江省三个地方开展国家监察体制改革试点工作,积累“可复制可推广的经验”,以便为在全国推进国家监察体制改革奠定基础。党的十九大报告强调,制定监察法,依法赋予监察机关职责权限和调查手段,即通过国家监察法赋予国家监察委员会以监督、调查、处置等相应的职责权限。国家
“事实上”在现代汉语中应用广泛,当前学界对其研究还有待进一步深化。本文以语气副词“事实上”为研究对象,以CCL等语料库为基准,将共时与历时相结合对其句法特征、语义特点、主观化、语法化和标记功能等进行了考察。全文共分为五章。第一章为绪论,介绍了本文的研究缘起,概括了关于“事实上”的研究现状,指出了现有研究的不足,确定了研究内容、目的及意义、方法和语料来源。第二章描写和分析了“事实上”的句法和语义特征
研究目的:研究单磷酸腺苷激活的蛋白激酶(Adenosine 5’-monophosphate(AMP)-activated protein kinase,AMPK)在运动调控老年小鼠海马自噬中的作用,为老年人通过科学运动延缓脑衰老提供科学依据。研究方法:16月龄健康雌性ICR小鼠21只,随机分为对照组(CON)、有氧运动组(EXE),有氧运动+Compound C组(E+C),每组各7只,CON组
作为一种一维横向无序结构,随机分布布拉格光栅阵列是研究低维无序系统的良好平台。基于无序结构的光纤随机激光,其中的模式竞争和光子局域化效应值得探讨。在此基础上搭建的随机激光器的输出特性,特别是脉冲输出及模式调控是当下亟需研究的方向。在上述背景下,本文研究了基于无序结构的随机光纤激光器,采用可饱和吸收效应解决了输出模式的不稳定问题,实现了激光的脉冲型输出,并创新地提出了两种调控手段来调节输出模式,为调
纤维织物增强混凝土(Textile reinforced concrete,简称TRC,又称Fabric Reinforced Cementitious Matrix Composite,简称FRCM)是近20年来新兴起的一种新型纤维增强材料,它是用纤维织物放入到混凝土中作为一种增强材料而形成的,具有承载能力高、轻质高强、延性好、防磁干扰、耐腐蚀性等优点。TRC的力学性能不仅与各组成材料有关,还与