面向图文的短文本表示模型研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:elelyn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相对于文本内容,图像内容能更加一目了然将信息呈现出来,因而在阅读中呈现出二者相结合的趋势。以功能神经影像文献为例,文献中图文信息往往相辅相成的出现在读者面前。然而,当前主流的文本表示模型却无法对文献中的图文信息进行充分利用,主要存在图文语料信息组织性不足、短文本语义表示能力不足、对图文信息缺乏综合性利用等一系列问题。针对这些问题,本文以功能神经影像文献为切入点,就面向图文的短文本表示模型展开研究。主要工作包括:(1)针对当前功能神经影像领域多模态语料信息缺乏的现状,本文构建了功能神经影像训练集和文本训练集。首先,根据功能神经影像文献中图片的不同视角,构建了功能神经影像图片训练数据集;其次,对于功能神经影像文献中文本,通过短文本语义相似度计算,得到了相应的相关语义对集合和非相关语义对集合,构建了短文本训练数据集。通过图文数据集的构建,为文本表示模型和图文融合表示模型的训练提供了充分的数据支撑。(2)针对目前由于短文本特征稀疏以及主题关注度低引起文本模型语义表示能力不足的问题,本文提出了基于LDA的短文本表示模型“Weighted-LDATVM”。采用潜在的狄利克雷分配法来捕获短文本的潜在主题,并使用粒子群优化算法来学习主题词的相应权重值,通过对文本主题词进行加权计算实现了短文本的语义聚焦,获得基于加权主题词向量的短文本表示模型。本文采用短文本间相似性度量实验对该模型进行了评估,实验结果表明,该模型对短文本的相似度测量具有较好的区分能力和语义表示能力。(3)针对功能神经影像文献中图文信息缺乏综合性利用的现状,提出了一种基于注意力机制的图文融合表示模型。传统的主题学习方法仅能够对文本进行表示学习,而不能将相关的图像进行有效利用。本文创新性地将基于注意力机制的图像描述技术应用于神经影像文献挖掘领域,并与传统基于文本的LDA主题模型融合,形成全新的Attend-NIC-LDA主题模型,在对文献主题词充分识别的基础上,结合文献中的神经影像图像信息,对脑认知功能主题词进行了有侧重性的挖掘。基于PLo S One期刊数据集的实验结果表明,本文提出的Attend-NIC-LDA主题模型不仅在语义聚类上优于当前主流的主题模型,同时,在当前开放存储文献资源飞速增长以及脑认知功能更新不断加快的趋势下,弥补了脑区与相对应认知功能系统性不足的现状。
其他文献
公务员能力素质的提升,是国家治理体系的建设和治理能力的提高的核心要素。公务员培训是提高公务员队伍素质的重要途径,公务员培训的意义已经上升到战略地位。不动产登记中心是国家建立不动产统一登记制度和机构改革下形成的新部门,机构改革和职责整合带来的业务流程再造、信息数据整合共享等,对人员的能力标准提出更高的要求,不动产登记机构干部队伍的能力建设问题亟待解决。本文以S市不动产登记中心为例,利用文献研究法、政
随着信息技术的逐步成熟,信息化与教育的融合程度不断深化,从长远来看,教育信息化是教育未来发展的重要趋势之一。当前,在政府的相关政策指导与信息技术逐步发展的背景下,教
柑橘隶属于被子植物门(Magnoliophyta),双子叶植物纲(Magnoliopsida),无患子目(Sapindales),芸香科(Rutaceae),是深受人们喜爱的水果。橘皮作为柑橘加工过程中的副产品,含有2
超宽带(Ultra Wideband,UWB)移动节点受环境非视距(Non Lineof Sight,NLOS)影响较大,容易导致定位和跟踪的精度低、实时性差和鲁棒性弱等问题,不能满足实际应用需求。本文从定位和跟踪两个方面对传统UWB移动节点定位与跟踪算法进行研究,主要研究如下:首先,论文阐述了本文选题的研究背景及意义,介绍了国内外的研究现状,接着对现有的UWB定位方法、基于接收信号到达时间法(T
为了探究氧阴离子洞对扩展青霉脂肪酶催化活性的影响,本论文利用同源置换手段和定点饱和突变技术对扩展青霉脂肪酶氧阴离子洞可能的构成位点进行改造,并对脂肪酶突变体的催化
生物透过窗口(Biological Transmission Windows,BTW)发光纳米材料具有背景信号低,组织穿透深度大,成像分辨率高等优势,因此在生物成像、生物传感等医学光学领域具有极大的应用潜力,并且近年来已经在材料组成、光学设计、应用领域取得了部分进展。例如开发的上下转换纳米颗粒、金银纳米棒及团簇、纳米硅球,由于具有生物窗口内的多波段发光、偏振荧光等特性,在多光谱成像、多模成像及温度
本研究综合运用 SWMM(Storm Water Management Model)模型和 GIS(Geographic Information System)技术,研究城市暴雨积涝动态数值模拟理论与技术方法,提出了基于有源扩散思想
已有研究金融发展对贸易产品品质影响的文献表明,金融发展能够促进一国出口品质的提升,但这些文献的研究角度大多为一国金融发展对本国出口品质的影响。那么从进口国的角度分析,伙伴国的金融发展水平是否对中国进口品质结构存在影响呢?并且伙伴国的金融发展是如何影响中国的进口品质结构?首先,针对基准回归。利用BACI数据库计算中国的贸易伙伴国在2003-2014年对华出口品质结构指标,并且从全球金融发展数据库(G
“一带一路”倡议提出以来,中国企业对“一带一路”沿线国家的投资速度迅速扩张,中国企业“走出去”的步伐越来越快。人口红利的逐渐消失以及绿色经济理念的发展,倒逼我国经济转型。作为国民经济的主体,制造业企业亟待转型升级,是中国下一轮经济健康发展的前提。因此企业转型升级是落实供给侧改革、实现可持续发展的内在要求。在与“一带一路”沿线国家的深度交流合作下,制造业企业作为转型升级的重点对象,OFDI对其转型升
快速正交频分复用(Fast Orthogonal Frequency Division Multiplexing,FOFDM)系统以其高光谱利用率、系统搭建简单等诸多优势获得了光通信行业的广泛关注。直接检测光FOFDM(D