篇章级的图文问答研究

来源 :清华大学 | 被引量 : 1次 | 上传用户:xushaowei20092009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
篇章级的图文问答是一个新兴的交叉领域课题。该课题综合了纯文本问答和视觉问答两个任务,要求智能系统根据提供的图像和长文本来回答问题。比起纯文本问答和视觉问答,篇章级的图文问答更接近人类回答问题的场景:结合视觉信息和已有知识来综合思考答案。因此这一课题在增强机器的理解能力上具有更好的发展前景。但是,这一新兴的课题也带来了新的挑战。一方面,纯文本问答任务中,给出的背景知识文本大多数只有段落级的长度,因此很难直接利用现有方法来从长文本中提取特征;另一方面,视觉问答任务要求处理的文本也很短小,现有的多模态融合方法也难以处理长文本的特征。针对篇章级图文问答的特点和难点,基于纯文本问答和视觉问答两个领域已有的方法,本文提出了一个多层次的解决方案。本文的主要研究内容分为如下几个方面:1.提出“基于词嵌入记录篇章信息的图文问答系统”,利用词嵌入空间的冗余性来解决长文本的问题。该方法从篇章中提取出关键词,并将篇章的重要特征嵌入到这些关键词的表示空间中。由于没有引入新的大规模结构,该方法基于现有视觉问答框架解决多模态融合问题。2.提出“基于联合优化下网络嵌入方法的图文问答系统”,解决关键词与非关键词嵌入空间不一致的问题。该方法通过引入具有较高迁移性的网络嵌入方法,来缓和两个嵌入空间的差距。该方法还使用联合优化策略来消除网络嵌入容易陷入局部最优的问题。3.提出“基于矛盾实体-关系图的图文问答显式推理系统”,使用离散结构来表示图文信息。该方法针对已有的符号化方法局部处理能力强、但提取的特征不易传播的问题,利用矛盾语义易传播的特点在图文间进行显式特征的比较与推理。4.提出“矛盾语义指导下的多模态记忆网络”,针对符号化的方法与深度神经网络各自的优缺点,利用记忆网络和注意力机制来对两种方法进行融合和相互补充。本文的研究内容形成了对篇章级的图文问答课题的初探。本文相关成果具备一定的理论意义,并对篇章级图文问答这一新兴交叉领域未来的发展具有参考价值。
其他文献
高温气冷堆堆芯是一个由大量燃料球随机密集堆积而成的球床。球床运行在高温条件下并由高压氦气流通过对流换热带走堆芯热量。本文在颗粒尺度下给出了高温球床导热、颗粒辐射以及对流换热传热过程的数值模型。对于球床中的颗粒运动,论文中采用离散单元法(DEM)计算不同球径比和区域宽度比下的双区球床混合过程。而颗粒尺度混合指数和混合熵用于定量描述混合强度。计算结果表明双区球床的球径比对混合过程的影响更为明显。同时,
涉及气相、凝聚相、等离子体相的复杂火焰场广泛存在于实际工业燃烧及其调控过程中,如火焰合成纳米颗粒、煤燃烧污染物生成、燃烧与壁面相互作用、等离子体及电场助燃等。在这些复杂火焰过程中,不同物质相态之间的相互作用及转换普遍存在,有很多亟待揭示的基础科学问题。本论文结合气相合成这一实际应用所涉及的复杂火焰场,发展了针对性的在线光学诊断方法,探讨了火焰合成中多相态的转化和相互作用,并揭示了固体壁面和火焰等离
随着全球人口日趋老龄化,房颤攀升为心脑血管疾病中高发病种。左心耳是房颤患者身体上心源性血栓主要形成部位,血栓脱落随血液游离到脑部,闭塞脑血管将导致脑卒中。脑卒中具有发病率高、致残率高、死亡率高、复发率高及经济负担高等特点,严重危害人类的生活质量和生命健康。为了定量诊治房颤、有效评估心源性血栓形成和脱落的风险,本文开展了基于心脏CT的左心耳腔体分割与腔内血栓自动诊断的研究。成果主要包括以下四个方面:
近年来,磷光和热活化延迟荧光(TADF)OLED器件的效率得到巨大的提升,其最高外量子效率早已突破30%,但效率滚降(roll-off)和较短的器件寿命成为制约磷光和TADF-OLED实际应用的重要因素。目前一种常用的改善器件roll-off和寿命的方法是采用具有TADF特性的热活化敏化主体,但目前热活化敏化主体在带隙较小的红光染料和激发态能级较高的蓝光染料上的应用较少,本论文提出了适用于红光和蓝
球床模块式高温气冷堆(HTR-PM)在乏燃料的暂存与中间贮存阶段均采用干式贮存冷却方案。暂存阶段乏燃料余热功率较高,需采用强制通风冷却,中间贮存阶段余热功率较低,采用自然通风冷却。研究乏燃料干式贮存冷却系统在正常运行工况下的余热排出特性与风机失效时的事故进程,对于验证设计基准、评价事故工况下的安全特性具有重要意义。干式贮存冷却系统是多尺度多物理场耦合的瞬态通风系统,其瞬态过程分析也为大尺度通风系统
高温超导薄膜具有极低的微波表面电阻,由其实现的高温超导滤波器具有低插入损耗、高带边陡峭度和高带外抑制等优异性能。随着现代无线通信技术的飞速发展,复杂的空间电磁波环境对无线通信系统提出了诸多新的挑战。能提升系统灵敏度和抗干扰能力的宽阻带滤波器以及具有多频选择性的多通带滤波器受到了越来越多的研究关注。高温超导宽抑制滤波器和多通带滤波器研究具有重要意义。本论文研究了基于准集总元件提高低频滤波器带外抑制性
在高温气冷堆中,反应堆舱室冷却系统被用于载出舱室中的热量以及堆芯中的衰变热,对于确保反应堆的安全起着非常重要的作用。在系统进行热量载出时,反应堆舱室中的传热过程是十分关键的环节,系统的整体载热特性与反应堆舱室中的局部传热过程之间存在着相互影响的关系。因此,同时研究系统的整体载热特性以及舱室中的局部传热过程就显得特别重要。本文建立了用于模拟舱室中局部传热过程的三维数值计算模型,并通过该模型模拟了五种
基于网络流的被动测量是高速网络中重要的测量技术。高速流测量需要满足高速、准确和低代价三方面的要求。目前的流测量技术采用了流采样方法,仅对采样到的分组进行计数,可满足高速和低代价的需求,却对小流测量带来了极大的误差。为此学术界提出了自适应非线性采样算法,对不同大小的流自适应地采用不同的采样率,能取得40Gbps吞吐率,并可做到对大流和小流的准确测量。但已有的自适应非线性采样算法对每个到达分组都要执行
生物质因其可再生、碳中性等优势而备受关注,但所含内在K在热转化过程中的迁移会造成换热面积灰结渣等问题。本文搭建了固定床实验系统和K气相释放/颗粒燃烧温度在线测量实验系统,针对不同热转化条件下生物质内在K的迁移规律和机理进行了深入研究,为解决K迁移引起的技术问题提供理论支撑。首先以柳木为典型木本生物质、以稻秆为典型草本生物质,研究了其在热解和燃烧过程中K的迁移规律和途径。研究发现,柳木中K主要为有机
一维无机宽禁带半导体氧化物具有形貌可调节,光电性能高,柔性等特性,其在应用光电器件中的需求不断增长。但是由于一维材料复杂的合成工艺以及缺乏有效的组装方式,它们的应用依旧受到限制。为了提升其应用前景,急需一种经济又简易的合成以及组装工艺。静电纺丝技术是一种经济的并且能够用于规模生产的技术,可以用来合成具有高质量、多级形貌的一维纳米结构。通过优化系统和工艺参数,可以制备具有高比表面积的、不同种类的一维