生物医学问答关键技术研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:swfcmoon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动问答能够根据用户的问题,返回正确的答案,是自然语言处理领域的一个研究热点。至今为止,通用领域自动问答对于简单问题的回答已经达到了较高的准确率,而生物医学领域问答性能仍然有待提高。针对生物医学实体关系复杂、问题和答案对语义理解困难等问题,本文研究问题和答案对间的语义联系,以及基于专业知识的语义理解等生物医学问答关键问题。本文主要研究内容如下:(1)基于问答对语义挖掘的生物医学问答研究。生物医学问答模型需要从复杂的问答对中捕获问题和答案之间的语义联系。本文为全面捕获问答对的语义联系,提出多单元协同注意力机制。首先采用协同注意力机制,基于问题表示指导答案注意力,同时基于答案表示指导问题注意力,获得问答对的语义联系。然后引入多个平行的协同注意力机制,通过不同的协同注意力单元促进问答对的语义表示。在MEDIQA数据集上的实验表明,本文提出的多单元协同注意力机制能够深度挖掘问答对的语义联系,有效提升生物医学问答对分类性能。(2)基于领域知识选择的生物医学问答研究。生物医学文本实体多、实体关系复杂,有时根据上下文无法完全做到对语义的理解,需要一定的专业知识辅助。为引入生物医学领域知识,本文首先基于问答任务构建生物医学领域知识库。然后,采用知识表示学习方法获得实体和关系的表示。接着,分别基于问题和答案的语义表示对知识进行关注,获得问题和答案的知识表示。最后,采用门控机制,融合知识表示和语义表示,分别获得问题和答案的知识语义联合表示,用于问答对分类。在MEDIQA数据集上的实验结果表明,基于领域知识选择的生物医学问答模型能够选择出有用的知识辅助问答对分类,提高生物医学问答模型性能。(3)基于对抗样本生成的生物医学问答。类型信息对于问答对分类可以起到重要辅助作用。为准确地捕获类型信息,本文首先对问题中的类型信息添加扰动,生成对抗样本。然后,将对抗样本加入训练集,分别训练基于问答对语义挖掘的生物医学问答模型,和基于领域知识选择的生物医学问答模型,增强模型对类型信息的捕捉能力。最后,利用合作学习,使这两个模型相互学习,促进领域知识和语义信息的进一步融合。在MEDIQA数据集上的实验结果表明,基于对抗样本生成的生物医学问答模型,能够准确地捕获问题和答案的类型信息。并且合作学习能够有效融合不同模型的语义信息和知识信息,提高生物医学问答模型性能。本文的研究提供了有效提升生物医学问答性能的方法。本文方法也可以用于其他问答任务,具有一定的普适性。
其他文献
Different countries have a variety of geographical,topographical,and climatic conditions.Some countries have their guidelines for design structures,and some depend on other countries to lay down the g
学位
随着计算机的快速发展,互联网信息爆炸式增长,如何从自然语言文本中抽取出特定的事实信息成为了自然语言处理领域的重点之一。关系抽取是自然语言处理中的一项重要任务,目的是预测实体间的语义关系,并为构建完整的知识网络提供支持。本文对有监督关系抽取和远程监督关系抽取的现有方法进行改进,以提升其准确率。在关系抽取问题上,现有研究常采用Attention作为信息提取与整合的方法。Attention是一种模拟人关
学位
双语命名实体对是跨语言自然语言处理领域的一项重要资源,大规模双语命名实体识别可以有效提升信息检索、机器翻译、自动摘要等自然语言处理任务的性能,研究抽取双语命名实体对有重要的意义和应用价值。本文对中英双语对齐语料抽取命名实体对的方法进行了研究,在学习前人工作的基础上,针对中英命名实体对匹配不完全、匹配错误等问题,提出了一种融合词向量的多特征命名实体对抽取方法。首先,使用命名实体识别模型分别在中英两种
学位
近年来,智能交通系统的快速发展使得车联网技术成为研究热点,第五代移动通信技术(5G)的到来更是极大地促进了车联网的发展。目前车联网的通信协议主要有两种,一种是IEEE 802.11p协议(又称WAVE,Wireless Access in the Vehicular Environment),另外一种是由我国主推的LTE-V(Long Term Evolution-Vehicle)协议,然而这两种
学位
随着我国城市化工作进程的向前推进,我国的城市规模不断扩大,进而也相继出现了一些问题,如交通堵塞问题、环境污染问题以及人口过多的问题,以上这些由于城市发展导致的不良状况也对市民的心理健康产生了不良影响,如抑郁症、拥挤焦虑症等等。当今社会经济迅猛发展,生活在社会中的人们面临着一定的生活压力,可能存在着显著性的亚健康状态。多数市民的心理状态都很疲劳,也因为精神疲劳进而产生其他严重的心理疾病。并且,心理健
学位
20世纪70年代到90年代,我国面临着严重的人均住房紧张的难题,为了在一定程度上缓解人口增长,解决住房难题,以我国事业以及企业单位牵头带领,修建了大批住宅小区。但受当时建设技术条件以及理念的种种限制,在建设住宅小区的同时,并没有意识到声环境问题的重要性。如今,在政府的积极鼓励之下,大力推进旧城区改造工作,人们的精神需求也提上日程,如何为当代居民提供一个宜居、舒适的老旧小区室外声环境成为了当下学者们
学位
本研究的目的是设计一种检测混凝土裂缝的方法,利用时间反转压电传感器进行混凝土结构健康监测(structural health monitoring,SHM)。SHM的目标是对混凝土结构进行持续的无损评估。当安装如核电站或桥梁等大型混凝土结构时,检测甚至定位混凝土结构的轻微损坏是一项具有挑战性的工作。压电陶瓷材料的发现以及基于时间反转法的传感器/驱动器技术在混凝土结构损伤识别和诊断领域的最新进展为S
学位
目前,经济快速发展导致了社会关系淡漠,同时城市居民也对身心健康状况越来越重视。繁重的工作任务和学习压力使得居民的生理和心理的健康水平日益下降,在寒风呼啸、冬季低温、降雪结冰、河流污染、冬季绿化匮乏和空气污染等条件下,寒地居民更需要一个健康促进的社区户外空间环境来调节和减轻身心压力。在寒地城市范围内,各类关于人居社区环境的会议越来越注重对于健康促进型社区户外空间环境的建设。论文将寒地社区户外空间作为
学位
图像分割作为图像处理的第一步决定着后续图像处理的任务与操作,结合水平集方法的活动轮廓模型是图像分割的研究热点。Chan-Vese模型作为一种结合水平集方法的几何活动轮廓模型,可以有效地分割含噪声和弱边缘图像。以欧拉弹性为正则项的图像分割模型较Chan-Vese模型可自动补回缺失边界,对图像分割效果更好。首先,文献中利用増广拉格朗日方法求ECV-L~1模型和ECV-L~2模型时,求解u、n两个参数对
学位
镉(Cadmium,Cd)是一种对人类及其他生物有剧毒的重金属,其造成的土壤质量恶化、作物产量降低、生物健康水平下降等不利影响,严重破坏生态安全。硫(Sulfur,S)作为植物生长的必需营养元素,在许多研究中被发现与植物响应重金属胁迫的过程具有一定关联性。野菊(Chrysanthemum indicum)为多年生草本植物,有分布广、适应性强、生物量较大等特点,目前多用于制作药材、提取精油和装饰。已
学位