面向特定领域的自由文本的自动问答关键技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hfxwh6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器阅读理解在自动问答任务中是一项较为复杂的任务。机器阅读理解是通过计算机阅读文本,对文本内容进行理解从而找出或者推理出问题的答案的技术。阅读理解也是人类各种语言的测试题型之一,在人类的高级阅读过程中不仅仅要对原文内容进行理解,更需要有进一步的分析和综合。受益于深度学习技术的快速发展,基于机器阅读理解任务的各种大型数据集的不断推出,使得机器阅读理解任务也有了新的进展。尽管目前机器阅读理解发展的很迅速,目前主流的机器阅读理解模型在回答抽取式机器阅读理解任务已经能够超越人类水平,但是这些主流的模型仍然是停留在语义匹配层面,与真正的“理解”二字距离还比较遥远。对于更为复杂的阅读理解任务并不能很好的得到结果。本文根据当前机器阅读理解任务所面临的一些问题和本文所使用的特定领域阅读理解任务数据集的相关特点,设计了一种具有针对性的机器阅读理解答案抽取方法。本文首先针对一个完整的机器阅读理解数据集(其中包含了各种不同类型的抽取式机器阅读理解数据,根据答案类型进行分类有单答案问题、多答案问题和推理问题)进行分类;通过将数据集进行分类之后,针对多答案问题的数据特征,利用多答案问题的一些结构化特点将其逐步分解为单答案,之后利用基准机器阅读理解模型对分解后的单答案进行答案抽取;最后针对推理问题答案求解,根据多答案问题数据格式将推理问题进行分解,将一个完整的推理问题分解为两个子问题,其中首先使用最长公共子序列获取标注数据,之后利用Bi-LSTM训练一个子问题拆分模型,针对拆分的问题其第一部分问题为了求解桥接实体,第二部分问题通过获得桥接实体再求解最终答案。
其他文献
情感识别是人机交互领域的一项重要的应用。语音作为人类交流的重要媒介,也是信息传递的重要的载体,同时也是人类与计算机交互里面最重要也是最自然的一部分。语音情感识别作为情感识别的一部分,其通过语音来分析人类细微情感变化,推测人类心理,在实际应用也起到重要作用。比如,客服反馈系统、刑事审讯、教学管理以及医疗服务等。近年来,人们利用人工智能和深度学习技术来处理了语音领域的一些问题,语音情感识别作为语音领域
离心泵内叶轮尾迹的发展及叶轮-隔舌的动静干涉作用使得泵内呈现复杂的非定常流动结构,由此产生的流体激励力引起泵的振动噪声。通过优化离心泵叶轮结构、增设偏置叶片来改善叶轮尾迹中旋涡脱落形态,降低因动静干涉作用造成的压力脉动,是离心泵减振降噪的重要手段。在国家自然科学基金“泵内受迫湍流的涡动力学特征及其激励机制”(No.51576090)的资助下,本文以一台低比转速离心泵为研究对象,采用数值计算和试验手
免疫检查点阻断治疗可以通过激发机体的天然免疫屏障来发挥抗癌作用,被认为是新型的非常有前途的肿瘤治疗方法。然而目前病人对免疫检查点阻断治疗的响应率仅有20%左右。寻找治疗响应与不响应病人之间的差异,从而提前预测鉴定病人是否对免疫检查点阻断治疗响应,是目前研究和临床上急需解决的重要问题。近年来,关于免疫检查点阻断治疗的研究越来越多,也积累了一些相应的数据。为了更好的了解不同响应病人间的转录组以及肿瘤微
锂金属负极具有极高的理论比容量(3860 m Ah g-1)和最低的还原电位(-3.045V相对标准氢电极),在新一代高能量密度存储中具有巨大的应用前景,是锂电池负极材料的最终选择。锂单质易与空气尤其是潮湿空气发生反应而失活,导致电池的生产成本急剧增加,目前的研究都在关注如何提高锂金属在电池中的循环寿命,很少注意到未来锂金属电池进行大规模组装所面临的挑战,现阶段缺少对提高锂金属的空气稳定性经济可行
钛合金零件具有高强度、高耐蚀性、高耐热性等优点,在航空航天、医疗器械、汽车工业等领域发展前景广阔。随着激光技术的发展,选区激光熔化(Selective laser melting,SLM)已成为高效高质量成形钛合金的有效方法。熔池内部湍流等因素会导致SLM成形钛合金零件内部产生不同类型的缺陷,部分缺陷由于体积过小或分布较为集中,给检测和统计带来了困难。本文针对SLM钛合金零件内部缺陷开展无损检测方
在原核生物中,蛋白质磷酸化在许多重要生物学过程的动态调控中发挥关键作用。磷酸化反应主要发生在蛋白质底物的多种氨基酸残基上,包括丝氨酸(serine,S)、苏氨酸(threonine,T)、酪氨酸(tyrosine,Y)、精氨酸(arginine,R)、组氨酸(histidine,H)、半胱氨酸(cysteine,C)和天冬氨酸(aspartic acid,D)残基。通过对NCBI Pub Med数
我国铁路的快速发展和广泛的覆盖范围为铁路运输效率及安全带来挑战。而影响铁路运输安全及效率的主要因素之一是在铁路限界内常发生的行人和轻飘物等异物入侵事件。我国主要以护栏网的形式物理阻拦侵限异物以此得到防护效果,但仍常有异物侵入铁路限界内,导致列车紧急制动,扰乱列车线路运行计划。同时铁路线路多处于半封闭式环境中,铁路上空区域成为防护盲区。铁路沿线附近的风筝,塑料袋等异物常飘入铁路限界内或飘落在接触网的
在过去的几十年中,创业已成为全世界重要的经济和社会发展议题,创业活动提升了全世界的经济效率、创造了大量新的就业岗位、提高了就业率。在中国,当前已形成了大众创业、万众创新的生动局面。中国相关政府部门除了加速拓宽就业渠道,还将毕业生自主创业行为视为减轻压力的方式之一。为此,教育部颁布文件,要求相关高校对于在校大学生提供必要的创新创业指导和教育,充分支持和鼓励毕业大学生创新创业的国家发展战略。德国大学生
行人检测是计算机视觉领域内的一个重要研究方向,并广泛应用于智能安防、智能交通、无人驾驶等领域。但现实场景中背景复杂,行人密集,存在相互遮挡和尺度悬殊的情况,导致SSD、Faster R-CNN等基于深度学习的目标检测方法的检测精度受到很大的限制。因此,本文从深度特征增强、损失函数的改进、多尺度特征融合三个方面进行改进,对提高行人检测精度和环境适应性具有重要意义。本文具体的研究内容可以归纳为以下几点
组织工程使用多孔支架作为各类药物、生物活性因子和细胞的载体,通过替代受损组织,诱导组织再生,实现结构和功能的恢复,通过仿生原理制备出结构和成分高度仿生的组织工程支架是常用的设计方案。本论文针对皮肤和骨的组织特点,基于仿生原理,制备了组织工程多孔复合支架材料,并进行了相关物理化学性能表征和组织再生评价。脱细胞真皮基质(ADM)取材于真皮组织,含有多种生物活性因子,与皮肤组织高度相似,常被用于创面修复