【摘 要】
:
随着人工智能与大数据的飞速发展,教计算机理解人类自然语言已经成为了最具挑战的AI完全目标。让机器学会像人类一样阅读文本,通过理解文本中的内在含义,能够根据问题和需求给予正确的响应和反馈,该任务过程被称为机器阅读理解任务。机器阅读理解作为自然语言处理任务中一个重要的研究领域,已经成为了学术界和工业界的关注热点。并且随着深度学习技术的兴起、不断推出的各种大型中英文数据集,机器阅读理解任务的难度和挑战性
论文部分内容阅读
随着人工智能与大数据的飞速发展,教计算机理解人类自然语言已经成为了最具挑战的AI完全目标。让机器学会像人类一样阅读文本,通过理解文本中的内在含义,能够根据问题和需求给予正确的响应和反馈,该任务过程被称为机器阅读理解任务。机器阅读理解作为自然语言处理任务中一个重要的研究领域,已经成为了学术界和工业界的关注热点。并且随着深度学习技术的兴起、不断推出的各种大型中英文数据集,机器阅读理解任务的难度和挑战性逐步上升。研究机器阅读理解的同时也要依赖于其它自然语言处理领域相关的技术,从而促进整个自然语言处理领域的发展,继而影响人工智能前行的进程,使得机器阅读理解技术具有非常重要的研究意义。本文通过分析中文机器阅读理解数据集Du Reader的特点,分别提出了基于特征工程与基于深度学习的机器阅读理解方法。对于特征明显的数据,采用基于特征工程的方法,设计了文本语义分析模型,应用代词解析,标记基本名词短语和句法解析等方法来丰富文档和句子的语义信息,并使用外部知识库CSC添加同义词集来扩展问题的词语集用于挖掘语义相关性,扩大答案范围以获得问题和正确答案句子之间的精确匹配。此外,本文为了进一步得到准确答案,在文本语义分析模型的基础上,设计了文本语义推理技术,定义了七种框架语义关系用来表示场景之间的联系从而得到某些潜在语义信息,并构建了30多种特征用于识别句子中的核心目标词,通过核心目标词激活的场景缩小扩展词集所扩大的答案范围,在框架关系之间结合核心目标词进行推理,提高答案获取的准确率。而对于特征不明确或者无法直接获取特征的数据,采用基于深度学习的方法,本文借鉴了Bi DAF模型的思想,提出了基于自注意力的SAR_Bi DAF阅读理解模型,在原有双向注意力的基础上加入了词注意力机制和自注意力机制,并且在语义匹配过程中引入多步推理机制将关注的重点信息进行累积以求达到最优,采用生成模式和抽取模式两种方式进行答案生成,进一步的提升了答案生成的准确率。最后将本文基于特征工程的方法和基于深度学习的方法在Du Reader数据集上进行实验验证。实验主要分为两个过程来进行:特征工程实验和深度学习实验。对于实验结果的评估,本文选用ROUGE-L和BLEU-4作为评价指标。通过与基线模型进行对比实验,实验结果表明,本文所提出的模型在机器阅读理解任务上具有更好的性能以及较好的通用性。
其他文献
PM2.5是主要空气污染物之一,随着空气污染问题日益严重,人们在日常生活中对其防控意识不断加强,提高PM2.5浓度值预测准确率对空气污染防控以及人类健康具有重大意义。本文利用传统机器学习以及深度学习的方法探讨了基于空间维度进行PM2.5浓度值预测的可行性,减少了PM2.5浓度值预测对历史数据的依赖。本文主要完成以下三个工作:1.针对缺少真实的PM2.5浓度值数据开展研究,本文首先获取了西安市近一年
随着全球化石能源的过度使用与温室气体的过量排放,致使极端天气与环境污染等问题频繁发生,给人类的生活与生产带来了严重影响。为了解决以二氧化碳为主的过量温室气体排放所带来的环境问题,人们通过建设碳排放权交易市场来实现低碳经济、绿色经济的可持续发展模式。碳排放权交易是以二氧化碳排放权为交易商品通过市场化机制来提高交易主体的减排意识,从而控制碳排放总量的一种减排手段。为了履行我国的减排承诺并实现经济的可持
作为目前工业化应用最轻的金属结构材料之一,得益于易于加工成形和容易回收再利用等优点,镁合金广泛应用于电子电器、航空航天和交通运输等领域,被广大研究人员誉为21世纪资源与环境可持续发展的绿色材料。但室温下塑性变形能力差,加工成品率较低,极大的限制了镁合金材料的进一步发展。随着计算机仿真模拟方法的逐渐成熟,越来越多的研究人员把对材料的研究重点从传统的实验研究转移到采用仿真模拟方法对材料各项性能进行科学
产业集聚是工业化发展到一定阶段的必然产物,与经济增长之间有着重要的联系。产业集聚能够通过降低交易成本、促进知识溢出、增强企业竞争等途径促进经济增长。随着集聚水平的不断增加集聚所产生的负面效应不断显现,最终会呈现出对于经济的抑制作用。现阶段,我国经济发展进入新时期,经济下行压力增加,如何通过提振制造业来促进经济增长,对我国有着至关重要的意义。本文选取制造业产业的集聚特性,以全国260个地级及以上城市
随着深度学习和无人驾驶技术的发展,道路目标检测的应用越来越广泛。道路目标检测对实时性和准确性均有较高的要求,此外室外环境常常出现雾天等恶劣天气情况,极大的影响了目标检测算法的效果。研究雾天环境下的道路目标检测问题,提高现有目标检测算法准确率,对相关行业的发展有重要意义。本文以卷积神经网络为基础,对雾天道路目标检测算法进行了研究。本文以YOLOv3网络为基础,提出了融合深度可分离卷积和密集残差网络的
情感在青少年的品德发展过程中扮演着重要角色,是形成优秀品质的重要条件,因此情感互动在思想政治课堂教学过程显得格外重要。思想政治课堂教学过程既是一个掌握知识的过程,也是一个情感互动的过程,在这一过程中强调学生主观能动性的发挥;情感在高中思想政治课的地位越来越重要,这就要求思想政治课教师重视课堂中的情感互动,掌握情感互动的技巧。当前的基础教育把师生情感互动放在了重要位置,针对高中生这个接收群体的性格特
思维导图是一种高维度思考与图文并茂形式相结合的可视化笔记法,它以图解的形式和网状的结构储存、加工、优化和输出信息。高中思想政治教育课是一门集情感态度价值观、知识、能力于一体的德育类综合课程,对学生的人格、品德、心理的养成和价值观的培养等具有重要影响。新课标的制定充分说明,目前对思想政治课的要求比以往更高,不仅强调培养学生的情感态度价值观,更要提升学生的思维能力、学习效率,培养学生的发散性思维能力,
肺癌是发病率与死亡率增长最快的恶性肿瘤之一,对全人类的身体健康造成了重大影响。因此,肺部病变的早期诊断对肺癌的诊断与治疗有重要的意义。肺癌的早期形态是肺结节,临床使用计算机断层扫描技术检查肺结节病变。肺结节的影像特征具有多样性,人眼筛查不仅工作量大,而且观察者对特征的判断具有主观性。对肺结节的表现特征进行准确的定量分析,对医生判断结节是否会成长为恶性肿瘤具有很大作用。本文首先研究并总结了肺部公开数
道德与法治课是集道德修养、社会参与、法治知识为一体的综合性课程,它是学生在初中阶段接受道德教育与法制教育的主要途径。一堂高效的道德与法治课不仅仅是完成对相关知识的传递,更重要的是要求教师对课堂时间进行科学有效的管理,在有限的时空下达成对学生文化价值观念等方面的整体培育。深化道德与法治课课堂时间管理研究,对提升课堂教学效率、达成教学目标、提高学生课堂参与度等方面具有重要的价值和意义。道德与法治课课堂
移动智能设备数目大幅度增长,但移动智能终端具有CPU处理能力弱、电量低等局限性,难以支持计算密集型业务。为了提高移动用户的服务体验质量,同时缓解移动云计算造成的回传带宽消耗,雾计算是一个可行的解决方案,雾计算作为云计算的扩展,支持在网络边缘节点部署计算能力。网络功能虚拟化技术可以为雾计算环境提供更加高效、灵活和可扩展的网络功能服务,通过将网络功能从专用硬件设备迁移到通用服务器上,可以灵活地利用网络