基于联合特征的文本蕴含识别方法研究

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:gaobaobao127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,自然语言处理渐渐走在科技前沿且备受研究者青睐。自然语言处理旨在增强人工智能与人之间的沟通,包括了信息抽取、信息检索、机器翻译等多项技术任务,能够解决人类完成此类数据量巨大的任务需要耗费大量精力的问题。同时,使计算机能够拥有人的思维模式,从语义层面理解文本从而更加高效完成任务是自然语言处理领域一直以来追求的目标。为此,文本蕴含识别技术应运而生。文本蕴含识别指通过给定前提文本与假设文本,判断假设文本是否可以从前提文本中推理出来,从而确定给定文本之间是否存在蕴含关系。传统文本蕴含识别方法需要很多人工抽取的特征、人工设定的规则以及词性标注、句法分析等预处理工具。随着自然语言处理的发展,研究者用神经网络来进行文本蕴含识别。这种方法能够一定程度模拟人脑,通过连续向量化表示来克服特征稀疏问题,但是对于语义信息的比较仍然有局限性,导致识别准确率并不十分理想。为此,本文提出基于联合特征的文本蕴含识别方法。首先建立了特征工程模型来提高文本特征抽取的准确率,通过文本向量化,特征增强,特征集成来构建特征工程模型,提取出文本特征;其次,本文提出一种文本匹配深度神经网络模型ESIM模型的改进方案,以提高语义层面的信息比较能力,将注意力机制融入ESIM模型——传统注意力机制完成文本软对齐,自注意力机制增强句子表征;最后,本文提出基于联合特征的文本蕴含识别方法,将特征工程与融入注意力机制的ESIM模型的特征融合,特征融合方法为D-S证据理论,并完成实验对比分析。实验结果表明,基于联合特征的文本蕴含识别方法在SNLI数据集上的识别准确率以及RTE-7数据集上的识别精确率均有所提高,从而证明了该方法的有效性。
其他文献
车联网是物联网技术在交通系统领域的典型应用,可支持三类信息如安全信息、娱乐信息和功能服务类信息的投递。在车联网的应用中,地域群播可形成区域广播来投递商业广告,或发
随着交通大数据到来,交通数据的采集和分析更加容易,各种移动终端产生的实时位置、交通流量及行驶速度数据等已成为交通大数据的重要来源。为了有效利用交通数据,以提供准确
移动智能设备已经成为人们生活中不可或缺的部分。虽然移动设备的硬件一直在高速发展,但是依然不能满足日益增长的性能和低功耗需求。为了解决上述问题,一种被广泛认可的方案
随着区块链中区块的快速增长,区块链节点面临由于大量区块产生带来的大容量存储问题,优化区块链节点的存储是非常必要的。本文针对传统分片存储方案中存在的容量和安全问题,
伴随科学技术的迅猛发展,现代工业进入到前所未有的“高级发展阶段”。社会对工业产品现代制造业的要求也越来越高。在这个过程当中三维实体数字化检测技术也随之出现,实时、
随着数学课程改革的不断深入,对于课堂教学中的过程性评价越来越重视,书面化的指导在最新版数学课程标准中有所体现,与之相关的研究也成为目前的一个趋势,而其中教师课堂教学
目的:反应模式可以很好地体现出初中生的心理健康状况,从而成为了心理学界关注话题。有研究表明反馈方式和自尊会影响初中生经历失败后的反应模式。不同归因的反馈方式和不同
本文的研究目的是探索制备具有高表面增强拉曼散射(SERS)能力的贵金属(金、银、铜)水热碳基复合材料的实验方法,并研究它们的SERS效应和增强机理。内容主要包括以下三个部分:
唇语识别是指利用计算机视觉技术根据说话人讲话过程中唇部变化识别出说话内容的技术。要实现准确的唇语识别,需要克服许多挑战,包括说话过程中说话人姿态的变化、所说内容的
随着数字图像处理技术的飞速发展及各种智能设备的广泛使用,大规模图像/视频数据库的应用变得越来越普遍。与此同时,出现了许多功能强大且易于操作的图像处理软件,使得即使是