结合传统计数特征和基于词嵌入特征的中文问答方法

来源 :天津大学 | 被引量 : 0次 | 上传用户:zygqqx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机对文本的表示和理解一直是一个我们亟待解决并一直在尝试的问题。在以前的信息检索任务中,被检索的文档比较长,已经包含了非常丰富的信息。但是在流行的文本问答等任务中,问题和答案文本都是比较短,对这种短文本做匹配任务就需要更加精细的建模。基于词分布式假设发展而来的词向量技术,使得语音数据和图像数据大放异彩的深度学习也能够在文本领域有用武之地。深度学习在自动学习端对端的输入到输出之间的复杂非线性关系尤为出色,但是却要完全放弃我们已有的丰富的领域知识构建而成的丰富特征。为了利用深度学习的巨大潜力和传统的文本建模方法,融合了传统的基于计数的特征和深度网络学习的特征来预测问答对的匹配程度。除此以外,中文由于其很多独特的地方,例如需要分词、字词不同级别的语义以及不同的语法和表达习惯,集合英文问答任务积累的丰富的研究工作给的借鉴,我们还结合了中文的特点去建模到传统计数模型和嵌入模型,最后的特征融合和模型融合的策略取得了较好的效果,显著优于基础的基线模型。
其他文献
本文基于CMOS工艺实现的同步型逐次逼近(Successive-Approximation)模数转换器(ADC)具有低功耗,小尺寸,易于实现多路转换的特点。其转换精度和转换速度处于中等水平,满足当前
现阶段,我国农村金融受抑制情况严重,从而阻碍了我国农村经济的发展。导致我国农村金融受抑制的根本原因在于我国农村金融体系尚不够完善,这种不完善体现在于农户与金融机构
信息检索中的风险的主要来源有查询的二义性,查询和文档的相关度的不确定性以及文档集中的文档是相关的,并非独立的。基于这些风险,很多风险评价方法都被提出。但是,它们大部
在海洋测量技术的蓬勃发展的今天,多波束测深系统以高效、高精度和全覆盖的优点使其成为海洋测量领域中不可或缺的关键设备。多波束测图精度主要受到三大方面影响,即多波束测深系统本身安装误差、外围辅助传感器测量误差和海底点波束归位模型误差,作为一类多传感器高精度集成的系统,多波束换能器的空间标定(校准)一直是多波束测量数据处理不可或缺的工作。目前关于多波束空间标定算法的研究已经很多,但是大多都是采用斑片试验
伴随着特征尺寸的减小,集成电路早已进入深亚微米工艺,由此带来的寄生效应越来越严重,芯片的电源、时序和信号完整性都面临着巨大的挑战,因此芯片的物理设计显得愈发重要。本
微光电子机械系统(Micro-Opto-Electro-Mechanical-System,MOEMS)是将光学与MEMS结合的产物,具有低成本、高性能、微型化、集成化,可靠性强等特点,电热驱动MEMS微镜作为微光
随着信息技术及互联网的迅速发展,生产生活中的各种行为都被数字化信息化,人们每天处理着各式各样的数据,数据不仅形式多样化而且数据量也呈现爆炸式增长。如何使用数据挖掘
历史建筑作为城市文化的重要组成部分之一,因具有历史文化价值与建筑艺术价值往往不能拆除重建。保护和加固再利用历史建筑已经成为发展的趋势,因此历史建筑的检测和加固的应用研究十分必要。旧有的历史建筑因服役时间过长,建筑结构不能满足现行建筑结构规范,具有一定的风险。因此需要对历史建筑进行合理和科学的检测鉴定,再对其进行加固设计,达到再利用历史建筑的目的。本文在查阅大量资料的基础之上,通过实例沈阳帅府,对砖
当今,无线传感器网络随着科学技术研究的深入得到了迅猛发展,应用范围将涉及目标跟踪、精细农业、工业制造、军事作战等方面。本文主要针对无线传感器网络目标跟踪中的分布式
石墨烯的优异性能引起人们对类石墨烯二维材料的广泛关注,进而实现其在场效应晶体管、功能复合材料、储能材料、等方面的应用。二维材料的性质与结构密切相关,制备大面积、高质量、性质可控的二维材料是实现其应用的先决条件。化学气相沉积(CVD)法提供了制备大面积高质量二维材料的可控方法,具有设备简单、成本低廉、操作方便等优点。采用CVD法能够制备得到单晶二维材料,同时也能通过调控生长参数及其它反应条件得到薄膜