基于搜索引擎的问答系统的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户：lvhuan009a

【摘要】

：

随着互联网技术的飞速发展和普及,网络已经成为大部分人获取信息和进行沟通的工具,其在丰富互联网内容、引导我们走向知识时代的同时,也使用户陷入了信息困境。尽管传统搜索

【作者】

：

江乐

【出处】

：

北京邮电大学

【发表日期】

：

2018年01期

【关键词】

：

搜索引擎问答系统多粒度词嵌入注意力机制

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术的飞速发展和普及,网络已经成为大部分人获取信息和进行沟通的工具,其在丰富互联网内容、引导我们走向知识时代的同时,也使用户陷入了信息困境。尽管传统搜索引擎和现有的问答系统缓解了用户需求和信息供应的矛盾,但一方面由于搜索引擎返回的结果为相关长文本的集合,用户仍需要手动从中检索出答案;另一方面现有中文问答系统大都基于知识库实现,需单独构建并维护异常庞大的知识库。为了解决上述问题,本文设计并实现了一套面向开放领域的基于搜索引擎的问答系统。本系统划分为Web服务端、问题分析、信息检索、答案抽取、答案合并和答案排序六个模块,其通过分析用户查询意图,从搜索引擎返回的相关文本挖掘出候选答案集,并在对集合元素进行合并、排序后,返回置信度最高的答案。另外,本文针对问题分析、答案排序问题分别提出了基于多粒度词嵌入表示的中文问题分类算法(Multi-granularity Embedding for Chinese Question Classification,MGE-CQC)和基于注意力的多粒度问答匹配算法(Multi-granularity Question Answering Matching with Attention,MQAMA)。MGE-CQC 通过先后对问题进行分词、词性标注、句法结构分析以获取问题的主谓宾等关键词,从中挖掘出各粒度的连续特征,再将问句细粒度的向量表示逐层传递给粗粒度得到问句特征向量,最后通过softmax激活函数输出问题类别;区别于MGE-CQC,MQAMA在特征工程阶段直接求得各粒度下原生问句特征,再引入注意力机制区分开问题中每个词、单字、部首的贡献程度,逐层传递得到问答匹配的关联向量表示,最后输入到sigmoid函数得问答匹配程度。根据算法评估、系统测试结果,本文提出的问题分类、问答匹配算法有效提高了问答准确率,且系统的可用性也得到了验证。

其他文献

程瑶田未刊书画题跋辑释

作为乾嘉时期的著名学者,程瑶田对中国传统书画也深有研究,不仅有专论书法的著作问世,现存的许多书画中还附有他的题跋手迹。这些题跋多为程瑶田应友人之请为中国历代的名作,

期刊

程瑶田书画题跋

东芝TBA-40FR与日立7600生化分析仪检测结果的一致性分析

目的探讨东芝TBA-40FR与日立7600全自动生化分析仪检测结果的一致性。方法应用两台生化分析仪对40份随机标本同时进行测定,测定的项目包括丙氨酸氨基转移酶（ALT）、天冬氨酸氨基

期刊

东芝TBA-40FR日立7600生化分析仪比对分析TBA-40FR Hitachi 7600 automated biochemistry analyze

基于循环农业的农作物秸秆资源化利用模式研究

目前,我国农业污染环境情况是逐年增加,我国政府也是对此事非常重视,更是大力的推广农作物秸秆资源循环化利用模式,农作物秸秆,主要就是农民在收获农作务产品之后,所遗留下来

期刊

农作物秸秆循环农业模式循环利用

“三级六步导学”教学模式在中职数学课堂教学中的应用

以《10.4.2应用样本均值和标准差估计总体》为例,介绍"三级六步导学"模式在中职数学课堂教学中的应用。"三六导学"是可以极大地激发中职学生的数学学习兴趣,让学生体验数学过

期刊

三级六步导学中职数学教学

水利水电工程中混凝土防渗墙施工技术的运用

水利水电工程是城市建设的重要工程项目,该项目的建设主要是为了解决地方的水土环境问题,并且提高国内的电力能源生产。在水利水电工程的建设过程中,应不断提升工程施工技术

期刊

水利水电工程混凝土防渗墙坝体渗漏

吉林省大学生社会责任意识调查报告

当代大学生的社会责任感现状问题是一个有着重大现实意义的社会问题,因为大学生是社会发展的动力,是社会未来的希望,作为青年知识分子,他们的精神价值选择,将直接影响到未来

期刊

社会责任感高等教育大学生

PCI术后穿刺点出血31例的相关因素及护理

目的探讨经皮冠状动脉介入（PCI）术后出血的相关因素及护理要点。方法选择行PCI的病例441例,分析股动脉出血者的相关危险因素。结果（1）出血病例（31例）占全部病例的7.0%;（2）出血组平均

期刊

经皮冠状动脉介入股动脉出血护理percutaneous coronary artery intervention femoral artery hem

关于工伤保险先行支付的思考——工伤保险先行支付维护的是谁的利益?

在2010年颁布施行的社会保险法中作出了先行支付的规定,这看似是保护弱势群体的一项好政策,然而在各地实践中执行情况并不好,尤其随着近年来有关"工伤保险先行支付行政诉讼"

期刊

工伤保险基金先行支付立法期待维护权益

浅析宋辽金元时期陶瓷器上鱼纹装饰的特征

宋辽金元时期,是中国古代陶瓷鱼纹装饰发展的一个高峰阶段。在这一阶段中,鱼纹装饰的数量、质量均达到了前所未有的水平。本文从鱼纹装饰的涵义、鱼纹装饰的技法、鱼纹装饰的

期刊

陶瓷鱼纹装饰特征

人·公民·世界公民:人权主体的流变与人权的制度保障

近代欧洲主权国家的确立在人权理论与实践上的表现,是把受保障的人权主体从人转化为了公民。公民身份与人权的国家保障的关联,一方面是近现代政治现实中人权保障的历史选择;

期刊

人权公民世界公民人权保障

基于搜索引擎的问答系统的设计与实现

与本文相关的学术论文