基于深度神经网络的智能问答系统性能优化研究

来源 :南京邮电大学 | 被引量 : 3次 | 上传用户:ZT0009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能问答系统是融合了自然语言处理技术、信息检索技术和语义分析的人工智能信息服务系统。智能问答系统采取一问一答的方法,通过处理与分析输入的语句,自动生成可靠准确的回复,并且尽可能的符合人与人之间日常交互的特点,为每位用户提供个性化的信息服务。智能问答系统赋予了计算机理解人类语句并做出响应的能力,具有适用范围广泛,使用方法简便等特点。然而由于对话的表达灵活多样,同时通过人们的生产生活,对话不断地增新。所以对计算机而言,使用传统的方法直接分析人类语句并做出响应存在着不小的技术挑战。现有的智能问答系统大多都只能实现简单的功能,无法在现实场景中发挥作用,此外在应答过程中还存在答非所问,应答场景有限等缺陷。随着人工智能技术和深度学习的快速发展,涌现出各式各样设计巧妙的神经网络,如卷积神经网络、递归神经网络、深度神经网络等,它们帮助研究者们在自然语言处理领域找到了新的突破口。为了解决上述问题,创建一个具有实际使用价值且应答流畅的系统,本文提出了一种基于深度神经网络的智能问答系统设计与优化方法。现有的智能问答系统多使用的是谷歌等线上开源语料库,然后再对语料库进行一系列预处理,包括文本清洗与分词,词性标注,词向量表示,词向量加权等,之后用检索匹配的方式生成应答。本文从四个方面对现有的智能问答系统进行优化。首先在语料库的建立上,除了使用线上公开的日常聊天数据外,我们收集了现实场景中商业推广主题和前端设计主题的真实数据,保证该智能问答系统可以为现实生活提供帮助。其次,预处理过程中,不再单独使用词袋模型表示词向量,而将其与Skip-gram模型相结合,共同生成最终的词向量。单独使用词袋模型生成的词向量为稀疏向量且彼此独立,尽管这种表示方法对离散特征友好,但是已编码的词向量丢失了词语之间的连接。Skip-gram模型用向量空间内词语之间的欧几里得距离表示两词的相近程度,以此增加了每个词向量中包含的信息量,方便机器理解连续的语句,生成密集向量,避免了维度灾难。使用词袋模型和Skip-gram模型相结合的混合词向量表示方法可以弥补单独使用词袋模型所带来的缺点,同时,保留了词袋模型出色的离散特征处理能力。第三方面,系统优化了词向量加权模块。摈弃仅根据词频决定词向量权重的传统方法,使用词频逆文档频率加权方法来提高关键词的权重,输出词语表达结果。最后联合使用检索匹配模型和基于注意力机制的生成对话模型产生应答,相较于现有的单独使用检索匹配模型生成应答,混合模型生成应答不仅可以回答语料库中预定义的问题,还可以通过长短期记忆网络的训练和预测真正理解句子的含义,回答开放域的问题。实验结果表明,运用混合词向量表示方法和词频逆文档频率的词权重调整方法可以提高语料库预处理的质量,混合模型生成的响应可以满足日常实际需求,并且整个系统可以顺畅的与人交流。
其他文献
无刷直流电机(BLDCM)是一个多变量、非线性系统。在Matlab6.5的Simulink环境下,利用Simulink和Fuzzy Logic Toolbox丰富的模块库,在BLDCM数学模型的基础上,建立了BLDCM模糊PI
在对半导体量子点的研究中考虑自旋-轨道相互作用对极化子基态能量的影响.采用LLP变分的方法研究了电子-声子相互作用.结果表明声子对极化子基态能量起了很重要的作用,而且由
  高温气体除尘是在高温条件下直接进行气固分离,实现气体净化的一项技术,它可以最大程度地利用气体的物理显热、化学潜热和动力能以及最有效地利用气体中的有用资源。因此,它
利用微型实验的方法制备氯气、氯酸钠、次氯酸盐,了解它们的化学性质,在微型化的条件下对实验进行重新设计和探索,达到最佳的实验效果.
研究不同提取方法对黄连中小檗碱含量的影响和相应提取物的抑菌性能。选用对真菌有良好抑制作用的黄连作为提取药材,利用水和95%乙醇作为提取溶剂,采用微波和超声处理作为辅
帕萨卡里亚起源于西班牙,最初是西班牙的歌曲,后成为舞曲。帕萨卡里亚一般为3拍子、慢速度、小调式,是巴洛克时期盛行的一种体裁,被巴赫、亨德尔等人发展到高峰。从1750年巴
通过对竹质家具的加工技术进行归纳表明,传统原竹家具应向工艺品方向发展,增加表面装饰方法,提高产品附加值;竹集成材家具应提高产品造型设计水平和加工精度,丰富产品类型;重
采用改进的线性组合算符方法,研究了Rashba效应影响下半导体量子点中强耦合极化子的光学声子平均数.导出在电子-体纵光学声子(LO)强耦合时抛物量子点中极化子的光学声子平均
文章在对高校图书馆建筑设计原则进行探讨的基础上,全面、深入地分析了图书馆功能的转变及几种典型的建筑设计理念,以便有效地指导建设有中国特色的图书馆。
为了提高无芒雀麦(Bromus inermis)对水分和养分的利用效率,采用正交试验设计,研究了灌水量、氮肥、磷肥和钾肥施用量对科尔沁沙地无芒雀麦品质的影响。结果表明,1)氮肥对干