基于FAQ的中文问答系统的研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:yilong_hongru
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文问答系统作为一种新型答疑模式,依托于自然语言处理和人工智能相关技术,使用自然语言提问,充分理解用户意图并实时反馈答案,具有高效、准确、快速的特征,基于FAQ的中文问答系统是一种检索效率较高的实现模式,适用于专业性较强的限定领域。“互联网+教育”理念的提出推动了网络教育的进一步发展,和传统教育模式相比,网络教育有着不可比拟的优势、有其存在的价值和意义,但是,网络教育的师生问答环节存在实时性差、教育资源浪费等问题,使得学生的学习积极性和网络教育的教学质量受到影响。本文将FAQ中文问答系统应用于网络教育的师生问答环节,针对专业课程知识进行解答,具体研究工作包括以下几个方面:首先,研究基于改进TextRank的类别关键词提取算法。为了减小算法的计算复杂度,先使用基于改进ECE的候选关键词确定算法过滤常见词和类别区分度较低的词,得到候选关键词集;然后在候选关键词集上使用改进的TextRank进行文档关键词提取,求文档关键词集的并集得到类别关键词集。对TextRank的改进包括边的构建方式、边的权重确定、顶点的初始权重赋值和随机跳转概率确定四个角度;其次,研究基于类别相似度和词序列相似度的问句定位方法。首先根据类别关键词构造类别语义空间,通过计算类别向量和问句向量的相似度得到问句的类别相似度,定位相似度最高的三个类别,得到候选问题集;接着在候选问题集上采用融合词形和语义的相似度计算方法得到问句的词序列相似度;最后根据类别相似度和词序列相似度得到问句相似度,在FAQ中定位问句相似度最高的三个问句对应的问答对;最后,通过实验验证算法的有效性,并在网院学习平台中完成FAQ中文问答系统的设计与实现,在实际应用场景中验证算法的实用性。通过实验验证,在候选关键词集上进行关键词提取,不仅能够减少算法的平均耗时,而且能够在一定程度上提高关键词提取的准确率;使用改进的TextRank进行关键词提取时,算法的精确率和召回率都明显提升,但是,由于要计算基于Word2vec的词向量相似度、信息熵和期望交叉熵,改进算法的平均耗时有所增加;类别相似度计算算法的p@k值和问句定位算法的平均倒数排名都有良好表现。根据系统测试结果,本文设计的用于专业课程知识问答的FAQ中文问答系统拥有良好的准确性和系统响应时间。
其他文献
<正>过去一年多来,企业社会责任的话题非常热门,不论学界、商界、政界都喜欢谈这个话题。如果你上百度网站搜索"社会责任"这个词,有750万条网页信息;再搜索"企业社会责任",结
文中阐述了伊犁州农机专业合作社发展现状,总结了培育与建设的措施与做法,并针对农机专业合作社健康、持续发展提出了意见和建议。
美国国立卫生研究院共同基金于2008年提出了建立人体微生物组计划,利用高通量测序技术开启了对人体微生物的系统研究。随着16S/18S rDNA基因序列系统发育分类体系的建立,微生物作为与人体密切相关的研究对象,进入了各个研究领域的视野。作为数量众多、易于转移、难以消灭的优秀标记物,微生物也逐渐在司法鉴定领域崭露头角,越来越多的研究表明,人体微生物与人的外在表征密切相关,作为人类的“第二基因”,可能
突发事件网络舆情是多个利益相关者以突发事件为中介共同作用所形成的群体效应,本文基于利益相关者理论,在界定突发事件网络舆情主要利益相关者、分析主要利益相关者作用机理
目的 观察小剂量阿加曲班在高危出血风险血液透析患者中的安全性及抗凝效果。方法 选取2016年2月至2019年5月具有活动性出血或出血倾向的61例血液透析患者,随机分为阿加曲班
21世纪,世界动画正在蓬勃地向前发展。尤其在中国经过几番变革,终于迎来了动画的第三次发展高峰期。世界动画艺术作品,是人类艺术创作的一种形式,它离不开人类艺术文化的三个主要
<正>清朝末年的社会动荡,亦是金石器物被大量偷盗、挖掘、转卖的时代,其出土数量远胜前代,这在一定程度上为金石学的研究提供了丰富的物质基础。金石学兴起固然有其内部的学
开放式创新是目前理论界和企业界关注的热点,从项目层面研究企业开放式创新管理对于企业更具指导意义。选取中控EPA项目作为研究对象,运用项目管理分析框架,从项目概念形成和
本文应用中国省际面板数据对FDI与国内资本的关系进行了实证研究。结果发现:FDI对国内资本存在挤入效应,产生这种效应的原因与FDI主要以“绿地投资”的方式进入并主要分布于
妇科外治法所用药物大多采用气味俱厚或苦寒清热,或温通走窜之品,治疗女性生殖功能紊乱及慢性生殖系统炎症具有较高的应用价值.卵巢功能失调,不排卵可导致月经失调、不孕,临