论文部分内容阅读
信息时代,数据浩如烟海。如何寻找合适的办法在大量的信息中有效地找到自己所需要的信息成为人们关注的问题。传统的搜索引擎依据关键词技术只返回相关网页链接信息,学生要花费大量的时间在众多的网页信息中寻找自己所需的信息。基于自然语言处理技术的问答系统,能够适时地回答用户提出的问题,直接给出相应问题的答案。因此,以提高学生知识获取效率为目的的各专业领域的问答系统应运而生。本文通过系统分析与实验相结合的方法,设计并实现了基于《计算机网络》课程知识库的中文问答系统。系统主要包括两个部分:问题解答模块、知识库管理模块。系统能够快速返回给用户有关计算机网络的课程知识,从而提高学生获取《计算机网络》课程知识的效率。本文所做主要工作如下:(1)对问答系统研究现状做了详细分析,介绍了问答系统相关技术与理论基础。分析比较了各种中文分词方法、句子相似度计算方法,介绍了Web信息提取提取技术与理论。(2)根据本文所采用的句子相似度计算方法,同时考虑到良好交互性的要求,以“问题—答案”对的形式构建《计算机网络》课程知识库。通过教材、网络精品课程及课堂三个途径搜集有关计算机网络的问题,遵照语言学特点处理变换问句,并做出合理答案。(3)使用ICTCLAS分词技术,实现对问题的分词处理。使用基于语义的句子相似度计算方法,对用户问题与知识库中问题进行相似度的计算,从知识库中寻找匹配的问句及答案返回给用户。(4)对于不能从知识库中直接获取到答案的问题,设计并实现了Web数据获取功能,借助搜索引擎接口获取与用户问题相关的结果页面,使用Jsoup技术从结果页面提取相关的链接和内容,返回与用户问题相关的网络释义。(5)设计并实现了知识库管理功能,实现对知识库的动态管理。(6)在完成上述工作的基础之上,设计并实现了《计算机网络》课程FAQ系统。通过功能测试,验证出该系统可以实现对用户所提问题的正确回答,达到系统预期目的。