论文部分内容阅读
网络技术的高速发展,使得远程教育越来越受到人们的关注。这种基于网络的教育模式将教师和学生分离开来,无法进行面对面的交流与解释,学习者必须进行自主学习。作为网络教学的重要组成部分,网上答疑系统能够及时解答学生的疑难问题,消除学生的学习障碍,在加强师生交流、帮助学生获取信息等方面具有不可替代的作用。因此,网上答疑系统的研究对于推动远程教育乃至我国整个教育事业的发展有着至关重要的作用。我国目前的网上答疑系统还处于探索阶段,国内较低的自然语言处理水平和人工智能的发展水平严重制约了网上答疑系统的智能水平。现有的答疑系统主要是通过Email、留言板、BBS或是聊天室等方式进行提问与解答,虽然有些系统也采用关键字匹配和分词搜索等技术,但是由于语义理解不足等原因,使得对于问题答案匹配的准确度比较低,效果不是很理想。基于以上原因,本文在分析总结了现有网上答疑系统的前提下,给出了基于本体的网上答疑系统的设计模型。在网上答疑系统中引入本体技术,构造一个针对某特定领域的领域本体,将其作为语义理解的基础,应用到网上答疑系统中来,可以在一定程度上改善目前答疑系统中的语义理解不足的问题,同时也使知识共享和知识重用成为可能。本文的主要贡献在于提出了一种用于网上答疑系统的领域本体的构造方法,并在网上答疑系统中将其作为语义理解基础,协助完成问题模式匹配和语句相似度的计算。领域本体的构造是整个网上答疑系统中的关键部分,本文将领域本体的构造过程描述为:确定领域本体的专业领域和范畴、提取领域中的概念、定义概念的属性值和概念间的关联关系、领域本体的形式化、用本体描述语言描述本体以及对本体的检验评价。用户以自然语言提出的问题是多种多样的,即使是同样的问题,也可能有不同的提问方式。所以首先应对用户问题进行分词处理,将问题分割成一组关键词组合。考虑到目前答疑系统中常用的基于字符串匹配的分词方法不能识别新词,本文采用的是基于字符串匹配和基于频率统计相结合的分词算