论文部分内容阅读
随着当前社会信息的迅速发展,越来越多的人正在从传统学习模式转向在线学习模式。与此同时新形式的大规模开放式课程慕课(Massive Open Online Course,简称MOOC)快速地发展促进了大量的开放式课程平台的产生。目前国内多数的开放式课程都依托于MOOC平台,该平台中重要的辅助教学模式是自动答疑,目前研究的热点内容——问答系统可以实现课程的自动答疑。虽然现阶段问答系统已逐渐成熟,但基于课程知识的问答系统并不完善,用户的提问不能实时得到答案。为此,本学位论文设计了一个基于课程的智能问答系统并应用于MOOC平台。该系统采用Web与本地问答数据库相结合的方式对问题的答案进行检索、组织和管理。若用户所提出的问题在问答库中有标准答案随即反馈给用户;若用户输入的问题不在本地问答数据库中,则结合Web搜索技术在网上爬取到与问题相关的文本,再利用自动文摘抽取技术得到问题的答案,辅助教师教学,从而能及时帮助学生得到课程相关问题的答案,保证了学习的顺利进行,并且促进教学质量和效果的改善与提高。首先,本学位论文研究在MOOC平台下实现智能问答系统的方法,通过构建本地问答数据库并利用互联网搜索技术,对用户提出的问题分析后返回相关答案,能够弥补目前MOOC环境下需要管理人员在线情况下才能回答学生提问的不足。其次,研究问题分析过程中用户输入问句的文本校对等方法,利用领域词典和N-gram模型对用户的问句进行合理的规范化,有效地检测用户提出的问题是否有字词方面的错误,并给用户一个良好的修改建议。最后,研究FAQ库合理有效的结构以及问答内容智能增长的方法;对FAQ库中未登录问题利用搜索引擎网页检索、网页爬虫技术、摘要处理技术向用户提供推荐答案的同时通过教师审核、认定等过程增加FAQ库中的问答记录。经系统测试后的结果表明,本学位论文设计的问句文本校对功能可以有效地纠正问句中错误的专业词汇,且基于Web的多文档自动生成答案摘要功能也达到了预期的设计目标,问句的文本校对功能纠正率达到了 85.3%;基于Web多文档生成的答案摘要准确率为78.8%;系统的准确率为87.3%,召回率为89.3%,F值为88.3%,测试结果满足用户需求。