论文部分内容阅读
随着科技的发展,人们素质的提高,智能教育辅助工具日益得到广大家长和学生的的重视,对于教学知识的答疑系统的智能化提出了更高的要求。针对特定领域的智能答疑系统的中文命名实体识别一直是难点和重点,目前各种解决方案的实际效果还难以满足人们的实际需求。本文借助海量智能分词系统对学生用自然语言提交的问题进行分词,提出了基于角色标注和规则相结合的命名实体识别方法,研究一个针对中学历史学科的智能答疑模型,以下简称为智能答疑模型。
智能答疑模型是建立在历史学科基础上的一个学科性问答系统,学生可以通过计算机访问系统完成答疑学习活动。为了使智能答疑系统能够正确理解问题,并准确而快速的返回答案,系统对分词处理后的语言查询进行了命名实体识别,通过基于角色标注和规则的命名实体识别方法提高查准率和查全率;答案搜索策略采用了两种方案:正常情况下系统搜索答案库查找答案,如果答案不存在,则搜索文档集,文档集是由已经预处理后的文本库。此外,答案库的完善策略也有益于对系统正确率的提升,学生如果对查询的结果不满意可以提交问题入库,教师查询到对现有返回结果不满意的问题进行重新回答,将答案库中的答案更新。答案库中存储有FAQ,为了提高检索速度和准确度,我们提取了针对常见问题的问句中的关键词,组合为关键词组,通过对查询语句进行命名实体识别等操作获得关键词组并与库中的关键词组相映射,进而完成查询--答疑过程。