论文部分内容阅读
2011年,第二轮本科教学审核评估工作开始启动,教育部高等教育教学评估中心使用基本状态数据库系统,对中国上千所高校进行数据采集。通过数据对高校办学定位和人才培养目标定位等方面进行审核评估,以促进高等教育事业的高质量发展。在高校基础数据采集时,固定的表单,大量的数据、高校特殊的数据情况等问题给数据采集带来很大困难,亟需设计实现本科评估问答系统对这些问题进行自动解答,提高数据采集工作效率,加快审核评估进程。本文在进行本科评估问答系统设计实现时,重点设计实现自动问答功能,同时增加了在线问答和离线问答功能进行辅助问答,实现对高校基本状态数据采集平台中问题的一站式解决。系统实现后可以帮助高校数据采集员、评估人员摆脱文档查找、网上查找,QQ咨询等效率低下的问题咨询方式,为高校自动化办公做出微末贡献。本文主要工作如下:第一,通过对部分高校的调研,获取高校评估人员和采集人员的实际系统需求。同时进行本科评估领域源数据的收集。第二,本文将自动问答分为问句预处理、信息检索、答案抽取三个子模块。在问句预处理中首先采用TF-IDF算法构造了本科评估领域专有词典;其次采用FMM和HMM相结合的分词方法进行语句分词,并使用N-gram算法对分词结果进行优选计算;再次利用词性标注,抽取出问句关键词,并根据构造的领域标准化词典,及设计的关键词标准化处理流程,对问句中抽取的关键词进行标准化,得到标准化后的问句关键词集合;最后依据标准化后的关键词,将问题分类为实际遇到的问题和领域知识点概念问题两种。在信息检索中,采用自动化的构建算法进行本科评估领域知识数据模型的构建。根据不同的问题类型加载不同的知识数据模型进行信息检索,提高检索效率。答案抽取是根据信息检索得到的处理结果,从Mysql数据库中获取答案。第三,根据实际应用需求分析结果,对本科评估问答系统进行详细设计,采用合适的技术进行编码实现。经过功能、性能测试表明系统功能达到用户需求,性能满足应用条件。目前本科评估问答系统已经初步实现,在对信息检索进一步优化后,准备进行实际部署应用。