论文部分内容阅读
网络上日益增多的教育信息资源给学习者的资源查找带来了很大困难,教育用户迫切需要专门面向教育领域的、能够准确理解用户查询意图的智能搜索引擎,来方便快捷地获取获取所需的学习资源;而当前以Google为代表的传统搜索引擎由于采用的仍然是关键字机械匹配的搜索机制,语义理解能力差,并且不是面向专业领域的,查全率和查准率比较低,很难满足学习者的资源获取需求。因此,研究开发能够准确理解用户语义的、专门面向教育领域的智能搜索引擎成为一项非常重要而紧迫的课题。
语义Web具有能够明确描述网络资源的语义关系、实现信息的机器理解和智能处理的特征,可以准确理解用户的查询语义,完善搜索引擎的搜索机制,为突
破关键词机械匹配模式的固有缺陷,实现搜索引擎的智能化带来了可能;同时,语义Web也是一项新兴的处于初级阶段的技术,还要深入研究突破基于本体知识库的语义推理、语义匹配、语义标注和语义排序等关键技术才能真正实现搜索引擎的智能化。本研究尝试利用语义Web和本体技术优化搜索引擎的搜索机制,解决教育用户的资源搜索问题。主要研究工作如下:
·提出一个基于语义Web技术的网络资源智能搜索通用模型SW-IUSM,其基本思想是在传统搜索引擎主要功能模块的基础上,加入基于本体知识库的语义推理模块、语义排序模块和对资源的语义标注模块,优化了搜索引擎的搜索机制,从而可以有效提高搜索引擎的搜索性能;基于SW-IUSM通用模型,本研究设计了一个适合教育领域知识特征和用户需求特征的教育信息智能搜索模型,为教育资源的获取问题提供了新的解决方案。
·在深入调研教育技术学科用户需求特征和相关文献的基础上,本研究构建了一个具有良好扩展性的《教育技术学导论》轻量级课程本体,可以根据用户需要不断丰富本体和实例。
·设计了一个具有教育领域适应性的语义推理算法E-Reasoning,结合推理规则对Jena推理机进行二次开发,通过与本体知识库中相关概念的语义匹配用户搜索概念进行层次可调节的推理扩展,提高搜索引擎的语义理解能力和查全率。
·设计了一个基于语义相似度计算的语义排序算法E-Ranking,对推理得到的多概念搜索结果首先结合改进后的PageRank算法进行一次排序,之后再对排序后的前N项结果计算文档元数据与搜索概念的语义相似度,根据计算函数值对结果进行二次排序,从而提高搜索引擎的查准率。
在上述研究的基础上,本文实现了一个具有较强领域适应性的教育信息智能搜索引擎--EIIS(Educational Information Intelligent Search),测试表明本系统具有一定的语义理解能力和智能性,与传统搜索引擎相比在查全率和查准率等方面上都有一定程度的提高。