论文部分内容阅读
随着互联网的不断发展,网络信息量激增,信息检索已经成为人们获取有用信息的主要方式。因为对信息资源缺乏一致表达,用户的需求常常难以被传统检索系统所准确理解,相关的资源也很难找到,进而也就无法实现语义信息的资源共享。怎样提升资源利用率、实现数字资源的语义查询是当前信息学领域面临的一个巨大挑战。本文在分析现有技术的基础上,结合语义网本体的结构特点,提出了一种基于本体的语义索引模型,根据关键词在本体中的位置推断其与不同实例之间的语义相关度,将相关度权重写入关键词对应的实例倒排列表,降低了语义检索时相似度计算的复杂度,提高了检索的效率。另外,本文还分析了不同查询扩展算法的特点,并给出了一种自适应的查询扩展方案,能够根据关键词的特点自动选择不同的扩展策略,在一定程度上改善了扩展效果。本文根据OWL2标准设计实现了本体管理和语义标注模块,完成了对本体的编辑管理和资源的半自动标注。最后利用提出的语义索引模型和查询扩展算法设计并实现了一个语义检索系统,并使用语义标注得到的实例数据对整体功能进行了测试,实验表明该系统具有良好的性能,能满足应用需求。