论文部分内容阅读
数字图书馆是21世纪图书馆的发展方向,随着网络的飞速发展,网络信息资源的数量迅猛增长,用户存取和利用网络信息资源的需求与日俱增,如何有效的找到所需信息成为了一个关键问题,将本体概念引入到数字图书馆是解决这一问题非常有潜力的方法。
本文介绍了本体的概念、描述语言、构建原则及构建方法,并对目前国内外主要的本体构建方法进行了比较和分析,然后,讨论了本体在数字图书馆的应用,着重分析了相似度计算及其在数字图书馆检索中的应用,讨论了基于名称和基于实例的两类相似度计算方法,并重点介绍了基于SUMO的语义相似度计算方法。
针对现有语义相似度算法的不足,本文提出了一种改进的语义相似度计算的综合方法,该方法先按启发式规则和信息增益过滤出候选概念集;接着,基于概念之间的语义距离,以树状层次结构为基础计算概念相似度;再综合实例属性和实例之间的关系分别计算语义相似度;最后通过赋予一定的权值进行相似度合并。这样做可使得语义相似度的计算更加全面,计算结果更加准确。
本文最后以七步法为指导,以Protege为开发工具,讨论了数字图书馆领域本体的构建过程,并作为实验实际构建了科技论文本体。在此基础上,构造实验平台原型,验证本文提出的相似度计算方法。实验结果表明,该方法有满意的查全率和查准率。