基于本体的语义检索方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:hgjsy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Tim Berners-Lee提出的语义Web的一个重要思想就是以本体来表示语义信息,通过在语义Web中引入本体层来实现语义信息的共享,从而提高网络信息服务的智能化与自动化。基于本体的语义检索能较好地解决传统信息查询检索中由于缺乏语义支持所造成的问题,为信息检索领域的研究开辟了一个新的方向,具有广泛的应用前景。
   本文从研究基于本体的语义检索方法入手,将传统的关键词查询转化为语义查询,分别对叙词表的本体语义描述、Hopfield语义检索算法、语义相似度算法、利用Jena工具进行动态语义检索及改进的向量空间模型算法等进行了深入的研究。本文所做的工作主要体现在以下几个方面:
   (1)提出基于本体的叙词语义描述及利用Hopfield神经网络进行概念语义扩展的方法。考虑到本体与叙词表在表达知识结构上的可借鉴性,针对叙词表的缺陷,对叙词采用五元组进行描述,以四元组来描述本体的语法,从而完成叙词的语义关系描述。将概念词作为节点,概念词间的共现率作为节点间的连接权,构成Hopfield神经网络。利用Hopfield神经网络的记忆、联想的功能,对基于Hopfield神经网络的语义检索方法进行研究,从而实现概念的语义扩展。
   (2)提出改进的本体语义相似度计算方法。利用本体概念之间的层次关系,在构建的领域本体的参照下,结合基于距离的语义相似度计算和基于属性的语义相似度计算,对其中的概念、属性及关系均提出相应的处理方法。为了使概念之间语义相似度的计算更符合人类主观判断,将语义相似度分成概念相似度和描述相似度,同时将描述相似度分为关系相似度和属性相似度,生成最终的语义相似度,并通过实验得到最优参数设置,从而使得检索的准确率最佳。
   (3)提出基于Jena的语义检索方法。基于软件工程的思想,忽略不同的本体语言、本体的RDF层集合间的差异,将RDF层本体信息从网页中分离并构建RDF模型、对RDF模型的集合进行运算、对RDF层的本体进行查询.通过修正RDF层本体,对RDF层本体序列化,从而完成语义检索。为验证算法的实效性,将其与传统的关键词匹配检索方法相比较,针对不同的资源进行实验,结果表明用户可以有效地检索到相关资源,缩短了查询时间,从而获得较好的检索结果。
   (4)提出改进的向量空间模型排序方法。在传统向量空间模型的基础上,对特征项的权重问题进行了研究,提出特征项提取算法及改进的向量空间模型排序算法。通过在计算中加入可调参数,使用户可以根据需要选择过滤精确等级,从而提高检索结果的输出质量。
   上述语义检索方法经过实验分析比较,得到比传统的检索算法更高的查询结果,在很大程度上提高了检索的查准率和查全率,改善了检索结果的排序能力,节省了查询时间,从而满足用户的检索需求,并且对今后研究语义检索算法及基于语义的搜索引擎的实现建立了技术基础。
其他文献
期刊
期刊
会议
学位
期刊
学位
期刊
期刊
期刊
期刊