论文部分内容阅读
在信息检索分布化和网络化的趋势下,信息检索系统的开放性和集成性要求也越来越高,这就需要系统能够检索和整合不同来源和结构的信息。在实践中,信息检索领域研究人员提出了从语义入手,利用语义来重新组织、存储和获取信息,信息不再仅仅是简单由文本、图像或表格堆砌成的,只能由人来识别。信息和语义的结合,将信息变成机器可识别的知识,使系统能够自动检索出用户真正需要的信息。对于如何实现这种结合,研究人工智能的信息领域专家提出了将本体论引入信息检索的思想。通过构建领域本体,描述领域内相关知识的概念和概念间的关系,并用语义进行表示,从而实现领域知识的共享与重用,为提高检索系统的查准率和查全率提供更好的保证。因此,本文根据本体描述语言和基于本体的信息检索框架,利用本体开发工具Protege构建了经济学领域本体,并用OWL语言对领域本体进行表示,同时通过改进本体的相似度计算模型,提高了本体推理机制的准确性,从而提高了信息检索的效率。
本文首先对信息检索的现状和存在的问题进行阐述,分析了未来信息检索技术未来的趋势,引出语义网的概念和将本体论应用到信息检索中的思想。然后对本体和推理机制的相关理论研究现状进行分析,对比传统信息检索框架,提出了基于本体的信息检索框架模型。
在这些理论的基础上,对经济学领域中的概念进行分析和定义,并揭示概念之间的关系,用自然语言描述这些定义和关系,根据一般的本体构建规则和步骤,提出经济学领域本体的构建方法和过程;然后对基于本体的信息检索框架中本体推理机制部分进行详细说明,在分析传统相似度计算方法的基础上,提出改进的相似度计算方法,改善了本体推理方式,使推理结果更准确的反映概念间的关系。最后利用本体开发工具和推理工具,在构建的经济学领域本体基础上实现基于本体的信息检索。
论文的主要创新点可以归纳为:(1)通过阅读大量文献,对本体相关理论进行深入研究,在此研究的基础上,利用自身具有的经济学领域知识以及通过向经济学界相关人员的咨询,构建出规范的经济学领域本体,实现经济学领域部分知识的标准化和共享;(2)对本体推理机制中传统的相似度计算模型进行改进,综合考虑影响本体相似度计算的多个因素,提出了改进的相似度计算模型,并用实例证明与传统模型相比,推理得到的相关概念更符合实际情况,从而提高了本体推理的准确性和合理性;(3)将构建好的经济学领域本体应用到基于本体的信息检索框架中,利用改进的相似度推理算法进行推理,达到提高信息检索效率的目的。
本文构建本体时所采用的OWL本体描述语言,能够清晰地表达概念的含义以及这些概念之间的关系。相对于XML、RDF和RDFSchema这些本体描述语言,OWL拥有更多的机制来表达语义,克服了XML、RDF和RDFSchema仅仅能够表达机器可读的文档内容的限制。改进的相似度计算模型综合考虑了多个影响相似度的因素,与传统的仅仅考虑一种因素的相似度算法相比,推理出的相关概念更能反映概念之间的相似关系,增强了推理结果的准确性和合理性,完善了本体推理机制。
目前,对于基于本体的信息检索机制的研究还处于发展阶段,本文仅仅对框架中的本体表示和推理机制进行了研究,而基于本体的信息检索框架还涉及资源表示、表达式解析等内容,本文在这些方面还需要进一步的研究。
本文尽可能全面、专业的构建出便于机器理解的经济学领域本体,并用逻辑描述语言进行表示,同时尽可能全面地考虑影响本体相似度计算的因素,对传统的相似度算法进行改进,但是由于研究条件和个人的时间精力有限,研究成果还具有一定的局限性,有待于进一步的完善和深入研究。