论文部分内容阅读
本体最早是哲学上的概念。20世纪90年代以来,研究者将本体的概念引入到人工智能、知识工程和信息管理系统等领域,从而本体的含义也发生了改变。本体是对领域中的概念及概念间关系的描述,通过概念之间的关系来描述对象的语义。通过统一的本体知识表示方法,减少了领域概念上的混淆,从而使领域内或领域间的共同理解和交流成为可能。
当前,由于在生物学文献网络知识管理中存在着生物学文献知识的提供者、需求者和网络创建者理解上的分歧,数字化的生物学文献知识在网络上无歧异地快速交换受到了严重的制约,并成为实现生物学文献网上无歧异交互的瓶颈。本文研究将本体论应用在生物学文献领域,通过在生物学文献的存储子系统和检索子系统中同时引入本体作为共同的标准,达成生物学文献知识的提供者、需求者和创建者三者之间的“共识”,并以此为基础实现基于本体的生物学文献网络知识管理系统。本文的主要工作包括:
基于现存的生物学文献主题词表资源,以古生物学文献为例,研究了生物学文献本体的构建过程,提出了生物学文献本体的构建方法。该方法利用了生物学文献主题词表,使用了框架机理表示生物学文献本体,使用OWL表示最终本体。该本体构建方法使本体的构建过程简化,减少了领域专家的参与度,有效地利用了OWL的推理机制,也利于本体的进化和重用。
分析了基于主题词表的生物学文献的自动标引中存在的两类问题,提出了基于本体的生物学文献的自动标引模式,并在最大限度地保持原有系统的情况下,利用本文建立的古生物学文献本体改进了原有的基于生物学主题词表的自动标引系统。该自动标引模式充分利用了本体的优点,提高了生物学文献的查全率。通过对生物学文献检索的主要流程的分析,提出了基于本体的生物学文献的检索模式,设计了基于OWL的分层检索模式,实现了生物学文献的分层检索,并给出了检索实例的显示结果。此方法充分利用了OWL的知识推理能力。
最后给出了对系统的自动标引部分的详细的测试方案和步骤,测试结果表明了生物学文献的自动标引中引入本体有助于生物学文献的查全率的提高。
总之,本文全面系统地将本体的概念、理论和方法引入了生物学文献领域,通过设计与构建生物学文献本体和基于本体的生物学文献网络知识管理系统,为本体方法在生物学文献领域的应用提供了范例。由于生物学文献与其他领域文献的相似性,本文中所采用的模型以及得出的方法对其它领域文献的知识管理问题也具有参考价值。