论文部分内容阅读
本体(ontology)的概念起源于哲学领域,古希腊哲学家亚里士多德将本体定义为研究“存在”的科学,即研究整个客观世界基本特征的科学。20世纪90年代以来,人们将本体的概念引入人工智能、知识工程和图书情报领域,从而使本体概念的内涵也随之发生了变化。这些领域中,一般来说,本体研究是关于知识概念表示和知识组织体系方面的研究。在图书情报领域,本体通常是指一套有关某一学科或某一领域的术语词表,以及术语之间关系的规范和说明。近年来,关于本体的研究与应用呈现出加速度发展的趋势,基础理论更为完善,应用领域更为广泛,技术产品更为成熟。与国外涌现的研究项目和研究成果相比,国内关于本体的研究尚存在较大差距,国内图书情报领域关于本体的研究尚处于起步阶段,尚未见到有关国内构建具有推理功能的学科或领域本体系统的报道。 本论文在调研了国内外大量文献和网页的基础上,全面研究探索了本体的理论与方法。阐述了本体的起源、概念、类型和作用,介绍了国内外关于本体研究的发展现状,应用领域、主要研究机构和研究内容,探讨了本体的相关理论和主要技术方法。对本体与叙词表,本体与语义网络的联系和区别进行了深入的分析,阐述了本体作为知识组织体系所具有的优越性。对5个著名的本体系统、7种本体构建方法、15种本体表示语言和5种常见的本体编辑工具进行了系统的阐述和比较研究,并列举了3个国际著名的本体研究应用实例。为了验证利用本体建立知识组织体系的可行性,论文以花卉学为例,在国内首次设计并构建了一个领域本体模型。进而为了验证花卉学本体模型的可用性,论文还在国内首次设计并构建了一个具有一定推理功能的花卉学文献试验性本体检索系统。 花卉学文献试验性本体检索系统以中国农业科学文献数据库作为目标文献库,以本论文构建的花卉学本体模型为基础,采用OpenCyc开放源代码项目的顶级本体结构和推理引擎,利用Oracle数据库应用程序设计实现了相应的检索功能和文献查询与知识录入界面。通过验证,表明该系统初步实现了推理检索、排除歧义、判断是非和概念检查与纠错等智能检索功能,展示了本体检索系统所具有的特点与优势。通过花卉学知识本体模型和花卉学文献试验性本体检索系统的设计与构建,论文探索并总结了构建领域或学科本体应用系统的途径与方法。摘要 通过理论与实证分析,论文得出以下结论: (l)与其它系统相比,Cyc系统和Onioseek系统是较为成熟的本体系统. (2)与其它方法相比,七步法和METHONTOLoGY法是较为成熟的本体构建方法.到目前为止,国际上尚未出现一种公认的构建本体的标准方法. (3)Loom、CycL和owL都是较为理想的本体表示语言,但它们又各有不足:Loom是高级编程语言,不易于学习掌握.cycL不是基于xML的,在通用性上受到限制.OWL是W3C最新推出的本体表示语言,现有许多本体编择工具还不能体现OWL的特有功能. (4)基于第四代编程语言的本体编辑工具均不能很好地满足实用本体系统构建的需要,尤其是它们大都不具备顶级本体逻辑体系结构和对推理机制的表示能力。要开发完备实用的本体系统,需要研制更为先进的本体编辑工具.(5)领域或学科本体不可能孤立存在,而必须依附于某个逻挥结构完善的顶级本体,并在使用中复用顶级本体的推理机制。(6)领域本体中的核,。概念数量与其所涉及到的上位学科乃至顶级本体中通用概念的数量呈倒金字塔型分布,例如:通用领域概念数量>农业科学概念数量>园艺学科概念数量>花卉学概念数量.(7)基于本体的检索,其效果在理论上优于一般的全文本检索.然而,由于推理机的复杂工作机制,其检索效率往往较低.〔8)在现阶段,文献数据库中的概念标引,利用本体表示语言向知识库中添加概念等工作大多需要手工完成.巨大工作量制约了本体系统构建与发展.因此,需要研制更为完善的自动标引工具. 本论文研究的意义在于全面系统地将本体的概念、理论和方法引入了图书情报领域,通过设计并构建花卉学领域本体模型和试验型检索系统,验证本体系统所具有的智能检索功能,为本体方法在图书情报领域的应用提供了范例.全文文字部分共14万余字,图87幅,表31个,附录6个,参考文献160