论文部分内容阅读
目的:中医药术语标准是中医药信息学的重要组成部分,是支撑中医药信息学快速发展的基石。近年来中药术语标准化研究有了很大的发展,但相对于中医药信息学的要求还有差距。行业内的知识标准,例如国标《中药编码》及《中国药典》,都是文本数据,并不是开放的中药信息智能数据库。中药材知识是中药知识的源头和重要的基础知识,中药术语标准化研究工作应该从中药材术语研究开始,逐步提升到整个中药学领域,为信息智能化奠定坚实的基础。为实现中药材术语概念内涵从自然语言描述向计算机语言的转换,本研究利用本体(ontology)的理论和技术方法,结合中医药领域本体研究现状,基于现有的成熟的本体构建规范,参考OBO Foundry本体开发原则,研究构建一个开放的、语义表达良好的、可验证的中药材领域本体,以实现计算机对中药材多来源数据的识别和匹配,探索中医药领域特色的本体构建方法。方法:使用OBO Foundry推荐的本体构建方法构建中药材本体。首先采用文献调研法调研国内外中医药本体现状,确定本体的主题和覆盖范围。然后收集已有公认的中药材领域权威知识《中国药典》和国标《中药编码》中的中药材术语,并将数据进行初步处理,梳理中药材相关的核心概念,选择顶层本体以及领域周围的可复用本体,用于构建中药材本体。本研究选择的顶层本体是BFO(Basic Formal Ontology,基本形式化本体),复用的本体有NCBI Taxonomy(NCB1生物分类数据库)、PO(Plant Ontology,植物学本体)等,使用OntoFox工具导入复用的本体。中药材本体类的划分采用自上而下和自下而上结合的方法,并依据《中国药典》和国标《中药编码》知识体系本身的特性来确定分类结构和本体类的属性,完成本体的框架设计。使用Protege工具和OWL语言创建本体类和属性,对中药材术语类进行形式化定义,使用本体推理机验证本体并根据推理结果对本体进行整编,完成中药材本体的构建。构建完成后采用文献抽样验证和专家咨询问卷的方式进一步验证本体的通用性、完备性和共识性。本研究共抽取了各类中药材相关文献中的103条中药材术语来验证中药材本体,发放了 12份中药材本体专家咨询问卷检验本研究的方法、本体设计的科学性并确保本体框架和核心概念的共识性。结果:本项研究包含了《中国药典》、国标《中药编码》中的843种中药材术语。在中药材本体框架的文献抽样验证中,共抽取了 103条中药材术语,其中101条术语可以适用于中药材本体框架,可适用率达98.06%,由此得出中药材本体可以覆盖大部分的中药材概念,基本具备通用性和完备性,但仍有进一步完善的可能。中药材本体专家咨询问卷的结果经统计得出本研究的研究方法、本体设计较为合理,本体框架和核心概念等具备共识性。中药材本体的构建实现了中药材术语概念内涵从自然语言描述向计算机语言的转换,使原本只能相互映射的中药材术语集可以映射到中药材本体中来,为中药学计算机人工智能的发展提供了可能。中药材本体还可应用于中医药标注系统的语义标注。结论:中药材本体的构建探索了中医药领域的本体构建的新方法,使中药材术语更适合于计算机的自动理解,更利于规范化、标准化、智能化。中药材本体的构建遵循OBO Foundry的本体开发原则,复用了多个OBO中的生物医学本体,将“中医药知识”与“现代生物医学本体”进行了沟通与连接,为以后中药材本体加入OBO本体提供了基本条件。中药材本体的构建为以后中医药领域本体的构建提供了方法学上的参考。