论文部分内容阅读
中医药是中华民族的宝贵财富,为中华民族的繁衍昌盛做出了巨大贡献。中医药文献中蕴含着丰富的中医药信息,中医药信息以高知识密集度、知识间关系复杂交错为特点,其隐性知识丰富,具有巨大的知识发现潜力。知识组织是揭示知识单元(包括显性知识因子和隐性知识因子),挖掘知识关联的过程或行为,最为快捷地为用户提供有效知识或信息。随着互联网技术的发展,中医药知识共享与服务的研究越来越受到重视,大力推进中医药知识组织与共享服务是中医药信息发展的重要方向之一。中医药知识由易于用文字语言表达的显性知识和难以表达传播的隐性知识构成,中医药知识组织的目的主要是为了促进中医药知识的传播与共享。为提高中医知识共享与发现,中医药领域开展了主题词表、语义网络以及本体等方面的研究,采用传统与现代的方法对中医药信息资源进行知识组织,取得了一定的成果。主题图作为一项国际标准(ISO 13250),是一种用来描述知识结构并与相关知识资源进行链接的知识组织技术,该技术通过主题、关联以及资源指引三个基本要素可以将领域知识结构化表达并组织,而且在主题词汇和关联关系的定义具有较大的自由度。主题图技术作为一种国际标准的知识组织方法,是一种描述知识的元数据格式,可以用来描述复杂的知识内容,易于构成完整的知识体系,实现知识资源的有效整合,同时主题图不局限于特定的知识类型,可以描述知识的数据结构以及相互关联,能够快速查找获取某一知识概念及其相对应的资源。因此,本研究将以《伤寒论》为例,探索主题图技术在中医药领域中的具体应用。1研究目的与意义本研究主要利用主题图技术对《伤寒论》原文知识进行组织,与临床医案建立知识关联,构建《伤寒论》主题图模型,为构建《伤寒论》知识库奠定基础,从而探索主题图技术在中医药领域知识组织中的具体应用,为中医药知识组织、表达、发现提供新的方法,促进中医药知识的传播与共享。2研究内容与方法本研究主要通过分析《伤寒论》原文内容、临床医案相关的基本主题与主题类型,关联关系与关联类型,分析资源指引的内容,建立基于主题图的《伤寒论》知识概念模型,并利用主题图开发工具,实现《伤寒论》主题图的构建与应用。具体研究内容包括以下几个方面:(1)《伤寒论》主题分析与提取本研究基于《伤寒论》原文内容,采用语言学方法,主要是通过语法和语义分析条文的句法、要素、语言环境来确定主题词汇,为后期主题类型以及关联关系的定义提供数据支持。由于古汉语中古今异义词、一词多义的现象普遍存在。因而在主题词汇提取时主要按照以下规则进行:①条文中表示无实际意义的形容词、副词、语气词部分不进行提取。②基于原文提取相关词汇,以原文为主,原则上对原词汇进行修改;③尽可能提取能够代表知识点的最小单位的词或词组作为主题。(2)主题类型的定义本研究的主要目的是构建《伤寒论》主题图模型,而主题类型是由具有相同性质的主题构成的一类主题,主题是主题图构建的基础要素之一。《伤寒论》确立了中医辨证论治体系的基本框架与临床理法方药的基本规范,其内容包含病证、治法、方剂、中药等,因而从《伤寒论》内容出发,在总体分析《伤寒论》内容的基础上,结合其方剂在临床医案中的应用情况,将具有相同性质的主题作为一个主题类型下的实例,定义《伤寒论》主题图模型所需要的主题类型。(3)关联类型的定义关联关系是主题图的要素之一,主题之间通过关联链接成一个结构化的知识网络,能够实现主题间在语义层面的匹配,是实现语义检索的基础。本研究通过分析《伤寒论》内部知识内容以及相关医案的主题类型,对已定义的主题类型之间的语义关系进行分析,建立主题类型之间的关联关系。(4)定义资源指引内容在主题图中,与主题相关的所有信息都可以称为资源指引,由于不同的主题类型有不同的属性、资源域以及资源出处,根据已定义的主题类型,结合《伤寒论》内容知识,建立主题类型的内部资源类型和外部资源类型,以使《伤寒论》主题图模型更加充实,实用性更强。(5)《伤寒论》主题图模型的构建与应用运用主题图构建工具Ontopia进行《伤寒论》主题图的构建,并实现可视化以及信息检索等应用。3研究结果本研究根据《伤寒论》的基本内容,结合中医辨证论治的要点,通过小范围的访谈与调研,确定了《伤寒论》主题图模型中药、方剂、医案、西医疾病、病证、原文、中医病证、病因病机、治法、人群等16个主题类型,同时根据《伤寒论》内容完善各个主题类型的实例。为了形成一个有效的知识网络,关联关系的分析与定义是必不可少的,本研究根据实际需要,分别定义了治疗、包含、禁用、导致、原文方证、参见等14个关联类型。同时为了全面描述主题资源,对所定义的主题类型进行资源指引分析,将资源指引内容分为内部属性资源和通过URI链接的外部资源。利用Ontopia公司提供的知识开发组件(Ontopia Knowledge Suite,OKS)完成《伤寒论》主题图的构建并实现可视化和信息检索等应用。4研究结论本研究以《伤寒论》为例,结合了临床医案部分内容,通过分析397条原原、文内容里的主题、关联、以及资源指引的内容,定义了 16种主题类型,定义了 14种关联类型,包括直接采用TCMLS中“治疗、现象表达、导致、包含、使用”5种语义关系和新定义的“禁用、等同、炮制法、煎制法、药物组成、来源条文、参见、伤寒论基础方、原文方证”9种关联关系,运用Ontopia主题图开发工具建立了《伤寒论》主题图模型,实现了《伤寒论》方剂、中药、治法、症状、医案等相关知识的可视化展示和浏览查询功能,验证了利用主题图进行《伤寒论》知识组织的可行性和优势。由于《伤寒论》是中医经典古籍之一,其语言和行文都有古文的一般特点,即用词以及词汇表达有相应的时代特点,在主题图中的主题可以灵活定义,因而使用主题图技术可以保留原文中的概念,呈现原文知识内容。本研究将主题图技术应用于中医药知识资源组织中,实现了中医药相关领域知识主题图模型的构建,是对中医药知识组织方法的一次新的探索与尝试,不仅合理、有效地组织了中医药知识,同时还以可视化的方式直观展示了中医药相关领域知识,并实现查询检索,具有重要的实际应用价值。