中医药学语言系统超级叙词表分类原则和构架的探讨

被引量 : 0次 | 上传用户:lie_luren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一体化医学语言系统解决了生物医学信息检索中相同的概念具有不同的表达方式、有用的信息分散在不同的数据库系统中所造成的查询困难等问题。超级叙词表作为一体化医学语言系统的重要组成部分,在系统中发挥着不可替代的作用,超级叙词表是系统的核心,为系统提供了“基本素材”——术语和概念。对于词表的研究而言,词表的分类占有重要的地位,合理的分类可以优化系统,提高用户的检索速度,减少加工人员的工作量,同时分类也是实现数据资源管理现代化的必要条件。参照国家标准、中医药学词典、词表等的分类,本文在现在的中医药学语言系统(TCMLS)超级叙词表的基础上制定了中医药超级叙词表的分类原则,提出了新的词表分类框架,以期能对中医药学语言系统的分类进行优化。1一体化医学语言系统研究现状目前,国内外研究一体化医学语言系统的有美国国立医学图书馆(NLM)的一体化医学语言系统(UMLS).中国医学科学院医学信息研究所的中文一体化医学语言系统(CUMLS)和中国中医科学院中医药信息研究所的中医药学语言系统(TCMLS)UMLS于1986年开始研制,到现在已经处于成熟阶段,广泛应用于词表的编制、自然语言的处理、自动索引和生物医学信息检索、医疗决策支持系统等地方。它有3个组成部分:超级叙词表、语义网络、专家词典。CUMLS的研究主要集中在中国医学科学院医学信息研究所,它建立的目的是为解决中文生物医学检索中相同的概念有不同的表达方式,有用的信息分散在不同地方的问题。该系统由中国医学用语数据库、中国医学用语语义网络系统、中国医学用语与标引检索语言对应转换系统3个部分组成。TCMLS是在参照UMLS基础上,根据中医药语言特点及学科体系特色,按照本体论设计原理而研制的语言系统。系统的建立将为中医药学科的数字化和标准化及与国际接轨提供必要的工具,同时将进一步提示中医药学科的完整性和概念中的相互关联性。2中医药词表研究现状目前,中医药相关词表主要有《中国中医药学主题词表》、中医药学语言系统的中医药超级叙词表和《中国图书馆分类法·医学专业分类表》。《中国中医药学主题词表》以中医药学学科体系为基础,同时兼顾了《汉语主题词表》和美国《医学主题词表》词表,将全部主题词按学科门类划分,排列于15个类目68个子类目,它是目前使用最广泛、影响最大的一部中医药学专业主题词表。中医药超级叙词表在参照《中医药表》、《中图法》、《医学主题词注释字顺表》及近年来各种版本的中医药学教科书的基础上分为16大类。由于TCMLS还没有完整建立,因此其分类还在不断完善中。《医学专业分类表》采用理、法、方、药的类目编制原则,将中国医学分为中医预防、卫生学、中医基础理论、中医临床学、内科学、外科学、妇产科学、儿科学、骨伤科学、皮肤科学、五官科学、急症学、中药学、中国少数民族医学等。3中医药超级叙词表分类原则在参照GB/T 7072-2002信息分类和编码的基本原则与方法、《中医药表》分类原则、地理信息分类原则等基础上,本课题将中医药超级叙词表的分类原则分为基本原则和独特原则。分类的基本原则是词表分类需要遵循的一般性原则,包括科学性原则、系统性原则、可延性原则、实用性原则、逻辑性原则、兼容性原则等。中医药学科有区别与其它学科的特征,所以中医药超级叙词表的分类原则也有别与其他学科词表的分类原则。中医药概念词的分类需要遵循中医的理论体系、诊疗手段等逻辑思维习惯,同时在制定中医药超级叙词表分类原则的时候需要考虑到中医药学语言系统的应用目的。中医药超级叙词表分类除遵循信息分类的基本原则外,还需要遵循以下独特原则:类名规范原则、详尽性原则、一致性原则、专指性原则、类目粒度的控制性原则、自调整原则、约定俗称原则、优先性原则、平衡性原则等。4中医药超级叙词表分类方法信息分类常见的方法有三种:线分类法、面分类法、混合分类法。其中线分类法又称层级分类法、体系分类法;面分类法又称组配分类法。本课题采用混合分类法,遵循中医药学科特色,自上而下建立中医药超级叙词表分类框架,将词表层层划分,形成树状结构表,从而清晰明了地展现中医药学的知识等级体系,满足不同角度和多途径查询知识信息。5中医药超级叙词表分类框架中医药学理论体系是包括理、法、方、药在内的整体,是关于中医学的基本概念、基本原理和基本方法的科学知识体系。在参照中医药相关词表体系类别的基础上,采用自上而下的方法,按照理、法、方、药的类目编排原则,对中医药超级叙词表类目体系进行构造。将中医药超级叙词表的一级类目分为“病因病机与诊断”、“地理学”、“方剂学”、“疾病”、“预防与养生”、“针灸学”、“治则治法”、“中药化学”、“中药学”、“中医基础理论”、“中医药研究机构”、“民族医学”、“中医人体形态”、“中医药相关学科”、“中西医结合”。6中医药超级叙词表分类框架的验证本课题通过两种途径来验证中医药超级叙词表的分类框架,一种途径是与现在系统的分类框架作对比,另一种是从中医药相关期刊中抽取主题词和关键词,验证其能否归入本文提出的框架。(1)与现在中医药超级叙词表作对比研究与现在的中医药超级叙词表相比,本文建议增加以下类目:“民族医学”、“中医人体形态”、“中西医结合”。“民族医学”作为中国传统医学的一部分,与中医药学的研究息息相关;疾病的诊断和治疗都离不开“人体形态学”的支持;医学的快速发展使得“中西医结合”的研究如火如茶,相关的机构、文献量激增。在原来的中医药超级叙词表基础上合并了部分类目,有些类目在语言系统中涉及的概念术语比较少,检索中很少用到,建议将其合并。例如“人文科学”、“医学信息学与文献学”、“自然科学与物理科学”等类目,系统中它们作为一级类目,其子类目仅有一个或者两个,因此建议将它们合并为“中医药相关学科”。(2)框架的验证抽取中医药相关核心期刊的主题词和关键词做分类框架的验证,从《中医杂志》、《中国中西医结合杂志》、《中国中医药信息杂志》中抽取2010年文章的主题词和关键词共5638个,与现在的TCMLS系统中的概念和术语匹配后,有1578个未在系统中出现。对这些词进行统计后,发现很多是西医的术语,例如:热休克蛋白70、理化检查、白细胞介素、碘放射性同位素等。还有些是自拟方剂、人物名称、疾病名称等,但是这些都可以归入系统的类目中,所以此分类框架还是比较合理的,可以囊括中医药相关的概念和术语。7总结与展望中医药超级叙词表的研究无论是对中医药词表的分类,还是对语言系统的应用开发都有重要的意义,其分类成果是理论与应用的桥梁。但是,由于人类的主观性和客观的复杂性,人类对中医药的认识不可避免存在局限性。本文提出的中医药超级叙词表分类原则与方法参考了国内外词表分类的相关研究,期望能在实践中不断完善,为中医药概念、术语的分类研究、相关标准的制定和语言系统的完善及应用提供帮助。中医药学语言系统不是一天建立的,它需要不断完善。中医药超级叙词表框架的构建也不能满足所有人的要求,只能尽量满足本系统的功能需求。坚持中医药学分类体系与现代医学分类体系的接轨,完善中医药学分类体系,不断反映中医药学现代化研究进程,是中医药分类的永恒主题。
其他文献
在大力新型城镇化与美好人居环境构建的总体背景下,我国的城市发展越趋注重空间环境品质及居民生活质量提升。在此过程中,城市街区及其"慢空间"的营造则是实现健康城市、宜居
在中国饱和的国内市场、能源和基础原材料短缺、融资成本低等外部条件和企业自身拥有充裕的资金和发展需求等内部条件的情况下,中国的海外并购达到一个新的历史水平。但是在并
研究将非线性建筑中的复杂曲面作为研究对象,从非线性建筑的理论渊源入手,引入"参数化建模"的设计手段将建筑复杂的几何特征精确地描述出来。首先,归纳总结复杂曲面的三种类
本研究探讨了异位病灶调节性T细胞(Treg)与促炎细胞因子IL-1β、TNF-α协同作用对子宫内膜间质细胞Smad2信号通路的活化作用及其分子机制。采用原代分离培养子宫内膜异位症(
醉酒犯罪问题一直是一个严重的社会问题,醉酒犯罪在近年一直呈上升趋势,同时给社会造成的危害和损失日益严重。为此,如何正确处理醉酒犯罪成为一个迫切需要解决的问题。对于
生态小城镇建设是生态城市建设的重要组成部分,特别是长株潭城市群资源节约环境友好两型社会配套改革实验区建设,而建设两型城郊型生态小城镇的关键在于编制两型城郊型小城镇
目前社会的快速发展,已经进入了新媒体技术的时代,这也使得新闻媒体的种类逐步增加,吸引了更多的人才投身到这一行业里。撰写新闻是记者的本职技能之一,新闻记者需要学会多角
目的分析胸腔镜下肺癌手术患者的临床护理配合方法及效果。方法选取2016年5月至2018年4月90例肺癌患者,双盲法纳入分组,对照组采用常规护理,实验组给予全面护理配合,对比2组
从纱线选择和制备、织造、后整理、成衣水洗工艺等方面探讨了羊毛牛仔面料的开发,测试分析了羊毛牛仔面料和纯棉牛仔面料的力学指标以及水洗后的织物风格。结果表明,采用32 t
目的:本研究旨在观察急性期针刺风池、风府治疗周围性面瘫的疗效,与常规针刺相比是否具有优越性,从而为针刺治疗该病寻找一种更为快捷、方便、高效且痛苦小的治疗方法。方法: