论文部分内容阅读
随着我国中医医院信息化建设的不断推进,医院信息系统采集了大量的医疗数据。大数据技术出现后,人们也更加重视这些来自日常医疗行为产生的数据,利用大数据技术对其进行处理、分析与利用,开展了大量的中医药临床相关研究,这也充分体现了中医从临床来到临床去的思想。舌象、脉象在中医诊断中发挥着重要作用,但受自然语言灵活性的影响,在描述上存在多种形式,计算机在识别、处理上会出现问题,影响了数据挖掘结果的质量。本体能形式化、规范化描述相关知识,在规范医学用语上已得到运用。因此,构建中医舌象、脉象本体,使其在规范舌象、脉象信息表达、提高挖掘结果质量与挖掘效率等方面发挥作用,是一项亟待开展的工作。目的:构建中医舌象、脉象本体,规范舌象、脉象诊断信息表达,为计算机识别、处理舌象、脉象信息奠定基础,规范和辅助医生进行舌象、脉象信息的采集。方法:按照七步法构建中医舌象、脉象本体。从已发布的标准、《中医药学名词》、《中医症状学研究》、《中医症状鉴别诊断学第二版》中收集舌象、脉象术语,进行去重和同义词整合处理。然后采用自上而下的方法初步确定分类框架,再从术语中提取属性值自下而上聚类,确定本体类、属性及约束,利用Protégé进行舌象、脉象本体的编辑。利用信息分类与编码技术,以属性组合的代码形式对舌象、脉象本体实例进行表示,并构建实例库。抽取四家三甲中医医院近几年的中医电子病历有关数据进行本体完整性验证,基于舌象、脉象本体开发中医舌象脉象规范化辅助软件。结果:根据分类框架和聚类结果划分了舌象、脉象本体类,舌象本体类属性有14个,脉象本体类属性有5个,舌象与舌象之间、脉象与脉象之间存在同义关系、上下位关系。舌象与脉象均采用定长主码与不定长补充码形式进行编码,舌象编码涉及本体类及其属性等13个方面,脉象编码涉及本体类及其属性等3个方面,构建了舌象、脉象本体实例库。对从中医电子病历中抽取的舌象、脉象诊断信息进行了编码验证,得到舌象总验证成功率为99.19%,脉象总验证成功率为99.52%。开发的系统能为用户提供规范的舌象、脉象诊断信息及主病的查询,规范和辅助用户进行舌象、脉象的采集,并能对舌象、脉象诊断信息进行编码,能导出相关数据,可用于数据挖掘中舌象、脉象数据的预处理。结论:构建的舌象、脉象本体能规范化表达舌象、脉象诊断信息,其具有完整性,能满足中医临床实际需求,促进了舌象、脉象信息的数据化、结构化。此外,本研究在促进标准应用、提高中医电子病历诊断信息质量方面进行了有益探索。但舌象、脉象的属性体系还需进一步完善,软件规范舌象脉象部分还需做成输入法的形式,以方便用户随时调用。