论文部分内容阅读
目的:探讨名老中医医案数据预处理及数据挖掘方法。方法:1.中医医案的数据预处理:(1)中药数据预处理:规范中药标准名称及别名,归纳四气、五味、归经、分类、功效等信息,设立中药代码、统计代码,建立数据表。(2)方剂数据预处理:规范方剂标准名称及别名,搜集类别、出处、用法、功用、主治、方解等信息,设定方剂代码,构建方剂数据表。(3)症状数据预处理:筛选症状描述词语,进行归类合并,建立相似症状组数据表。(4)疗效评价数据预处理:参考《中药新药临床研究指导原则》,选择主症、次症并赋分,建立疗效评价数据表。2.中医医案的数据挖掘:(1)用药分析:(1)在前期数据预处理的基础上,借助于所构建的名老中医医案数据库,构建对用药频率及药性频率的统计分析方法;(2)通过名老中医医案数据库导出数据,借助于SAS软件,构建对中药的Logistic回归及Varclus聚类方法;(3)通过名老中医医案数据库,构建运用Apriori算法挖掘用药组合的方法。(2)基于BP神经网络的辨证模型:借助于名老中医医案数据库,按照二分类方法建立数据表,借助Matlab软件,探讨辨证模型的构建方法。(3)“方性”量化分析:对方剂性味、归经、功效进行量化计算,建立“方性”的量化方法。(4)基于“种子”概念提取方法的症状信息挖掘:借助于ICTCLAS分词系统对医案进行分词处理,筛选24个种子概念,扫描医案,获取复合种子概念,即症状信息。结果:1.中医医案的数据预处理:完成700余味中药、418首方剂、79个相似症状组、20个常见疾病疗效评分等数据的预处理,并成功导入名老中医医案数据库,实现了医案的录入功能。2.中医医案的数据挖掘:(1)用药分析:(1)用药频率分析:以相应医案为例,统计出了相应医案的中药使用频率及药性频率;(2)通过Logistic回归分析得到了用药通用指数及特异指数,通过Varclus聚类分析,得到了用药分类结果。(3)通过Apriori算法,挖掘出了用药组合并总结出了名医经验方。(2)基于BP神经网络的辨证模型:以气虚证为例,成功构建了气虚证辨证模型,总准确率达到80%。(3)“方性”量化分析:以血府逐瘀汤与少腹逐瘀汤为例,计算出二者四气、五味、归经的量化结果,与临床应用特点相符。(4)基于“种子”概念提取方法的症状信息挖掘:成功提取出了217个复合种子概念。结论:对名老中医医案有效的数据预处理,是名老中医案数据库构建的必须条件,同时也为数据挖掘提供便捷;对名老中医医案进行多角度、多层次的数据挖掘,为探索名老中医经验提供了方法,使名老中医医案的价值更好的运用于临床,经验更好的运用于临床。