论文部分内容阅读
目的:结合计算机信息学方法,运用数据挖掘技术对PCOS症状、证候及用药规律进行研究,建立“症-证”、“症-药”及“证-药”处方规律挖掘模型,以期验证数据挖掘对妇科PCOS规律发现的有效性及为中医妇科PCOS科学研究提供参考。方法:收集临床医案病例308例,筛选变量形成医案数据库,对所获病案数据进行数据预处理,运用数据挖掘技术中因子分析、聚类分析及决策树算法、关联规则算法构建模型,分析挖掘PCOS证候规律及用药规律。结果:第一次因子分析后筛选出16个公因子,剔除无效变量后进行第二次因子分析,筛选出13个公因子。对入选的13个公因子进行聚类,得到:阳虚肝郁证、肝郁血虚证、脾阴虚证、肾虚证、血瘀证、痰湿证6类证候,与临床辨证基本一致。构建C5.0算法下的决策树得到症状与证候间的预测模型,获得:If精神状况=“心悸气短”and小便是否正常=“小便短赤”,then证型=“肝郁血虚证”等规则预测。关联规则挖掘中获取症状与药物使用规则45条,在分证下的用药规律挖掘中,阳虚肝郁证用药以熟地、菟丝子、当归与山药,附子、紫河车、肉苁蓉等药物关联性较大;肝郁血虚证用药以栀子、丹皮、甘草、柴胡与薄荷、大枣等药物关联性较大;脾阴虚证用药以石斛、麦冬、牛膝、熟地与玉竹、百合、北沙参等药物关联性较大;肾虚证用药以山药、熟地、茯苓、泽泻与杜仲、吴茱萸等药物关联性较强;血瘀证用药以当归、赤芍、川芎与五灵脂、延胡索、皂刺等药物关联性较强;痰湿证用药以半夏、陈皮、橘红、白茯苓与枳实、桔梗、黄芩等药物关联性较强,与临床用药结论基本一致。结论:对PCOS中医证候的因子分析与聚类可构建六类模型:阳虚肝郁证、肝郁血虚证、脾阴虚证、肾虚证、血瘀证、痰湿证,其证候机理围绕肝、肾、脾三脏展开,并以血虚血瘀、痰扰为相关因素出现,与临床结果基本一致,说明降维与聚类方法可以作为PCOS的证候分析方法。对于建立预测模型,C5.0算法显示的训练与测试的正确性说明C5.0算法可用于构建PCOS"症-证”模型。关联规则挖掘得到45条PCOS用药规律,形成的“症-药”规律与临床结论基本一致。关联规则下的阳虚肝郁证用药以附子、当归等为主补阳疏肝,肝郁血虚证用药以柴胡等为主疏肝养血,脾阴虚证用药以山药、牛膝等为主健脾补阴,肾虚证用药以熟地、山药等为主补肾益肾,血瘀证用药以桃仁、红花等为主活血化瘀;痰湿证用药以黄芩、桔梗等为主涤痰化湿,发现的“证-药”规律及不同证候下用药规律与临床结论基本一致,可为临床PCOS辨证用药提供指导。因此,使用因子分析,聚类分析,决策树及关联规则的数据挖掘方法对中医妇科PCOS研究是有意义的。