论文部分内容阅读
1目的1.1筛选出原发性骨质疏松症(primary osteoporosis, POP)发病的重要危险因素和中医证候要素,明确POP发病的重要影响因素。1.2建立基于广义偏线性模型(generalized partial linear model, GPLM)的、包括危险因素和中医证候要素内容的POP判别模型,为建立POP筛检工具提供数理模型依据。1.3初步建立符合北京、上海社区人群特征的POP筛检工具,为对POP高危人群进行筛查提供科学依据。2方法2.1 POP筛检问卷设计在导师课题组前期设计的《原发性骨质疏松症中医证候调查问卷》的基础上根据量表学和临床流行病学方法,结合骨质疏松症专家的临床经验,以及《中医内科常见病诊疗指南:西医疾病部分》中的中医证候辨证内容,增加了躯体症状条目,新加了生活习惯、发病相关因素等领域内容,制定了《社区40岁~65岁妇女骨质疏松危险因素及证候调查问卷》。整个筛检问卷包括一般信息、生活习惯、发病相关因素、躯体状况、临床体征等五个领域的内容,共65个条目,为封闭式设计。在调查实施前,由独立的中国中医科学院中医临床基础医学研究所伦理委员会对问卷内容进行论证,认为符合医学伦理要求。2.2调查人群筛选标准2.2.1纳入标准纳入:①女性;②年龄40~65岁;③意识清楚,可用言辞表达,有阅读能力,与调查人员沟通无障碍者;④经调查人员说明研究目的后,本人愿意接受筛检问卷调查和骨密度(bone mineral density, BMD)检测,并在“卷首页”签名同意者。2.2.2排除标准排除:①药物或其他疾病(如糖尿病、化脓性脊髓炎、肾炎、甲亢等)引起的继发性骨质疏松症;②有恶性肿瘤、痛风、类风湿性关节炎等疾病,影响中医证候判断者;③精神障碍、认知障碍者。2.3 POP诊断标准根据2008年中华中医药学会发布的《中医内科常见病诊疗指南:西医疾病部分》中BMD检测T值为骨质疏松定性诊断标准,取BMD检测报告单中腰椎L1-L4、股骨颈、股骨全区3个部位的最小T值,T值>M-1SD为骨量正常,M-1SD~2.0SD为骨量减少,<M-2.0SD以上为骨质疏松症。2.4数据来源2009年3月~8月期间,在上海市徐汇区凌云、华泾镇、长桥3家社区医疗服务中心,北京市东城区交道口、景山、朝阳、东华门、北新桥5家社区医疗服务中心,进行POP高危人群筛选,对符合本次调查纳入标准的人员进行现场问卷调查,并进行BMD检测。在上海社区共发放筛检问卷1101份,返回问卷1027份,经核实排除不合格问卷26份,得到合格问卷共1001份,占发放问卷数的90.92%。在北京社区共发放筛检问卷800份,返回问卷763份,经核实排除不合格问卷24份,得到合格问卷共739份,占发放问卷数的92.38%。应用课题组与北京科技大学合作开发的“骨质疏松症健康管理系统”网络数据采集平台(http://210.76.97.192:8080/gzss),将合格的问卷独立双录双核后,进行一致性检验,共获得1740例合格筛检问卷和BMD检测数据。2.5统计分析方法2.5.1统计分析软件应用SPSS 18.0 for Windows软件、SAS 9.2 for Windows软件和SPSS Climentine 12.0数据挖掘软件进行筛检问卷数据分析和统计建模,运用Lantern 1.5软件进行隐树模型分析。2.5.2筛检问卷信度和效度分析运用克朗巴赫α系数和Guttman折半系数法考核筛检问卷的信度,筛检问卷“躯体症状”领域条目的结构效度采用因子分析(factor analysis)方法。2.5.3 POP发病危险因素分析采用多分类logistic回归(multinomial logistic regression)方法分析POP发生与各危险因素之间的定量关系,建立多项logit模型(multinomial logit model),以初步筛选出影响POP发生的危险因素。2.5.4 POP中医证候要素分析运用隐树模型(latent tree model)方法,通过可见的“症状显变量”来探求内在的不可见的“证素隐变量”,并建立“证素隐变量”之间的隐树结构,分析POP的基本中医证候要素及其相互关系。2.5.5 POP判别模型的建构运用支持向量机(support vector machine, SVM)数据挖掘方法筛选出与骨质疏松发病相关的重要危险因素和中医症状为自变量,以BMD定性诊断为因变量,建立基于GPLM的POP判别模型。2.5.6 POP筛检工具的评价运用接收者工作特征曲线(receiver operating characteristic curve, ROC)评价筛检工具的判别准确度,通过ROC曲线下面积(area under the ROC curve, AUC)评价筛检工具诊断价值的大小。3结果3.1筛检问卷信度和效度评价3.1.1筛检问卷信度评价通过对筛检问卷“躯体症状”领域条目分析,肾阳虚证、肝肾阴虚证、脾肾阳虚证、血瘀证等4个维度的克朗巴赫系数α值分别为0.803、0.871、0.811和0.707,整个领域的克朗巴赫系数α值为0.913。“躯体症状”领域4个维度的Guttman折半信度值分别为0.789、0.831、0.743和0.699,整个领域的Guttman折半信度值为0.867。3.1.2筛检问卷效度评价采用因子分析方法,运用主成分法提取公因子,经过平均正交旋转法,迭代25次,KMO检验统计量为0.935(>0.5),Bartlett’s检验的近似χ2=18058.066,df=741,P<0.01。按特征根值>1提取其因子,共提取了10个因子,累积方差贡献率达到53.789%。3.2 POP发病危险因素的筛选3.2.1 POP发病相关因素一般描述经方差分析,年龄、体重指数、绝经年限在骨量正常、骨量减少和骨质疏松三类人群中的均数差异有统计意义(P<0.05)。经交叉表分析,肉类膳食、鱼类膳食、饮用咖啡、每天锻炼时间、是否变矮、是否绝经、怀孕次数、生产次数、骨折次数等在三类人群中的分布比例差异有统计意义(P<0.05)。3.2.2 POP发病危险因素的多项logit模型将肉类膳食、鱼类膳食、饮用咖啡、每天锻炼时间、是否变矮、是否绝经、怀孕次数、生产次数、骨折次数等9个影响因素作为自变量;绝经年限和体重指数作为协变量;以BMD定性诊断为因变量,以骨量正常人群作为参考分类标准,运用SPSS 18.0软件Multinomial Logistic过程逐步向前法(forward stepwise)建立多项logit模型。按α=0.05的标准,模型最终引入的变量有:绝经年限、体重指数、鱼类膳食、是否变矮、是否绝经和生产次数。3.3 POP中医证候要素分析3.3.1 POP躯体症状一般描述北京、上海两地总人群中,出现频率高于15%的躯体症状有:健忘、遇寒痛甚、腰膝酸软、恶热、乏力、畏寒、腰痛、易怒、脱发、纳呆、视物模糊、头晕、下肢骨痛、下肢困重、失眠、夜尿次数、小便清长、腿软、背痛、齿摇、目睛干涩、气短、便秘、多梦易惊、下肢抽筋、身痛、耳鸣、盗汗、尿频、口苦、手足烦热等。经方差分析和两独立样本t检验,按α=0.05的标准,畏寒、目睛干涩、齿摇、纳呆、腹胀、胸胁苦满、夜尿次数、下肢抽筋、下肢骨痛等9个症状在骨量正常和骨质疏松两类人群中的发生率差异有统计意义(P<0.05)。3.3.2 POP中医证候要素隐树模型分析利用启发式单重爬山算法学习得到BIC评分最高的隐树模型,其BIC评分为-15671。隐树模型中的显变量症状所展现的隐变量与POP常见的肾虚、肝虚、阳虚、阴虚、肾精不足、血瘀等基本证候要素特点相吻合,病变部位以肝肾两脏为主,病性以虚证为主3.4基于GPLM的POP判别模型建构和评价3.4.1 GPLM模型变量筛选采用支持向量机RBF核函数变量选择方法,筛选出12个对骨质疏松症有重要判别意义的变量,分别是:是否绝经、绝经年限、鱼类膳食、目睛干涩、驼背、体重指数、生产次数、下肢抽筋、下肢骨痛、腹胀、胸胁苦满、饮用咖啡等。3.4.2 GPLM模型参数估计综合多项logit模型筛选出来的危险因素和SVM方法筛选出来的中医症状变量为自变量,BMD定性诊断为因变量,构建GPLM模型。GPLM模型线性部分参数估计,是否绝经、体重指数、下肢抽筋、下肢骨痛、绝经年限(线性效应)的模型系数分别为:1.14182、-0.15805、0.36149、0.32267、0.12956,具有统计意义(P<0.05)。GPLM模型非线性部分估计,绝经年限(非线性效应)的检验χ2=13.5948,P=0.0012,具有统计意义(P<0.05)。3.4.3 GPLM模型评价用“是否绝经”、“下肢抽筋”、“下肢骨痛”“体重指数”4个危险因素和中医症状作为自变量,与因变量BMD定性诊断拟合线性logistic回归模型,其AUC值为0.7536,而拟合GPLM模型时加入了“绝经年限”的非线性效应,其AUC值为0.7971,提高了骨质疏松症人群的判别准确率,经检验,χ2=21.9162,P<0.001,具有统计意义(P<0.05),说明带有非线性效应的GPLM模型要优于线性logistic回归模型。3.5 POP筛检工具的建立和评价3.5.1 POP筛检工具的建立基于GPLM模型,将“是否绝经”、“绝经年限”和“体重指数”3个西医危险因素,“下肢抽筋”和“下肢骨痛”两个中医症状作为筛检工具的主要条目。将GPLM模型中各变量的参数估计值取Exp值,并取10倍值调整后得到筛检工具算式:Score=31.3×是否绝经+11.4×绝经年限-8.5×体重指数+14.4×下肢抽筋+13.8×下肢骨痛。3.5.2 POP筛检工具的评价筛检工具的AUC值为0.789(95%CI:0.766 to 0.812),与AUC=0.5相比较,检验Z值为21.482,P<0.0001,具有统计意义(P<0.05)。筛检骨质疏松的灵敏度为55.67%(95%CI:50.6% to 60.6%),特异度为84.62%(95%CI:82.0%-87.0%),阳性预测值为63.0%(95%CI:57.7% to 68.0%),阴性预测值为80.2%(95%CI:77.5%to82.8%),Youden指数为0.403。以-80为截断值,高危人群(Score≥-80)中,63.0%患有骨质疏松,37.0%骨量正常;低危人群中(Score<-80),仅19.8%患有骨质疏松,80.2%骨量正常。结果显示筛检工具具有较好的筛检骨质疏松和排除骨量正常人群的能力。4结论4.1绝经是POP的主要危险因素,低体重指数也是POP发病的危险因素;鱼类膳食和POP发病之间均存在负相关性,是POP的保护性因素。4.2下肢抽筋和下肢骨痛是POP发病的重要中医症状。肾虚、肝虚、阴虚、阳虚和血瘀是POP的基本中医证候要素。病变部位以肝肾两脏为主,病性以虚证为主。隐树分析方法可以弥补聚类分析在中医证候研究方法上的先天不足。4.3经过GPLM模型非参数部分的拟合检验,发现绝经年限与骨质疏松发病之间存在非线性效应。将西医危险因素和中医症状作为线性变量,绝经年限作为非线性变量,建立基于GPLM的POP判别模型,反映病证结合特点,与线性logistic回归模型相比,具有更好的判别准确性。4.4在POP筛检工具中,融入中医证候特色内容,具有较好的灵敏度和特异度,增加了筛检工具对骨质疏松高危人群的判别准确性,满足了骨质疏松中医临床实际应用的需要。