体外冲击波治疗上尿路结石的疗效预测:人工神经网络和Logistic回归模型的建立与比较

被引量 : 15次 | 上传用户:wanglaow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景和目的泌尿系结石是泌尿外科的常见病与多发病,尤其在我国南方的部分省份,发病率较高。随着人们生活水平的提高,近年来上尿路结石的发病率明显增高。自上个世纪80年代问世以来,体外冲击波碎石(Extracorporeal Shockwave Lithotripsy,ESWL)经过三十年的技术改进和临床经验积累,使得很大一部分的上尿路结石患者免除开刀之苦,其治疗上尿路结石具有安全、有效、痛苦小、恢复快和费用不高的特点。然而,对于较大上尿路结石的治疗,可能需要多次碎石,一方面,可能增加肾脏不可逆损伤的风险;另一方面,排石过程中经常会伴随肾绞痛、发热、血尿、石街等并发症,从而不得不转为其它外科方法治疗,影响ESWL的疗效。临床实践证明,并不是所有的上尿路结石都适合ESWL治疗,有些结石ESWL无法击碎,有些结石ESWL击碎后病人无法自行排出。伴随ESWL不成功而带来的问题是,病人可能会为失败的ESWL承担经济、时间及痛苦就医经历的后果,从而使得ESWL的优势不能最大化。如果在体外冲击波碎石前,能对其治疗效果准确预测,一方面可以制定相对正确的治疗方案,避免减少病人不必要的痛苦和经济损失、降低医疗服务成本;另一方面也有利于在治疗前向病人充分告知,有利于医患的沟通和理解。尽管对于ESWL治疗上尿路结石疗效预测的研究不少,然而,因受限于研究条件,存在以下不足:1)个别病例数较少,仅局限在方法学上的探索,并未广泛应用在临床实践中;2)受研究条件等限制,纳入的疗效影响因素不全面,因此预测的准确性还有待提高;3)部分研究对病例没有分层,将肾结石与输尿管结石合并在一起研究,临床应用意义不大。本研究分别运用logistic回归分析和人工神经网络建立ESWL治疗肾结石和输尿管结石的疗效预测模型,确定ESWL治疗上尿路结石疗效的重要影响因素和预测变量重要性评价,并对人工神经网络和Logistic回归分析方法、预测效果和优缺点进行比较,最后,确定预测效果较好的模型的工作概率分界值,使研究成果直接转化为临床应用。方法对325例肾结石患者和1,065例输尿管结石ESWL治疗前的临床资料如性别、尿路刺激症、治疗前血尿、肾绞痛、结石位置、结石患侧、年龄、身高、体重、病程时间、结石长径、结石宽径等影响因素和ESWL治疗结局进行回顾性分析。首先,将ESWL治疗的肾结石和输尿管结石的病例资料分别进行无偏随机化分组,对于Logistic回归分析和建模,约70%的病例分配至训练样本,约30%病例分配至坚持样本;而对于人工神经网络,则是约56%的病例分配至训练样本,约14%的病例分配至检验样本,约30%的病例分配至坚持样本。采用χ2检验对分类变量如性别、尿路刺激症、治疗前血尿、肾绞痛、结石位置、结石患侧等进行每个预测变量与应变量(ESWL治疗结局)关系的显著性检验。通过拟合单变量logistic回归取得连续预测变量(年龄、体重指数、病程时间、结石长径与短径的乘积)的显著性检验,初步找出对应变量(ESWL治疗结局)有影响的因素,再将上述预测变量显著性检验分析中P<0.25者,与其它重要预测变量一起,纳入多元模型的候选预测变量。然后采用logistic逐步回归分析(前向法:LR法)多因素分析,建立logistic回归预测模型,并将训练样本组和坚持样本组回代至此模型,得到ESWL治疗结局预测概率,绘制ROC曲线,计算曲线下面积(AUC),并计算敏感度,特异度和总准确度,评价预测模型的准确性。建立3层前向型神经网络模型,隐含层设置为1层,输入层的参数为所有10项可能有临床意义的预测指标,预测因子设置依次为性别、尿路刺激症、治疗前血尿、肾绞痛、结石位置、结石患侧,预测协变量依次为年龄、体重指数、病程时间、结石长径与结石宽径的乘积(文中简称“结石大小”),标准化协变量。其中,性别编码为“男”=1、“女”=2;尿路刺激症、治疗前血尿、肾绞痛编码为‘有”=1、“无”=2;结石位置编码为“肾上盏”=1、“中盏”=2、“下盏”=3、“肾盂”=4、“混合”=5或“输尿管上段”=1、“中段”=2,“下段”=3。输出层为ESWL治疗结局,“成功”编码为1,“失败”编码为0。以前述“分区变量”分配病例样本,选择“自动体系结构选择”,隐含层中最小单位数为1,最大单位数为50,训练类型为“批处理”(肾结石组)或“袖珍批处理”(输尿管结石组),优化算法选用“调整的共轭梯度”(肾结石组)或“梯度下降”(输尿管结石组),间隔中心点为0,间隔偏移量为±0.5。运行神经网络后,获得ESWL治疗结局预测的拟概率,以0.50为预测分界值,计算预测的总准确率、灵敏度和特异度,绘制ROC(Receiver Operating Characteristic curve, ROC)曲线,计算曲线下面积(Area Under Curve,AUC),评价人工神经网络预测的准确性。最后,从建模原理与方法、预测效果、优缺点三方面比较logistic回归预测模型和人工神经网络。统计学软件包应用IBM(?)公司出品的统计软件包SPSS20.0进行χ2检验,单变量Logistic回归和多元logistic分析和建立模型,并以其附带的神经网络模块中的多层感知器建立人工神经网络。采用Hosmer-Lemeshow进行logistic回归拟合优度检验,并以χ2检验进行模型的显著性检验。P值精确到小数点后3位,以P<0.05为有统计学差异。用统计软件包Medcal(?)进行ROC曲线的绘制和ROC曲线下面积的比较,进行约登指数的计算和预测概率分界值的筛选。结果1) ESWL治疗肾结石组共325例肾结石,最长随访3个月,碎石成功250例,转为其它方法治疗75例,总成功率76.9%。对全部肾结石患者性别、结石患侧、结石位置、尿路刺激症状、血尿或肾绞痛进行单因素分析,我们发现结石患侧、结石位置、尿路刺激症状、血尿对ESWL治疗结局有显著性影响。对本组患者年龄、体重指数、病程时间、结石大小进行单因素logistic回归拟合,结果排除体重指数,其余预测因素均纳入候选变量。进一步用logistic逐步回归进行多因素分析,发现病程时间、血尿和结石大小,是ESWL治疗肾结石疗效的独立影响因素(P<0.05),其AOR(Adjusted OddsRatio)值(95%可信区间)依次是0.977(0.964-0.989)、12.388(3.44-44.565)、0.192(0.113-0.323)。建立以训练样本为基础的logistsic预测模型。对预测模型进行χ2检验验证其显著性,χ2值为108.938,P<0.001,预测变量对应变量(ESWL碎石结局)有显著的解释能力。通过分类交互表计算Hosmer-Lemeshow拟合优度检验统计量,得到χ2=6.927,df=8,P=0.545,无统计学显著性差异,因此认为模型拟合观测数据良好。通过预测-观察分类表,对于模型预测的准确性进行评价。将训练样本和坚持样本的观察数据分别回代到模型,得到模型对训练样本和坚持样本的预测概率值,以0.5作为预测结果的分界值,结果显示模型对训练样本的灵敏度为94.4%,特异度63.3%,总体准确率为86.0%,而对坚持样本的灵敏度100%,特异度20.0%,总体准确率为88.4%。人工神经网络自动剔除建模过程中典型的“冗余”单元后,输入层共建立19个单元。自动体系结构选择了建立一个隐含层,隐含层内共有6个单元,激活函数为hyperbolic tangent,输出层共有2个单元,激活函数为softmax。将预测变量重要性指标除以最大指标值,得到标准化的预测变量重要性排序,发现列于前五位的是:结石大小、病程时间、血尿、结石位置、体重指数。以0.5作为预测拟概率分界值,运用人工神经网络对全部样本进行预测,结果显示训练样本的敏感度、特异度和总体准确率为98.4%、72.5%和90.8%;检验样本的敏感度、特异度和总体准确率为97.4%、55.6%和89.6%;坚持样本的敏感度、特异度和总体准确率为93.3%、46.7%和86.5%。Logistic回归模型的AUC为0.625,95%可信区间为0.525-0.718;人工神经网络AUC为0.856,95%可信区间为0.774-0.917,与AUC为0.5进行显著性检验,前者P值为0.122,后者为P<0.001。两者AUC差异的非参数显著性检验,z值为3.988,P=0.0001,两者AUC存在统计学上显著性差异,意味着logistic回归模型的预测效果差,ANN的预测效果优于logistic回归模型。计算约登指数并权衡敏感度与特异度后,发现概率分界值为0.595时,肾结石ESWL疗效预测的ANN模型的敏感度和特异度达到较为理想状态,分别为92%和60%。2) ESWL治疗输尿管结石组共纳入1065例输尿管结石,最长随访3个月,碎石成功874例,转为其它方法治疗191例,总成功率82.1%。用χ2检验对本组患者性别、结石患侧、结石位置、尿路刺激症状、血尿或肾绞痛进行单因素分析,按着P<0.25的预测变量筛选标准,我们发现除治疗前是否出现血尿外,其余预测因素对ESWL治疗结局有显著性影响。对本组患者年龄、体重指数、病程时间、结石大小进行单因素logistic回归逐一拟合,均纳入候选预测变量。用logistic回归对进行多因素分析,结果显示治疗前肾绞痛、结石位置(输尿管上段、输尿管中段)结石大小为ESWL治疗输尿管结石疗效的独立影响因素,其AOR值(95%可信区间)分别是1.508(0.999-2.277)、0.651(0.391-1.086)、0.374(0.191-0.731)、0.246(0.152-0.396)。Logistic回归预测模型的χ2值为54.460,P值<0.001,提示纳入模型的预测变量对治疗结局有显著的解释能力。预测模型的拟合优度通过Hosmer-Lemeshow检验,显示模型拟合程度尚好(χ2=8.406,df=8,P=0.395)。将训练样本和坚持样本分别回代至预测模型,得到对训练样本和坚持样本进行预测概率值,以0.5作为预测概率分界值,结果显示训练样本灵敏度98.1%,特异度4.2%,总体准确率为82.9%。坚持样本灵敏度99.3%,特异度11.3%,总体准确率为84.7%。人工神经网络自动剔除建模过程中典型的“冗余”单元后,输入层共建立17个单元。自动体系结构选择了建立一个隐含层,隐含层内共有5个单元,激活函数为hyperbolic tangent,输出层共有2个单元,激活函数为softmax。将预测变量重要性指标除以最大指标值,得到标准化的预测变量重要性排序,结石大小、结石位置、病程时间、年龄和体重指数列于前五位。应用人工神经网络对全部样本进行预测,以0.5作为预测拟概率分界值,结果显示训练样本的敏感度、特异度和总体准确率分别为98.8%,12.7%和84.0%;检验样本的敏感度、特异度和总体准确率分别为99.2%,16.7%和89.3%;坚持样本的敏感度、特异度和总体准确率分别为97.8%,9.4%和83.2%。Logistic回归模型的AUC为0.729,人工神经网络的AUC为0.751,与AUC为0.5进行显著性检验,前者P值<0.001,95%可信区间为0.676-0.777,后者为P值<0.001,95%可信区间为0.700-0.797,借助统计软件包MedCalc(?)对AUC进行非参数显著性检验,计算z统计量为0.750,对应的P值为0.4534,即两种预测模型的AUC面积在统计学上无显著性差异,换言之,输尿管结石ESWL疗效的logistic回归模型和ANN模型的预测效果相差不大。权衡敏感度与特异度后,确定概率分界值为0.769时,ESWL治疗肾结石疗效预测的ANN模型的敏感度和特异度达到较为理想状态,分别为81%和60%。结论本研究发现,患者病程时间、结石大小、治疗前血尿是影响肾结石ESWL疗效的独立影响因素,而影响输尿管结石的ESWL疗效的重要因素为性别、肾绞痛、结石位置和结石大小。和Logistic逐步回归法建立的预测模型相比较,人工神经网络具有自学习、并行计算的功能,虽对预测变量的解释性不如logistic回归模型,但预测效果较好,仍可做为预测ESWL成功率的有利工具,有助于筛选更加适用ESWL治疗的患者,有利于患者充分知情,与患者共同制定治疗方案,减轻患者医疗风险和经济负担。
其他文献
忆阻器是一类有记忆特性的非线性电阻,但因其对制备环境和技术要求严格,导致忆阻器实物短期内仍不能走出实验室,所以设计可以替代忆阻器的电路模型是一个重要的研究方向。现
<正>英语教学改革的重要课题之一,就是如何充分开发每一位学生的创造性思维,使其具备迎接未来挑战的综合能力。创造性思维能力的发展,能促使学生更好地理解和掌握语言,进而达
会议
为适应经济全球化及金融一体化的趋势,面对加入WTO后的激烈市场竞争,2005年央行正式公布,工行、建行、交行成为首批直接投资设立基金管理公司的试点银行,银行混业经营付诸现
公立医院需要建立科学有效的全面预算管理绩效评价指标体系,用以评价预算的执行情况和效果,确保预算循环的顺利实现。文章分析医院预算绩效评价指标体系现存的问题,提出设计
TiO2一种重要的宽禁带半导体而且锐钛矿相Nb掺杂的TiO2薄膜(TNO)具有极好的光、电性能,被认为是非常有潜力的透明导电薄膜。本文首先通过CASTER模块用模拟的方法验证了锐钛矿相
一、实例分析教师给学生布置了一篇开放性作文.主题是环境保护。作文写成上交后,教师作了简单了解。然后要求学生先自己修改一遍,再要求小组合作评改。
管道运输是一种常用且重要的运输方式,可以为国民经济发展提供基础运输支持。而在实践当中,因为管道面临着老化、人为破坏以及腐蚀等威胁,使得管道泄漏事故屡见不鲜,不但会形
微波能应用具有节能、环保、高效、可控等优势,既符合现代工业需要又符合节能减排要求,在很多领域得到了广泛的应用和发展。微波能应用设备主要包括微波能发生器、微波能传输
长周期光纤光栅(Long Period Fiber Grating,LPFG)由于其无后向散射、对周围环境敏感等特点广泛应用于传感领域和通信及其它技术领域。光子晶体光纤(Photonic Crystal Fiber,PCF
[研究背景]SLC33A1(Solute carrier family33, member1)是在研究神经节苷脂O-乙酰化的过程中被发现的一个基因,位于人类染色体3q25,因为其可以将细胞质中的乙酰辅酶A转运至高