基于重采样与分类算法的永久性结肠造口危险因素探究

被引量 : 0次 | 上传用户:zb3637607
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:研究结直肠癌手术治疗中需要进行永久性造口的概率,探究可能导致患者需做永久性造口的危险因素,为临床分析提供参考,降低还纳手术失败病人面临术后并发症的风险。方法:本文基于湘雅医院2018-2019年直肠癌手术240例病人的手术记录,剔除部分缺失及无效数据,最终得到227例有效样本点,其中永久性造口样本点47例,占比不足20%,则样本点中多数类和少数类的比例差异较大,属于不平衡数据。一方面如果少数类样本数据过少会导致使用传统预测方法误差较大,另一方面传统的SMOTE算法只能对数值型数据进行重采样,而本文的数据集含有名义变量,故本文通过Python3.7软件,使用SMOTE-NC算法对数据进行平衡化处理。接着本文将数据集以6:4的比例分为训练集和测试集,并对训练集进行重采样,在原始训练集和重采样训练集上,分别建立基于XGBoost算法的分类模型,以及L1 penalty Logistic模型。结果:通过计算多个模型评价指标,发现XGBoost与L1 penalty Logistic在重采样之后,F-measure,G-mean,Recall指标均有明显提升。可以认为使用重采样数据的模型在需要进行永久性造口的样本点预测上有了显著改进。考虑利用XGBoost的F-score得分排名靠前的变量进行变量筛选,以及L1penalty Logistic给出的系数进行变量解释。本文认为(1)年龄(F-score:625,Logistic系数:0.001952,两者均为重采样后结果,下文Logistic系数用coef代替),(2)肿瘤下缘距肛缘距离(F-score:462,coef:-0.09544),(3)腹腔是否给化疗药-0(即不给)(F-score:220,coef:0.205214),(4)术前有无贫血-0(即非贫血)(F-score:205,coef:0.021091)是更重要的变量,且年龄越大、肿瘤下缘距肛缘距离越近、腹腔未给化疗药、术前无贫血将会导致更高的需要永久性造口概率结论:在永久性结肠造口的研究中应当重点关注上述影响较大的指标,并以XGBoost等模型预测患者所需实施何种造口手术,减少还纳手术并发症的风险。
其他文献
将制度变革简单地归于经济发展的观点是值得商榷的 ;人民代表大会制度的变革与“法律现代化运动”和“渐进的改革”有密切联系 ;我国人民代表大会制度变革的政治原因在于 :执
采用盆栽试验研究了4个不同耐酸特性的玉米自交系在几个关键生育期的氮、磷、钾营养特性和生长状况。结果表明,耐酸自交系在苗期、拔节期和开花期对氮、磷、钾的吸收和累积均
近几年,高考中有关数列试题较为稳定,与80年代数列试题相比,重在考查课本基础知识及基本技能,并以等差数列、等比数列有关概念及性质为主要考查对象.本文试对近几年高考数列
本文介绍了并行图归约(PGR)机中智能存储系统的设计方案。智能存储系统不仅能响应高级访存命令,依存储信息自动实现操作变换;而且能独立完成自己的存储管理任务.进行存储空间
“微课程”在中学教学领域具有较强的实用性。通过阅读文献、实地调查等方法,本文就“微课程”在高中地理教学中的运用作了详细分析。本文着重探索了“微课程”当下的研究现状
文章以实际工程桥梁静载试验为例,介绍支点附近斜截面抗剪工况的静载试验方法,对比采用Midas杆系模型和Ansys实体模型计算的斜截面应力理论值,结合静载试验的实测数据分析和
20年前建造的许多旅馆已逐渐不适应目前的发展要求,近年来旅馆改造项目越来越多,这显示了市场的需求。旧客房改造设计受到诸多限制,此问题值得建筑师去研究。该文结合作者近年来的
根据我国以农业为基础,以工业为主导发展国民经济的总方针,在城乡住宅建设方面围绕提高设计质量、节约用地、降低造价和节约劳动力等问题,已引起有关方面的重视。现就国外这
目的探讨还原型谷胱甘肽联合生长抑素治疗急性胰腺炎的临床效果。方法选取2016年3月至2018年10月我院收治的100例急性胰腺炎患者作为研究对象,随机分为两组各50例。在常规治
在建立健全社会主义市场经济体制的新形势下,河南省清丰县人武部党委成员讲党性,顾大局,抓工作落实不松 Under the new situation of establishing and perfecting the soc