数据挖掘技术在预测鼻咽癌患者5年生存状态中的应用

来源 :四川医学 | 被引量 : 0次 | 上传用户:shenyemaizui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的运用数据挖掘技术分析与鼻咽癌患者预后有关的各种因素,建立预测鼻咽癌患者5年生存状态的预测模型并评价其效果。方法收集从2005年1月~2007年12月在我院接受诊治的130例鼻咽癌患者的资料。将所有病例分为两组:一组作为训练样本,用于筛选变量及建立预测模型,参与数据挖掘过程,共计104例;一组作为验证样本,用于评价模型效果,不参与数据挖掘过程,共计26例。数据挖掘过程中所采用技术包括单因素分析、logistic回归分析及人工神经网络(ANN)。结果单因素分析显示年龄、T分期、N分期、M分期、92福州分期、KPS评分、颅底骨质破坏、颅神经损伤、咽旁间隙侵犯、确诊到放疗时间、鼻咽疗效、颈部淋巴结疗效共12项指标与鼻咽癌患者的5年生存状态相关(P<0.05)。验证组验证显示,logistic回归模型预测患者5年生存状态的准确率、敏感度和特异度分别为80.8%、81.2%和80%,而ANN模型预测患者5年生存状态的准确率、敏感度和特异度分别为88.5%、87.5%和90%。结论数据挖掘技术可从与鼻咽癌患者预后相关的大量信息中挖掘出有意义的指标,并利用这些指标建立预测模型来判断患者5年后的生存状态。ANN模型的效能优于logistic回归模型。 Objective To analyze various factors related to the prognosis of patients with nasopharyngeal carcinoma by using data mining techniques and establish a prediction model to predict the 5-year survival of patients with nasopharyngeal carcinoma and evaluate the effect. Methods The data of 130 NPC patients who were treated in our hospital from January 2005 to December 2007 were collected. All cases were divided into two groups: one was used as a training sample for screening variables and establishing a prediction model, and involved in the data mining process, a total of 104 cases; a group as a verification sample to evaluate model effects, not involved in data mining process, A total of 26 cases. Techniques used in data mining include univariate analysis, logistic regression analysis and artificial neural network (ANN). Results Univariate analysis showed that age, T stage, N stage, M stage, 92 Fuzhou staging, KPS score, skull base bone destruction, cranial nerve injury, parapharyngeal space invasion, radiotherapy time, nasopharyngeal efficacy, cervical lymph node A total of 12 indicators of efficacy and nasopharyngeal carcinoma patients 5-year survival status (P <0.05). Validation of the validation group showed that the accuracy, sensitivity and specificity of the logistic regression model in prediction of 5-year survival were 80.8%, 81.2% and 80%, respectively. However, ANN model predicts the accuracy and sensitivity of the 5-year survival and The specificity was 88.5%, 87.5% and 90% respectively. Conclusion Data mining can mine meaningful information from a large amount of information related to the prognosis of patients with nasopharyngeal carcinoma and use these indicators to establish a predictive model to determine the patient’s survival status after 5 years. ANN model is better than the logistic regression model.
其他文献
多年来,姜堰市按照“因地制宜、统筹规划、分类实施、整体推进”的原则,不断优化运行机制,强化工作措施,狠抓责任落实,深入开展农村改厕工作。自2007年实施农村改厕项目工作
科技馆与一般商业展览场所不同,其公益属性和教育属性决定其应以创造社会效益为定位.何为科技馆的社会效益,又如何实现科技馆的社会效益呢?本文试论述如何衡量科技馆的社会效
森林采伐作业是合理利用森林资源.提高森林采伐作业质量的根本任务。文章就当前采伐作业,提出了伐区木材生产的过程,仅供参考。
期刊
任何一个家禽育种者的目标都是要生产出尽可能多的可孵化蛋,以便从其种群中获得最多的健康肉仔鸡或小母鸡。这听起来很简单,但怎样做才能真正实现这一目标呢?除了拥有生产性能
阐述了国内外穴盘育苗装置发展现状,对比出国内在此项研究中的略势.阐明进一步研究成本低、能够适应我国需要的蔬菜花卉穴盘播种设备,对于促进我国蔬菜花卉生产具有重要的现
探讨了施工缝位置及接缝形式的确定,分析了水池施工缝质量问题的产生原因,对施工缝加强新老混凝土结合的措施作了阐述,以确保钢筋混凝土水池的施工质量.
从海南土壤样品中分离出91株放线菌.采用尖孢镰刀菌古巴型4号生理小种作为指示菌株,筛选得到22株抗性菌株.选取其中抗性最强的AM2041菌株,对其进行形态特征、生理生化特征、1
剖析新疆伊宁县发展鲜食玉米的优势,指出目前发展鲜食玉米中存在的问题,提出相应的对策建议,为伊宁县种植业结构调整提供依据.
在开放经济条件下,对外贸易对广东经济发展有重大影响,是影响产业结构的主要因素之一.本文从产业结构角度,对广东1990年-2009年的出口商品的分类数据,运用Johansen协差检验法
目的探讨心绞痛的临床诊断与治疗以提高诊治水平。方法对2010年2月至2011年9月我院收治的64例心绞痛患者进行相关治疗,记录并作回顾性分析。结果经过积极治疗64例患者中显效4