糖尿病患者诊断相关分组及其住院费用预测研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:xinxinzhang2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
糖尿病是常见的慢性非传染性疾病之一。随着中国经济的快速发展和人口的老龄化的加剧,中国的糖尿病发病率也在不断上升,过高的糖尿病医疗费用支出给家庭和社会造成了沉重的经济负担。因此,本文开展糖尿病患者诊断相关分组(DRGs)及其住院费用预测的研究。该研究成果对集成学习算法在医疗数据的应用具有理论意义,也对完善和推进我国糖尿病的DRGs付费制度具有实践意义。本研究以澳大利亚AR-DRG为参考,利用北京某三甲医院的主要诊断为糖尿病的患者病案首页数据,在临床相似的基础下,构建了糖尿病DRGs分组模型,并基于DRGs分组结果利用集成学习方法构建了住院费用预测模型,具体研究分述如下。首先,本文利用数据挖掘相关知识对复杂的原始医疗数据进行预处理,包括数据集成、数据规范、数据变换、数据清理。将处理后的糖尿病患者住院费用数据构建数据库,为后续的DRGs分组和住院费用预测奠定基础,保证了分组和住院费用预测的准确性和科学性。其次,以住院的糖尿病患者为研究对象,提出了糖尿病合并症并发症等级划分模型;利用多元线性回归等统计学方法确定了糖尿病住院费用影响较大的因素,得到特征变量。然后将特征变量作为分类节点利用CHAID决策树模型进行DRGs分组,得到了10个DRG细分组,并制定相应的偿付标准和费用范围。利用方差减少量(RIV)以及变异系数(CV)等指标评价分组效果,结果表明:组内费用同质性较高并且组间差异较大,得到的分组方案合理。最后,将前文得到的糖尿病患者DRGs分组结果作为新的特征变量和原始数据构成新的数据集。采用随机森林和XGBoost两种集成学习算法构建住院费用预测模型,并利用网格搜索法分别对两个模型进行参数优化。为实现住院费预测精度的提升,本文提出了一种新型的Stacking模型,将随机森林和XGBoost作为基学习器进行融合,进一步提升模型预测精度。最终本文对糖尿病患者数据对于Stacking模型进行了实例分析,与常用的回归预测模型的对比结果表明:本文构建的Stacking模型具有很好的预测精度。
其他文献
目的:观察植入用缓释顺铂治疗晚期食管癌的安全性和有效性,并探索其合适给药剂量。方法:本研究为前瞻性、多中心、单臂Ⅱa期临床研究,计划入组病例24~32例。西京医院消化内科
(2R,3S)-苯基环氧丙酸乙酯含有一个环氧三元环结构,是合成抗癌药物紫杉醇侧链的关键中间体。本课题拟用微生物环氧化物水解酶制备(2R,3S)-苯基环氧丙酸乙酯。首先,以消旋的苯
世界大多数国家普遍存在着控制股东,公司的控制权通常掌握在控制股东手中。控制股东滥用控制权是全球大部分国家都要面对的重要公司治理问题。如何对控制股东行为进行有效规
在热带海洋环境下,微生物的存在会使得钢的腐蚀从全面腐蚀转变为局部腐蚀的形式,增加了腐蚀的不可控性,并且使得材料的腐蚀比无菌环境下的腐蚀更为严重。在实验室的前期工作中,我们做了大量有关于细菌在热带海洋环境下对碳钢电化学腐蚀影响的研究,为45钢浸泡在热带海洋环境下的应用条件提供了大量的实验数据。但是对于真菌,还很少被人们用来做对碳钢腐蚀的研究。而酵母菌在海洋环境中广泛存在,因此展开胶红酵母菌对45钢腐
<正>4月25日,记者在2010年上海市中职校毕业生就业情况新闻发布会上获悉,2010年上海市中职校毕业生"就业质量"和"用人单位满意度"明显提高;中职校毕业生的自身价值和对经济社
[目的]了解分娩期产妇对护理服务的需求状况,以期提高分娩期护理服务质量,完善产期服务模式提供新的信息。[方法]随机抽取某医院2009年4月—2009年12月住院分娩的320例初产妇
量子纠缠作为量子信息科学中的重要资源,在进行信息处理、计算和传送方面具有经典通信无法比拟的优越性,利用量子纠缠进行信息传递的一种新型通信方式称之为量子通信,它为发
<正>"视域"(horizon),是一个源自现象学和阐释学的重要概念。有人认为,"视域是一个人在其中进行领会或理解的架构或视野。每个人作为一个历史的存在者都处于某个传统和文化之
目的:探讨低管电压及对比剂剂量在超重患者前瞻性心电门控冠状动脉成像中的可行性。资料与方法:对临床拟诊为冠心病的90例超重患者(30kg/m2≥BMI≥25.0kg/m2)行640层CT前瞻性
介绍了发电-透平膨胀机的工作方式及机组保护与控制的实现方法。