论文部分内容阅读
目的:疾病诊断相关分类(DRGs)医疗保险付费方式在过去的几十年里逐渐成为世界公认比较先进的支付方式之一,然而,目前中国学者对于肺炎DRGs付费方式的研究甚少,因此本文通过对天津市2013年参保肺炎患者的住院总费用的分析,建立参保肺炎患者住院中费用的预测规则及疾病分类,为建立DRGs预付费方式提供参考。方法:数据来源于2013年天津市参保人员数据库系统,对其住院总费用进行一般统计学描述,运用粗糙集理论建立肺炎患者住院总费用的预测规则,以DRGs医疗保险付费方式的核心思想为指导,运用数据挖掘中的决策树分析方法对纳入的研究对象进行分组。数据管理、属性选择及赋值过程运用SAS 9.1实现,应用Rosseta软件对粗糙集决策表进行属性约简以及规则建立,对建立的规则进行评价则运用SPSS 13.0进行,应用SPSS Clementine 12.0数据挖掘软件包的CART算法进行决策树的构建和剪枝。结果:研究共纳入2013年天津市参保肺炎患者10963名,男性(58.10%)多于女性(41.90%);中位年龄为68岁,四分位数间距为24岁,以中老年人居多;所住医院的等级以三级医院最多(54.48%),其次是二级医院(29.29%),一级医院最少(16.23%);绝大部分患者未接受手术治疗(90.66%),少数患者接受了手术治疗(9.34%);中位住院天数为11天,四分位数间距为6天。中位住院总费用为9483.47元,四分位数间距为9340.38元;其中,中位住院总费用分别为一级医院(4147.08元)、二级医院(8164.71元)、三级医院(13013.50元),四分位数间距分别为一级医院(2724.89元)、二级医院(5381.22元)、三级医院(10992.65元)。(1)粗糙集规则建立结果:选择性别、年龄等6个条件属性,住院费用等1个决策属性,利用粗糙集理论建立的决策表经约简后,共建立11条预测规则,其预测正确度为83.90%,ROC曲线下面积(AUC)及其95%CI为0.729(0.697,0.760)。(2)决策树构建和剪枝结果:经CART算法决策树,共纳入住院天数、医院类别等6个基础变量,其变量重要性排序为住院天数(0.447)、年龄(0.194)、医院等级(0.180)、手术与否(0.104),出院诊断(0.059),性别(0.016),其预测总符合率为84.18%,对其结果进行ROC曲线的绘制,曲线下面积(AUC)及其95%CI为0.770(0.744,0.796)。(3)模型比较结果:对两种方法的ROC曲线进行Z检验,结果为Z=1.989,P=0.047,按照α=0.05的检验水准,可以认为,两种数据挖掘方法的分类能力差异有统计学意义,决策树CART算法对天津市2013年参保肺炎患者的住院总费用的分类能力更优。(4)超额费用统计结果:本次10963名研究对象中,14个组合存在超额病例,共计435例,构成比为3.97%,超额病例的住院总费用为14308991.51元,占全部病例总费用(136825283元)的10.46%,超额住院总费用为3291593.21元,占超额病例住院总费用的23.00%,占全部病例住院总费用的2.41%。结论:对于2013年天津市参保肺炎患者总体来说,住院天数越多、医院等级越高、患者年龄越大,其住院总费用越高。数据挖掘作为一种从海量数据中提取有效信息的方法,与DRGs的思想结合显示出其独特的优势。粗糙集理论在天津市参保肺炎患者的住院总费用预测方面展现出了良好的预测能力,而决策树构建的规则也为保证医疗保险基金合理利用、完善社会医疗保险体系提供了理论依据。