聚类分析在医疗费用数据挖掘中的应用

来源 :华南预防医学 | 被引量 : 0次 | 上传用户:xunzhaogancao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的建立一种预处理方法,在进行医疗费用数据挖掘时,将因变量(呈偏态分布的连续性变量)转换为分类变量,从而得到更加科学合理的研究结果。方法以广东省甲型病毒性肝炎医疗费用调查取得的115例患者为研究对象,分别采用中位数的分类方法和K-means聚类的方法作为预处理方法,对医疗费用这一呈偏态分布的因变量进行分类,然后建立支持向量机数学模型,采用支持向量机进行医疗费用影响因素分析;通过比较模型的预测精度、模型收益以及影响因素的筛选结果,确定最优的预处理方法。结果 115例甲肝病人甲肝总住院费用中位数为2 744.69元,呈偏态分布。应变量以中位数方法分类,采用支持向量机模型筛选影响因素结果显示,对医疗费用影响最大的有7个变量(前3位为医院等级、性别、疾病类型);采用聚类分析进行数据预处理时筛选影响因素结果显示,对医疗费用影响最大的有7个变量(前3位为医院等级、住院天数、支付方式)。与中位数方法的分类方法比较,采用聚类分析进行数据预处理时,支持向量机模型结果得到的预测精度由91.30%上升到97.39%;收益图表陡峭地升高到100.00%然后渐渐变得平缓,显示模型收益更好;影响因素筛选结果更加科学合理,符合实际情况。结论聚类分析是一种优秀的数据挖掘预处理方法,具有良好的应用性。
其他文献
目的探讨CT导引下移植肝脏穿刺活检技术及其临床意义。方法25例次移植肝脏在CT导引下行穿刺活检,用HE染色法显示其病理形态学改变。结果25例次肝脏穿刺成功率为100%,其中诊断
探索腹腔镜直肠癌前切除手术中远切端的离断新方法,以降低手术费用,为在经济欠发达地区推厂该手术创造条件。观察组20例,术中取耻骨联合上方水平辅助切口,并以一次性弧形切割吻合
重庆作为第四个直辖市,具有显著的经济优势和区位优势,改革开放以来,重庆特别重视国际物流业的发展。为了让重庆成为未来的物流核心节点,抓住发展机会,发展自身优势,政府和企
近半个世纪以来,由于西方体育运动项目在民间的快速普及,造成了早年在闽东民间倍受人们欢迎的许多本土体育游戏现已绝迹,做好保护闽东民间体育游戏这一非物质文化遗产的工作,
教师是学校持续发展的第一资源。研究教师专业素养的目的是确保教育质量。从教师个性特征、教师知识、教师职业道德、教师教育教学技能等方面展开了研究。但是,教师是否把专
<正> 一九五○年三月一日調查阜新县腰衙門村被發古墓,情形如次: 一、古墓位置:在該村東北平頂山下大草坡間,墓頂約低於坡面二尺,距村五里。二、發見及開掘經過:一九四九年十
作为当前深化医药卫生体制改革的一项重要制度安排和新医改五项工作重点之一,促进基本公共卫生服务逐步均等化对人民群众享有安全、有效、方便、价廉的医疗卫生服务具有重要
近年随着杭州城市经济的不断发展,杭州旅游产品已经不能仅仅围绕西湖风景区景点,杭州有望成为世界级的休闲、度假、会展之都,需要进行集观光、休闲、会展“三位一体”的多元化旅
用图示方法进行正态性检验,不需要作复杂的运算、简单直观、近年来,正态性的图示又有了许多发展,本文在这些发展的基础上,给出了一些图形的接受区间,提高了使用效率,排除了对图形解
<正>一、普惠金融的意义及新疆发展普惠金融必要性分析(一)普惠金融的意义党的十八报告中"公平"和"平等"两词各出现了21次和17次,习近平总书记在十二届全国人大一次会议闭幕