医保审核中异常检测方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:julyanjust
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,医保违规情况较为严重,医保基金被滥用、浪费的数目惊人。如果能从医保数据中自动、智能地检测出可能违规的行为,将大大减轻人工审核的负担。为解决该问题,本文对某地区医保中心的数据进行分析,将问题归结为找出违规可能性较大的“可疑”处方,排除大部分正常处方,以达到减少人工审核量的目的。本文主要工作有:  (1)算法研究方面,提出了两种基于高效剪枝的离群点检测算法。已有基于距离的离群点检测方法因其简单、直观而被广泛应用,然而该类算法需要大量距离计算,因此,如何在精度损失最小化的前提下降低算法时间复杂度已成为一个亟待解决的课题。在已有研究的基础上,本文引出并证明了若干剪枝定理,提出了单阶段两次剪枝的快速离群点检测算法(MFO),实验结果显示,该算法能在确保精度的前提下接近或优于理想情况下的ORCA算法。  为进一步提高MFO的执行速度,本文提出了一种优化MFO算法初始剪枝阈值的预估剪枝半径(阈值)策略,通过随机抽样并计算样本集的离群度来估计剪枝半径。基于该方法,本文提出了QMFO算法,实验结果显示,该算法能在精度损失很小的情况下达到线性时间复杂度。  (2)医保审核中智能方法的应用研究方面:  1)对医保数据进行预处理分析,解决其高维稀疏问题,并将提出的MFO算法应用于白内障、胆结石、阑尾炎三种疾病的病例处方检测。与基于密度离群点检测算法(LOF)的实验对比显示,MFO算法能检测出大部分的“可疑”处方,优于LOF算法。此外,本文提出了一种面向医保审核的属性权重计算公式,以提高检测的准确率;  2)针对白内障、胆结石两种病例,本文采用神经网络建立了“疾病-药物种类”模型(“D-M”模型)和“疾病-诊疗项目费用”模型(“D-O”模型),以就诊的基本信息作为输入,输出药物种类是否使用(D-M模型)和各诊疗项目的费用(D-O模型),实验结果显示,该类模型具有较好的效果。  3)针对医保数据分类问题,本文在有标记医保数据上应用了朴素贝叶斯和Logistic回归算法,分析和测试了分类效果。实验结果显示,在有标记的情况下,采用这两种算法能够有效地进行可疑处方检测。
其他文献
基于控制网格的三维模型形变技术在CAD与图形学领域具有广泛应用。  但是,到目前为止,为三维模型建立有效的控制网格仍然十分困难。自动的三维模型控制网格生成方法存在着无
学位
随着教育改革的不断深化,高校规模的不断扩大,各大高校教学运行和教学管理的任务也随之增大。其中,公共选修课是普通高校提高学生综合素质、培养一专多能型人才的重要环节,公
在统计机器翻译中,领域问题对翻译系统的性能具有很大影响,当训练语料与测试语料来自同一领域时,翻译效果比较好,反之则翻译性能会下降。随着互联网的发展,用于统计机器翻译的双语
基于图像的绘制(IBR,ImageBasedRendering)技术是一种以计算机图形学、计算机视觉和数字图像处理技术为基础,构造虚拟场景的技术。以基于图像的绘制技术为核心,将周围360度的场景
学位
运动估计是整个H.264视频压缩编码过程运算复杂度最高的一部分。UMHexagonS算法具有高效的编码性能和可伸缩性,被认为是最为广泛使用的运动估计算法之一。UMHexagonS算法运算
联合补充问题(Joint Replenishment Problem,JRP)是在多产品库存补充问题中确定每种产品的订货批量大小及订货周期,从而在满足确定需求的前提下最小化单位时间内的总成本。在
学位
在现代社会,视觉信息,尤其是数字图像媒体在数字网络通信中扮演着越来越重要的角色。数字图像通常包含一些诸如商业机密,医学档案以及军事图纸等重要敏感信息,这些图像的不正