论文部分内容阅读
医疗保险是与每个人的切身利益相关的重要领域。而随着医保覆盖面的增加,人民享受其福利的同时,也有许多不法分子只为一己私利而进行医保欺诈,严重损害了国家和人民的利益。然而,庞大的数据量使得其无法通过人工的方式一一进行排查。同时,医保欺诈的种类众多,如:冒用医保卡、小病大处方、伪造病历等,对于不同的欺诈形式,可能需要面向不同的方向来进行欺诈检测。而不同欺诈方式,其结果却都可能导致患者的数据中存在不合理用药的记录。鉴于此,一种高效而准确的面向不合理用药的医保欺诈检测方法是十分有意义的。时至今日,国内外已经有许多专家提出了多种方法来进行欺诈检测,然而医保欺诈问题仍然没有得到很好的解决。首先,很多传统的方法通常会制定规则来判断是否存在欺诈行为,但是实际的医疗中患者的经济条件和疾病的严重程度会导致患者所使用的药物有很大差异,而这使得判别的边界十分模糊,致使出现漏判和误判的情况。其次,一些疾病常伴有并发症发生,而这些并发症也会影响患者的用药情况。最后,医保数据常伴有数据缺失率高、数据重复和数据格式不统一等诸多问题,这也极大地增加了检测的难度。基于上述问题,一种良好的欺诈检测方法需要能够排除患者自身因素的干扰,排除脏数据的干扰,准确的找出欺诈者。从学术的角度来看,需要数据的清洗与分析,筛选出可用数据,并使用有限的数据对医保欺诈中患者用药不合理的情况进行检测分析。鉴于此,本文进行了一系列研究,研究的工作和贡献概括如下:1.提出一种基于离群点的不合理用药检测方法ODPC,通过分析患者间用药的相似程度,找出其中用药不合理的患者。本文针对一种疾病,从数据集中提取出全部患有该病的患者、患者所患疾病以及对应药物的信息,构建多类型实体的异构信息网络。根据网络内部节点的连接结构计算患者间用药方式的相似度并利用医学知识根据患者的用药情况计算权重加以辅助,最终为每个患者计算分数,该分数能够反映候选患者与正常患者用药的相似程度。再根据一个能自动调整的动态阈值,找出分数中的离群点,该分数对应的患者用药不合理并有很高的欺诈可能性。本方法从数据出发,不需要过多专业的医学知识,通过比较待检测患者与正常患者的用药相似度,判断其是否用药合理。最后,在真实的医保数据集中验证了本文的方法具有较高的准确率。2.提出一种基于频繁模式挖掘的不合理用药检测方法,通过挖掘疾病的治疗模式,从而检测出用药不合理的患者。本文根据患者们的医保记录,构建出疾病-用药的信息图。在该图中进行极大团挖掘,针对每个极大团,通过挖掘频繁模式找出疾病的治疗模式,将待检测患者的用药模式与挖掘出的治疗模式相比对,判断患者是否存在不合理用药的情况。本方法从疾病的治疗模式出发,通过改进现有的频繁模式挖掘方法,在考虑并发症等多方面情况下,挖掘出疾病的治疗模式,从而判断患者是否用药合理。这种方法的结果能够被医学验证,更容易被医保机构所接受。最后,在真实的医保数据集中验证了本文的方法能够在较短的时间内获得准确率较高的结果。