基于大数据的医保异常分析与研判方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:kulahai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新医改的推进,我国社会医疗保险发展迅速,医疗事业信息化水平也在不断提升。然而,随着医保制度改革的进一步深化,参保人数的逐渐增多和信息化的逐步深入,近年来出现了许多医疗报销行为不合理情况。这些行为违反了国家医疗保险相关的法律法规,通过虚构身体状况、隐瞒真实情况等,从国家医保机构、医院、社区诊所、药店等医疗行业机构骗取大量的医保基金,严重危害到了我国医保制度的完善和健全。同时经过多年医疗信息化及各类医疗信息系统的应用,医院以及医保管理部门已经积累了大量的医疗就诊记录和电子数据,涵盖了就诊时间、治疗花费等内容,但现有医疗信息标准的不统一和低效利用难以推动基于医保研判分析的数据共享、数据映射和数据融合。因此,如何在大数据背景下有效开展对医疗保险数据集的研究与分析,挖掘隐藏于其中的异常行为是一个非常有价值的研究问题,对于促进医保数据标准化和结构化,提高医保异常检测效率和挖掘质量,辅助医保研判等具有重要的现实意义与价值。本文依托国家自然科学基金重点项目“大数据驱动的智慧医疗健康管理创新”(编号:71532002)和国家自然科学基金面上项目“医疗健康大数据驱动的临床误诊研判理论与技术”(编号:62173025),在充分对国内外理论和技术文献综述基础上围绕着医保异常分析的相关方法和大数据挖掘技术进行研究,引入医疗信息标准化、关系提取、机器学习、大数据分析等方法,研究医保数据结构化、大数据辅助医保病案编码、医保异常行为挖掘和医保主动研判方法等内容。研究内容和结果如下:(1)基于Hadoop的医保病案编码实施方法首先分析了ICD-11相对于旧的编码方式所拥有的新特点和优势,阐述了ICD编码在当前医疗大数据中的应用情况以及重要作用,分析了在当前情况下推广和应用ICD-11标准所面临的潜在问题。随后建立了ICD-11实施评估表,通过实施前、实施中以及实施后三阶段,提出了ICD-11实施不同阶段的具体步骤。根据其中保障病案数据上报、旧编码标准的迁移映射以及ICD-11自动编码的实施这三个关键阶段,对此从大数据分析技术角度进行设计,提出了跨区域的ICD-11信息服务架构、基于Map Reduce模型的医保病案编码转换和映射方法以及面向大数据分析的医保病案自动编码方法,解决了ICD-11实施过程中的关键问题,提高了医保病案编码转换与升级的效率与准确率,保证了医疗保险报销的准确率。(2)基于频繁模式的医保聚集异常行为挖掘方法基于新的医保病案编码体系,首先分析了医疗聚集异常行为检测所面临的挑战,针对医疗聚集异常行为的复杂性,给出了相关概念并构建了医疗聚集行为结构化模型和医疗行为矩阵,引入关联规则挖掘方法,将医疗聚集行为挖掘转换为频繁模式挖掘问题。利用大数据分析技术,结合Map Reduce分布式计算模型和医保报销的实际场景,提出一种改进的基于分布式的医疗聚集行为挖掘方法,克服了关联规则挖掘方法在医疗领域应用的不足之处,提升了高维频繁项集数据检测的效率与准确性,通过对真实的门诊报销数据进行分析与验证,实现了对医疗聚集异常行为的有效识别。(3)基于患者信息加权树的医保欺诈标记方法基于多叉树的概念,针对不同患者类型的相似医疗索赔信息,首先构建了患者信息加权多叉树,以患者信息列值视为节点,将根节点和叶节点之间的每条完整路径视为相应患者类型的一个详细信息集,并根据信息集出现的相对频率计算边的权重和阈值,将患者的医疗保险报销信息与包含真实欺诈信息的患者信息列表进行映射来检测欺诈性索赔。通过与传统的映射方法相比,基于患者信息加权树的映射通过提供有效的欺诈标记来减少误报的数量,提高了欺诈检测的效率。(4)基于智能大数据的医保主动研判方法在研究内容(1)(2)(3)的基础上,首先分析了现有大数据理论在医疗健康相关应用中的局限性,聚焦在医疗健康大数据分析领域遇到的复杂问题,提出了智能大数据的定义与概念模型,该模型可以有效利用大数据数据集之间的关系,通过融合医保大数据结构化处理、数据集语义分析、机器学习方法集映射、探索性可视化等关键技术与方法,建立了智能大数据驱动的医保主动研判框架。在Hadoop、Hbase、Spark等大数据组件的支持下,将本文提出的智能大数据分析模型和医疗大数据主动决策框架应用在具有现实意义的医保研判支持场景中,最终能够在医疗健康大数据时代下为我国医疗信息化发展所需要的理论和技术提供借鉴作用。
其他文献
对话是人与人之间交流的重要方式,同时也是人机交互的主要手段。随着人工智能技术的发展,对话生成技术也得到快速发展,但其仍不能满足人们日益增长的生活需求。研究基于神经网络的对话生成新技术,对促进对话系统和人机交互技术的发展具有理论价值和实际指导意义。目前,基于深度神经网络的对话生成方法已经取得了较大的进展,但仍存在一些问题需要探索:(1)现有的端到端对话生成模型容易生成通用性回复,并且生成的回复包含有
学位
轨道列车运维是轨道交通安全的重要保障,基于物联网和人工智能(Artificial Intelligence,AI)技术实现轨道列车关键部件在线监测是当前智能化列车运维的发展趋势。轨道列车在线监测主要包含两个关键步骤:数据采集和故障诊断。由于轨道列车车体结构和运行环境的复杂性,基于物联网和AI技术实现列车数据采集和故障诊断仍面临诸多问题。一方面,大量已有列车车体底部的一些关键部件所处的位置未预留电源
学位
聚合物材料因其结构丰富、柔韧性好、可溶液加工、成本低、质量轻等优势,被广泛应用于聚合物薄膜晶体管及光电探测器的研究开发中。但是聚合物薄膜的无序结构限制了电荷的传输,因此制备高有序度聚合物薄膜成为改善器件电荷输运的重要途径。纳米线结构的引入是提高聚合物薄膜有序度的重要手段之一。然而这一结构对电荷传输及器件性能的影响有待进一步探究。同时,关于纳米线结构对电化学晶体管、光电探测器等光电器件性能影响的讨论
学位
自深度学习模型在ImageNet 比赛上以惊人的性能引起广泛关注以来已有十年时间。深度神经网络在计算机视觉,语音处理,自然语言处理,搜索,计算广告学乃至推荐系统等多个领域都取得了巨大成功,推动了人工智能的快速发展。与此同时,深度学习的黑箱特点让研究者仍然无法从科学的角度理解深度神经网络的学习机理。深度学习的黑箱难题一方面使得深度学习面临对抗样本等问题的挑战,另一方面也使人们无法有效地来选择模型结构
学位
随着工业化进程的加速,空气污染已经成为了一个全球性的问题。空气污染会对人体健康带来很大的威胁。因此,对于空气污染进行监测和预测显得尤为重要。近年来,为了更好地进行空气污染监测,国家建立了许多空气质量监测站点(标准站)来实时监测空气污染物。这些站点可以提供准确的污染物浓度数据,但是部署这些站点需要高昂的成本,因此导致了它们的分布较为稀疏。随着传感器技术的发展,低成本、便携的微型空气监测传感器设备(微
学位
高功率光纤激光器,具有结构紧凑、光束质量好、转换效率高、散热好等独特的优势,在军事战术武器、激光雷达、相干光通信、工业加工、激光医疗等领域应用广泛,是国际上激光技术研发领域持续发展的热点方向之一。随着高功率光纤激光器输出功率的迅速攀升,增益光纤中非线性效应和横模不稳定性问题已成为其进一步发展的瓶颈,亟待突破。大模场面积(Large Mode Area,LMA)单模光纤,在增大模场面积的同时,保持单
学位
随着计算机科学技术的不断发展,新闻网站和即时通讯等在线数据快速增长,多样性数据不断产生。海量信息触手可及,如何设计有效的分类系统来自动处理这些内容成为了亟待解决的问题。在传统的分类方法中,待分类的样本只属于一个标签,即多分类学习。但是现实生活中很多对象是具有多个标签的,例如一篇学术论文很可能既属于“数据挖掘”,又属于“机器学习”。多标签文本分类技术在现实生活中被广泛应用,例如,主题识别、新闻分类、
学位
随着移动设备和通信网络的发展,每天海量的视频数据被采集、传播和保存。视频已成为信息的主要载体,理解和分析视频中的人体行为具有重要的现实意义。行为识别作为视频理解的重要分支,旨在通过分析视频数据,利用特定算法,对视频包含的人体行为进行分析和识别。基于计算机视觉技术的人体行为识别算法是近年来的研究热点之一。计算机视觉技术通过模拟人类的视觉信息处理过程,赋予计算机感知环境的能力和人类视觉功能,为人体行为
学位
表格按照行和列的方式来组织数据,是一种非常有效的数据格式。表格数据广泛应用在人们日常的生产和生活中,如会议日程、财务报告和信用卡消费记录等。虽然人们可以很容易理解不同风格和布局的表格,但是对于机器而言,自动化地识别并理解各式各样的表格仍是一个不小的挑战。考虑到线上和线下文档中拥有着大量的非结构化表格数据(如图像文件和PDF文档),自动化的表格结构识别方法将有助于大规模的表格数据分析工作。较早的表格
学位
非饱和粉质黏土是一种寒区常见的冻胀敏感性土,其冻胀变形易诱发寒区路基变形、涵洞开裂、桩基上拔等工程病害,给我国寒区工程的建设和运营带来了极大的威胁。目前非饱和粉质黏土的冻胀机制研究存在两个瓶颈性问题:(1)目前的冻胀试验和模型研究大多针对饱和土提出,非饱和土的冻胀机制不明,缺少适合非饱和土的冻胀理论模型。(2)目前的冻胀试验方法缺少微观测量手段,无法对冻胀过程中水分迁移、分凝冰聚集生长、土体局部变
学位