序列模式挖掘在临床路径发现问题中的研究与应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ruocich
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提高医院管理的效率和增加患者就医的透明度,规范医护人员的临床行为和减少医疗资源的浪费关乎每个人的切身利益,这是当前全社会关注的热点问题。临床路径作为一种临床医疗行为管理的手段,已经被世界上很多国家用于医院管理,并取得了很好的效果。我国从2009年开始进行临床路径的试点和推广工作,力争2020年底实现全部二级以上医院纳入临床路径管理。目前临床路径的制定是由相关领域医学专家根据经验和专业知识制定,费时费力。医疗信息技术的发展使得医院积累了海量的临床数据,促进了大数据技术在临床医学上的研究和应用,这为临床路径的发现和制定提供了新思路。数据挖掘技术能充分利用已有数据的信息,为临床路径的制定提供参考和指导,使临床路径的制定更具科学性和合理性。本文基于频繁序列模式挖掘对临床路径发现问题进行了研究。主要工作内容如下:(1)提出了有前缀约束的频繁序列模式挖掘算法CPM-PC(Clinical Pathways Mining with Prefix Constraints)。临床路径是针对某个病种的一套标准化的治疗方案,实际上是一系列检查、治疗以及护理行为按照时间先后顺序组成的一个序列,因此临床路径的挖掘问题被转化为频繁序列模式挖掘问题。另外,患者一个完整的治疗疗程总是由一些特定的医疗行为开始,像手术过程一般是从麻醉开始,据此在论文中提出临床路径"前缀集"的概念,即可以作为某种疾病治疗开端的临床项目的集合。在此基础上,提出了一个适用于临床路径发现的序列模式挖掘算法CPM-PC,该算法充分考虑临床路径"前缀集"的作用,能够较高效的挖掘出有意义的序列模式。(2)提出了临床路径基于属性的评估模型。由于临床路径的挖掘会产生大量的候选序列模式,对这些模式如何选择,目前还没有相关研究。对临床路径评估的研究大都集中于对已经试点的临床路径进行结果分析式的评估,这种方法不能适用于临床路径的选择过程。因此,在总结国内外临床路径评估方法的基础上,对各评价指标进行分析,选择住院时长LOS,医疗总费用C,药占比P三个基本属性提出了基于属性的临床路径评估模型,更加侧重于临床路径本身的属性,通过计算临床路径基于属性的加权评估值ABWE评价临床路径的优劣。最后,在阜阳市某医院的真实临床数据集上进行了实验,对实验结果的分析显示CPM-PC算法在挖掘临床路径过程中相比于传统的序列模式挖掘算法有更好的性能。
其他文献
有限元分析(Finite Element Analysis)是最常用的工程分析模拟方法,已经被广泛应用于复杂产品的设计与开发中。有限元网格模型生成是进行有限元分析的关键一环,其质量直接影响分析的精度与速度。为了保证有限元网格质量,在有限元网格生成后需要对其进行拓扑优化,然而现有拓扑优化算法都十分耗时。为此,本文研究基于样本学习的有限元网格拓扑优化方法,将机器学习技术引入有限元网格拓扑优化之中,以提
近年来,随着互联网的快速发展,互联网上的信息量日益增长且呈现多元化的特点。于是如何能够迅速、准确而高效地为互联网用户定位所需要的信息,成为搜索引擎的主要目标。通用
随着网络与应用的发展,信息呈爆炸性增长趋势,数据达到前所未有的规模,大规模数据中心的存储压力正迅速增长。基于分布式哈希表(DHT)的对等存储系统由于其良好的扩展性以及快速
自然语言理解是人工智能领域的核心课题,其语义模糊特性深刻影响着自然语言理解研究。模糊语义的量化问题一直是计算机和语言学界关注的热点,本文基于中介真值程度度量方法研
随着计算机应用的不断发展,要求大幅度地提高企业基础信息运营部门的工作效率和质量,各行各业都迫切需要通过面向业务的监控管理平台,来实现面向业务、自上而下的从IT基础架构到
当前移动智能终端设备数量增长迅猛,性能提升显著,在满足用户需求的同时,凸显了其固有的能耗与电池容量之间的矛盾。动态电压频率调节(DVFS)是能够有效解决这种矛盾的一种机
煤矿顶板事故是我国煤炭开采过程中的主要灾害之一,为保障安全生产各煤炭企业大都建立了矿压、微震、地音、顶板离层等监测系统,这些手段虽能从不同的侧面反映顶板安全状况,但一
随着计算机与互联网技术的发展,数据资源日益丰富,但是隐藏在大量数据资源中的知识却没有得到充分的利用。Web挖掘可以快速有效地获取Web上有用的信息。因为Web上的信息主要以
近年来,互联网技术日新月异,信息的数字化和网络化为信息的存取和人们对信息的查询提供了很大的便利性,人们可以随意的从网络上下载、拷贝、传播数字产品,随之而来的问题是使一些
多维时序数据可视化是科学计算可视化的重要研究方向。多维时序数据的来源非常广泛,如实地采集和计算机仿真模拟等。时序数据由于它的数据量大、不直观等特点,很难被有效地认