Optimized Healthcare Decision Support Method Based on Predictive Mining Techniques

来源 :湖南大学 | 被引量 : 0次 | 上传用户:teddycici
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机信息处理技术发生了很大的变化。经过多年的相对稳定,商业智能世界正经历着翻天覆地的变化。BI是任何组织不可缺少的组成部分,也是理解是什么东西驱动一个组织并最终导致最好决策的一个必要工具。BI工具是决策支持系统的心脏,因此不受医疗保健部门的影响。数据仓库是商业智能的基础。 医疗环境通常数据丰富但是信息贫乏,且管理信息系统总的来说很弱。医疗保健部门由大量的临床资料组成,这些数据很少供决策使用。随着患者数据存储密度的增加,医疗保健部门受到很大的关注,迫切需要把这些数据“坟墓”转变成具有信息知识的“金块”。博茨瓦纳卫生部的案例,地方组织有丰富的数据但缺乏创新的挖掘工具和结构良好的DSS来发现隐藏在数据中的关系和趋势。调查证明了博茨瓦纳的健康信息管理系统(HIMS)艮弱,分散,数据收集技术并不是很协调,且明显的收集了重复的信息。数据和信息系统之间加大的差距,要求系统的开发工具将这些“数据坟墓”都变成知识的“金砖”。因此呼吁BI工具系统的开发,将这些“数据坟墓”都变成知识的“金砖”是不可避免的。整理、分析、解释和传播信息方面都存在很大的挑战。几个孤立的数据库使得情况复杂,跟踪健康结果和测量特定的干预措施的影响将更加复杂 在这个研究中,我们提出要加强博茨瓦纳医疗信息系统,优化决策支持系统,提高数据生成和利用。为了实现我们的主要目标,我们提出通过运用预测开采技术重新构建其BI过程促进医疗BI。BI通常被描述为一个业务管理术语,它使用应用程序和技术来收集,提供访问和分析机构的数据和信息,以帮助人们做更好的业务决策。1989年Howa rd Dresser提出BI作为一个总括的术语来描述“基于支持系统事实来提高业务决策的概念和方法”。提出了一个定量,语境设计,公司关系,分析和概念化的研究来加强医疗BI。今天,预测分析的演化,分析大量历史数据和创建准确的预测未来的趋势的能力继续发展,没有例外的医疗行业。我们的研究是通过协同构建一个基本的数据仓库工作,应用数据挖掘(DM)技术,数据分析框架和一个概念性的商业智能技术中心框架。 研究中,,我们使用了从博茨瓦纳卫生部获得的反逆转录病毒疗法(ART)数据集。博茨瓦纳是第一个在非洲建立全国性的ART项目的国家之一。“玛莎,”一词,意为“新曙光”,是指该项目来表示希望提供抗逆转录病毒药物的艾滋病毒携带者和艾滋病的人活得更长、更健康的生活,为他们提供时间来培养他们的家庭和为国家建立一个未来。在博茨瓦纳的ART项目引言前,艾滋病毒/艾滋病疫情继续蔓延有增无减,其特点是高水平的发病率和死亡率。艾滋病的流行导致了一些疾病的出现,其在前艾滋病时代是罕见或看似无害的。治疗这些疾病的经验不同。在许多情况下,对照试验评估治疗的艾滋病人口缺乏。一些艾滋病患者在ART项目下仍然有感染的风险,预防或缓解患者可能感染的工作也比较少。我们旨在建立一个分类和预测模型,通过挖掘历史数据来确定患者可能感染上述疾病,以采取适当的医疗措施。 为构建协同效应,我们首先建立了一个基本的数据仓库/数据存储库,我们从卫生部Microsoft Access2003文件中提取数据,并将其转换成Microsoft Excel2007文件格式,此格式用平滑技术是来清理噪声数据。通过使用一个Java NetBeans的应用程序来加载数据,数据被加载到Oracle11g基本数据仓库。这项研究中用到了1648名患者的数据 DM技术的使用在调查临床数据之间微妙的关系上正变得越来越受欢迎。预测分析正在以越来越快的速度被组织所接受,从数据中需要获得可行的和前瞻性的见解,且医疗部门必须跟上发展的步伐。分类模型用于预测个体的行为。他们将数据分到预定义的分类类标签上。“类”在分类中是目标变量,在我们的案例中是机会性感染(OI)变量。为了达到挖掘模型这一目标,我们紧随包括6个阶段的通用ISP-DM过程。在数据理解阶段,我们研究了卫生部的SQL数据仓库下的各种数据,并最终决定使用ART项目下的历史数据。与相关人员的工作不同,在数据存储库中选择使用DM工具,因为它提供了很多优势。不需要移动或者转换数据。这使得整个挖掘过程没那么复杂,费时和易出错。另外一个益处就是安全。数据由广泛的安全机制的Oracle11g数据库保护。在数据准备阶段,对数据资源编目后,我们通过选择28个数据变量用于学习来准备数据。研究过程包括数据准备、清理、整合,提取和格式化数据,这些工作都是在加载数据到Oracle11g基本数据仓库前做的。建模阶段当然是DM过程最华丽的一部分,此阶段用复杂的分析方法从数据中提取信息。这个阶段涉及选择建模技术,生成测试设计、构建和评估模型。在SQL开发人员的DM工具下创建了数据挖掘者的工作流。这使我们能够在图形环境下交互式地建立、分析和测试DM过程。DM工作者通过返回到工作流的结果来建立这些模型。建立了四个分类和预测模型用于测试,分析其鲁棒性。该模型对广义线性模型训练(GLM)、支持向量机、决策树(DT)和朴素的贝叶斯算法。并对每个算法的设计结构和优点进行了讨论。提出了模型的训练,模型训练数据的学习。训练是针对部分源数据进行的,然后将剩余的测试部分的数据分成50个小片。这中类建立的节点检测了所有一共四种定义的模型。在成功的训练模型中,测试和估计阶段被执行,对于其鲁棒性的严格测试也完成。在这个阶段,我们来预测数据最小化成果如何来达到我们的商业目的。每个模型的结果都被严格测试,分析每个模型的所有结果,利用混淆矩阵的分析性能,接收端的操作特征曲线以及LIFT积累分析衡量了分类模型的预测性能比随机预测性能要好的程度。总体数来,lift可以看做是一个百分比:由模型产生的正确的正的模型类别比上实际测试集中的正的类别。它依据整改率的界级别由高到低排列,所以,最高浓度的积极的预测是在分位数的顶部。同样有一个开销矩阵编码分类记录惩罚的利润分配估计也被完成。我们的混淆矩阵展示了由每一个模型所记录的正确与不正确的预测,并与实际测试集中的分类进行比较。在分析和精确比较每一个模型的性能表现后,SVM模型相比仅有0%的预测可信性的的GLM模型,以84%的总体性能被证明是我们数据的最好模型。在总案例数为820的情况下,SVM对690个做出正确预测。SVM也被证明能够以60分位数这样一个更高的测量影响更有可能的准确预测消极或积极的类。该模型有曲线下最高测量面积即0.8941.部署阶段专注于整合在测试和评估阶段学习到的新知识。OI支持向量机被部署到剩余数据,最后最终结果生产并以表格格式发布。预测结果包括病人身份证以及病人是否可能有风险感染的预测概率和预测类别。 统计分析结果表明,血红蛋白、病毒载量和病人之间有着重大的关系。这就建议具有较高体重的病人也会呈现血红蛋白、病毒载量增多的趋势。但是,年龄、BCD4a nd CD4之间却没有显著的关系。 我们提出的商业智能不再是简单的将各个不同的IT部件组合,而是在成熟的框架下采用BICC策略,BBIC将安排卫生保健机构中相关学科的人来有效的使用BI,从而能够快速有效的决策,最终为患者提供更好的医疗服务,他们同样将为有效的监控、评估、决策提供良好的环境。 我们研究过程中遇到了各种各样的问题,在解决这些问题的过程中,我们对医疗保健系统进行了多次的创新,原始数据的互相矛盾、差异和不完整,存在大量的冗余数据,就是一个我不得不面对的严重的问题,包括人类健康的临床数据对我们的研究工作是非常重要的,当所研究的数据存在误差时,将使得结论不准确。怎样将不包含配药信息的PLMS数据导出也是我面对的问题之一。有一些问题仅仅是人工问题,面对这样的问题我们必须对数据进行修改。总之,存在着大量的工作需要我们完成。医疗保健部门每天都产生大量的数据,随着研究技术的创新,医疗保健部门将能完成以前因为数据太多、分析时间太长、数据不能被SQl存储而不能完成的工作,自服务BI是计算机领域重要且热门的研究课题,通常,BI主要指IT人员和商业分析师依据以往的经验去发现、寻找大量数据中的信息,用于辅助决策,而今天,似乎所有的人都能成为分析师,通过对简单的操作说明进行研究,我们可以建立更多新的有用的预测模型。 从我们对实验结果的分析可以看出,医疗系统的BI还有很多有趣的问题值得探讨,且还能不断改善,我们的研究将为将来的研究打下坚实的基础。
其他文献
筹资作为长期护理保险制度建设关键环节,直接关乎制度的可持续性和稳定性。第二批国家试点城市基本确立了以个人和单位作为缴费主体的筹资机制,按照比例筹资成为主要城市的做法,同时也明确了退休职工缴费的原则和标准,进一步完善了长期护理保险筹资机制。但是筹资标准差异大、居民筹资渠道单一、退休职工人群缴费是否应该由财政补助等问题仍然有待探索。本文提出要建立鼓励年轻人缴费的激励机制、明确各级财政在筹资中应该承担的
期刊
我国长期护理保险现已进入扩大试点阶段,在应然状态上,长期护理保险应当实现独立筹资,但是我国制度试点地区基本采取依附筹资模式,应然与实然的矛盾说明长期护理保险筹资机制尚不完善。结合我国具体国情,明确依附模式有助于在起步阶段快速建立长期护理保险制度,但是为了保证长期护理保险的独立性和稳定性,依附模式应逐渐转变为独立模式,独立筹资是建设独立险种的内在要求。我国在建立独立筹资的长期护理保险制度时,要注重完
期刊
<正>首批试点城市中,筹资主要来源于基本医保基金,单位缴费责任不对等,需要进一步探索建立互助共济、责任共担的多渠道筹资机制。2016年,人力资源和社会保障部出台《关于开展长期护理保险制度试点的指导意见》(以下简称《指导意见》),选择15个试点城市和2个重点联系省份统一组织开展长期护理保险试点。2020年,国家医保局会同财政部印发《关于扩大长期护理保险制度试点的指导意见》(以下简称《扩大试点指导意见
期刊
我们生活的世界正不断加速变化的速度。这个世界不仅是个加速变化的世界,也是个越来越复杂的世界。如果我们的学生不会跨越文化壁垒,将来怎么适应千变万化的世界?但目前英语专业一年级学生英语写作交际能力的现状不尽如人意,甚至成为一些学生的心头之痛。许多在校学生为了通过英语写作测试而被动学习英语写作。外语学习者面临的不是智力危机,而是交际危机。因此迫切需要在英语学习者中培养学习交能能力,以培养其语篇能力,提高
学位
在亚波长光学领域,按照人为意愿控制电磁波在纳米金属结构中传输是学术界和技术应用领域长期关注的一个重要问题。表面等离子激元(Surface Plasmon Polariton, SPP)为人们控制光和传导光提供了一种新思路。在基于表面等离子体激元的纳米结构体系的研究中,发现了许多新现象。光照射在具有亚波长周期性孔阵列的金属薄膜上时,产生了超强光透射现象(EOT),后又有利用亚波长周期性结构阵列应用在
学位
目的:探讨限制性液体复苏策略在脓毒性休克患者治疗中应用的效果。方法:将医院2019年9月至2022年8月诊治的脓毒性休克患者60例按随机数字表法分为对照组与研究组,各30例。对照组根据相关诊疗指南采用充分液体复苏策略治疗,研究组采用限制性液体复苏策略治疗。比较两组治疗后4周内生存率、治疗相关指标(补液量、利尿剂用量、24 h乳酸清除率、ICU住院时间)、治疗前后血流动力学指标[心率(HR)、平均动
期刊
“以献身地质事业为荣、以艰苦奋斗为荣、以找矿立功为荣”的地质“三光荣”精神是地质行业的优良传统和宝贵财富。站在新时代,高校的地学人才培养要适应经济社会发展的新要求,要因势而谋、应势而动、顺势而为,发挥融媒体视域下的全程媒体、全息媒体、全员媒体、全效媒体的积极作用,解决生产、传播、接受三个环节的困境,以人为本,打造生态,找准重点,强化地质“三光荣”精神培育,培养优秀地学人才。
期刊
教育戏剧在小学体育教学实践中的运用狭义的教育戏剧是运用戏剧技巧渗透及融入学校学科教学,成为教学工具和媒介,是戏剧教学法纯教学工具发挥的升华版,把戏剧的肢体动作、空间环境、角色换位思考、思想品德,渗透应用在各个学科的学习之中。本研究进行两种形式的教育戏剧体育实践课来探索教育戏剧在体育课中的功能。研究目的:更多地立足于体育学科核心素养,特别是情感、态度和价值观维度教学目标的基础上,将教育戏剧技巧运用于
会议
香菇味道鲜美、营养丰富,是一种兼具食用和药用功能的食用菌。本文对香菇的营养价值、加工利用及医学方面的应用等进行了概括和综述,并对香菇产业目前存在的问题进行了阐述,对香菇未来的发展前景进行了对策思考与展望,旨在为之后的进一步研究和开发利用提供一些参考。
期刊
探究不同产地香菇营养成分及其香菇多糖的抗氧化活性,为食疗的选材与香菇多糖的深度开发提供依据。以5个地区的香菇为原料,对其蛋白质、脂肪、总糖、灰分等指标检测分析,并利用超声辅助优化香菇多糖的提取方案,同时对香菇多糖的抗氧化性能进行分析。结果表明,干香菇蛋白质含量福建古田最高,为30.81%;脂肪含量福建古田最高,为3.33%;总糖含量河南白云山最高,为46.53%;灰分含量福建古田最高,为6.88%
期刊