基于稀疏编码LSTM与多任务学习的糖尿病辅助诊断

来源 :东华大学 | 被引量 : 0次 | 上传用户:luzb2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
糖尿病是一种常见的代谢性疾病。近年来,糖尿病发病特征出现了年轻化、患病人数逐年增多、并发症发病患者也随之增多的变化,从而加大了内分泌临床医生对于糖尿病病情及其并发症诊断的压力。目前,各级医疗机构在为糖尿病患者提供医疗服务的同时,积累了大量的糖尿病现实世界数据,包括糖尿病患者信息、就诊信息、诊断信息、医嘱信息、检查检验信息等。如何借助新一代人工智能技术特别是深度学习技术,在糖尿病现实世界数据的基础上,实现糖尿病生化指标和并发症预测,对于糖尿病病情掌控和糖尿病并发症预防有着重要的意义。
  现有的糖尿病生化指标和并发症预测模型大多建立在公开数据集上,通过神经网络的模型进行预测和分类。公开数据集数据完整,可以直接使用神经网络进行学习,利用公开数据集实现的模型多偏向于单一血糖预测或者单一并发症预测。而实际应用中,糖尿病患者存在血检时间不规律、同时患有多个并发症的现象,并且糖尿病生化指标存在多样性,因此多数现有模型在应用中存在局限性。
  为了解决上述问题,本文提出了基于稀疏编码LSTM的糖尿病生化指标预测模型。该模型可以用于对实际医院中的糖尿病生化指标预测,整合了序列化稀疏自编码和LSTM。在已有糖尿病生化指标特征抽取模块的基础上,本文提出了基于双向LSTM多任务学习的糖尿病并发症预测模型,该模型利用五种并发症的相关性,进行多任务学习,完成多并发症预测工作。除此之外,本文设计并实现了基于的糖尿病医疗辅助诊断系统。本文研究内容包括以下三个部分:
  1)提出基于稀疏编码LSTM的糖尿病生化指标预测模型。该模型利用某三甲医院提供的糖尿病生化指标作为数据集,实现了对患者进行糖化血红蛋白、空腹胰岛素和餐后2小时血糖三个糖尿病生化指标进行预测的功能。首先,该模型进行数据整理以及数据预处理,利用医疗卡号(患者身份唯一标识)将患者所有检测指标整合到一起,提取出模型中要使用的三个指标和它们对应的检测时间。其次,该模型对数据进行特征提取,因为医院提供的数据中存在较多的数据缺失,而患者糖尿病生化指标又有重要的时间关联性,所以数据需要进行特征提取,特征提取方法使用本文提出的序列化稀疏自编码模块。最后利用长短期记忆神经网络(LSTM)对特征向量进行回归计算,得到目标预测值。实验结果证明了该模型的可行性和有效性。
  2)提出了基于双向LSTM多任务学习的糖尿病并发症预测模型。该模型以患者生化指标的特征向量、患者基本信息(包括性别和年龄)作为输入数据,利用多任务双向LSTM构建了一个可以预测五种并发症的模型,五种并发症为:糖尿病视网膜病变、糖尿病肾病、糖尿病周边神经病变、糖尿病足病和糖尿病心血管疾病。该模型首先进行数据预处理,利用医疗卡号将需要输入的患者数据整合到一个矩阵中,然后多任务模块将患者的所有信息进行参数共享分给五个任务,每一个任务代表了一个并发症。最后每个任务利用双向LSTM进行二分类运算,得到的结果能够表示患者是否患有当前任务代表的并发症。通过实验结果的分析,证明了模型的有效性和可行性。
  3)设计并实现了糖尿病辅助诊断系统。该系统以基于稀疏编码LSTM的糖尿病生化指标预测模型和基于双向LSTM多任务学习的糖尿病并发症预测模型为核心,实现了糖尿病患者生化指标预测和糖尿病患者并发症预测的系统功能。将实验得到的模型应用到了系统之中,让医生通过系统界面直接使用模型进行诊断,为医生提供糖尿病辅助诊断上的支持。
其他文献
【摘要】主要利用网络资源,采用任务驱动法,让学生在老师的引导下通过自主学习,在轻松、愉快的学习环境下,获得“生命起源”的相关知识。  【关键词】生命的起源和进化 信息化 教学设计  【中图分类号】G71 【文献标识码】A 【文章编号】2095-3089(2016)03-0199-01  1.教材分析:“生命的起源和进化”一节是高等教育出版社出版的中等职业教育国家规划教材配套教学用书《生物基础》中的
期刊
【摘要】自主互动快乐学习是我们数学老师定制的一种学习方法,是让我们在玩中学、学中玩、学中乐、爱上学的一种学习方法。我身为队长,每天都要带着自己的队员讲题,我们队讲的非常详细,我在小组学习中学会了当小老师,讲课方面有所提升,从以前讲到现在,越讲越会讲,并且细节比以前讲得更细、更突出,效率也因此得到了提高,学会了分析问题,体会到了快乐,体会到了成就感。  【关键词】自主 分组 互动 快乐 队长带领成员
期刊
乳腺癌(Breast Cancer)是具有高死亡率的癌症之一,始终危害着中国女性的健康,其发病率在近几年也呈现出了迅速上升的态势。由此可见,中国乳腺癌的防治面临着巨大的挑战。影像学检查技术的发展十分迅速,磁共振成像技术(Magnetic resonance imaging,MRI)凭借其高分辨率等优点在诸多影像检查方法中脱颖而出,被广泛应用于临床诊断中。与此同时,为了减轻放射科医生的工作负担,计算机辅助诊断技术(Computer-Aided Diagnosis,CAD)也应运而生,辅助医生作出精准决策。虽
互联网交易系统中存在着多种大规模交易相关的实时数据流,系统资源调度通常根据不同的数据流进行不同的调度处理,流量能否准确预测对调度效果有着重要的影响。但是,现有的单一流量预测方法无法准确预测混杂流各分流量的变化。针对此问题,本文主要做了如下几个工作:
  首先,由于大规模服务系统的混杂业务流在任意时刻的数据具有不确定性,导致混杂流中不同数据流之间的相关性难以确定的问题,本文提出了混杂数据流分流量峰值预测模型。该模型使用延迟相关系数模型确定分流量间的相关性筛选辅助数据流,然后通过辅助数据流帮助预测目标数
数字版权管理技术一直被用于实现一些重要内容的版权保护和版权转让过程。设计作品在生产制造与工程建设中有着重要的指导作用,极具商业价值,有着对其进行版权管理的需要。然而,不同于一般的数字内容,设计作品的功能性组成复杂、内容的保密性要求高、对版权的公证要求严格、公证周期需要尽可能短、作品的所有权往往具有唯一性、交易的公平性难以保障。这些特殊性为设计作品的版权管理带来了挑战。为此,本文根据设计作品的组成特点,研究了使用区块链对其进行版权管理的方法。
  如何兼顾作品的效果可展示性和方案保密性是设计版权保护的
肿瘤是一类由于基因表达紊乱导致的疾病,它可以发生在身体不同的组织和器官中,表现为细胞不受控制的恶性増殖,最终向正常组织和器官扩散。肿瘤异质性是恶性肿瘤的重要特征,同一种肿瘤不同患者个体之间或者同一患者体内不同部位肿瘤细胞从基因型到表型上存在差异,这种差异将同一种肿瘤区分出很多的不同亚型,也使得其在演化轨迹上具有高度复杂性。
  随着人类社会的飞速发展和生态环境的快速变化,人们的身心承受着越来越大的压力,这使得肿瘤疾病日益频发,严重威胁人类的健康和生存。但是肿瘤的异质性却是肿瘤研究领域一道难以逾越的关
【摘要】音乐是诉诸于听觉的艺术,一切实践都须依赖于听觉,只有亲自听之,赏之,才能感悟音乐的真谛。本文主要针对音乐欣赏教学中学生聆听音乐的途径和方法,结合课堂教学实例,引起学生的注意,培养听的习惯;创造机会让学生多听以及丰富听的形式,深入听的感受这三方面进行的一次探索。  【关键词】欣赏教学 途径 聆听习惯 形式 方法  【中图分类号】G633.951 【文献标识码】A 【文章编号】2095-308
期刊
【中图分类号】G625 【文献标识码】A 【文章编号】2095-3089(2016)03-0218-02  “老师,您的茶杯。”我刚从课堂上回到办公室,一个身材瘦小、脸上总是带着泥巴的小男孩子不久进入我办公室,毕恭毕敬的递过我忘在教室里的茶杯,还对我微笑着说:“老师,您忘记端走了。”看着他的举动,回想与他相伴的点滴,我的心头涌上很多感触。这个昔日里沉浸在自我世界里,自私,沉默少言的,不懂得分享,行
期刊
【摘要】硬笔书法(书写)简体汉字讲技法,而关键的问题是学生兴趣与爱好的培养与教学,是教学各个方面的协作配合的成功才能成就书写的成功。  【关键词】硬笔简体字书写 教师责任心 学生专用心  【中图分类号】G623.9 【文献标识码】A 【文章编号】2095-3089(2016)03-0230-02  书法艺术是中华民族的文化瑰宝,是人类文明的宝贵财富。为了贯彻落实国务院教育部《关于中小学开展书法教育
期刊
【摘要】自古以来,人们对《长恨歌》这首诗的主题就一直存在着不同的说法,结合白居易的自身经历和创作意图,从普通的人性角度去考虑,站在女性角度、“后来人”的角度去揭示《长恨歌》的主题似乎更有现实意义。  【关键词】长恨 爱情 知人论世 以意逆志  【中图分类号】G633.3 【文献标识码】A 【文章编号】2095-3089(2016)03-0245-02  《长恨歌》是白居易的代表作之一。早在作者生前
期刊