疾病智能分析系统中若干关键技术研究与实现

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：b411574103

【摘要】

：

疾病智能分析系统是典型的临床决策支持系统，是人工智能研究领域非常活跃的分支。疾病预测模型是疾病智能分析系统的核心部分，采用机器学方法依据医学数据集构建疾病预测模型，在

【作者】

：

陈旭

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2018年期

【关键词】

：

疾病智能分析系统疾病预测模型医学数据集卷积神经网络集成学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

疾病智能分析系统是典型的临床决策支持系统，是人工智能研究领域非常活跃的分支。疾病预测模型是疾病智能分析系统的核心部分，采用机器学方法依据医学数据集构建疾病预测模型，在分析患者病情基础上给出诊断结果，从而帮助医生进行辅助诊断。然而目前疾病智能分析系统存在一些问题，限制了疾病智能分析系统的发展。首先，现有疾病预测模型大多针对单一疾病进行预测分析，无法满足临床上多种疾病鉴别诊断需求;此外，医学数据具有不均衡特点和小样本特点，限制了疾病预测模型的性能;最后，主流疾病预测模型直接输出诊断结果，缺乏必要的推理和解释信息。　　本文对目前疾病智能分析系统中存在的一些问题进行了研究，主要内容如下:　　1，研究了异构多源医学知识表达与运用方法。针对诊疗规则结构化数据，采用充分条件进行疾病预测结果的补充，利用必要条件进行结果过滤。针对半结构化门诊病历，抽取医学特征集合，利用位编码方式转化为多标签数据集，最终将疾病预测问题抽象为多标签不均衡数据集上的分类问题;针对专业医学书籍非结构化数据，利用知识图谱进行表达，为后续诊断结果提供更多信息;针对疾病预测模型缺乏解释性信息问题，提出基于知识图谱的疾病解释模型，依据疾病预测模型结果和患者信息给出解释信息。　　2，针对医学数据集不均衡导致稀有疾病召回率低问题，本文提出了结合集成技术和欠采样技术的疾病预测模型，该模型迭代地从多数类样本中有放回地多次采样部分样本集，以训练多个基础分类器，然后将多个基础分类器加权组合为一个强分类器。该模型将采样概率引入到训练过程中，通过预测效果来调整样本的采样概率，促使模型可以学习不同类型多数类样本特征，以提高分类器性能。为了充分利用标签之间的相关性，提出了一种基于最大带权互信息生成树的标签选择算法，利用标签之间的互信息来衡量标签之间的相关性，进一步提高了少数类样本召回率。实验表明，本文提出的模型在稀有疾病召回率上最多提升30％，在整体样本预测效果上，精确率提升约6％，召回率提升约4％-17％，F1值提升约5％-15％。　　3，针对将门诊病历转化为医学特征集合丢失信息问题，本文提出了一种基于卷积神经网络的疾病预测模型，将门诊病历信息作为词序列，利用卷积神经网络获取语义信息;针对稀有疾病模型训练问题，提出结合迁移学习和动态采样的模型，该模型将已训练的多数类疾病预测模型作为稀有疾病的初始化模型，并引入动态采样技术生成均衡训练数据集，利用模型预测结果来更新样本采样概率，使模型更多学习错误分类的样本，从而提高预测模型效果。实验表明，与结合集成技术和欠采样技术的疾病预测模型相比，本章所提模型获取了最高约12％的F1值提升，约6％的召回率提升。

其他文献

多值背景上的属性约简及应用研究

随着数据库技术的发展与普及,各个领域的数据库中积累了大量数据。如何从数据中获取为决策服务的有价值知识是人们所关注的。因此,近年来在人工智能领域中数据挖掘成为了一个

学位

多值背景形式概念分析属性约简基于案例推理

基于无线传感器的生物实验室联网技术研究

无线传感器网络作为一种新兴的应用型网络，由大量的传感器节点组成，具有覆盖范围广、成本低、自组织性和以数据为中心等优点，必将得到越来越广泛的应用。而生物实验室是一类科学

学位

无线传感器生物实验室安全控制智能化管理通信协议拓扑结构

基于用户行为序列的推荐系统研究

互联网诞生于美国少数几所学校和科研机构中，随着技术的发展，互联网慢慢地融入到人们的日常生活中。从互联网诞生初期到今天，互联网以惊人的速度在用户身边蔓延开来，因此导致了各

学位

推荐算法用户行为序列个性化建模猎奇心理

基于SOA的电力应用自动化系统一体化数据交换平台

现代企业资源具有分布式、异构性、跨领域协同工作等特点。在企业信息化建设过程中,由于业务的复杂性和计算机技术飞速发展,许多信息系统的开发缺乏整体规划和系统性,不同时期构建的业务系统可能基于不同的操作系统平台和数据库技术。因而各个系统之间很难有效地实现信息共享和交互,形成了“信息孤岛”现象。随着电力市场的发展和协同业务开展的增多,“信息孤岛”式的系统已经不能满足企业发展的需要,迫切需要研制出一套真正的

学位

数据交换数据共享一体化统一化标准化

支持运行时软件信任管理的远程证明研究

随着Internet的快速发展，越来越多的软件运行在开放、动态、多变的网络环境下，软件的形态也在不断演化，这使得针对运行时软件的信任管理变得更加困难。开放网络环境下的软件通常

学位

信任管理远程证明可信计算运行时软件

H.264视频编码器在DSP上的实现与优化

由于各种通信网络的迅速发展,多媒体技术已经广泛融入人们的日常生活中。其中,视频压缩技术是目前应用最为广泛的多媒体技术之一。最新的H.264/AVC视频压缩标准中采用了许多

学位

H.264优化DM642运动估计

基于Windows Home Server的远程控制下载设计与实现

在深入分析了Windows家庭服务器操作系统之后，编程实现了一整套专门针对家庭服务器的远程控制下载软件，为充分发挥家庭服务器的内容存储和分享提供了坚实的基础。本远程控制下

学位

远程控制家庭服务器Web服务对等服务网络浏览器插件远程控制下载

无线胶囊内窥镜磁定位技术研究

无线胶囊内窥镜的问世是消化道无损诊断的革命性创新，随着临床应用的展开，产品的局限性逐步体现出来。其中，运动和姿态控制是迫切需要解决的问题，要实现运动和姿态控制，必须先知道

学位

无线胶囊内窥镜磁定位定向偶极子圆柱磁铁矩形磁铁多目标定位

数据防泄漏系统若干关键技术研究

随着信息化的发展，信息系统的安全越来越重要，保护数据资料防止泄密更是信息安全的重点。数据防泄漏技术是防止信息泄密的重要手段之一，其目的是采取技术和管理手段防止信息数据

学位

数据防泄漏应用安全虚拟应用信息安全信息泄密跨安全域身份认证

无线传感器网络位置分类定位算法的研究

节点位置信息是无线传感器网络应用必不可少的元素,是事件位置报告、目标追踪、地理理由、网络管理等功能的前提条件。为了提供有效的位置信息,无线传感器网络节点必须在随机

学位

无线传感器网络RSSI测距位置分类定位算法节点优化

疾病智能分析系统中若干关键技术研究与实现

与本文相关的学术论文