论文部分内容阅读
医学影像技术可以为大量疾病的临床诊断和治疗提供关键的信息。在实际应用中,医学影像数据的解读通常由具有丰富实践经验的专业医生人工进行,该过程繁琐、工作量大,且严重依赖于专家的主观经验。不同专家之间也存在评判一致性不高的问题。计算机辅助诊断技术的引入可以降低医生的负担,提高诊断效率。然而现有的方法大多基于传统机器学习技术,需要较强的医学先验知识和复杂的特征工程,限制了算法性能的上限。深度学习技术提供了一种端到端的解决方案,能够从数据中自发地学得具有良好判别能力和泛化能力的多层次抽象特征,显著提高了预测结果的精度。研究深度学习在医学影像分析中的应用具有重要意义。
本文以最基础也最重要的诊断分类为例,分别基于脑电图(EEG)、磁共振成像(MRI)和延时视频(time-lapse)这三种具有较大差异的医学影像数据,对不同的医学诊断问题进行研究,展示了不同的深度学习技术和用法。通过对深度学习方法进行不同程度上的改进和创新,本文提出的方法在对应研究的医学问题上均达到了业界领先的水平。希望能够抛砖引玉,为深度学习在医学影像数据中的应用提供比较多样和全面的视角。本文的主要研究内容如下:
(1)基于EEG和深度学习的睡眠状态检测。睡眠状态的检测有利于睡眠相关疾病的诊断。目前现有的深度学习方法大多基于原始的EEG信号,具有计算量大、算法性能一般的缺点。本文将单通道EEG信号通过短时傅立叶变换转换成时频图后,从自然语言处理中获取灵感,提出了两种新颖的深度学习模型用于睡眠状态的检测。基于卷积神经网络(CNN)的C-CNN模型紧凑且高效,在计算代价和模型性能之间达到了很好的平衡;基于注意力机制和双向长短时记忆的Attention模型则可以获得更好的性能,领先于现有的方法。此外,通过将代价敏感学习整合到模型训练过程中,解决了睡眠状态中存在的严重类别不平衡问题。保证每个睡眠状态均有较高的召回率,取得了更好的平衡分类正确率。
(2)基于MRI和CNN的鼻咽癌诊断支持系统。鼻咽癌是中国东南部、台湾、香港、马来西亚和新加坡等地区最常见的头颈癌,本文为鼻咽癌的诊断提供了一套可视化的诊断支持系统,且可以在不同分辨率和不同型号的MRI设备下运行。首先,该套系统通过开操作和大津阈值法对MRI切片进行自适应地分割和裁剪,以提取切片中有效的大脑区域,同时也解决了跨分辨率跨系统的问题;然后使用修改后的残差网络对不同MRI切片进行处理、提取特征,利用提出的可视化方法快速定位恶性肿瘤可能存在的切片和区域;最后对所有切片的高层次抽象特征进行整合,给出最终的鼻咽癌阳性概率。整套系统在为医生提供可疑肿瘤位置标注的同时,鼻咽癌阳性诊断的ROC曲线下面积AUC指标达到了0.994。
(3)基于time-lapse和多任务学习的胚胎早期发育阶段分类。在进行体外人工受孕时,对胚胎的早期发育阶段进行准确地检测,可以为评估胚胎质量提供宝贵的信息,有利于受孕的成功。本文提出了一种具有动态规划的多任务深度学习框架(MTDL-DP),用于胚胎早期发育阶段的分类。它首先基于视频中相邻帧具有大量互补信息的特性,利用多任务学习和相邻帧为延时视频的每一个图像帧生成多个预测结果;然后通过集成思想对这些预测进行整合,赋予当前帧一个胚胎发育阶段;最后使用动态规划进行后处理,优化整个视频的发育阶段序列,使得最终预测的发育阶段序列非递减,且搬运距离损失最小。通过提出的MTDL-DP算法,本文将胚胎早期发育阶段分类的精度提高了3.1%。
本文以最基础也最重要的诊断分类为例,分别基于脑电图(EEG)、磁共振成像(MRI)和延时视频(time-lapse)这三种具有较大差异的医学影像数据,对不同的医学诊断问题进行研究,展示了不同的深度学习技术和用法。通过对深度学习方法进行不同程度上的改进和创新,本文提出的方法在对应研究的医学问题上均达到了业界领先的水平。希望能够抛砖引玉,为深度学习在医学影像数据中的应用提供比较多样和全面的视角。本文的主要研究内容如下:
(1)基于EEG和深度学习的睡眠状态检测。睡眠状态的检测有利于睡眠相关疾病的诊断。目前现有的深度学习方法大多基于原始的EEG信号,具有计算量大、算法性能一般的缺点。本文将单通道EEG信号通过短时傅立叶变换转换成时频图后,从自然语言处理中获取灵感,提出了两种新颖的深度学习模型用于睡眠状态的检测。基于卷积神经网络(CNN)的C-CNN模型紧凑且高效,在计算代价和模型性能之间达到了很好的平衡;基于注意力机制和双向长短时记忆的Attention模型则可以获得更好的性能,领先于现有的方法。此外,通过将代价敏感学习整合到模型训练过程中,解决了睡眠状态中存在的严重类别不平衡问题。保证每个睡眠状态均有较高的召回率,取得了更好的平衡分类正确率。
(2)基于MRI和CNN的鼻咽癌诊断支持系统。鼻咽癌是中国东南部、台湾、香港、马来西亚和新加坡等地区最常见的头颈癌,本文为鼻咽癌的诊断提供了一套可视化的诊断支持系统,且可以在不同分辨率和不同型号的MRI设备下运行。首先,该套系统通过开操作和大津阈值法对MRI切片进行自适应地分割和裁剪,以提取切片中有效的大脑区域,同时也解决了跨分辨率跨系统的问题;然后使用修改后的残差网络对不同MRI切片进行处理、提取特征,利用提出的可视化方法快速定位恶性肿瘤可能存在的切片和区域;最后对所有切片的高层次抽象特征进行整合,给出最终的鼻咽癌阳性概率。整套系统在为医生提供可疑肿瘤位置标注的同时,鼻咽癌阳性诊断的ROC曲线下面积AUC指标达到了0.994。
(3)基于time-lapse和多任务学习的胚胎早期发育阶段分类。在进行体外人工受孕时,对胚胎的早期发育阶段进行准确地检测,可以为评估胚胎质量提供宝贵的信息,有利于受孕的成功。本文提出了一种具有动态规划的多任务深度学习框架(MTDL-DP),用于胚胎早期发育阶段的分类。它首先基于视频中相邻帧具有大量互补信息的特性,利用多任务学习和相邻帧为延时视频的每一个图像帧生成多个预测结果;然后通过集成思想对这些预测进行整合,赋予当前帧一个胚胎发育阶段;最后使用动态规划进行后处理,优化整个视频的发育阶段序列,使得最终预测的发育阶段序列非递减,且搬运距离损失最小。通过提出的MTDL-DP算法,本文将胚胎早期发育阶段分类的精度提高了3.1%。