基于文本与图像的肺疾病研究与预测

来源 :自动化学报 | 被引量 : 0次 | 上传用户:abcd55443388
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过对目前现有的肺癌检测技术研究,发现大部分研究人员主要针对肺癌CT影像进行研究,忽略了电子病历所隐藏的肺癌信息,本文提出一种基于图像与文本相结合的肺癌分类方法,从现有的基于深度学习的肺癌图像分类出发,引入了电子病历信息,使用Multi-Head Attention以及Bi-LSTM对文本建模.实验结果证明,将电子病历信息引入到图像分类模型之后,对模型的性能有进一步的提升.相对仅使用电子病历进行预测,准确率提升了大约14%,精确率大约提升了15%,召回率提升了14%.相对仅使用肺癌CT影像来进行预测
其他文献
基于深度图序列的人体行为识别,一般通过提取特征图来提高识别精度,但这类特征图通常存在时序信息缺失的问题.针对上述问题,本文提出了一种新的深度图序列表示方式,即深度时空图(Depth Space Time Maps, DSTM),该算法降低了特征图的冗余度,弥补了时序信息缺失的问题.本文通过融合空间信息占优的Depth Motion Maps(DMM)与时序信息占优的DSTM,进行高精度的人体行为研
期刊
无监督跨域迁移学习是行人再识别中一个非常重要的任务.给定一个有标注的源域和一个没有标注的目标域,无监督跨域迁移的关键点在于尽可能地把源域的知识迁移到目标域.然而,目前的跨域迁移方法忽略了域内各视角分布的差异性,导致迁移效果不好.针对这个缺陷,本文提出了一个基于多视角的非对称跨域迁移学习的新问题.为了实现这种非对称跨域迁移,我们提出了一种基于多对多生成对抗网络(Many-to-Many Genera
期刊
唇读,也称视觉语言识别,旨在通过说话者嘴唇运动的视觉信息,解码出其所说文本内容.唇读是计算机视觉和模式识别领域的一个重要问题,在公共安防、医疗、国防军事和影视娱乐等领域有着广泛的应用价值.近年来,深度学习技术极大地推动了唇读研究进展.本文首先阐述了唇读研究的内容和意义,并深入剖析了唇读研究面临的难点与挑战;然后介绍了目前唇读研究的现状与发展水平,对近期主流唇读方法进行了梳理、归类和评述,包括传统方
期刊
生成式对抗网络(Generative Adversarial Networks, GANs)是一种有效模拟训练数据分布的生成模型,其训练的常见问题之一是优化JS散度(Jensen-Shannon divergence)时可能产生梯度消失问题(Vanishing gradient problem).针对该问题,本文提出了一种解码约束条件下的GANs,以尽量避免JS散度近似为常数而引发梯度消失现象,从
期刊
电熔镁熔炼过程中的异常工况(如半熔化工况)直接影响产品质量、威胁人员和生产安全,有必要及时诊断.但与异常直接相关的超高温熔池温度(>2850℃)难以利用温度传感器检测,目前现场主要依靠工人在定期巡检时人眼观察炉壁来诊断,工作强度大、安全度低、诊断不及时.针对上述问题,本文提出一种炉体图像驱动的电熔镁炉异常工况实时诊断方法.结合电熔镁炉熔炼各区域温度分布的空间特征、正常工况下熔炼温度变化和水雾扰动引
期刊
二元语义偏好关系作为一种新的偏好信息结构和有效的词计算模型,已被应用于各种决策领域。为了处理评价信息为二元语义偏好关系的复杂问题,首先给出了能够协助专家在某些情况下进行快速决策的二元语义偏好关系有序一致性策略方法;其次,提出了一种新型乘性一致二元语义偏好关系概念,并探究了完全乘性一致二元语义偏好关系的设计方法;最后,构建了具有收敛性的二元语义决策模型,该模型能够将非一致性的二元语义偏好关系调整成为
期刊
多视角图像生成即基于某个视角图像生成其他多个视角图像,是多视角展示和虚拟现实目标建模等领域的基本问题,已引起研究人员的广泛关注。近年来,生成对抗网络在多视角图像生成任务上取得了不错的成绩,但目前的主流方法局限于固定领域,很难迁移至其他场景,且生成的图像存在模糊、失真等弊病。为此本文提出了一种基于混合对抗生成网络的多视角图像生成模型ViewGAN,它包括多个生成器和一个多类别判别器,可灵活迁移至多视
期刊
逆境胁迫是指对植物施加有害影响的环境因子,是目前造成植物减产、品质下降的主要影响因素。植物在遭受逆境胁迫后通过外源物质的施加可显著提升作物对逆境胁迫的抵抗能力,目前在作物遭受逆境胁迫后常用的外源干预物质主要有植物生长调节剂、外源有机物、外源无机物和金属离子等,国内外针对不同的外源物质缓解及调控作物面临逆境胁迫下的研究主要集中在生理生化、活性氧、代谢酶、基因变化等细胞和分子水平,然而,针对外源物质对
期刊
目的 探讨一种基于数字化人体(CVH)的冠脉CT血管造影(CTA)多维可视化方法对于CTA中观察冠脉结构和辅助诊断的可行性。方法 获取CVH断层数据集和临床冠脉CTA影像,分别对冠脉进行分割、提取中心线和标定,获得右冠状动脉(RCA)、左主干(LM)、前降支(LAD)和回旋支(LCx)等节段,然后使用曲平面重建技术对冠脉横断面、冠状面、矢状面、拉伸曲平面和拉直曲平面等多平面进行重建,并在此基础上使
期刊
本文根据元胞自动机模型划分方法,将二维图像分解为2×2矩阵单元结构.提出了几种逻辑运算式,用以分类由黑白二值点构成的2×2矩阵图形.本文通过CNN神经网络的多层结构形式,分析了金字塔结构逻辑在相似的组合形式下,对二值图形边缘检测和池化的功能.通过同步脉冲形式能将灰度图像,分解为多个时间维度的二值图形,方便多层金字塔逻辑运算处理.分析了如何采用延时继电器使金字塔结构逻辑具有记忆的特性.讨论了3×3输
期刊