基于语义与视觉特征的眼底图像阅片报告自适应生成研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:maruijun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
眼底疾病指人眼球内后部组织中的部位病变。眼底检查十分重要,许多疾病如高血压、糖尿病等都可以从眼底图像呈现出来,一般是各医院眼科必做检查项目。从拍摄眼底图像到医生给出诊断报告并解释给病人发病情况通常需要30分钟左右的时间,在医院患者数较多的情况下,整个过程可能会延至1-2天。而利用人工智能方法使机器自动生成眼底图像阅片报告将缩短医生的诊断时间,并给予医生以提示作用,同时会方便患者保留对当前病情的文本依据。将人工智能技术应用于医学图像阅片报告自动生成任务是一个重要且有价值的研究方向。目前有很多关于医学图像诊断报告自动生成问题的研究,它们大多基于图像报告自动生成方法。传统的图像报告生成方法无法从图像中有效的提取抽象特征,且不具有泛化性。随着计算机视觉与自然语言处理技术的不断发展,引入注意力机制的编码器-解码器模型在图像报告自动生成问题中取得了较好的研究成果。而针对医学领域中的图像阅片报告自动生成问题,只有具体病症的描述需要参考图像中的视觉特征,报告中的非视觉语句如医生建议等内容不需要参考图像中的视觉信息来生成。为了解决上述问题,本文提出了一种基于语义与视觉特征的眼底图像阅片报告自适应生成模型,具体所做工作如下:(1)构建基于深度卷积神经网络(Deep Convolutional Neural Network,DCNN)的眼底图像特征提取模型。本文模型的输入为眼底图像数据和与图像相对应的文本数据,由于眼底图像本身质量不够统一和眼底图像特征的特异性,我们设计了针对眼底图像数据的预处理方法,并对文本数据进行中文分词与词频统计处理,之后设置对比实验验证各个因素对DCNN提取眼底图像特征效果的影响。最后实验结果证明,DCNN提取的眼底特征是切实有效的,能为本文后续的眼底图像阅片报告自动生成任务带来准确的特征表达。(2)提出了一种决策自适应图像报告生成模型。针对在生成非视觉语句时无需参考视觉特征的实际问题,本文基于自适应注意力(Adaptive Attention)图像报告生成模型提出了一种改进方法。具体的,本文提出了一种全新的决策机制使生成描述过程中自适应的决策是否利用视觉信息。模型使用经过本研究实验证明对眼底图像特征提取工作有效的残差神经网络(Residual Networks,Res Net)Res Net_50作为图像编码器,使用决策自适应长短期记忆网络(Long Short-Term Memory,LSTM)作为解码器生成图像报告,通过决策模块触发索引以控制生成每一个词语时是否利用带有注意力机制的方法。实验结果表明,该模型在由北京同仁医院提供的眼底图像及描述数据集上的性能超过自适应注意力模型,能较为准确的生成眼底图像阅片报告。(3)提出了一种基于强化学习(Reinforcement learning,RL)的决策自更新图像报告生成模型。针对传统图像描述方法利用交叉熵损失(Cross-Entropy Loss)生成与人工标注尽可能相似的句子容易造成曝光误差(exposure bias)、训练目标与评价指标不相同的问题(loss-evaluation mismatch problem),我们基于本研究提出的决策自适应眼底图像阅片报告生成模型引入强化学习来解决这两个问题,方法使用图像报告自动生成评价指标——CIDEr作为目标函数对模型进行进一步训练,并使决策方法能够进行强化自更新。实验结果表明,引入强化学习的决策自更新方法进一步提高了决策自适应模型的性能。
其他文献
随着全球经济一体化的发展和城市化进程的日益加快,人口的迅速增长和建筑密集化的现象给城市公共交往空间的发展带来一系列亟需被关注和解决的问题。城市空间是市民们用来游憩和传播文化的场所,因此人居环境的可持续发展需要被赋予极大的重视。游憩行为是人们自古以来就有的需求。在高密度城市背景下,经济发展与城市化水平的提高也随之带来生活压力的增大,这使得让人们越来越重视游憩的体验和城市公共空间的品质。游憩空间是城市
学位
近年来,疫情防控导致许多慢性病或急轻症患者不方便去医院就诊,给互联网医疗行业带来了挑战和发展机遇。在线医疗平台可以查询医院或医师信息、相关疾病知识,同时也提供线上问诊和预约挂号等服务,但是多数患者在做出就医选择时,仍然过多关注医院级别和医生名气等,并非是根据自身疾病的具体情况来做出选择。也就是说,在线医疗平台并没有针对患者的情况来进行医生个性化推荐,反而平台中公开展示的医院和医师信息,更容易使得患
学位
氮氧化物(NOx)是造成酸雨、雾霾、光化学烟雾等极端天气现象的元凶,是主要的大气污染物之一,严重危害了生态环境以及人们的身体健康因此,开展氮氧化物治理工作迫在眉睫。氨选择性催化还原技术(NH3-SCR)是应用最为广泛的NOx脱除技术,被广泛应用于工业烟气净化,是实现“大气污染防治行动计划”的主要工程技术,其中催化剂制备是SCR技术的核心。商用V2O5-WO3(MoO3)/TiO2催化剂的传统制备方
学位
近年来,国际环境的不断变化引起了市场环境的急剧变化,给我国供应链管理带来了极大的挑战与运营风险。对于供应链上各企业来说,影响供应链运营效率和各企业绩效的最重要环节除了供给侧的稳定供给之外,需求侧对真实市场需求变化的准确预测更是不可忽视的影响因素。随着市场环境的不断变化,需求侧顾客的需求会产生不确定性。当需求端需求量突然增大时,供应链上下游企业由于存货不足而造成利润损失。而另一方面,当需求量突然减小
学位
伟晶岩型锂铍稀有金属矿是战略性矿产资源;锂铍稀有金属矿石的浮选分离是目前锂矿研究的世界性难题之一。介绍了常见伟晶岩型锂铍稀有金属矿性质及矿物晶体特性,概述了我国伟晶岩型含绿柱石的锂辉石矿石锂铍浮选工艺、浮选药剂及浮选机理等方面研究现状。目前基于浮选药剂作用强化锂铍矿物与脉石表面特性差异,实现锂辉石与绿柱石的高效分离是细粒浸染型含绿柱石伟晶岩型锂辉石矿石主要的分选方法。锂辉石、绿柱石与主要脉石长石和
期刊
“城市是文化的容器”,而公园又作为城市的重要组成部分,因此一个有文化底蕴和人文内涵的公园可以使人们很容易形成对城市的第一印象。随着中国城市化建设向深层次推进,公园景观建设已不能满足人民日益增长的情感需要,人们对于城市公园的要求不仅仅局限于休闲游憩,而更注重文化、意境和情感的需求。目前,各大城市出现千篇一律的公园景观,批量复制又毫无创新,设计停留在视觉表层,造成公园景观风貌趋于一致,文化特色丧失,人
学位
氮杂内酯类化合物是一类化学结构独特的杂环化合物,作为优势的药物骨架结构,在活性天然产物和药物分子结构中广泛存在,如抗炎、抗真菌、抗肿瘤、抗病毒、抗寄生虫等。目前关于氮杂内酯类化合物的报道中,多为大环内酯,而中环内酯类化合物的合成却鲜有报道。因此,氮杂中环内酯类化合物的合成仍然存在较大的发展空间。设计和发展新型高效、环境友好的有机合成方法,构建新颖独特的氮杂中环内酯类化合物,对研制和开发内酯类化合物
学位
在经济学、区域科学和地理学中,空间模型对于实证性问题的分析起着重要的作用。其中讨论最多的是空间自回归模型,它可以用来解决空间数据普遍存在的空间依赖和空间自相关性问题。传统的空间自回归模型认为所有回归变量对因变量的影响都是线性的,然而当非线性分量存在会使得因变量估计误差变大。随着计算机技术的飞速发展,人们获得了体量庞大的观测数据,变量选择成了现代统计分析的热门问题之一。综上,本文研究了参数维数发散的
学位
随着中国经济和技术的快速发展,铁路运输成为主要的货物运输方式之一,其中编组站的编组调度效率影响着货车运输效率,而驼峰缓行器是编组站作业的核心,是我国最重要的驼峰速度控制设备之一,缓行器的性能和可靠性直接关系到调车安全性和运行效率。相较于传统驼峰缓行器,电磁缓行器具有制动速度快、不受气候条件影响、控制精度高、构造简单、维修量小、占用距离短、受车轮状态影响小,并可以在弯道上使用等优点。本文主要针对驼峰
学位
随着社会的进步以及生活质量的提高,人们不再追求能够提供人体所必须营养的食品了,而是追求具有调节和改善人体机能的食品,因此,具有保健功能的食品越来越受到人们的欢迎。本论文以菊科植物小蓟为研究对象,从药食两用保健品的开发角度出发,通过进行小蓟中总黄酮含量的测定和小蓟中蒙花苷含量的测定、胶囊的制备工艺研究、质量评价以及抗氧化活性的测定,以期为小蓟药食两用保健品的开发研究奠定基础。本论文的主要研究内容如下
学位