【摘 要】
:
在当前大数据时代,大量的医学影像没有得到有效利用。而在医疗、教育以及科研等领域却亟需大量经过标注的数据,因此需要一种技术对医学影像进行标注。然而使用手动标注的方法耗时耗力且需要医学专业人士才能完成,人工智能技术的兴起为医学影像的自动标注带来了福音。传统的自动标注方法仅仅使用了图像单一模态的数据,与图像数据紧密相关的诊断报告却未得到使用。因此本文提出了一种利用跨模态方法进行医学影像自动标注的技术,重
论文部分内容阅读
在当前大数据时代,大量的医学影像没有得到有效利用。而在医疗、教育以及科研等领域却亟需大量经过标注的数据,因此需要一种技术对医学影像进行标注。然而使用手动标注的方法耗时耗力且需要医学专业人士才能完成,人工智能技术的兴起为医学影像的自动标注带来了福音。传统的自动标注方法仅仅使用了图像单一模态的数据,与图像数据紧密相关的诊断报告却未得到使用。因此本文提出了一种利用跨模态方法进行医学影像自动标注的技术,重点研究如何利用图像和文本两种模态的数据进行自动标注,本文的研究内容包括以下几点:1)针对多种模态数据在神经网络中的融合方式和融合时机进行研究,探索不同融合方式和融合时机对任务结果的影响,为后续的跨模态医学影像自动标注提供基础;2)针对医学影像中的疾病类型进行自动标注研究。由于疾病类型是一种图像级别的标签,所以本文将使用图像分类的方法,研究模态内部的病灶关联性以及模态之间的病灶关联性,并且基于这两种关联性提出一种关联性学习方法,以更好的融合两种模态的特征,从而提高疾病类型的自动标注效果;3)针对医学影像中的病灶位置进行自动标注研究。由于病灶位置是一种像素级别的标签,所以本文将使用图像分割的方法,研究单个病灶的位置、形状、大小等等细节信息对标注的影响,然后基于这种影响设想使用文本信息进行辅助分割,并基于这种设想提出了互感知特征融合方法,使图像特征在文本特征的辅助下可以更好地提取出病灶细节,从而提高病灶位置的自动标注效果;4)针对眼底领域的需求,根据上述两项研究,研发出了一款跨模态的眼底图像自动标注原型系统,该系统既可以对眼底图像中的四种常见疾病类型进行标注,也可以对眼底图像中的高荧光进行标注,该系统为上述研究的转化提供了例证。
其他文献
字符识别是受到学术界和工业界重视的技术,需要根据针对性的场景设定和模型设计来解决相关实际问题。芯片字符识别作为字符识别的一种特殊场景,可以解决工业缺陷检测、自动化配装芯片等广泛性的工业问题。早期芯片字符识别方法,例如模板匹配等,只能在固定字体和固定场景发挥效果,但近年来随着深度学习算法的扩展和显卡浮点性能的增加,深度学习模型能够识别更多相似字体和更多场景的芯片,但深度学习模型的高精度基本建立在大量
移动边缘计算(Mobile Edge Computation,MEC)通过将计算资源部署到网络边缘,在地理上缩短了与用户的距离,可以就近处理用户的请求,避免了漫长的网络传输,从而提高服务的响应速度。由于边缘节点部署在网络边缘,单个节点的覆盖范围相对有限,因此用户的移动就有可能导致用户离开当前节点的覆盖范围而进入另外一个节点的覆盖范围。当用户从一个节点的覆盖范围进入另外一个节点的覆盖范围时,为了保证
本文以舰船、飞机等大型复杂装备电磁干扰现场检测为背景,把现场检测中的电磁干扰信号分类识别作为研究课题。针对大型装备面临的电磁干扰现场检测与故障模块查找问题,设计了一套EMI信号分类识别系统,构建大型装备电磁干扰现场检测案例库,进行EMI信号采集与特征分析、故障模块定位。首先,介绍了该系统应用场景、技术指标和软硬件构成,对系统中涉及的虚拟暗室、特征提取、模板匹配等相关技术进行了分析。其次,针对系统中
基于参量阵原理的屏幕定向扬声器是一种能够同时呈现画面和产生高度指向性可听声的新型屏幕扬声器,它利用超声波在介质中自解调产生定向可听声。由于介质的自解调过程是非线性的,受温度、湿度、信号处理算法和屏幕定向扬声器本身特性等多种因素的影响,导致屏幕定向扬声器解调出的可听声存在失真,对设备的音质有较大影响,因此本论文主要围绕屏幕定向扬声器的谐波失真进行研究,为便携式设备的屏幕定向扬声器实现高保真音质提供一
随着人机对话技术的不断发展,各种各样的智能对话系统层出不穷,如:领域问答系统、闲聊机器人、终端导航机器人等智能产品,很大程度上方便了人们的日常生活。在各种类型的对话系统中,任务型对话系统是一个重要分支,主要通过多轮交互解决用户在某个领域遇到的问题,提高业务办理效率,减少人工参与。本文针对金融领域任务型对话系统的用户意图识别进行研究,包含领域分词优化、对话意图识别以及融合意图识别的智能对话系统的设计
矩阵积和式是一种常用的矩阵不变量,在组合计数、统计检验、无线通讯、统计物理、分子化学等领域有重要的应用。积和式的定义与行列式相似,但是它的计算复杂性远远高于行列式。英国理论计算机科学家Valiant在1979年证明积和式计算是组合计数中的#P完全问题,即其难度不低于组合优化中的NP完全问题。迄今为止,对一般矩阵最为有效的积和式精确算法是Ryser基于容斥原理所建立,其计算复杂性为O(n2n-1)。
随着互联网时代的到来与发展,为大数据、云计算、人工智能等新兴技术提供了肥沃的土壤,同时也为各行各业带来了新的变革与推动。教育作为民族振兴、社会进步的基石,一直是我国优先、重点发展的行业。长期以来,我国教育面临的突出矛盾是人们对高质量个性化教育服务的迫切需求与优质教育资源供给的严重不足,针对教育资源供给侧的创新和个性化教育服务新模式的探索是当前教育改革与发展所面临的重大课题。本文搭建支持矩阵自动推理
语义匹配技术备受关注,成为了当前自然语言处理技术应用领域热点话题之一,在问答系统以及信息检索等领域拥有着广泛的应用场景。目前,最热门的语义匹配模型为基于BERT的微调模型,但是大多数基于BERT模型的语义匹配技术由于采用统一注意力机制,对于句式复杂的文本语义信息抽取不够充分,导致对句子语义的理解存在偏差;同时,BERT模型规模庞大,计算量着实惊人,仅仅单个样本计算一次的开销动辄上百毫秒,在严格的延
随着科技水平的进步,视频数据在人们的日常生活中占据着越来越重要的地位。视频中存在着大量的文字信息,对其进行提取有助于视频内容的审核以及视频内容归纳分类。而视频文字检测识别技术能很好的满足对于大量视频内容提取与审核等方面的需求。相比于人工,借助视频文字检测识别技术进行视频内容提取与审核等工作,能够大幅提高效率并降低人力成本。本文基于深度学习技术,对视频文字检测算法和视频文字识别算法进行了研究,设计实
对于医学图像分割任务来说,传统的手工方法依托于医生的经验知识,不仅耗时耗力而且分割精度也没有保证。而随着计算机技术的发展,依托于深度学习的自动化分割方法在各个领域显示出了自己独特的优势,于是有了将深度学习与医学图像相结合来实现自动化医学图像分割的技术。在此背景之下,本文以深度学习为工具探索生成式对抗网络在脑肿瘤分割中的应用,主要工作如下:(1)从多尺度特征的角度出发实现了一个基于并行多尺度的生成对