肿瘤亚型长尾分布下病理区域预测算法的研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:nimadehundan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在医学临床研究中,病理影像是医生诊断癌症的基础。随着数字切片技术的发展,全视野的数字化病理图像相较于传统玻璃切片,可以在不同倍率下清晰地表示出细胞信息。但每一张病理图像仍然需要病理专家认真地读片,并没有降低医生在诊断方面耗费的时间与精力。随着计算机硬件与人工智能技术的发展,将深度学习与病理图像相结合一方面可以用于预测病理图像中的肿瘤区域或其他目标区域,另一方面可以用于挖掘病理图像中隐藏的疾病特征并进行预后因素的探索,在临床中的意义重大。使用深度学习模型预测病理图像中的肿瘤区域已经被证实是有效的,但肿瘤存在很多的亚型,罕见的肿瘤亚型由于样本量不足导致网络模型的特征表示很容易偏向于常见的肿瘤亚型,所以在预测罕见亚型的肿瘤区域时敏感性较低,进而造成漏诊。这种常见肿瘤亚型占据大部分样本,而罕见肿瘤亚型占据少部分样本的数据分布在学术界被称为长尾分布。但本文数据集与公共数据集的长尾分布有着本质的不同:尽管不同亚型之间发生了长尾分布,但它们的非肿瘤区域或肿瘤区域仍然属于相同的标签。由于非肿瘤区域都为特征一致的正常细胞,而肿瘤区域的肿瘤细胞存在特征上的差异性与多样性,所以肿瘤亚型长尾分布对于深度学习模型指标的影响只体现在肿瘤区域中。因此,本文的研究目标是在深度学习模型能够保证预测病理图像中病理区域整体准确率和整体特异性的前提下,提升预测罕见亚型肿瘤区域的敏感性,主要研究工作如下:1)针对高分辨率的胃癌病理图像作为深度学习模型的输入会导致参数量和浮点计算量大幅提升的问题,本文结合大津法与医生提供的标注信息将其预处理为256*256的patch图像作为网络的输入,通过patch图像级别的分类实现病理图像级别的区域预测。2)针对数据集中肿瘤区域内亚型的长尾分布会导致模型预测不平衡的问题,本文基于最优基准模型,将数据重采样、损失重加权、Mixup数据增强、解耦两阶段训练和双边分支的算法进行了改进与扩展,设计与实现了一系列在肿瘤区域内基于平衡亚型长尾分布算法的模型,并进行了大量实验。3)针对基于平衡亚型长尾分布算法的模型在指标上虽有提升但仍不能满足研究目标的问题,在深入分析实验结果后,本文基于最优基准模型,首先提出了基于对比学习的算法来拉近不同亚型在肿瘤区域的特征表示,其次提出了单阶段训练的多专家模型,可以在同一模型的单阶段训练中得到数据分布具有差异性的不同子网络,最后将两者结合,提出了基于对比学习的多专家模型Con Exp Net,并进行了消融实验。本文的研究经过大量实验,Con Exp Net在保证整体准确率和整体特异性(85%以上)的前提下,将预测不同亚型肿瘤区域的最低敏感性从基准模型的69.8%提升到了83.8%,达到了本文的研究目标。
其他文献
目标检测是实现重点区域监测、城市管理的重要手段,广泛应用于人脸识别、自动驾驶、军事安防等领域。多源传感器信息融合的目标检测技术能够充分发挥各传感器的检测优势,提高目标检测准确性和鲁棒性,其中毫米波雷达与相机传感器凭借成本以及性能优势成为传感器融合的主流趋势。Center Fusion是目前业界主流的雷达与相机信息融合的目标检测算法,能够实现三维目标检测以及目标运动状态预测,但仍存在以下问题:Cen
学位
自步入21世纪,无线通讯技术得到了飞速的发展。而在信息数据爆炸的今天,常用通信设备的工作频段大都集中在了8 GHz以下。为了解决频带拥挤的问题,同时为了追求更高速的传输效率,无线通讯技术已朝着更高频率的毫米波频段前进。无线通信的实现必定离不开无线接收机,低噪声放大器(Low Noise Amplifier,LNA)作为无线接收机的第一级有源电路,起着放大信号、抑制噪声的作用,其性能的好坏对整个接收
学位
在移动终端、边缘推理等领域快速发展的当下,人们期待人工智能芯片不仅可以提供充足的算力,而且具有极低的功耗开销,即高能效神经网络加速器人工智能芯片。本文基于多权重多线程执行模型人工智能计算架构,利用逻辑复用、逻辑复制、流水线等数字芯片设计思想,设计优化高能效神经网络加速器芯片计算核心模块。具体来说,1)采用逻辑复用和流水线设计方法,优化人工智能计算架构内组合逻辑资源,相较于基准架构,降低组合逻辑面积
学位
FPGA拥有设计灵活、修改方便、开发成本低、开发周期短等众多优点,因此在通信、军事、航天、无人驾驶等领域均有愈发广泛的应用。FPGA的开发需要用到相应EDA软件。而目前商用的FPGA EDA软件主要由Xilinx和Intel等国外大公司垄断。这种垄断会形成技术依赖,也会存在断供的风险。在学术上,以VTR为代表的EDA软件主要面向简单的理论模型,且其流程做到布线即止,难以用于复杂的实际芯片。因此,研
学位
功率放大器在射频收发系统中起到重要作用,是无线通信系统中最重要的模块之一,本文中所设计的功率放大器是相控阵芯片的一个模块,其性能好坏对于系统至关重要,对整个通信收发系统的性能影响很大。本论文基于IBM 0.13μm Si Ge Bi CMOS8XP工艺,设计了两款工作在92-96 GHz频段内的功率放大器。仿真结果表明,本论文所设计的两种功放在关键指标上均较好的满足了设计要求和应用需求。针对W波段
学位
目标跟踪是计算机视觉领域的一个重要课题,在安防监控、视觉导航、医疗诊断、军事制导等方面有广泛应用前景。然而,由于目标运动过程中会出现多尺度变化、遮挡干扰等问题,现有目标跟踪算法并不能同时有效应对多种问题。本文聚焦于跟踪过程中目标多尺度变化和遮挡干扰问题展开研究,旨在通过借鉴目标检测领域相关技术提升跟踪器精度,实现跟踪器有效、稳定运行。(1)针对目标跟踪过程中的多尺度变化问题,结合多层特征融合思想,
学位
单细胞转录组测序技术的发明使得对细胞的研究从之前Bluk测序的群细胞水平上升到单个细胞水平。随着技术的日益成熟,单个细胞的测序成本也大幅下降,越来越多的大规模数据被测出。更大规模的数据可以让研究人员更深入的探究细胞间的差异,发现未知的细胞类型。聚类作为单细胞转录组研究中用于细胞类型识别最常用方法,是单细胞数据后续深入研究的基础,但是随着数据规模的增长,现阶段的聚类算法已经出现运行效率低以及不能正常
学位
染色质结构在基因调控与细胞功能中发挥着重要的作用,目前对于单细胞染色质结构的研究有基于图像和染色质构象捕获技术(Hi-C)等方法,这些方法能够捕获全基因组范围内基因的相互作用信息。传统的染色质结构研究认为染色质在细胞核中形成了一种从最小的染色质环(Loop)到拓扑相关结构域(TAD)、从TAD到A/B区室、从区室到染色体疆域的从小到大的层级关系。通过染色质相互作用数据准确地识别各个结构在细胞基因组
学位
目前,资本市场对于国家的经济发展非常重要,特别是在经济和储蓄水平不是很高的泰国。资本市场有助于刺激和推动经济增长更快,并对增加收入和提高国家生活水平产生影响。根据每年决定投资股票市场的新进入投资者数量,股票市场已经成为了泰国人民获得收益的热门渠道之一。此外,上市公司应了解投资者的行为以及决定投资股票的因素。因此,本研究的目的集中在影响投资股票市场决策的人口特征因素与投资行为之间的关系。研究的主要目
学位
伴随着5G技术的快速发展,多媒体视频信息量呈现爆炸式增长。视频技术正在突破传统的二维平面类向空间自由视角方向上演进,它给人们带来高清、可交互的视频观影体验。自由视角视频技术的突破将改变人与媒体的交互方式,在5G超高清视频、体育、综艺、智慧场馆、直播等场景具有重大应用价值。中国超高清视频产业联盟发布的《5G超高清新场景白皮书》指出:超高清视频业务是5G早期研究场景中最具吸引力的方向。其中自由视角视频
学位