基于哈希与敏感度的下采样不平衡分类算法及其在大规模病理图像分类中的应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:dxw2814
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症的早期发现和诊断在病人的治疗和护理中起着至关重要的作用。组织病理学分析是目前诊断癌前病变的金标准。然而,由于外观、异质结构和纹理的变化,人工评估大规模组织病理学癌症费时费力,而且往往依赖于人的主观解释。近年来,随着载玻片扫描技术的进步和数字存储成本的降低,将组织病理学染色切片制作成数字化的全玻片病理学图像(Whole Slide Image,WSI)并开发计算机辅助系统引起了广泛的关注。在实际应用中需要在整个WSI水平上提供肿瘤增殖评估。直接在千兆像素的WSI上诊断和定位肿瘤转移是不可取的,因为这需要大量的内存消耗。现有技术通常将WSI分割成小块图片进行进一步分类。由于良性样本的数目远大于恶性样本的数目,类别不平衡问题严重影响了分类性能。数据重采样是医学乃至机器学习领域最常用的解决不平衡分类的方法。然而,现有的重采样方法通常采用基于距离的邻域关系来提取数据的分布信息,对于大规模高维的数据集,应用这种类型的方法会带来极低的计算效率。在包含有噪声的数据集中,少数类的表达能力不足,基于邻域的重采样方法很容易被噪声所干扰,导致重采样策略不合理。针对当前重采样方法的不足,本文将神经网络分类器训练与采样结合,提出了一种基于哈希与敏感度的在线加权采样的算法。本文所提出算法的主要思想是通过赋予较高随机敏感度的样本更高的权重,挑选出对当前分类器来说更有价值的样本。该方案不需要计算样本之间的距离,使得算法非常适合处理大规模高维数据集。此外,该方案无须丢弃样本,在一定程度上克服了传统下采样直接丢弃样本造成信息损失的缺点。本文进行了多组实验,实验结果显示本文所提出的算法在处理大规模组织病理学图像不平衡数据时具有更好的分类性能,同时具有更高的效率。
其他文献
AGV移动机器人在现代工业物流领域实现高速化、信息化与智能化的过程中发挥着重要作用,路径跟踪控制作为AGV系统的核心技术,近年来也得到了广泛的关注。滑模控制算法是一种有效针对非线性系统且具有较强鲁棒性的控制方法,但该算法最大的不足在于易引起控制系统的抖振现象。本文借助RBF神经网络与PSO等智能算法,研究滑模控制器的抖振抑制与AGV路径跟踪效果的最优化,突破滑模控制算法在AGV运动控制领域的应用限
发动机前端附件驱动(Front End Accessory Drive,FEAD)系统是发动机重要组成部分,由驱动轮、附件轮、传动带、张紧器等元件组成。多楔带在系统工作过程中受到发动机曲轴扭振激励,表现出横向振动、纵向振动、侧向振动等振动及多种振动的耦合形式,其中带的横向振动增大发动机前端的噪声、降低带的寿命、影响FEAD系统的可靠性,对带的横向振动研究具有重要意义。针对FEAD系统,本文开展了如
水性聚氨酯丙烯酸酯(Waterborne Polyurethane Acrylate,WPUA)目前已在木器家具、皮革、纸张的涂装领域得到广泛应用,但由于基体树脂内含有大量亲水基团而使涂层的吸湿率较高,影响了材料的使用寿命。针对目前WPUA普遍存在耐水性能不佳的缺陷,论文在光固化WPUA的分子基本结构与组成的基础上,通过增加WPUA的交联密度及引入低表面能疏水链段的方式进行分子设计,以改善WPUA
中性粒细胞胞外诱捕网(NETs)在调节免疫血栓的形成过程中扮演着重要角色。感染条件下,关于血管内NETs的形成,目前研究多数聚焦于活化的血小板介导中性粒细胞形成NETs的机制研究,然而内皮细胞介导NETs形成的研究相对较少。在感染条件下,血管内皮细胞显著表达ICAM-1分子,中性粒细胞与血管内皮细胞ICAM-1直接相互作用能否可以引起NETs的产生,此过程中介导NETs形成的机制如何,目前尚未明晰
目的脓毒症(Sepsis)是临床常见的危急重症,主要表现为多器官功能障碍。据统计,全球每年有超过3000万例sepsis患者,其中重症者占50%以上,合并心肌损伤是sepsis患者死亡的重要原因。褪黑素(Melatonin,MT)是一种被广泛研究和探讨的神经内分泌激素,该激素主要由松果体加工与合成。既往的研究表明,人类的睡眠周期、生殖系统的功能维持以及日常情绪的调节都有MT的参与。近年来有研究表明
4G/5G的出现驱动了移动边缘计算(MEC)和移动群智感知(MCS)的发展,其中边缘服务器部署、服务部署以及感知任务分配等问题受到学术界的广泛关注。本文将结合聚类算法、非线性规划、次模优化理论等对MEC的边缘服务器部署和服务部署及MCS的任务分配进行研究。主要包含的工作有:(1)提出一种联合边缘服务器部署和服务部署的两步算法,考虑MEC平台的经济效益。移动边缘计算中同时考虑边缘服务器和服务部署的研
随着现代城市化的快速发展、城市的空间格局以及人们生产、生活方式的改变,给公众健康带来了严峻挑战。相关研究表明健康活动是主要的健康行为方式,能够有效预防并控制多种慢行疾病的发生与发展。在此背景下,“健康促进”开始作为城市发展的目标得到广泛关注,促使市民开展户外健康活动是其重要议题。城市滨水空间作为城市公共开放空间的重要组成部分,在承载生态服务、城市形象展示等功能的同时亦是市民开展舒缓休憩、运动休闲、
肺癌是危害全体人类健康与安全的重大疾病,而肺结节的早期筛查与诊断能有效的降低肺癌死亡率,因此对肺结节识别的研究具有重大意义。CT(Computed Tomography)扫描图像由于其成像快、图像清晰等优点,在肺结节识别研究上更具优势。目前,基于深度学习的肺结节识别算法存在以下问题:CT图像环境复杂、小肺结节在高层深度特征图中丢失、检测结果假阳性率高。因此,本文研究了一种两阶段的基于反向连接与多视
CsPbBr3荧光粉具有光谱极窄、色纯度高等优点,在宽色域显示等领域具有重要应用前景。然而,低下的稳定性与封装性能严重制约了其实际应用,与CsPbBr3晶体粒径匹配的微尺度封装结构设计与制造是解决上述难题的关键。为此,本文提出了气凝胶多孔结构CsPbBr3荧光粉封装方法,研究了多孔结构CsPbBr3荧光粉的封装机理及光学性能,最后制成荧光膜并应用于LED器件,主要内容如下:(1)气凝胶多孔结构Cs
随着分布式可再生能源的发展,更适合分布式能源的直流微电网逐渐兴起。双向DC-DC变换器作为主要的连接设备在直流微电网中起着能量交换和稳定直流母线电压的作用,但随着应用范围的扩大,其面临着电压电流应力过大、回流功率过大、电能传输损耗大等问题。三电平半桥结构能有效降低变换器开关管电压应力,本文以双向三电平半桥DC-DC变换器为研究目标,通过对移相控制进行优化,提高双向DC-DC变换器的工作性能,包括降