基于深度学习的图像稠密预测研究及应用

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:longxue1211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像的稠密预测(Image Dense Prediction)是为图像中的每个像素做出预测,它是计算机视觉领域的一个重要研究方向,图像分割就是其代表性的例子。此外,关键点的预测和其它一些应用也通常采用稠密预测的方式。随着近几年深度学习方法的发展与应用,图像的稠密预测相关研究也取得了很大的进步,并且有不少方法在工业界得到应用。本论文的研究将基于深度学习的图像稠密预测应用于两个领域:多人人体姿态估计与视网膜眼底水肿区域分割。首先,对于自顶向下的多人姿态估计策略,提出了基于空间注意力机制的全分辨率单人姿态估计方法,利用空间注意力机制来融合多尺度特征,把特征图恢复到原图像尺寸从而减少因下采样带来的精度损失。然后,提出了一种自底向上的多人姿态估计新方法。它包括一个轻量级的堆叠沙漏网络,以及结合关节点及其偏移预测的关节点组装算法,极大的减少了网络模型的计算量,使得该多人姿态估计算法达到实时运行速度。最后,对于视网膜眼底图像,提出了能同时进行多种病变分割与分类的U型结构网络,其中利用了并行注意力模块来增加小区域的可识别性,并且针对性的改进了损失函数来更好地解决类别不均衡问题。该方法取得了AIChallenger 2018竞赛的冠军。本论文的主要贡献如下:(1)自顶向下的多人姿态估计先检测出每个人体区域,然后对其中每个人进行姿态估计。本文为此提出了一种单人姿态估计网络来提高关节点的定位精度。它采用了一个全分辨率的编码器—解码器结构来减少了因尺度伸缩量化带来的误差,利用全局上下文模块对编码器和解码器进行了优化,并结合了空间热度图和多尺度特征来更好地获取关节点局部信息。以轻量级的ResNet34为骨架网络,该方法在MSCOCO数据集上达到了72.5%的mAP。(2)本文提出了一个高效的自底向上的多人姿态估计算法,其中提出的轻量级堆叠沙漏网络模型极大的减少了模型的参数和计算量,并且在模型中融入了多感受野机制来适应图像中不同尺度的目标,进一步结合基于关节点及其偏移预测的高效关节点组装算法,使得该算法在做到轻量与实时的同时,依然能够达到与目前优秀算法相当的精度,在MPII多人数据集上达到了81.0%的mAP。(3)本文为视网膜眼底图像辅助诊断,提出了能同时进行多种病变分割与分类的U型结构网络。利用并行注意力模块针对性地优化小区域的病变检测问题,通过特征编码的方式改进了特征图向量化的过程,针对数据中的病变类别不均衡的问题改进了损失函数。该网络病变分类的AUC达到99.38%,病变分割精度达到76.12%的Dice,并取得了2018年度AIChallenger竞赛该赛道的第一名。
其他文献
本文希望厘清Amihud(2002)非流动性指标被定价的原因是“非流动性补偿”还是“错误定价”。本文将高Amihud组合和低Amihud组合的预期收益率之差定义为“Amihud溢价”,然后探讨了它的形成机制。首先,本文分析了2007-2018年的月度数据,证实A股市场存在稳健的“Amihud溢价”,它同时具有经济和统计意义上的显著性,而且在不同行业、市场环境和月份下都存在。进一步的分析表明“Ami
锗酸盐激光玻璃具有稀土离子溶解度高、声子能量较低、物化和机械性能优异、抗激光损伤阈值高和红外透过范围较宽等特点,有望应用于通信、光纤激光器及传感等领域,近年来备受
绿色气球菌(Aerococcus viridans)为革兰氏阳性球菌,是一种重要的人畜共患病原菌,在环境中普遍存在,可以引起人和动物的多种感染甚至死亡。在兽医临床上,绿色气球菌可引起猪的脑膜炎、肺炎、尿路感染和关节炎等,此外,该菌还可引起牛临床和亚临床乳腺炎。但由于该菌与肠球菌和链球菌的形态及生化特征很相似,所以前期绿色气球菌多被误判为这两种细菌。近年来,由于鉴定方法的完善,越来越多的绿色气球菌被
分布式拒绝服务(Distributed Denial of Service,DDoS)攻击是攻击者通过控制大量僵尸主机,对一个或多个目标同时发动攻击,消耗攻击目标的服务器资源和网络带宽资源,使目标主
扭超势与连通分次Frobenius代数存在确定的一一对应关系,可以通过一个扭超势建构一个连通分次Frobenius代数.本文推广了这一结论,讨论了由箭图诱导的分次Frobenius代数,说明
随着重金属污染土壤面积不断扩大,导致我国农作物种植受到不同程度影响。农作物从土壤中吸收的重金属积累在体内,并通过食物链传递,进入人体内,对人类健康构成了严重的威胁。
在庆祝中国共产党成立95周年大会的讲话上,习近平对文化自信特别加以阐释,指出“文化自信,是更基础、更广泛、更深厚的自信”。文化自信成为继道路自信、理论自信和制度自信
线性判别分析是最经典的统计学习方法之一。LDA具有诸多魅力,如:在样本容量较小时,相较逻辑回归,LDA具有更好的渐近效率和更稳定的估计;当数据服从多元正态分布时,LDA又被证明是贝叶斯最优分类器,并且中心极限定理的存在使得这个性质尤其具有吸引力。但当面临非线性可分场合、多原型混合、小样本高维特征这三种场景时,LDA不再适用。本文主要针对非线性可分场景的判别分析拟合进行研究,我们提出了特征扩维判别分
随着加密数据库关键字搜索功能的开发与使用,可搜索加密的相关研究在实际应用中具有重要意义,能够实现在不可信的云服务器上对已加密的数据进行存储和搜索。动态可搜索对称加密不仅支持在不可信的云服务器端实现关键字搜索操作,还支持数据库的实体更新操作,包括添加和删除。现有的动态可搜索对称加密方案大多仅涉及对单次操作内的泄露问题提出解决方案,在多次操作之间的信息泄露问题中仅仅定义了前后向安全,保证刚添加的文档不
近年来,网络化奇异系统,在电力系统、航空航天、控制等领域得到了广泛应用,与此同时也面临着通信资源短缺的难题。传统的时间触发机制已经不能满足节省通信资源的需求,为了提高通信资源的利用率,越来越多的学者们开始研究基于事件触发机制的网络控制系统,目前已有许多成果被报道,然而基于事件触发的网络化奇异系统却很少有学者研究。随着网络的日益开放,网络化奇异系统更容易受到拒绝服务攻击(Denial-of-Serv