复杂场景下特征增强的显著性目标检测方法

来源 :华南理工大学学报(自然科学版) | 被引量 : 0次 | 上传用户:lkekej1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全卷积神经网络(FCN)高效的特征提取能力极大地提升了显著性目标检测算法的性能.然而现有算法依靠简单的特征拼接或相加等融合策略无法有效地增强特征,导致算法在复杂场景中的目标误检和漏检问题依然突出.文中提出基于场景的针对性特征增强方法来提高显著性目标检测算法的性能.首先,目标误检多发生于背景复杂且目标和背景元素交织的场景,文中分别从特征全局性增强和特征结构化增强角度解决目标误检问题;其次,针对目标漏检一般发生在目标的内部和边缘,基于残差学习从背景中学习丢失目标的信息,修复丢失的目标内部和边缘区域;最后,在5个基准数据集上与其他13种先进的方法进行实验对比,结果表明文中所提模型的各性能评价指标均优于其他13种方法,显著地解决了复杂场景中的目标误检和漏检问题.
其他文献
现有基于深度学习的语音带宽扩展算法中,时域算法语音特征提取不够精确,训练数据量大;频域算法对数功率谱特征提取未重视帧与帧之间的信息关联,频率轴数为奇数,不便于加深网络深度,且忽略时域信息;时频两域算法模型相对复杂.针对以上问题,文中提出了一种基于Flatten-CNN的语音带宽扩展算法.首先,为了充分利用语音特征和减少数据量,文中算法基于频域运行;其次,为了利用对数功率谱时间轴信息,提出了一种改进的编码器,通过引入平铺层,实现对数功率谱时频两轴特征提取;接着,为了加深网络深度,在频率轴数据处理时去掉最后一
5G的发展推动了通讯设备的小型化、集成化,也带来了新的电磁兼容问题,而将频率选择表面(FSS)引入设备可显著减少设备之间的干扰.为克服传统FSS设计方法效率低、质量差和依赖经验等缺陷,提出了一种新型FSS形状优化方法.该方法根据FSS的形状特性,提出了在极坐标系下分区定义形状优化参数的策略,并基于遗传算法实现了FSS优化参数的智能搜索,实现了以工作频率和电磁屏蔽性能为目标的FSS单元形状智能优化.采用实心单元、环形单元和缝隙单元3种结构类型算例进行验证,结果表明,优化后FSS谐振频率向28 GHz移动且电
触觉传感器因可以模仿人类皮肤感知外界信息而获得广泛的关注和研究,其中基于纳米ZnO的触感传感器及其阵列因具有高灵敏度、高机械强度、高柔韧性、生物兼容性好、低成本工艺等优点,在仿生机器人、人机交互、生物医学和可穿戴电子设备等领域具有广阔的应用前景.文中首先介绍了纳米ZnO触觉传感器基于压电效应的传感机理及其主要制备方法,然后从压电性能优化、多功能化、集成化、阵列化4个方面系统概述了纳米ZnO压电触觉传感器的研究进展,列举了相关技术领域与研究方向的最新成果,并讨论了ZnO触觉传感器在应力成像、人体运动和生理健
生物滴滤池的生物活性决定着一个生物处理厂有机废气处理系统的处理能力,而影响活性的最重要因素就是其中的微生物菌群.为了解生物滴滤池中微生物群落结构、多样性及相对丰度,利用宏基因组技术,对挥发性有机物处理系统中生物滴滤池的填料固形物的微生物多样性进行分析.结果显示,生物滴滤池活性污泥中,细菌、真核生物、古菌、病毒的相对丰度分别为89.34%、1.99%、1.06%、0.03%,共检测出微生物75门、195纲、395目、752科、1798属.其中,细菌主要分布为变形菌门(Proteobacteria)、放线菌门
音乐源分离在音乐信息检索领域有着重要的研究价值.传统音乐源分离方法存在依赖假设、模型复杂度有限、表示能力不足等问题.能应对这些问题的时域深度学习端到端网络模型训练耗时长,且分离性能有待提升.为进一步改善时域端到端分离模型的表示能力和计算效率,在目前时域分离性能最优的Demucs模型基础上进行改进,提出了一种端对端网络Unet-SE-BiSRU.该模型在广义编码层和解码层中引入了注意力机制,采用挤压-激励块(SE)根据待分离音频的种类有选择地提取特征;在一维卷积后增加组归一化,以应对在学习过程中可能出现的梯
文中从隐写方法遵循的最小化失真或最大熵原则出发,将嵌入概率的最优分布作为先验知识来指导视频隐写分析.为更好地刻画运动向量的嵌入优先级,从视频的运动特征、纹理特征以及编码框架下的局部最优性定义失真函数,并利用Gibbs分布估计运动向量的嵌入概率.据此提出一种利用嵌入概率对检测特征进行定量增强的方法,并从相对熵的角度对增强的原理进行了解释.实验结果表明,3种经典的隐写分析算法在使用文中特征增强方法后,检测准确率均有提升,且对码率具有鲁棒性.与新型深度神经网络VSRNet检测方法的对比结果也验证了文中方法的有效
受台风暴雨影响,浙南林溪流域滑坡频发.针对该区域滑坡规模小、长度与厚度比值大的特点,采用浅层滑坡稳定性模型(SHALSTAB)对潜在滑坡进行了预测,以log(降雨量q/土壤的导水系数T)作为划分标准,结果显示随着log(q/T)值的提高,预测的滑坡区域逐渐扩大,预测捕获率升高的同时,误判率也随之上升.以log(q/T)≤-3.1作为预测滑坡的判别标准,模型效果较好,预测捕获率为62.50%,误判率(17.79%)较低.预测结果显示,滑坡潜在区域主要位于斜坡下部、土体厚度大和坡度陡峭的地区,山体顶部、土体厚
文中主要探究裂褶多糖硫酸酯化的制备工艺及其抗凝血活性.采用单因素实验、响应面法优化三氧化硫-吡啶法制备硫酸酯化裂褶多糖(S-SPG)的工艺,并通过APTT(活化部分凝血活酶时间)、TT(凝血酶时间)、PT(凝血酶原时间)经典凝血实验探究其抗凝血功能.结果表明:当三氧化硫-吡啶复合物与裂褶多糖的质量比为4、反应温度为70℃、反应时间为3 h时,S-SPG的取代度最高,为1.85.红外光谱和13 C核磁数据表明裂褶多糖成功引入了硫酸基团.抗凝血实验表明,裂褶多糖经硫酸酯化后具有较强的抗凝血活性,对APTT、T
以大米蛋白粉为原料,通过二步酶解法制备大米低聚肽,在对其基础理化成分分析的基础上,利用氨基酸组成、相对分子质量分布、扫描电镜、紫外光谱和圆二色光谱分析进行结构表征,采用羟基自由基清除能力、铁离子还原能力(FRAP)、氧自由基吸收能力(ORAC)和还原能力4种体外抗氧化评价体系考察其体外抗氧化作用.结果表明:大米低聚肽中蛋白质和肽含量分别为95.75% ±0.53%和89.11% ±0.94%;大米低聚肽富含亮氨酸、丙氨酸、缬氨酸等抗氧化性氨基酸,相对分子质量在1000以下的组分占91.84%;大米低聚肽为
为探究金华市某岩质滑坡成因机制,多方面分析表明该滑坡是在固有内部因素条件下由地下水活动诱发产生的.为评价滑坡发展趋势,解决陈旧信息和波动性数据造成的传统灰色GM(1,1)模型预测精度较低的问题,提出一种利用动态新陈代谢和马尔科夫模型对原始灰色GM(1,1)模型改进的方法.通过新陈代谢理论来实现数据的动态更新,使得灰色GM(1,1)动态模型的预测值更加接近最新的变化趋势.利用马尔科夫模型对得到的灰色动态新陈代谢GM(1,1)模型预测值进行修正,提高了模型的预测精度.预测结果表明,灰色-马尔科夫动态新陈代谢G