【摘 要】
:
针对现有算法的多尺度特征融合效果不理想和全局信息利用不充分的问题,提出一种基于多尺度优化和全局注意力的显著目标检测模型.利用特征增强模块对从骨干网络VGG-16中提取出来的粗糙特征进行增强,提升特征的显著性表达能力,对不同层次特征融合得到高层级和低层级特征;设计全局注意力模块,利用空洞空间卷积池化金字塔ASPP模块提取全局信息,计算特征的通道权重;利用通道权重引导侧输出进行特征学习能力提升,通过逐层连接方式得到最终预测结果.该方法在5个常用的数据集上进行测试,并与9种相关方法进行比较.实验结果表明,该模型
【机 构】
:
上海应用技术大学计算机科学与信息工程学院 上海201418;华东理工大学信息科学与工程学院 上海200237
论文部分内容阅读
针对现有算法的多尺度特征融合效果不理想和全局信息利用不充分的问题,提出一种基于多尺度优化和全局注意力的显著目标检测模型.利用特征增强模块对从骨干网络VGG-16中提取出来的粗糙特征进行增强,提升特征的显著性表达能力,对不同层次特征融合得到高层级和低层级特征;设计全局注意力模块,利用空洞空间卷积池化金字塔ASPP模块提取全局信息,计算特征的通道权重;利用通道权重引导侧输出进行特征学习能力提升,通过逐层连接方式得到最终预测结果.该方法在5个常用的数据集上进行测试,并与9种相关方法进行比较.实验结果表明,该模型鲁棒性更佳、检测性能更好.
其他文献
针对5 G无线传播模型的构建,使用Pearson系数量化特征与目标值之间的相关性,以此构造出新的特征.将这些特征送入到BP神经网络、决策树、随机森林中来建立无线传播模型,并且能够预测新环境下无线信号覆盖的强度.该模型为建立精准的无线网络提供技术支持,使网络建设成本降低,并提高建设效率.
利用脉搏波特征参数法估测动脉血压(ABP)时,需要进行人工特征设计和筛选以提取出与动脉血压相关性高的特征参数,具有局限性.对此,提出基于卷积神经网络(CNN)的单路光电容积脉搏波信号(PPG)的连续动脉血压测量算法.对PPG信号依次进行去噪平滑、单周期分割和插值处理后,将其输入到CNN中进行特征提取,以建立其与动脉血压间的关系.根据美国医疗器械促进协会(AAMI)的规定,医疗用途的血压测量器械的平均误差应不大于5±8 mmHg.实验结果表明,该算法的测量误差满足AAMI要求.
内运车是用于港口内部货物转运的车辆.如果在转运过程中缺乏监管,很容易造成偷货(将A货主的货转移至B货主堆位)、漏货(货物转运未经过计量设备)等行为,给港口带来严重的损失.为了有效杜绝这类情况的发生,提出轨迹真实状态序列提取方法并设计自适应有限状态机(Adaptive Finite State Machine,AFSM)对内运车作业是否产生异常意图进行判断.实验采用重庆市某港口内运车辆一个月(7547趟)的真实轨迹数据,结果表明轨迹真实状态序列提取方法能有效提取内运车作业轨迹的真实状态,使用AFSM进行轨迹
针对长短期记忆循环神经网络在对时间序列进行学习时存在早期特征记忆效果差、难以充分挖掘整个网络流量特征等问题,提出一种基于双向长短期记忆循环神经网络的网络流量预测方法,以提高网络流量预测的准确性.对网络流量序列进行双向学习,避免单向学习导致较早学习部分特征提取和记忆效果差的问题.同时双向学习可以充分挖掘网络流量天与天之间双向的特征,完整地学习到网络流量的整体特征.仿真实验结果表明,改进后的方法相比原方法具有更好的预测效果.
随着数据中心网络承载的数据量的爆炸式增长,越来越多的框架、模型和应用选择使用RDMA技术来加速网络传输.RoCE是RDMA技术在以太网上的实现,但针对RoCE网络目前还没有有效的状态感知和度量体系,无法全面展现RDMA网络状态.对此,提出针对RoCE的实时状态感知系统和多维度多层次的RDMA度量指标体系.采用旁路分布式流量捕获方式,运用Sketch算法全方位度量RDMA网络状态.系统易于部署且成本低,具有可扩展性和灵活性.实验结果表明,该系统能在较低误差下客观反映出RoCE网络状态,提供故障定位建议.
图像二值化算法通过消除文档背景噪声将文本与背景分割开.针对古籍图像提出一种基于局部对比度和相位保持降噪的古籍图像二值化算法.根据归一化局部最大值最小值来构造古籍图像局部对比度,同时对古籍图像进行相位保持降噪.将局部对比度图像和降噪图像相结合来识别文本笔划像素.通过局部窗口内所检测的文本笔划像素估计局部阈值从而计算古籍背景修复模板.用图像修复算法和形态学闭操作来估计古籍背景.用所估计背景来增强古籍图像,采用Howe算法对增强后的古籍图像进行二值化求得最终结果.该算法在DIBCO2016、DIBCO2017和
在面向社区楼道或门栋监控中,人脸信息尤为重要.通过NB-IoT(窄带物联网)接入,可以满足低成本、广覆盖和多接入的需求,但是常规编码方法在窄带低码率下无法保障人脸质量.针对该问题,提出一种面向人脸业务的混合分辨率监控视频压缩方法.利用监控视频统计特性优化人脸检测速度,采用不同分辨率区别编码人脸和非人脸区域,在高倍率压缩下提高了人脸的可辨识性.实验表明,该方法相较于主流感兴趣区域编码,人脸区域PSNR提高了5.57 dB,编码速度提高了5.12倍,具备NB-IoT环境下的实用性.
随着云计算和信息技术的发展,制造企业逐渐由生产型向服务型转化.为了满足用户需求、解决云制造服务优选问题,提出一种基于多层次属性建模的云制造服务匹配和优选方法.对云制造服务资源和属性进行详细描述和划分,构建多层次属性描述模型.从基本属性、功能属性、非功能属性、综合匹配四个层次对候选服务和请求服务进行匹配计算.对不同类型的属性分别采用不同的匹配计算方法,包括基于本体语义的句子相似度计算方法、基于集合理论的匹配及欧氏距离计算方法.实验结果证明该方法具有良好的有效性和可行性,且相对于其他同类方法有较好的查询性能.
针对当前网络流量无法根据流量变化的特征进行预测,且通过单一或者组合模型依然得不到较高准确率的问题,提出一种基于HP(High-Pass Fliter)滤波的流量预测模型.基于高铁站流量数据日高夜低的周期特性以及流量波动增长的长期趋势,依据HP滤波将网络流量分解成周期序列及趋势序列.利用自回归-滑动平均模型(ARMA)对平稳序列预测的优势来进行周期变化的预测;使用人工蜂群算法(ABC)优化后的支持向量回归机(SVR)对趋势序列进行预测;将二者预测的结果叠加,使用遗传算法优化的BP神经网络(GABP)进行结合
乳腺癌是易发生且致死率高的恶性肿瘤之一,及早诊断识别是降低致死率的关键.基于应用广泛的乳腺癌病理图像,结合卷积神经网络展开乳腺癌的识别研究.针对癌症图像细节和纹理特征难以识别的问题,采用插值处理将图像进行适当放大,以便研究分析.针对卷积神经网络参数庞大不易训练和不易硬件实现的问题,提出一种精简的5卷积层W型网络结构,具有较少的权重参数,可以降低时间和空间复杂度从而便于硬件实现.精度损失曲线测试和混淆矩阵实验结果表明,与传统顺序结构5卷积层神经网络相比,采用提出的网络使乳腺癌诊断识别的准确率提高4百分点,且