基于多任务分支SSD的目标检测算法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:qubinai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对原始SSD算法各检测特征层没有关联导致特征融合较差,使得检测效果不佳,而现有改进算法DSSD以及RSSD等检测速度太慢的问题,提出一种基于多任务分支的SSD目标检测算法.对特征金字塔进行研究,构建语义与定位级联模块和融合分裂模块用于两个不同分支,在通过两个分支模块之后得到两组多尺度特征,构建多尺度通道聚合模块进行融合和加权,得到最终用于检测的特征金字塔.实验结果表明,在PASCAL VOC 2007数据集上达到79.6% 的检测精度,与SSD、DSSD相比具有更好的准确率,检测速度优于DSSD,具有实时检测的能力.
其他文献
为有效解决不可感知性、鲁棒性和有效载荷的权衡问题,以及水印信息的高安全性问题,提出一种基于秘密共享和平稳小波变换(SWT)的音频水印算法.利用Shamir的秘密共享方案对水印信息处理得到n份秘密信息,其中n-1份安全存储在区块链中,剩余一份嵌入在根据水印信息特征产生出的哈希码选定的浊音帧中.在频域内,通过SWT和Schur分解(SD)修正浊音帧的离散余弦变换(DCT)系数,将水印自适应地嵌入到从SD获得的正交矩阵的第一列元素中.实验结果表明,该算法具有较高的不可感知性,在低通滤波、重采样、重量化、MP3压
为解决已有病毒检测机制无法很好地处理大量未知病毒及深度网络模型难以部署在嵌入式设备上应用的问题,提出一种基于轻量级深度网络的计算机病毒检测方法.采用B2M算法将病毒映射为灰度图像,提取灰度共生矩阵GLCM作为轻量级深度网络SqueezeNet的输入,将传统视觉特征与深度神经网络进行整合,实现病毒的高准确率判别.对SqueezeNet进行卷积结构和特征增强的改进,使之运行速度更快、资源消耗更低,检测精度更高.实验验证了该方法的有效性.
房建工程招标阶段的造价控制除了与企业效益有关,也直接影响工程建设质量.文章通过分析招标阶段造价控制的必要性,从严审施工图纸、工程量清单招投标、招标文件编写、合同审查、EPC及模拟清单等方面给出了有效的造价控制方案.
针对目前使用消息队列遥测传输(message queuing telemetry transport,MQTT)协议进行遥测数据传输时容易出现多节点通道数据重复,以及移动传输中节点通道连接不稳定等问题,提出一种基于WebSocket的MQTT协议(MQTT over WebSocket)数据传输方法.通过设置身份标识去重算法与数据格式匹配算法,构建数据传输模型,解决传输过程中可能出现的冗杂重复、数据丢包问题.使用该方法,辅以支持北斗导航的硬件设备开发一套车辆信息管理系统.测试报告表明,系统使用该方法实现了
针对云南边远山区低网络覆盖率和低传输速率下普通移动设备对神经网络处理速度慢、成本高、效率低的问题,提出一种基于APSoC的心音辅助诊断算法的硬件加速方法.在对5122例心音信号进行去噪、特征提取等预处理后,训练CNN网络模型用于心音样本分类.设计通用卷积电路与通用池化电路,将HLS优化后生成硬件电路部署至Zynq-7020 APSoC硬件平台,实现CNN算法的硬件加速.实验结果表明,相同条件下,其分类速度相比Intel-i7-8700提高了35倍,分类准确率仅损失了不到1%.该方法满足了高性能、低功耗、低
生成适应网络利用对抗训练辅助模型进行域适应分类,但仅使用单源域学到的知识有限,且对抗训练不足以减少域差异,造成判别特征难以识别,影响分类精度.针对该问题,提出一种结合对抗网络与条件均值的多源适应分类方法(MSDACG).对多个源域进行特征提取,提升特征学习的有效部分,对不同源和目标域特征使用特定域的生成对抗网络及条件最大均值差异拉近域间距离,采用差异损失约束由不同源域训练的分类器,实现利用多个源域的监督信息对目标域样本进行分类.实验结果表明,MSDACG模型能学到更优的域不变特征,与目前多源域适应算法比较
为提高编码程序对网络吞吐量和网络延迟的增益,在机会网络编码的基础上,利用自适应处理进行升级,提出一种机会网络编码扩展算法.该扩展算法作为通信栈中的一个独立层,仅依赖于节点本身的信息.在分组编码模块,编码算法搜索编码机会,寻找将消息附加到传出分组的机会;在决策制定过程中,根据网络链路质量的变化自动调整容限角;在自适应处理观察编码过程,采用与编码相关的参数.实验结果表明,与面向传输优化的机会网络编码(ONC-TO)、基于聚类的网络编码方法(CNC),以及不使用网络编码方法相比,所提编码程序能够显著提升网络有效
针对传统的同时定位与建图(SLAM)算法在动态环境中会降低自身运动估计的精确性以及系统鲁棒性的问题,提出一种适用于动态环境的视觉惯性SLAM算法——DVI-SLAM(dynamic visual inertial SLAM).根据对极几何约束检测并去掉动态特征,利用更加精确的静态特征进行状态估计;添加视觉信息自适应权重因子,提高系统的鲁棒性.改进的SLAM算法在公开的视觉惯性数据集TUM-VI上进行相关实验,实验结果与VINS-MONO相比在高动态场景中的定位精度平均提高了47.34%.
为加速嵌入式平台ARM CMSIS-NN上的神经网络卷积算法,提出一种面向开源RISC-V(精简指令级架构第五代)的卷积算法.采用RISC-V的P拓展指令集中特有的8位数据操作指令,优化ARM CMSIS-NN(微处理器软件接口标准)库中因为缺少DSP指令8位数据操作指令而带来的内存使用效率不高的不足.经实验仿真和下板验证,在蜂鸟E203 FPGA开发板上以16 MHz的时钟频率完成功能验证,与同等实验室实验情况下的arm-cortex-m3等设备相比,性能提升约12倍.
为提升基于TextRank算法的关键词抽取效果,分析中文语义结构和分词算法的特点,提出一种融合语义依存和外部知识库的方法.使用语义依存图代替共现窗口构建词图,增强词图中各节点间的语义联系;在此基础上引入规范化谷歌距离和领域词典这两个外部知识库特征,结合文档内外部信息对词图中的边进行加权计算,对提取出的文档关键词应用前后向匹配算法做进一步处理,使提取的关键词更具语义完整性.实验结果表明,该方法在数据集上的关键词抽取效果有了显著提升,可读性更强,验证了所提方法的有效性.