【摘 要】
:
随着人工智能的快速发展,深度学习技术在物联网行业的应用不断繁荣起来。SAR卫星图像检测,行人检测,自动驾驶等等的应用层出不穷。为了适应高准确率的检测效果目标检测网络的层数被设计的越来越深,与此同时带来的计算量也变得大了起来。我们知道目标检测算法从开始的设计到实际部署每一环都是至关重要的,不仅仅是以计算量的大幅度增加为代价来提高检测的准确度,还要顾及到目标检测算法部署到实际生活场景中的所遇到的困难。
论文部分内容阅读
随着人工智能的快速发展,深度学习技术在物联网行业的应用不断繁荣起来。SAR卫星图像检测,行人检测,自动驾驶等等的应用层出不穷。为了适应高准确率的检测效果目标检测网络的层数被设计的越来越深,与此同时带来的计算量也变得大了起来。我们知道目标检测算法从开始的设计到实际部署每一环都是至关重要的,不仅仅是以计算量的大幅度增加为代价来提高检测的准确度,还要顾及到目标检测算法部署到实际生活场景中的所遇到的困难。在现实生活中大规模应用的嵌入式设备往往是预算有限的(计算力比较低),比如NVIDIA Jetson Nano低功耗模式可用USB供电只需要5w就可以运行,NVIDIA Jetson Xavier NX最高功率模式才15w,譬如这些设备是不能与高计算能力的服务器端设备进行比较的。所以设计一个合格的具有现实意义的目标检测网络不能为了一味的追求高准确率而忽略了它的实际应用能力。那么如何在不掉大量精度的条件下对网络进行优化设计,使得模型推理速度提高是本文的主要研究方向。本文以SAR舰船图像检测为背景,主要创新工作和研究的成果总结如下:(1)为了解决在有限计算能力的嵌入式平台上实时推理目标检测模型的难点,文章提出了基于深度学习的目标检测算法加速方案。首先,对基于YOLOV3原始的高计算量的目标检测模型进行特征提取网络的替换。在保证一定准确率的前提下,把复杂的特征提取网络替换成更轻量级的MobileNetV2。其次对复杂的目标检测模型进行结构化剪枝,分别剪去原始模型30%、50%的参数量,使其去掉部分冗余参数得到更优的推理速度。最终相比于原始的SAR图像检测模型在控制准确率平均损失在1.47%左右,速度平均可提升40.1%。采用优化方案后的SAR图像检测模型在提升了速度的同时保证了准确率。(2)为了解决从服务器上训练完成目标检测算法到应用在小型智能化平台上的难点,文章提出了一套完整的可执行的部署方案。文章使用NVIDIA提供的TensorRT前向推理加速方案,使用TensorRT可以对原始的目标检测模型进行结构的相似性融合,通过降低了对CUDA核的调用来起到加速效果,同时文中实验还使用了TensorRT的INT8低比特量化方法对目标检测模型做了进一步的提速。不同框架之间可以采用开放神经网络交换格式(ONNX)来进行模型间的转换,在转换成TensorRT支持的模型后就可以脱离原始的训练框架直接进行推理。实验最终实现了从服务器上训练完成目标检测算法到部署在小型智能化平台上的一套完整流程。
其他文献
对遥感图像中的道路进行自动识别与分割在地理信息系统数据的更新、土地管理、城市规划、军事打击等不同应用领域都有着十分重要的应用价值。随着科学技术手段日新月异的发展,机器学习和人工智能技术在人们日常生活中的应用更加广泛,如何利用深度学习算法更加高效地解决遥感图像道路分割的难点,提高遥感图像道路分割的精度,简化神经网络训练过程中的难度已经成为各国学者们的重点研究方向。本课题基于深度学习理论并结合可见光遥
随着我国经济快速发展,人们的生活水平逐步提高,生活节奏逐渐加快,消费观念开始转变,越来越多的人选择搭乘出租车出行,出租车行业规模日渐庞大,车载GPS系统等采集设备也积累了海量的出租车行驶数据。与此同时,出现了出租车定价体系不够合理、评价与监管体系不够完善、出租车资源浪费等问题。目前行业内对出租车的经营状况的画像研究还远远不够,无法做到针对出租车的个性化分析从而采取更有效的管理措施。因此,本文尝试基
在信息爆炸的时代背景下,大量重复冗余的信息充斥人们的生活,如何从众多无结构或半结构的信息里提取出高质量且精准的信息是信息抽取任务快速发展的原因之一。信息抽取在问答系统、数字图书馆等任务中都有广泛应用,实体关系抽取是其重要的子任务之一。传统和基于深度学习的实体关系抽取方法已经在实际应用中取得了较高的准确率,但其主要集中在特定领域,在面对不容易获得大规模监督训练数据集的实体关系抽取任务时,传统方法逐渐
软件缺陷预测是一种以提高软件质量为目的通过预先识别可疑缺陷模块为软件测试资源分配提供决策支持的技术。但是软件缺陷预测模型的性能取决于所考虑的软件特征的质量。冗余和不相关特征可能会降低模型的性能,这就需要特征选择方法来识别和移除这类特征。本文针对软件缺陷预测中的特征选择进行深入研究,主要研究工作如下:(1)本文将软件缺陷预测特征选择问题转化为多目标优化问题。结合特征工程的实际意义,在综合分析模型运行
临床病历文本中所包含的信息资源极其丰富,却因其规范化程度有限而导致信息无法被有效地提取和利用。病人以往的病情、诊断和治疗记录,对辅助医生做出更好的医学决策具有重要意义。本文的研究任务是对中医临床病历文本进行事件抽取,以事件为单元对病人的病情发展进行呈现,同时抽取出每个事件的发生时间。事件抽取技术是从非结构化信息中抽取出用户感兴趣的事件,并以结构化表达方式呈现给用户。经过研究发现,不管是在研究任务上
由于各种不确定性和不可抗力的存在,导致众多产品的制造生产过程存在着很多风险源,这些风险源的存在会对产品的稳定性乃至项目的成败产生直接的影响。光纤传感器是以光纤为介质研发的一类传感产品,其理论技术的不断进步依托于光纤通信技术的飞速发展。对于光纤传感产品而言,其产品性能的优劣不仅取决于先进的理论算法,更取决于产品在制造过程中的各个工序的管控。分析产品生产环节存在的各种风险源并加以控制,可以降低设备故障
如今,在线社交网络已经成为我们日常信息传播的重要载体和渠道,有关社交网络的研究,对人类社会发展和商业推广等方面都有着实际的应用价值。社交网络应用分析的一个重要问题是对用户进行排名。现有的社交网络用户排名算法主要分为基于中心性的方法,基于超链接引导主题搜索算法以及基于PageRank算法。传统的排名算法无论是加权的还是未加权的,仅使用基于边的关系,一些排名算法考虑到结点参与的高阶结构,通过模式去获取
并联机构具有精度高、承载能力大、位置反解简单等优点,特别是以Stewart平台并联机构为主的六自由度并联机构,研究应用广泛。但Stewart平台并联机构其本身存在一些不足,而且目前对于其他构型结构的六自由度并联机构研究匮乏。本文基于以上背景,提出了一种具有闭环支链的新型六自由度并联机构,用于运动模拟平台。论文对此新型并联机构进行了相应的理论分析和虚拟仿真,并结合人体体感模型运动阀值,优化了仿真运动
近年来,无人机因为其高性价比,机动性强,灵活操作等优点,在各个领域得到了应用。特别是通信领域中,由于无人机可以与地面用户建立良好的视距链路(Line of Sight,Lo S),从而提升数据传输效率,同时无人机可以搭载雾服务器完成计算任务,还可以安装射频信号发射器为设备充电。但是,在用户相关信息(如用户位置、发射功率)动态变化的情况下,对能量有限的无人机的飞行轨迹进行设计以最大化系统网络容量,存
以敦煌莫高窟为代表的中国古代壁画有着悠久的历史和极高的文化价值。然而,随着岁月的变迁,古代壁画不可避免地由于风沙、潮湿或人为盗取等因素遭到损害。因此,及时地对已发现的受损壁画进行修复能够最大程度地保留其经济和文化价值。传统的人工修复不仅对修复专家具有更高的技术要求,且一旦操作不当会有损伤壁画的可能性。因此,对损伤壁画进行数字化修复不仅能避免对壁画本体因人为失误而造成损坏,更能使完整的壁画数字图像易