【摘 要】
:
图像处理在遥感技术、医学领域、安全领域、工业生产领域具有广泛的应用,图像边缘检测算法是图像分割、目标识别、形状提取的图像处理分析基础。基于梯度计算的Canny与Sobel算法是当今广泛使用的边缘检测算法。国外主流的Intel处理器、德州仪器TIC66xx信号处理器、NVIDIA的GPU等均适配有成熟的边缘检测算法函数库。飞腾M7002作为一款国产高性能DSP,将边缘检测算法面向该平台适配并生成高效
论文部分内容阅读
图像处理在遥感技术、医学领域、安全领域、工业生产领域具有广泛的应用,图像边缘检测算法是图像分割、目标识别、形状提取的图像处理分析基础。基于梯度计算的Canny与Sobel算法是当今广泛使用的边缘检测算法。国外主流的Intel处理器、德州仪器TIC66xx信号处理器、NVIDIA的GPU等均适配有成熟的边缘检测算法函数库。飞腾M7002作为一款国产高性能DSP,将边缘检测算法面向该平台适配并生成高效的函数库是亟需解决的问题。本文将Canny及Sobel边缘检测算法在飞腾平台上进行了实现,并针对体系结构与硬件特性开展了深度优化,为飞腾M7002提供了高效的边缘检测算法库。本文主要工作及贡献如下:(1)研究Canny与Sobel边缘检测算法的原理及特性,面向飞腾M7002平台进行了代码实现,测试验证了算法的正确性。(2)根据飞腾M7002硬件特性,提出了一种Canny并行梯度算法,并分别针对3*3,5*5与7*7三种卷积核进行了实现;设计实现了一种基于帕斯卡三角法的5*5与7*7 Sobel扩展卷积模板,并将三种卷积核并行优化。(3)提出了一种并行化的数据类型转换接口,实现了算法对字符型与整型、字符型与浮点型、短整型与整型的数据类型转换,提升了Canny与Sobel并行算法的可扩展性及实用性。(4)深入研究了飞腾M7002编译工具链、高速缓存机制、DMA数据传输机制、向量存储空间等底层软硬件特性,通过编译优化、访存优化、循环优化、软件流水、双缓冲的优化方法,解决了数据访问不连续的问题,并从指令处理时间间隙与数据传输间隙的角度对算法开展了进一步的优化,有效提升了算法在目标平台上的执行效率。本文所做工作已在飞腾M7002平台上实现并应用。测试结果表明,在飞腾单核上Canny边缘检测算法性能提升了1.4~2.1倍,Sobel边缘检测算法性能提升1.075~1.525倍。
其他文献
背景和目的肾细胞癌(Renal cell carcinoma,RCC)是泌尿生殖系统常见的恶性肿瘤。经循环转移是肾细胞癌转移灶形成的重要途径。循环肿瘤细胞(Circulating tumor cells,CTCs)是指肿瘤细胞从原发部位脱落或转移到外周血中的肿瘤细胞。它们可能附着并生长在远处器官,长期以来被认为是肿瘤侵袭性的标志。循环肿瘤细胞的检测为评价肿瘤负荷和侵袭性提供了一个新的有力工具。在本
知识库问答融合了自然语言处理的核心技术,旨在利用知识库中的三元组回答用户的自然语言问句,现已逐渐成为人机交互的新趋势。面对大规模知识库,自动问答技术提供了一种高效、准确的信息获取方式与途径。近年来,国内外开始涌现一些大规模的知识库,如国外的Freebase、DBpedia,以及国内由NLPCC在2016年在KBQA评测任务下提供的开放域中文知识库等等,它们都提供了大量数据基础,使得基于大规模的知识
目的:比较超声引导下经皮射频消融(RFA)治疗第二肝门区肝细胞癌(HCC)与非第二肝门区肝细胞癌(HCC)的疗效和并发症,探索导致经皮RFA治疗第二肝门区HCC技术失败和影响患者肿瘤局部进展和无病生存期的风险因素。材料与方法:收集2010年1月至2018年12月接受超声引导下经皮RFA治疗HCC的患者资料进行回顾性分析,共纳入86例第二肝门区HCC患者,根据肿瘤解剖位置随机选择匹配86例非第二肝门
在本论文中,首先利用零曲率方程,从一个3×3矩阵谱问题出发,推导出了WadatiKonno-Ichikawa方程族的超扩展;然后利用超迹恒等式建立它的超Bi-Hamilton结构;最后利用谱参数展开法得到超Wadati-Konno-Ichikawa方程的无穷守恒律.
背景和目的脑性瘫痪(Cerebral palsy,CP),简称脑瘫,是由于中枢神经病变所引发的运动障碍、姿势发育异常、活动受限的症候群。患儿出生前后1个月内,在各种危险因素的影响下,发生非进行性、永久性的神经发育障碍。目前在我国的脑性瘫痪发病率为2.0‰~3.5‰,相比于全球范围内的1.2‰~5‰略有所低。由于脑部损伤的永久性结果,临床上并没有完全治愈脑瘫的方式。但通过外科手术很大程度上可以矫正脑
目前,我国的高端装备制造技术与国外先进水平相差较大,高端关键零部件约80%依赖进口,严重影响着我国的高端装备行业的发展。要改变这一现象,解决卡脖子问题,就要淘汰现有的“成形”制造,超越表面完整性制造,创新抗疲劳制造理论与技术,并在制造企业中快速实现技术推广与应用。磨削加工是精密加工的最后一道工序,不仅能够保证工件所需的尺寸精度,还能获得较好的表面完整性。工件的表面完整性主要包括表面形貌、表层残余应
河南滑县道口镇,作为历史上的运河古镇,具有“三街六铺七十二胡同”的传统街巷空间结构。受特定的地理、气候环境以及社会文化等方面的共同影响,道口镇的街巷布局方式与空间特征具有很强的地域性,也是居民生活方式与历史文化的物质载体。另外传统街巷空间在古镇既起着交通组织的作用,也是古镇社会组织结构与社会网络的具体体现本文通过对国内外优秀的传统街巷保护与更新案例和相关理论进行研究,从传统街巷空间构成要素分析入手
指令选择将编译器的中间表示转换为针对各种编译目标进行优化的一系列目标平台机器指令,是经典编译器后端有效提升科学计算程序执行性能的重要组成部分,高质量的指令选择对生成代码的大小和质量有很大的影响。2019年,LLVM全球开发者大会将全局指令选择定为大会主题,全局指令选择近两年已成为LLVM后端主流架构的研究热点。在申威平台上进行LLVM全局指令选择技术的实现与优化,对进一步完善申威编译系统具有重要意
银(Ag)纳米材料因为具有广谱抗菌作用,近年来得到了越来越多的关注。研究表明,Ag纳米粒子直径小于10 nm时具有高效的抗菌性,但未加修饰的Ag纳米粒子稳定性差,易团聚、氧化,还会产生细胞毒性,从而限制其作为长期抗菌剂的应用。平衡Ag纳米粒子的高效抗菌性和对生物细胞的低毒性仍然是一项艰巨的工作。由小颗粒组装的晶簇结构具有保持小尺寸效应和大尺寸稳定性的潜力,为解决Ag抗菌纳米材料设计中尺寸大小与稳定