论文部分内容阅读
针对图像二维卷积过程中存在冗余读取和计算导致CPU串行计算效率不高的问题,提出了一种应用于ARM处理器中NEON协处理器的高效实现方法,以边缘检测和形态学操作为例,对算子进行分解并调整图像遍历顺序,减少了冗余操作并提高了计算的并行度。在ARM Cortex-A9测试平台上相比于Open CV库函数的方法提升了2至6倍不等的性能,可应用于嵌入式实时图像处理系统,并可推广应用于其他处理器的SIMD(单指令多数据流)结构。