论文部分内容阅读
近年来,卷积神经网络(CNN)算法及其在视觉感知领域的应用很大程度上改变了传统的机器视觉框架。但因为CNN算法大量的计算工作负载使其很难在高实时性,嵌入式场合得以广泛应用。最近,有一些国际著名的学术、商业机构推出了其专用的解决方案,用来降低功耗并提高性能,但大量的数据传输与访问仍然是一个棘手的挑战。本文的主要的工作如下:1.整合并优化了CNN卷积层,进行了细粒度的算法并行性分析,提出了Intra Output Feature Map的并行思路;对片上片外存储模型进行分析并为CNN设置了较通用的存储解