OpenVX高效能并行可重构运算通路的设计与实现

来源 :计算机工程 | 被引量 : 0次 | 上传用户:AsiaIT
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对专用硬件在处理图形图像时无法同时兼顾灵活性、可扩展性和时效性的问题,设计一种支持OpenVX 1.3标准的专用处理器.通过对OpenVX 1.3标准中的核函数进行数据通路映射,分析实现函数高效处理所需的运算单元数目,确定适用于该标准的数据通路运算器的结构.通过编写指令对数据通路进行重构,适应OpenVX标准的演进和扩展.应用65 nm CMOS工艺库对整体电路进行综合验证,实现的OpenVX可重构数据通路运算器面积为21076.21μm2、功耗为778.63 mW、系统主频为500 MHz、吞吐量为1.86 GB/s.实验结果表明,该数据通路运算器具有较强的可编程性和可扩展性,能够有效满足实时和高速的通用图像处理要求.
其他文献
在车载自组织网络中,车辆节点数量的变化和信标传输参数对信道负载有直接影响,节点数量达到一定程度时,周期性信标消息会占据整个控制信道而造成信道拥塞.针对该问题,通过预测局部密度设计传输参数自适应拥塞控制策略.根据网络中车辆节点自身所接收到的数据包和碰撞包的数量预测短期内局部密度的变化,依据信道忙时比率评估当前时刻信道负载,并将其与预设阈值进行对比,结合局部密度预测值自适应调整下一周期的传输参数.仿真结果表明,该策略能够在控制信道拥塞的同时,提高数据包递送率,降低消息传输延迟.
针对WFRFT系统难以适应复杂电磁环境及最优控制参数难以选取的问题,提出一种新型WFRFT认知通信系统构建方法.在传统WFRFT通信系统的基础上引入信号认知模块,完成电磁信号的采集及电磁环境中目标信号调制特征的识别.根据WFRFT信号调制特征裂变的特性,分析控制参数间的耦合作用机理,并设定优化控制参数的目标.将目标信号调制特征参数引入到WFRFT控制参数优化模型中,提出基于目标特征的WFRFT认知通信系统控制参数联合优化方法,并通过粒子群算法的迭代计算,选取最优控制参数集,针对最优参数的WFRFT认知通信
针对训练汉维机器翻译模型时汉语-维吾尔语平行语料数据稀疏的问题,将汉语预训练语言B E RT模型嵌入到汉维神经机器翻译模型中,以提高汉维机器翻译质量.对比不同汉语B E RT预训练模型编码信息的嵌入效果,讨论BERT不同隐藏层编码信息对汉维神经机器翻译效果的影响,并提出一种两段式微调BERT策略,通过对比实验总结出将B E RT模型应用在汉维神经机器翻译中的最佳方法.在汉维公开数据集上的实验结果显示,通过该方法可使机器双语互译评估值(BLEU)提升1.64,有效提高汉维机器翻译系统的性能.
社交媒体内容结构具有复杂性,大量虚假信息掺杂在真实内容中,或者在真实图片上配以杜撰的文字内容,导致基于单个模态的方法难以有效检测谣言.提出基于注意力机制与Dempster\'s组合规则的混合融合方法.通过新增用户模态,提取文本、视觉和用户3个模态的特征向量,利用注意力机制对词语和视觉进行双向匹配,给予对谣言检测具有更多贡献的词语和视觉神经元更大的权值.在前后期融合均加入注意力机制,实现特征和决策的自动加权,并使用Dempster\'s组合规则实现混合融合.在真实的中文Weibo数据集和外文Twit
在云网融合背景下,承载软件即服务(SaaS)业务功能的云基础设施可能横跨多个数据中心和归属网络,难以保证云资源安全可控.为缩短SaaS业务服务的处理时延,设计基于冗余执行和交叉检验的SaaS组合服务模式,并对容器、Hypervisor和云基础设施的安全威胁进行建模,建立拟态化虚拟网络功能映射模型和安全性优化机制.在此基础上,提出基于近端策略优化的PJM算法.实验结果表明,与CCMF、JEGA和QVNE算法相比,PJM算法在满足安全性约束的条件下,能够降低约12.2%业务端到端时延.
传统范围查询方法主要针对一维数据,在感知节点上传的信息较多,导致能耗较高.提出一种基于压缩HMAC算法的两层无线传感器网络多维数据范围查询方法.使用AES对称加密算法生成数据密文及加密索引链,运用反向0-1编码和压缩HMAC算法生成最值比较链,反向0-1编码不需额外进行数值化处理,压缩HMAC算法能够缩短HMAC编码长度,从而减少感知节点的发送数据,降低感知节点的能量消耗.在AliOS Things Developer Kit开发板和iTOP-4412核心板上对该方法进行实验,并从单个周期采集数据个数、感
普朗克常数是量子世界和可观测量子效应的基本标志.作为物理学中基本物理常数之一,它的精确测定对于质量计量的物理基准建立、量子效应精密测量及早期宇宙大爆炸物理特性研究等都有重要意义.经过一百多年来各种间接和直接方法测量,普朗克常数的精确值2019年才被定义.系统地回顾了这一历史进程,并展望普朗克常数精密测量领域的未来发展.
社交网络灰帽用户极易隐藏且类型多样,导致现有检测算法适用性较差.提出一种基于传播时空特性的社交网络检测算法.构建用户生成内容传播网络度量白帽和灰帽用户在传播空间上的不同特性,融合时空传播特性并调节权重比例以提高分类性能.实验结果表明,该算法能有效检测不同类型灰帽用户,与用户特征分析、社交网络链接分析、多视图融合等主流灰帽用户检测算法相比,其在CAVERLEE、CRESCI-15、CRESCI-17等多个数据集上的准确率及AUC值最高分别提升26.08%和30.54%.
流媒体的码率自适应算法依据网络状态动态调节视频块的码率,提升用户体验质量,但忽略了视频类型的差异对用户体验质量的影响,导致算法性能下降.提出区分视频类型特征的码率选择算法C-ABR.设计相应的用户体验质量效用函数,使用强化学习算法训练模型A3C,提升用户体验质量.实验结果说明,相对于典型的码率自适应算法Pensieve和MPC,C-ABR算法用户体验质量分别提升22.7%和50.4%.
为研制猪繁殖与呼吸综合症病毒(PRRSV)质粒核酸标准物质,建立数字PCR方法,并联合多家实验室利用数字PCR方法对标准物质进行合作定值,探讨了合作定值过程中影响质粒定值准确性的因素,并评定了标准物质不确定度.研制的两种质粒核酸标准物质已获得国家二级标准物质证书(编号GBW(E)091038及GBW(E)091039),可为检测方法提供定量标准,用于方法评价、产品质量控制等诸多方面.