基于Intel Xeon Phi众核架构的视频算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:birchwoods2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
帧率上转换(Frame Rate Up-Conversion,FRUC)算法通过在原有两个视频帧中插入中间帧的方式,实现将视频从一个较低的帧率提高到一个较高的帧率。随着超高清4K视频的出现,像素点的急剧增多,导致一些传统的串行帧率上转换算法难以达到快速处理甚至实时的要求。近年来,异构多核设备已经成为高性能计算领域的重要设备,2012年Intel发布了支持X86指令架构的Intel Xeon Phi协处理器,该设备具有57个以上的基于X86架构的计算核心。同时该协处理器支持多种并行编程语言,如OpenMP,Pthread,OpenCL等。所以本文提出了基于Intel Xeon Phi的并行帧率上转换算法,对算法中的两大核心模块运动估计算法和运动补偿算法进行并行研究,本文所研究的主要工作有以下两个方面:(1)提出了基于MIC架构的OpenCL并行视频帧率上转换算法。首先,我们对运动估计模块进行了并行分析,针对3DRS算法具有空间候选运动矢量相互依赖的特性,我们提出了一种基于宏块级的并行思路。首先将图像划分为240×135个块,我们利用MIC多线程的优势,将每行的240个块进行并行操作,即每个核单独进行每个块候选运动矢量的计算。然后,我们对运动补偿模块进行了并行分析,图像中每个像素点在运动补偿模块处理的操作流程完全一致,且相互独立,不存在任何的依赖关系,所以,我们对图像中所有像素点的插值过程进行了并行。最后我们对并行帧率上转换算法的实验结果进行了理论分析。(2)提出了基于双MIC卡的视频帧率上转换算法。我们设计了一种异步式处理的方案,即将运动估计模块和运动补偿模块同时进行处理,由于实验环境的节点拥有两块MIC卡,所以我们将运动估计模块放在一块MIC卡上进行,运动补偿模块放在另一块卡上进行。利用Pthread在CPU端开启两个子线程,分别控制与两块MIC卡之间的数据交互,第一块MIC卡计算完的数据传输回主机端,再由主机端把数据传输给第二个MIC卡,当第一块MIC卡计算完成后,直接进行下一帧的处理,无需等待第二块MIC卡是否执行完成。其中两个MIC卡与主机端数据拷贝是用信号量控制的。为了发挥MIC多线程的优势,我们在MIC上分别实现了Open MP和OpenCL的并行模式。最后,我们对比了OpenMP和OpenCL两种编程模型在MIC上的计算时间,并对实验结果进行了理论分析。
其他文献
建筑火灾作为一种发生频率较高的火灾,通常造成的人员伤亡及财产损失惨重,建筑结构抗火性能的研究也成为近年来国内外学者研究的重要课题。钢筋混凝土结构因其良好的材料性能
针对当前高光谱图像非线性梯度解混算法的局限性,本文提出了基于神经网络的高光谱图像非线性解混算法和基于神经网络和差分搜索算法的高光谱图像非线性解混算法。两种算法构
布里渊散射是光纤中重要的非线性效应之一,是光纤中入射光波和声波之间相互作用引起的一种非弹性散射现象。光纤中的布里渊频移与温度和应变呈线性关系,因此,光纤中的布里渊
《新安晚报》创刊于1993年,是安徽省发行量最大、影响力最广、广告收入最多的都市报,在全国的都市报中也属于佼佼者。2010年,媒介融合中的《新安晚报》成立网站,因此笔者选取
在信息爆炸式增长、多媒体技术及互联网发展日新月异的时代,人与人之间对各种多媒体资源共享的需求越来越高,大量的图片共享需要构建高效的检索系统。现有的社交图像搜索技术
当前社会,在大数据迅猛发展的势头下,信息量呈现出爆炸式增长。面对海量数据的冲击,越来越多的用户需要个性化和针对性的信息推荐,高校图书馆作为高校学术研究的主要信息提供
随着互联网时代的到来,异质信息的规模正在飞速增长。具有广泛应用的图数据不仅在数量上急剧增长,其包含的信息也更加多样化,因此对海量图数据进行有效地管理具有重要意义。
人脸识别的研究对于图像处理、模式识别、计算机视觉、计算机图形学等领域的发展具有重大的推动作用。随着视频监控、信息安全、访问控制,尤其是互联网信息检索等应用领域的
自从2006年云计算的概念被提出以来,这一融合了网格计算、并行计算、效用计算以及分布式存储技术的产物得到了快速发展,给用户带来了无可比拟的使用体验:成本低廉、按使用付
随着投资者投资理念的形成,证券市场不断规范化,上市公司经营绩效评价在协助市场管理者加强监管,引导投资者理性投资,促进上市公司加强内部管理等方面的作用显得越来越重要。