论文部分内容阅读
最近本刊连续介绍7ARM家族的多款產品,包括最新的Cortex-A73架构和全新的Mali-G71。不过,这类产品都是面向高性能和顶级用户的,对入门级用户和主流用户来说,ARM又有怎样的新产品呢?今天,我们就向大家介绍ARM面向入门级和主流用户的产品——Mali-G51。除此之外,ARM在发布Mali-G51的同时也更新了视频处理器,这个型号为Mali-V61的全新视频处理器又有哪些特性呢?同样,本文也将为你带来它的最新信息。
在之前的文章中,我们介绍过ARM已经推出的Bifrest家族GPU的架构设计以及相应的产品Mali-G71。从架构来看,Bifrest的最大变化在于改用了全新的线程级并行。相比之前的指令集并行,线程级并行的优势在于几乎能够做到对着色器核心接近100%高效率的应用,并且能够带来相对于指令集并行能效比方面的显著优势,这也是Mali-G71推出的最重要原因之一。不过Mali-G71过于庞大,定位也偏重高端领域,对入门级和主流用户来说有点太“大”。于是经过一段时间的研发后,ARM推出了面向入门级和主流用户的Mali-G51图形处理核心。
请注意,本文在这里并没有说Mali-G51是GPU核心,而只是图形处理核心。在这里先来澄清一个观点:和我们一般意义上认为Mali-G71这类核心就是GPU有所不同的是,ARM更乐意称Mali的各个部分为Mali MultimediaSuite,也就是Mali多媒体套件。从产品的角度来说,ARM现在推出的Mali-G系列实际上只能完成GPU的计算和渲染部分,图形显示和视频编解码则由Mali-DP和Mali-V来完成。之所以这样做,是因为ARM作为一个IP提供商,需要为SoC厂商提供不同的搭配方案才能保证它们拥有足够的商业灵活性——因为不同厂商的需求是完全不一样的,目标客户更在意的是产品的竞争力,而不是最新的技术,这就要求IP的灵活搭配。所以ARM允许Mali的各部分在一定的范围内自由进行搭配。
另外,ARM在本次更新GPU计算核心(最受关注)的同时,还同步更新了Mali的其他部分。比如随着Mali的计算核心部分更新之后,ARM又在201 6年中旬更新了一个全新的视频处理器——代号为“Egil”,产品型号为Mali-V61,替换目前正被广泛使用的Mali--V550。下面我们就正式开始对Mali-G51和Mali-V61这两款产品进行详细介绍。
Mali-G51:高效能的入门级产品
一般来说,Mali-G71被认为是Mali-T880的继承者,相对应的,Mali-G51就是Mali-T820和Mali-T830的继承者——后者被用在很多注重性价比的产品上,比如三星自行设计的Exynos 7870,用于主打性价比的Galaxy A系列手机。对这类产品而言,性能反而不是其最重要的考量因素,如何在极其有限的空间、成本内实现尽可能高的每平方毫米性能和每美元性能才是最重要的。
从技术角度来看,Mali-G51的设计是很有趣的。它并不是Mali-G71的简单缩减版本,而是在架构上进行了全新的调整以适应其所需要针对的市场。目前ARM的Mali-G系列采用不间断的连续开发周期,和桌面GPU先开发顶级产品再削减规格推出中低端产品有所不同的是,Mali-G系列的每一款都有可能是正在设计中的Mali架构产品的分支。这意味着有可能较晚推出的、面向入门级市场的产品反而可能会拥有比较早推出面向顶级市场的产品更多的功能。
这一点在Mali-G51上表现得非常明显。相比较早之前推出的Mali-G71,Mali-G51的最大变化在于每个核心钟ALU、纹理单元和像素单元之间的配比情况。简而言之,Mali-G51从之前Mali-G71的“单像素”设计转成了“双像素”设计。从架构角度来看,Mali-G71的每个着色器核心在执行24FLOPs(12个FMA操作时),其纹理单元和混和单元可以处理1个纹理数据和1个像素数据。相比之下,Mali-G51在相同的操作时可以处理2个纹理和2个像素数据。与此类似的事情发生在Midgard时代,ARM在高端GPU上调整了ALU的数量,这是因为对高级图形效果而言,着色计算的需求是远远高出像素计算的,因此更多的ALU能够加强计算能力,更快速完成处理操作。对入门级SoC应用更多的UI操作等轻工作负载而言,像素计算重要性更高。
虽然双像素核心是Mali-G51的最大变化,但并不是唯一变化。由于Mali-G51使用的是最新的Bifrost架构,还带来了一些架构上的细微调整。比如加入了全新的指令帧缓冲压缩技术得到了改进,AFBC版本升级到了1.2版并进行了一些优化,更高的存储效率,对恒定色块的一些技术改进等。
总而言之,ARM宣称Mali-G51相比之前的Mali-T830带来了性能、密度和能量效率等多方面的显著改进,在相同的节点和条件下,Mali-G51比Mali-T830面积小了30%,每平方毫米性能提高了60%,每瓦特性能也提高了60%。考虑到Mali-G51的面积、效能以及市场目标,这样的设计结果是非常令人满意的。
不仅如此,ARM还宣称Mali-G51对如今火热的VR能提供出色的使用体验和性能,对一些简单负载的应用来说,Mali-G51或许已经足够。上市方面,Mali-G51应该在2018年才会出现在终端设备中,到时候肯定有大量的入门级移动设备“盯上”这款物美价廉的核心。
Mali-V61:为10bit时代做准备
在一般用户的眼中,视频单元是一个最容易受到忽视的部分。实际上对于今天我们正在使用的SoC来说,面对海量的视频资源和极为复杂多样的用户需求,如果不能对编解码部分做出很好的处理,就很可能会流失相当大一部分用户。之前ARM就非常重视SoC上的编解码部分,并于2014年10月推出了名为Mali-V550视频处理器,用于搭配Mali-T800系列使用,组成完整的图形处理部分。Mali-V550的优点在于引入了基本的HEVC支持,不过不足也是显而易见的,那就是部分编码格式在今天看起来不够齐全。因此如今在Mali-V550的基础上,ARM又推出了代号为“Egil”的新视频处理器,商品名为Mali-V61。 所谓视频处理器,顾名思义它多用在视频的解码和编码中,既然需要支持视频编解码(甚至图像的编解码),那么支持的规格就要尽可能的丰富。这一点Mali-V61绝对够格,它支持HEVC Main 10 High Tier、HEVC Lite、VP9、H.264、H.263、MPEG 4、MPEG 2、VC1、Real 8/9/10、JPEG等门乎目前所有主流的视频和图像编解码技术。当然,除了HEVE和VP9外,其余的编解码技术都很成熟了,下面本文重点说说HEVC和VP9。
在HEVC的编码方面,前一代Mali-V550B经实现了HEVE的基本功能支持,而Mali-V61则在此基础之上做出了进一步加强。比如可以支持HEVC Lite,这种编码器相比H.264实际上改善的地方非常有限,且缺少对HEVE B帧的支持,画质和压缩水平没有完整的HEVC编码器那样有显著优势。因此,Mali-V61在HEVE上进行了彻底的加强,使其可以提供对HEVE完整编码的支持。更值得一提的是,Mali-V61不但能够支持传统8bit的HEVC编码,还可以提供对Main10配置文件的10bit支持。解码方面,Mali-V550对于HEVE的解码就支持得很不错,到了Mali-V61上自然也一并集成了。
除了HEVC之外,VP9的应用也非常广泛。Mali-V550并不支持它,而在Mali-V61上则开始全面支持VP9的编解码,虽然目前VP9应用还不够多,但是考虑到谷歌对其支持不遺余力,并且VP9不收费——HEVE可是要收专利费的,这对很多个人和小型组织来说可不是那么友好,因此在未来网络视频和共享视频等将有可能大规模采用VP9压缩算法。Mali-V61目前可以提供对VP9 Profile 0(8bit)和Profile 2(10bit)的支持,同时支持编码和解码,功能一次性到位。
除了支持上述重要的新一代视频压缩编解码算法外,ARM还特别提到了Mali-V61对VP9的参考帧缩放功能的编码支持。所谓参考帧缩放功能,是指VP9在发现参考帧和当前帧尺寸不一致时,可以使用缩放因子进行缩放,再进行亚像素内插值等操作。参考帧是利用前后画面(帧)的差值进行编码的技术,应用得当可以大幅度提升视频压缩比。比如VP9可以在8个已存储的参考帧中动态选择其中3个进行帧间预测和对比。一般来说,参考帧缩放往往需要较高性能、功耗的模块才能完成,Mali-V61的优势在于在低功耗硬件编码器中实现了这个功能,值得赞赏。
除了上述功能之外,Mali-V61从应用角度来看可以配置最多八个核心,实现Mali-V61MP8的方案,最少可以使用一个Mali-V61核心来实现基本的视频编解码功能。功耗方面,ARM表示TSMC 16nm FinFET工艺下800MHz的Mali-V61单核就可以满足1080p@80fp s的编解码,如果使用Mali-V61MP6的话,能够实现4K@120fps的编解码。因此一般来说,Mali-V61在移动设备上使用单核就够了1只有对4K电视机、4K高速摄影机等设备来说,120Hz的4K编解码能力才是必须的。当然,其中需要考虑功耗、性能的平衡,这就需要厂商根据用途仔细衡量70最后在商业化方面,和之前介绍的Mali-G51一样,Mali-V61商业化的速度也不会太快,大概在2018年左右到来,考虑到超清视频的市场爆发情况,这个速度也算相当不错了。
写在最后
纵观此次ARM公布的两款新品,其中的Mali-G51是面向入门级和主流用户,它依靠非常出色的能耗比和较小的面积,肯定会得到诸多厂商的青睐,相信也将是未来常见的入门级移动产品的主要图形处理核心。Mali-V61的定位和Mali-G51则完全不同,它是为下一代4K高清时代应用而准备的产品,本身设计和功能都足够强大,显然将成为市场主流,肯定有厂商用Mali-V61搭配Mali-G71来使用,以支持更多的解码格式,进一步提升SoC的性能和功能。这样一来,Mali-G51和Mali-V61,凭借出色的设计、强悍的功能以及一出生就合着金钥匙的特殊地位,获得成功只是时间问题罢了。
在之前的文章中,我们介绍过ARM已经推出的Bifrest家族GPU的架构设计以及相应的产品Mali-G71。从架构来看,Bifrest的最大变化在于改用了全新的线程级并行。相比之前的指令集并行,线程级并行的优势在于几乎能够做到对着色器核心接近100%高效率的应用,并且能够带来相对于指令集并行能效比方面的显著优势,这也是Mali-G71推出的最重要原因之一。不过Mali-G71过于庞大,定位也偏重高端领域,对入门级和主流用户来说有点太“大”。于是经过一段时间的研发后,ARM推出了面向入门级和主流用户的Mali-G51图形处理核心。
请注意,本文在这里并没有说Mali-G51是GPU核心,而只是图形处理核心。在这里先来澄清一个观点:和我们一般意义上认为Mali-G71这类核心就是GPU有所不同的是,ARM更乐意称Mali的各个部分为Mali MultimediaSuite,也就是Mali多媒体套件。从产品的角度来说,ARM现在推出的Mali-G系列实际上只能完成GPU的计算和渲染部分,图形显示和视频编解码则由Mali-DP和Mali-V来完成。之所以这样做,是因为ARM作为一个IP提供商,需要为SoC厂商提供不同的搭配方案才能保证它们拥有足够的商业灵活性——因为不同厂商的需求是完全不一样的,目标客户更在意的是产品的竞争力,而不是最新的技术,这就要求IP的灵活搭配。所以ARM允许Mali的各部分在一定的范围内自由进行搭配。
另外,ARM在本次更新GPU计算核心(最受关注)的同时,还同步更新了Mali的其他部分。比如随着Mali的计算核心部分更新之后,ARM又在201 6年中旬更新了一个全新的视频处理器——代号为“Egil”,产品型号为Mali-V61,替换目前正被广泛使用的Mali--V550。下面我们就正式开始对Mali-G51和Mali-V61这两款产品进行详细介绍。
Mali-G51:高效能的入门级产品
一般来说,Mali-G71被认为是Mali-T880的继承者,相对应的,Mali-G51就是Mali-T820和Mali-T830的继承者——后者被用在很多注重性价比的产品上,比如三星自行设计的Exynos 7870,用于主打性价比的Galaxy A系列手机。对这类产品而言,性能反而不是其最重要的考量因素,如何在极其有限的空间、成本内实现尽可能高的每平方毫米性能和每美元性能才是最重要的。
从技术角度来看,Mali-G51的设计是很有趣的。它并不是Mali-G71的简单缩减版本,而是在架构上进行了全新的调整以适应其所需要针对的市场。目前ARM的Mali-G系列采用不间断的连续开发周期,和桌面GPU先开发顶级产品再削减规格推出中低端产品有所不同的是,Mali-G系列的每一款都有可能是正在设计中的Mali架构产品的分支。这意味着有可能较晚推出的、面向入门级市场的产品反而可能会拥有比较早推出面向顶级市场的产品更多的功能。
这一点在Mali-G51上表现得非常明显。相比较早之前推出的Mali-G71,Mali-G51的最大变化在于每个核心钟ALU、纹理单元和像素单元之间的配比情况。简而言之,Mali-G51从之前Mali-G71的“单像素”设计转成了“双像素”设计。从架构角度来看,Mali-G71的每个着色器核心在执行24FLOPs(12个FMA操作时),其纹理单元和混和单元可以处理1个纹理数据和1个像素数据。相比之下,Mali-G51在相同的操作时可以处理2个纹理和2个像素数据。与此类似的事情发生在Midgard时代,ARM在高端GPU上调整了ALU的数量,这是因为对高级图形效果而言,着色计算的需求是远远高出像素计算的,因此更多的ALU能够加强计算能力,更快速完成处理操作。对入门级SoC应用更多的UI操作等轻工作负载而言,像素计算重要性更高。
虽然双像素核心是Mali-G51的最大变化,但并不是唯一变化。由于Mali-G51使用的是最新的Bifrost架构,还带来了一些架构上的细微调整。比如加入了全新的指令帧缓冲压缩技术得到了改进,AFBC版本升级到了1.2版并进行了一些优化,更高的存储效率,对恒定色块的一些技术改进等。
总而言之,ARM宣称Mali-G51相比之前的Mali-T830带来了性能、密度和能量效率等多方面的显著改进,在相同的节点和条件下,Mali-G51比Mali-T830面积小了30%,每平方毫米性能提高了60%,每瓦特性能也提高了60%。考虑到Mali-G51的面积、效能以及市场目标,这样的设计结果是非常令人满意的。
不仅如此,ARM还宣称Mali-G51对如今火热的VR能提供出色的使用体验和性能,对一些简单负载的应用来说,Mali-G51或许已经足够。上市方面,Mali-G51应该在2018年才会出现在终端设备中,到时候肯定有大量的入门级移动设备“盯上”这款物美价廉的核心。
Mali-V61:为10bit时代做准备
在一般用户的眼中,视频单元是一个最容易受到忽视的部分。实际上对于今天我们正在使用的SoC来说,面对海量的视频资源和极为复杂多样的用户需求,如果不能对编解码部分做出很好的处理,就很可能会流失相当大一部分用户。之前ARM就非常重视SoC上的编解码部分,并于2014年10月推出了名为Mali-V550视频处理器,用于搭配Mali-T800系列使用,组成完整的图形处理部分。Mali-V550的优点在于引入了基本的HEVC支持,不过不足也是显而易见的,那就是部分编码格式在今天看起来不够齐全。因此如今在Mali-V550的基础上,ARM又推出了代号为“Egil”的新视频处理器,商品名为Mali-V61。 所谓视频处理器,顾名思义它多用在视频的解码和编码中,既然需要支持视频编解码(甚至图像的编解码),那么支持的规格就要尽可能的丰富。这一点Mali-V61绝对够格,它支持HEVC Main 10 High Tier、HEVC Lite、VP9、H.264、H.263、MPEG 4、MPEG 2、VC1、Real 8/9/10、JPEG等门乎目前所有主流的视频和图像编解码技术。当然,除了HEVE和VP9外,其余的编解码技术都很成熟了,下面本文重点说说HEVC和VP9。
在HEVC的编码方面,前一代Mali-V550B经实现了HEVE的基本功能支持,而Mali-V61则在此基础之上做出了进一步加强。比如可以支持HEVC Lite,这种编码器相比H.264实际上改善的地方非常有限,且缺少对HEVE B帧的支持,画质和压缩水平没有完整的HEVC编码器那样有显著优势。因此,Mali-V61在HEVE上进行了彻底的加强,使其可以提供对HEVE完整编码的支持。更值得一提的是,Mali-V61不但能够支持传统8bit的HEVC编码,还可以提供对Main10配置文件的10bit支持。解码方面,Mali-V550对于HEVE的解码就支持得很不错,到了Mali-V61上自然也一并集成了。
除了HEVC之外,VP9的应用也非常广泛。Mali-V550并不支持它,而在Mali-V61上则开始全面支持VP9的编解码,虽然目前VP9应用还不够多,但是考虑到谷歌对其支持不遺余力,并且VP9不收费——HEVE可是要收专利费的,这对很多个人和小型组织来说可不是那么友好,因此在未来网络视频和共享视频等将有可能大规模采用VP9压缩算法。Mali-V61目前可以提供对VP9 Profile 0(8bit)和Profile 2(10bit)的支持,同时支持编码和解码,功能一次性到位。
除了支持上述重要的新一代视频压缩编解码算法外,ARM还特别提到了Mali-V61对VP9的参考帧缩放功能的编码支持。所谓参考帧缩放功能,是指VP9在发现参考帧和当前帧尺寸不一致时,可以使用缩放因子进行缩放,再进行亚像素内插值等操作。参考帧是利用前后画面(帧)的差值进行编码的技术,应用得当可以大幅度提升视频压缩比。比如VP9可以在8个已存储的参考帧中动态选择其中3个进行帧间预测和对比。一般来说,参考帧缩放往往需要较高性能、功耗的模块才能完成,Mali-V61的优势在于在低功耗硬件编码器中实现了这个功能,值得赞赏。
除了上述功能之外,Mali-V61从应用角度来看可以配置最多八个核心,实现Mali-V61MP8的方案,最少可以使用一个Mali-V61核心来实现基本的视频编解码功能。功耗方面,ARM表示TSMC 16nm FinFET工艺下800MHz的Mali-V61单核就可以满足1080p@80fp s的编解码,如果使用Mali-V61MP6的话,能够实现4K@120fps的编解码。因此一般来说,Mali-V61在移动设备上使用单核就够了1只有对4K电视机、4K高速摄影机等设备来说,120Hz的4K编解码能力才是必须的。当然,其中需要考虑功耗、性能的平衡,这就需要厂商根据用途仔细衡量70最后在商业化方面,和之前介绍的Mali-G51一样,Mali-V61商业化的速度也不会太快,大概在2018年左右到来,考虑到超清视频的市场爆发情况,这个速度也算相当不错了。
写在最后
纵观此次ARM公布的两款新品,其中的Mali-G51是面向入门级和主流用户,它依靠非常出色的能耗比和较小的面积,肯定会得到诸多厂商的青睐,相信也将是未来常见的入门级移动产品的主要图形处理核心。Mali-V61的定位和Mali-G51则完全不同,它是为下一代4K高清时代应用而准备的产品,本身设计和功能都足够强大,显然将成为市场主流,肯定有厂商用Mali-V61搭配Mali-G71来使用,以支持更多的解码格式,进一步提升SoC的性能和功能。这样一来,Mali-G51和Mali-V61,凭借出色的设计、强悍的功能以及一出生就合着金钥匙的特殊地位,获得成功只是时间问题罢了。