论文部分内容阅读
你知道如何让你的PC达到最优化的状态吗?当然,这个优化不仅仅是指软件的优化。俗话说,硬件是基础,软件是灵魂。没有好的硬件基础,怎么能让你的PC体验与众不同呢?
购买P C 最重要的配件是什么?肯定有超过八成的用户回答:CPU——中央处理器!没错,CPU的确是PC系统中不可或缺的一部分。但是,在经过优化后的PC中,CPU仅仅是PC的两大核心之一,那么另外一个核心是谁呢?
为了解释清楚这个问题,我们先从应用着手。看看我们目前常见的一些应用对计算机硬件提出了怎样的要求。
1.在播放采用H.264编码的1080p影片时,CPU解码压力不堪重负,占用率极高。任何一个微小的操作都有可能造成播放顿挫、声画不同步,甚至假死机。
2.在图片浏览时,缩放图片、旋转图片速度非常缓慢,等待时间甚至超过了我们浏览图片的时间,让人心烦气躁。这种情况在大图片上表现得尤为明显。即使这种看起来简单的工作,CPU完成速度都不够理想。
3.在使用Google Earth时,CPU缓慢的渲染速度极大地影响了地图的加载、显示速度。甚至放大和缩小地图,如果由CPU单独完成都会十分缓慢。
4.游戏应用,CPU无法带给你精美的画面、绚丽的特效。其他诸如爆炸、流体、烟尘等特效,CPU都难以完美计算,往往是敷衍了事,令游戏效果大打折扣。
……
实际应用中还有很多类似的例子。CPU作为计算机统筹、计算的中心部件,已经不堪重负。即使是强悍如频率高达3GHz的Core 2 Duo处理器,每秒也仅能完成60亿次整数计算,相比之下,稍老一些的GeForce 8800GTX GPU*,每秒就可完成3500亿次左右的整数指令运算,这个数值大约是CPU的60倍左右。除了整数运算,CPU的浮点运算能力相比GPU也毫无优势,不足以完成如此庞大的计算量。
* 注释: G P U英文全称G r a p h i cProcessing Unit,中文翻译为“图形处理器”。
C P U 和G P U的设计差异
CPU的设计长期目标是为了尽可能快地完成各种各样的单一任务,即使目前双核心和四核心处理器发展得如火如荼,每时钟周期也只能完成4个并行的任务。反观GPU,每次处理一帧画面都有几十万甚至上百万个像素在等待计算,其中还包含了复杂的光照模型、几何模型、大量的材质计算、变换等。如果没有强大的计算能力,它不可能完成这些任务。GPU的设计就是为尽可能多地并行处理任务而生。设计GPU体系时,首先考虑的并行计算规模和能力,其次才是I/O吞吐能力、整数运算等工作。
看到这里,有些读者可能会疑惑了。目前市场上存在多代GeForceGPU,他们都可以对CUDA提供无差别的支持吗?答案是肯定的。NVIDIA的每款显卡都提供了相应的驱动程序,这个驱动可以理解为CUDAenable的GPU设备抽象层。它的作用是提供硬件设备的抽象访问接口。只要利用了CUDA的SDK*,CUDA就可以将语言恰当地转化为不同类型GPU所需要的处理模式。
*注释:S D K 就是 S o f t w a r eDevelopment Kit 的缩写,中文意思就 是“软件开发工具包”。
不仅CUDA对NVIDIA自家的GPU可以很好地兼容,它的另外一个特性在于其开放性。因为有了设备抽象层,CUDA很好地弥补了编程语言和设备之间的差异,所以不同设备都可以依靠设备抽象层得到合适的语言来进行有效计算。从这个发展势头来看,CUDA很可能成为通用处理器的标准接口。
熟悉了CUDA语言,我们就可以轻松利用它的开放性和可编程性创造自己的强大计算系统。如蛋白质折叠计算、医药合成计算、数学模型计算、核计算、粒子碰撞、爆炸计算等极为复杂的数学处理,都可以在CUDA的帮助下加速完成。不久前NVIDIA和Pegasys公司共同宣布的TMPGEnc最新版本4.0 XPress,就利用CUDA通用计算技术,在GeForce显卡帮助下将视频编码速度提高446%。还有科学计算软件Matlab,也利用CUDA插件加速计算,可比CPU单纯计算速度提升800%以上。目前CUDA正在进入大规模应用阶段,相关计算和科学研究的速度必将极大加快,到那时桌面巨型计算机也不再会是梦想。
2.PhysX物理处理技术
物理处理技术是游戏特效处理的重要组成部分。它对计算性能要求极高,以一整套独特的物理学算法为基础,需要大量同步运算的能力,进行诸如流体处理、布料模拟、爆炸处理、碰撞处理、烟尘处理等特效的计算。以往物理处理多是由CPU完成,而CPU在游戏处理中还要进行如AI、数据调用等复杂的处理工作,几乎无暇分配太多资源给物理处理。这样就拖累了整个游戏系统的运行速度。
不过这些都会发生改变,NVIDIA就在GeForce GPU中集成了PhysX物理处理引擎。它依靠GPU强大的计算能力和并行处理能力, 加速执行游戏处理中的物理效果。同时提供给游戏制造商更多的物理处理选择, 以增强以往由于CPU性能不足而减损的物理处理部分。从目前已经支持物理处理的游戏效果来看,启用了PhysX物理加速后,游戏的帧数得到了极为明显的提升,画面也更加华丽绚烂。同时由于更多物理处理的加入,游戏性也得到了一定程度的提高,整体使用效果非常出色!
除了PhysX加速外,AI加速计算也被NVIDIA纳入研究日程中,目前已经有相关成果出现。在NVIDIA的演示Demo中,几万的机器人会在复杂的花园中自动寻找路径,避开倒塌的石块,智能寻找掩体,掩护战友并狙击敌人。这种AI计算在CPU上是无法完成的,而利用GPU的强大计算能力,不仅仅是物理加速,AI加速也将近在咫尺。
3.3D视觉技术
虽然我们已经有了3D的游戏画面,但是显示器本身的结构使得游戏画面始终在“屏幕内”显示,没有“凸显”出屏幕。相比之下,GeForce GPU通过整合硬件软件的解决方案,实现了游戏立体3D效果的自动转换,把游戏体验提升到全新的高度。
目前已经有350多种游戏可以有效支持3D视觉处理,在高分辨率和高画质模式下,通过专用的驱动和3D眼镜,会得到极为震撼的3D视觉效果。游戏画面凸显于显示器之外,获得极为精彩、真实的游戏体验。
4.NVIDIA SLI技术
N V I D I A S L I多卡互联技术从Ge F o r c e 6提出以来到目前最新的GeForce GTX 280,已经发展得非常成熟。SLI技术主要作用是通过双卡并行计算增强系统的3D运算效能,尽可能地提供流畅和高画质的游戏画面。目前SLI技术从高端显卡到低端显卡已经充分普及,并得到了游戏玩家的喜爱和广泛应用。其中三路SLI技术互联的GeForce GTX 280依旧保持着3DMark测试成绩的世界纪录,充分说明了SLI技术强大的实力。
总结:视觉就是计算机
在传统的理念中,CPU就是计算机;现在我们还可以大声宣称——视觉就是计算机。视觉是信息输入我们大脑的最快途径,与计算机的每次交互都应该是可视、互动、并且完全三维立体的!借助优化PC以及各种各样和显卡配合的技术,计算机视觉技术必将得到极大的发展。这样的良性发展,也正是优化PC所追求的。
购买P C 最重要的配件是什么?肯定有超过八成的用户回答:CPU——中央处理器!没错,CPU的确是PC系统中不可或缺的一部分。但是,在经过优化后的PC中,CPU仅仅是PC的两大核心之一,那么另外一个核心是谁呢?
为了解释清楚这个问题,我们先从应用着手。看看我们目前常见的一些应用对计算机硬件提出了怎样的要求。
1.在播放采用H.264编码的1080p影片时,CPU解码压力不堪重负,占用率极高。任何一个微小的操作都有可能造成播放顿挫、声画不同步,甚至假死机。
2.在图片浏览时,缩放图片、旋转图片速度非常缓慢,等待时间甚至超过了我们浏览图片的时间,让人心烦气躁。这种情况在大图片上表现得尤为明显。即使这种看起来简单的工作,CPU完成速度都不够理想。
3.在使用Google Earth时,CPU缓慢的渲染速度极大地影响了地图的加载、显示速度。甚至放大和缩小地图,如果由CPU单独完成都会十分缓慢。
4.游戏应用,CPU无法带给你精美的画面、绚丽的特效。其他诸如爆炸、流体、烟尘等特效,CPU都难以完美计算,往往是敷衍了事,令游戏效果大打折扣。
……
实际应用中还有很多类似的例子。CPU作为计算机统筹、计算的中心部件,已经不堪重负。即使是强悍如频率高达3GHz的Core 2 Duo处理器,每秒也仅能完成60亿次整数计算,相比之下,稍老一些的GeForce 8800GTX GPU*,每秒就可完成3500亿次左右的整数指令运算,这个数值大约是CPU的60倍左右。除了整数运算,CPU的浮点运算能力相比GPU也毫无优势,不足以完成如此庞大的计算量。
* 注释: G P U英文全称G r a p h i cProcessing Unit,中文翻译为“图形处理器”。
C P U 和G P U的设计差异
CPU的设计长期目标是为了尽可能快地完成各种各样的单一任务,即使目前双核心和四核心处理器发展得如火如荼,每时钟周期也只能完成4个并行的任务。反观GPU,每次处理一帧画面都有几十万甚至上百万个像素在等待计算,其中还包含了复杂的光照模型、几何模型、大量的材质计算、变换等。如果没有强大的计算能力,它不可能完成这些任务。GPU的设计就是为尽可能多地并行处理任务而生。设计GPU体系时,首先考虑的并行计算规模和能力,其次才是I/O吞吐能力、整数运算等工作。
看到这里,有些读者可能会疑惑了。目前市场上存在多代GeForceGPU,他们都可以对CUDA提供无差别的支持吗?答案是肯定的。NVIDIA的每款显卡都提供了相应的驱动程序,这个驱动可以理解为CUDAenable的GPU设备抽象层。它的作用是提供硬件设备的抽象访问接口。只要利用了CUDA的SDK*,CUDA就可以将语言恰当地转化为不同类型GPU所需要的处理模式。
*注释:S D K 就是 S o f t w a r eDevelopment Kit 的缩写,中文意思就 是“软件开发工具包”。
不仅CUDA对NVIDIA自家的GPU可以很好地兼容,它的另外一个特性在于其开放性。因为有了设备抽象层,CUDA很好地弥补了编程语言和设备之间的差异,所以不同设备都可以依靠设备抽象层得到合适的语言来进行有效计算。从这个发展势头来看,CUDA很可能成为通用处理器的标准接口。
熟悉了CUDA语言,我们就可以轻松利用它的开放性和可编程性创造自己的强大计算系统。如蛋白质折叠计算、医药合成计算、数学模型计算、核计算、粒子碰撞、爆炸计算等极为复杂的数学处理,都可以在CUDA的帮助下加速完成。不久前NVIDIA和Pegasys公司共同宣布的TMPGEnc最新版本4.0 XPress,就利用CUDA通用计算技术,在GeForce显卡帮助下将视频编码速度提高446%。还有科学计算软件Matlab,也利用CUDA插件加速计算,可比CPU单纯计算速度提升800%以上。目前CUDA正在进入大规模应用阶段,相关计算和科学研究的速度必将极大加快,到那时桌面巨型计算机也不再会是梦想。
2.PhysX物理处理技术
物理处理技术是游戏特效处理的重要组成部分。它对计算性能要求极高,以一整套独特的物理学算法为基础,需要大量同步运算的能力,进行诸如流体处理、布料模拟、爆炸处理、碰撞处理、烟尘处理等特效的计算。以往物理处理多是由CPU完成,而CPU在游戏处理中还要进行如AI、数据调用等复杂的处理工作,几乎无暇分配太多资源给物理处理。这样就拖累了整个游戏系统的运行速度。
不过这些都会发生改变,NVIDIA就在GeForce GPU中集成了PhysX物理处理引擎。它依靠GPU强大的计算能力和并行处理能力, 加速执行游戏处理中的物理效果。同时提供给游戏制造商更多的物理处理选择, 以增强以往由于CPU性能不足而减损的物理处理部分。从目前已经支持物理处理的游戏效果来看,启用了PhysX物理加速后,游戏的帧数得到了极为明显的提升,画面也更加华丽绚烂。同时由于更多物理处理的加入,游戏性也得到了一定程度的提高,整体使用效果非常出色!
除了PhysX加速外,AI加速计算也被NVIDIA纳入研究日程中,目前已经有相关成果出现。在NVIDIA的演示Demo中,几万的机器人会在复杂的花园中自动寻找路径,避开倒塌的石块,智能寻找掩体,掩护战友并狙击敌人。这种AI计算在CPU上是无法完成的,而利用GPU的强大计算能力,不仅仅是物理加速,AI加速也将近在咫尺。
3.3D视觉技术
虽然我们已经有了3D的游戏画面,但是显示器本身的结构使得游戏画面始终在“屏幕内”显示,没有“凸显”出屏幕。相比之下,GeForce GPU通过整合硬件软件的解决方案,实现了游戏立体3D效果的自动转换,把游戏体验提升到全新的高度。
目前已经有350多种游戏可以有效支持3D视觉处理,在高分辨率和高画质模式下,通过专用的驱动和3D眼镜,会得到极为震撼的3D视觉效果。游戏画面凸显于显示器之外,获得极为精彩、真实的游戏体验。
4.NVIDIA SLI技术
N V I D I A S L I多卡互联技术从Ge F o r c e 6提出以来到目前最新的GeForce GTX 280,已经发展得非常成熟。SLI技术主要作用是通过双卡并行计算增强系统的3D运算效能,尽可能地提供流畅和高画质的游戏画面。目前SLI技术从高端显卡到低端显卡已经充分普及,并得到了游戏玩家的喜爱和广泛应用。其中三路SLI技术互联的GeForce GTX 280依旧保持着3DMark测试成绩的世界纪录,充分说明了SLI技术强大的实力。
总结:视觉就是计算机
在传统的理念中,CPU就是计算机;现在我们还可以大声宣称——视觉就是计算机。视觉是信息输入我们大脑的最快途径,与计算机的每次交互都应该是可视、互动、并且完全三维立体的!借助优化PC以及各种各样和显卡配合的技术,计算机视觉技术必将得到极大的发展。这样的良性发展,也正是优化PC所追求的。