3D视觉成像的下一站

来源 :电脑爱好者 | 被引量 : 0次 | 上传用户：placaptain

【摘要】

：

3D视觉成像的三个方向　　曾经，智能手机只要做到性能强、网速快、拍照清晰、续航持久就可以了。然而，如今的人们已經不再满足于“屏幕内的视界”，除了需要拍摄更具立体感的照片，更安全的面部识别/支付、3D试妆、AR装潢、AR游戏、体感游戏、全息影像交互等需要“3D视觉成像”技术支撑的应用环境（图1），才是智能手机未来的发展趋势。　　根据原理和硬件实现方式的不同，智能手机领域最靠谱的3D视觉成像技术逐渐衍

【出处】

：

电脑爱好者

【发表日期】

：

2018年19期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

3D视觉成像的三个方向

　　曾经，智能手机只要做到性能强、网速快、拍照清晰、续航持久就可以了。然而，如今的人们已經不再满足于“屏幕内的视界”，除了需要拍摄更具立体感的照片，更安全的面部识别/支付、3D试妆、AR装潢、AR游戏、体感游戏、全息影像交互等需要“3D视觉成像”技术支撑的应用环境（图1），才是智能手机未来的发展趋势。
　　根据原理和硬件实现方式的不同，智能手机领域最靠谱的3D视觉成像技术逐渐衍生出了三个方向，它们分别是双目立体成像、3D结构光以及TOF技术。下面，就让我们依次了解一下这三种技术的差异吧。

双目立体成像：无解的光线

　　我们去电影院通过立体眼镜观看3D电影，就是双目成像技术的一种表现形式：由于双眼会有视觉差距，从而呈现出立体的画面。在手机领域，配备两颗摄像头阵列，就满足了双目成像技术的最基本要求。
　　双摄手机能干啥
　　如今几乎所有千元以上的新品都在主打双摄模块（图2），而两颗镜头的组合，也赋予了智能手机在一定程度上侦测物体远近的能力，可以拍摄出具备硬件级背景虚化效果的照片。此外，以华为/荣耀手机为代表的品牌，在相机APP中还提供了“3D动态全景”模式（图3）。点击开启后，只要按住快门将摄像头对准被摄物体，然后绕着它沿固定方向移动，松开手即可完成拍摄。
　　在相册预览时，我们只要点击照片中对应的3D图标，就能将这张静止的图片变成动态的视频，通过陀螺仪转动手机，或手指的拖拽移动欣赏拍摄物体的不同角度。总之，在拍摄具备景深信息和3D动态的立体照片，以及时下流行的AR合影和AR萌拍时（图4），双摄手机的表现总会优于单摄手机，而这就是类似双目成像技术背后的功劳。

　　来自光线的困扰
　　智能手机所武装的标准摄像头能否拍摄清晰的图像，完全取决于环境的光线，过亮或过暗的光线都会造成识别上的困难。就拿时下流行的“面部识别”功能为例（图5），无论手机前置摄像头是1颗还是2颗，其本质上还是2D成像，不仅存在被面部照片或面部视频“欺骗”的风险，在漆黑环境下也将彻底失效。
　　为此，很多手机还会额外搭配专用的前置红外补光单元，从而解决漆黑环境下的面部识别难题。比如小米8，就在屏幕的刘海部分添加了隐藏式的红外照明原件和红外相机（图6）。需要注意的是，红外补光单元的加盟，依旧无法解决此类手机属于2D成像面部识别的事实，与iPhone X可以用于安全支付的Face ID不可同日而语。
　　换句话说，目前智能手机通过双摄模拟双目成像技术的方案，最多只能算是2.5D，无论是精准度还是对光线敏感度的要求，都还不足以帮助手机进入真正的3D视觉成像时代。

3D结构光：距离是死穴

　　iPhone X是一款里程碑式的产品，它在手机领域首次实现了深度机器视觉技术，依靠名为“结构光技术”的硬件模组，实现了对面部信息采集从2D到3D的进化。
　　浅析结构光技术
　　简单来说，iPhone X在采集面部信息时，前置摄像头基本就是摆设，而是依靠由红外镜头、泛光感应元件和点阵投影器构成的“结构光模具”（图7）。其中，点阵投影器会发射3万多个肉眼不可见的光点投影在你的脸部，绘制出三维建模的立体面谱（图8），红外镜头则会读取这些点阵图案，并将信息发送到A11处理器的安全隔离区进行匹配对照，而泛光感应则是确保识别面部不受环境光线的影响。
　　和前文提到的已经逐渐普及的、基于前置摄像头和软件算法实现的2D面部识别方案相比，iPhone X通过结构光带来的Face ID，具备金融级别的安全等级，因此苹果才敢让Face ID在解锁手机之外，还能用于购买应用以及支付Apple Pay。

　　如今，结构光技术已经不再是iPhone X的专利，小米8探索版、OPPO Find X等手机都先后引入了类似的技术，从而实现了媲美iPhone X的Face ID能力。需要注意的是，小米8探索版的结构光模块暂时只能用来解锁（通过屏下指纹识别用于支付），而OPPO Find X则已支持支付宝刷脸支付的功能。　　从技术上来看，iPhone X、小米8探索版和OPPO Find X的结构光模块大致相同，只是在元器件的叫法、点阵传感器类型和发射点的数量上存在差异。比如iPhone X将关键元件称为点阵投影器（散斑结构光，可发射3万个识别点）、红外镜头和泛光感应元件；小米8探索版叫点阵投影器（编码结构光，可发射3.3万个识别点）、红外相机和泛光照明元件（图9）；Find X则称为点阵投影器（散斑结构光，可发射1.5万个识别点）、IR补光灯和IR摄像头（图10）。虽然细节上存在不同，但几款手机在面部解锁的体验上却基本相同。
　　结构光技术的缺陷
　　结构光技术帮助手机进入了3D视觉成像时代，但它的实际应用范围还是相对有限，比如它只能放在手机正面与前置摄像头做邻居，目前比较成熟的方案也就是面部解锁、面部支付、3D美颜以及类似Animojis的3D表情制作（图11）。而未来结构光的优化方向则是实现3D静态建模，扫描用户3D头像信息用于游戏、3D视频通话或进行3D打印（图12）。
　　此外，结构光的特点是不必获取被拍摄物体的表面纹理，而是将一簇簇的光线投影到物体的表面，进而通过光线采集物体的位置以及三维纵深等信息。然而，正是因为结构光投射的是一簇簇的光线，如果距离过远，光线就会发散从而失去识别能力，这也就造成了结构光仅能作用于近距离识别。
　　无论是iPhone X、小米8探索版还是Find X，只要手机距离面部超过1米左右，解锁就会失效。当然，现实中手机解锁时距离我们也就是一臂的距离，并不影响结构光的识别，但如果用于更远距离的AR/VR交互就有些不够看了。

TOF技术：未来的趋势

　　TOF（Time of flight，飞行时间测距法）同样是一种用于3D视觉成像的技术，它和结构光一样，都是通过光线进行物体的识别，但二者在底层技术和识别效果方面却存在着极大的差异。

　　TOF技術的原理和优势
　　TOF技术的原理，就是通过专用传感器，给目标连续发送光脉冲，然后用传感器接收从物体返回的光，最终通过探测光脉冲的飞行（往返）时间来得到目标物的距离。和结构光的点阵传感器相比，TOF技术在距离和精度上有了极大的改善：
　　1结构光技术发射的是一簇簇的光线，而TOF技术发射的是一整面光线（图13），可见有效深度信息点从3万个提升到30万个甚至更多。当用户进行解锁和支付等涉及安全的操作时，TOF技术可带来更精细的深度成像，最大限度提升人脸识别的安全性，做到金融级别的安全保护（图14）；
　　2结构光技术的最佳工作距离为0.2米到1.2米，而TOF技术的最佳工作距离为0.4米到5m米（理论最高可达10米），更远的有效距离，可以进一步扩展3D视觉成像应用的范围和潜力；
　　3TOF技术的传感器比结构光模块更少更小，成本相对更低，也可以简化手机主板布局，哪怕是仅有屏幕1/3宽度的“刘海”里也足够容纳相关的硬件单元；
　　4TOF技术既可以与手机前置摄像头联姻，放在手机的额头位置，也能与手机后置镜头搭档，实现背部三摄的豪华布局。

　　前置TOF设计方案
　　vivo曾在2018世界移动大会（上海）中发布了前置TOF方案（图15），并将其命名为“vivo TOF 3D超感应技术”。由于TOF的功能与结构光有所重叠，所以前置TOF设计同样可以带来与结构光相似的功能，比如金融级的面部解锁、面部支付、3D美颜、3D表情、3D头像建模等，利用TOF有效距离更远的优势，在应用范围和实际体验上的表现会更好（图16）。
　　比如，利用手机将万物（比如自己的头像）建模，再将模型与其他虚拟游戏结合，让玩家自己作为“新世界”的主角，兼顾沉浸式视觉体验与体感操作的乐趣。此外，在购物方面，TOF可以带来更真实和精确的3D试衣效果，无需逛卖场试衣就能放心下单。
　　后置TOF设计方案
　　OPPO最新发布的R17 Pro属于后置TOF方案的代表，它在后置双摄的上方安装了第三颗镜头（图17、图18），也就是所谓的TOF模块，从而将后置拍照从2D时代推向3D时代。
　　和前置TOF方案相比，后置TOF自然不再适用于面部解锁和面部支付等功能了，但它在后置镜头的3D美颜、AR装潢、AR游戏、体感游戏、全息影像交互等功能上，却可以带来比前置TOF方案更好的体验。
　　其中，AR无疑是后置TOF方案的主战场，因为时下大部分AR应用都是使用后置摄像头拍摄真实世界的画面并进行算法识别，然后再进行内容的填充。有了TOF技术加持的后置摄像头，可以将更完美的3D建模填充到画面里（图19），让AR效果更真实。
　　理性看待TDF技术前景
　　对智能手机而言，TOF是比结构光更具前景的3D视觉成像技术，它可以让手机屏幕从单纯的2D画面转变到更具空间感的3D画面，无论是画面的信息还是内容都将兀然增多。通过TOF模块与前置或后置镜头的搭配，还可以让TOF更有针对性地满足具体应用场景的安全和体验需求。
　　可惜的是，TOF技术才刚刚进入商业化量产的前期阶段，与其搭配的应用环境还不成熟，所以如今它的玩法还不够丰富，相关手机的售价也谈不上性价比，短期内还是属于偏概念的技术。想让TOF技术真正爆发，还需要等待5G网络的普及，届时TOF搭配更极致的网速和带宽，它将在3D视频通话、远程VR、远程AR、远程JR等泛现实迎来杀手级的体验（图20）。
　　让我们共同期待吧。

其他文献

用好切片器数据联动尽在掌握

首先根据自己的需要插入透视表，因为这里需要对多个关联数据进行查询。因此可以插入多个透视表，比如先插入区域和销售额的透视表，用于查询某个区域的销售额。点击“插入→数据透视表”，在打开的窗口中，选择一个表或区域，数据选择A1：D9的数值，位置选择“现有工作表”，定位一个位置存放数据透视表（图2）。　　选中插入的数据透视表，右击选择“显示字段列表”，在右侧打开的数据透视字表字段，将“区域”移动到下方的“

期刊

给PPT安一个电影字幕结尾

文档中加入字幕效果　　首先在PowerPoint中创建一个新文档，输入相关的内容信息后，通过全选命令将所有的内容选中。接下来点击“开始”标签，找到“段落”中的“居中”选项并点击它，使得所有的内容居中进行显示。然后通过回车键将每一行的内容进行分隔，这样便于以后更好地进行观看。这里要提醒大家的是，输入的信息一定要整体下沉，不然就体现不出字幕滚动的效果。　　接下来点击PowerPoint的“动画”标签，

期刊

幻灯片中人物介绍巧显示

1. 人物布局的设定　　打开Articulate Storyline 3，新建一个项目。在“故事视图”状态，双击“无标题场景”幻灯片进入编辑窗口。选择“设计”选项卡，点击“文章大小”，在弹出窗口的“文章大小”处选择“自定义”，将“锁定纵横比”前面的勾选去掉，设定宽度为1400，高度为700，右击设置好它的背景。　　利用“插入”选项卡中的“图片”，插入所需要的人物图片。全部选定图片，选择“格式”选项

期刊

机箱选购有讲究

很多用户攒机的时候，机箱往往会被作为最终平衡预算的一个配件，预算多就买个贵的，预算少就买个便宜的。这样不受重视的地位也让它成为了一些奸商趁机“揩油”的重要工具。　　其实作为整个主机系统最重要的保护与支撑装置、与外部连接的主要通道，机箱对电脑的使用体验、功能展现，以及安装的方便性等方面影响还是很大的，在挑选的时候也同样有许多值得注意的细节。機箱规格与尺寸　　挑选机箱的时候，第一条要注意的肯定是机箱尺

期刊

Word自带剪贴板增强功能

Q：复制粘贴是文档编辑中经常用到的操作，但是系统的剪贴板只有一个位置，要粘贴以前的内容又需要进行一次复制。如何可以调用以前的剪贴板内容？　　A：其实微软的Word软件中就有一个增强版的剪贴板功能，在其中可以看到多个不同的剪贴板内容。首先点击“开始”标签下“剪贴板”右下角的按钮，就可以看到复制的剪贴板内容，通过点击每一个内容后面的按钮，就可以快速地进行粘贴等操作。　　利用第三方的剪贴板工具，也可以完

期刊

多重出击玩转PPT金字塔图表

就地取材直接使用SmartArt插入　　PPT自带SmartArt组件，其中就包含金字塔图表。比如现在需要制作一个跑步强度和跑量关系的金字塔图，那么只要点击“插入→SmartArt→棱锥图”，然后选择一个自己喜欢的图形插入即可（图1）。　　在PPT中插入金字塔图后，根据自己的需要在文本上添加各种跑步类型，然后再设置一下颜色和形状，插入一些修饰文本和辅助箭头图形，这样即可完成一幅简单的金字塔图了（

期刊

处理器内置显卡逐个看

市占率第一 Intel核芯显卡　　也许很多人没想到，目前在显卡市场上，占有率第一的显卡品牌并非是N卡或A卡，而是Intel的内置显卡，也就是Intel Graphic HD系列，也被称为Intel核芯显卡（以下简称核显）。特别是其中的HD 630这个型号，在很多测试软件的数据库中，实际上也成为了装机率第一的显卡型号。例如鲁大师2018年上半年最受欢迎显卡排行榜（实际上就是装机率排行榜），以不同名称

期刊

解读Chrome 69的安全特性

盘点网络安全的三大威胁　　浏览器作为我们上网的主要工具，现在正遭受越来越多的安全威胁。对普通网民来说，这些威胁主要分三大类：一类是钓鱼网站，钓鱼者通过制作和官方一模一样的网页诱使我们点击，从而捕获我们的密码；一类是恶意广告，通过脚本和插件，在我们上网时弹出各种广告页面；再有就是各种浏览器插件，比如大家都很熟悉的Flash，它的漏洞有可能会被黑客利用，在后台自动下载恶意代码等等（图1）。 Chrom

期刊

无需安装的快应用来了

如今很多用户都在抱怨手机存储空间不足，而我们所安装的无数APP则是消耗存储空间的大户。那么，如果可以无需安装APP就能使用它的功能，不就可以最大限度解放手机空间了？　　早前CFan曾向大家介绍过使用浏览器APP里的网页版应用（H5）来节省手机存储空间的方法。如今，在很多手机预装的应用商店中都出现了名为“快应用”的分类，比如华为和OPPO等品牌。相对于需要安装的APK、H5和小程序，快应用在稳定性、

期刊

支付宝和微信授权登录的管理

Q：支付宝和微信是大多数人手机中的支付应用，于是很多应用也随之出现了“使用微信或支付宝账号登录”的功能。使用这些功能进行登录以后，通过什么方法可以对这些授权登录的应用进行管理？　　A：打开微信的设置窗口，点击列表中的“隐私”选项后，再点击“授权管理”选项，这样就可以看到哪些应用进行了授权。点击右上角的“管理”按钮，将不需要的授权删除就可以了。　　支付宝是在“账号管理”中的“账号授权”中进行管理操作

期刊