论文部分内容阅读
IHS表示,如果我们以Google Trends来了解“gesture sensing”的关注度,那么可以发现:2013年到2015年之间有相当明显的搜寻热度。事实上,一些具有平台制定实力的大厂,大约从2009年就已经开始布局手势感应技术;历经了数年的改进与时机的等待,约在2013年到2015年之间,一些相关的成果陆续呈现了出来。因此,媒体、产业、供应链自然地在这段时间里表现了他们的兴趣。“手势操控”基本上是以手势来作为人机介面的媒介,与语音、触控一样,都可以算是自然人机介面(natural user interface)的一种。当触控荧幕的使用冲击了既有的键盘、鼠标后,手势跟语音成为下一个受到关注的人机介面。
终极的人机介面可能是基于具有人工智能的机器,让使用者以自然语言交谈的方式进行,使用者根本无需做任何的学习,全凭机器背后的人工智能来了解使用者。然而,人工智能不会在近期几年就成熟到可以应用到日常电子产品的程度;就算是有机会,相关的法律约束、道德问题都必然将引起社会的激烈讨论、甚至对立。比较接近目前实际的情况是:在触控荧幕成为新一代的人机介面之后,我们的电子产品、物联网、机器等装置,正在不断地安装感应器(sensors),这些感应器成为人机介面或是大数据的基础;而后端的演算法、甚至未来发展出来的人工智能,将会是这些装置真正具有“智能”的关键。
手势操控受到一般使用者的关注可以从2006年的Wii开始算起。到了2010年的Microsoft Kinect时,算是达到了一个新的里程碑,因为这是第一次使用者可以徒手、不需仰赖任何控制器的方式与装置互动。从2013年第4季起,主流的家庭游戏机,包含Microsoft Xbox与Sony PlayStation,都可以支援徒手的手势操控。相形之下,Nintendo Wii U的人机介面已经显得过于传统。Intel的RealSense经过连续两年在CES的展示后,终于在2015年正式安装到笔记型电脑等装置。不过,从目前手势操控本身的成熟度来看,手势操控的人机介面在效能与应用上,还未达到投射式电容在2007年时一开始就令人惊艳的地步。即使是能够达到,使用者行为的改变仍然需要时间,更何况在某些装置上,手势操控可能是一种辅助性的人机介面,而不是主要的介面。
手势操控跟触控荧幕不存在取代的关系,这两个自然人机介面会有各自合适的使用情境。触控荧幕适合用于手机与平板电脑,同时也是主要而直觉的使用者介面,然而由于使用者已经可以碰触得到荧幕,所以手势操控就显得有些多余,或只是辅助性的目的。对一些使用者无法接触到荧幕的装置来说,手势操控就是相当合适的人机介面。例如:智能型电视可以透过具有荧幕的装置,或是机顶盒来达成,但是在这两者的使用情境下,使用者都需要与荧幕保持一定程度的距离,因此,触控荧幕并不适合。相对而言,除非仍然坚持以遥控器的方式作为人机介面,否则徒手的手势操控会是相当合适的方式。
一些新兴的沉浸式应用,像是扩增实境(augmented reality)、虚拟实境(virtual reality)等,装置本身不会有面积够大的荧幕方便操作,因此就其使用情境而言,手势操控会是相当合适的人机介面。智能型手表其实也有类似的难题,穿戴式装置比起行动装置更讲究穿戴的舒适性;即使可以作曲面荧幕,操作情境比起手机来说还是相当的不方便,这时手势操控跟触控荧幕彼此间就可以搭配、成为相辅相成的角色。Google在2015年为Android Wear发表了Wrist Gestures,正是利用内建的惯性MEMS感测器,让使用者可以转动手腕的简单方式来操作智能型手表。
再者,未来许多以物联网为基础的智能家电(IoT-based home appliances)本身可能根本没有荧幕,或者仅有一个以指示功能信息为主的小型荧幕,除了集中到手机、机顶盒上透过语音操作外,手势操控也会是合适的人机介面。例如:Apple目前发表的HomeKit平台,搭配iPhone,已经逐渐让物联网的智能家电生态体系有更清楚的轮廓,而Apple早在2013年11月时也并购了PrimeSense,取得了手势操控技术,并且这两年间仍持续地巩固其专利。Google在2015年5月发表的Project Soli,更具创意;以雷达波反射的原理,将整个手势操控的功能缩小到一个长宽各小于1公分的单晶片中。
手势操控的技术可以有不同的功能范畴,因而影响感应器的设计。许多手机已经内建惯性MEMS感测器,因此可以利用来做一些简单的手势操控应用,例如:甩动手机来选取上一首或下一首音乐、甩动手机来玩掷股子游戏、翻动手机以拒绝接听等等。同样地,距离感测器(proximity sensor)也可以用来做手势操控。不过,这些都不是手势操控感测器的真正潜力所在,只是因为感测器已经内建、加上应用软件的创意,才有了这些应用。具有深度图(3D depth map)能力的手势操控感测器将有机会在未来大放异彩。当感测器能够建构深度图时,除了具有手势操控能力外,同时也可以为装置带来“视觉”。例如:Intel的RealSense、第一代的Microsoft Kinect和目前的Project Tango都采用了类似的深度感测技术原理(structured light),但是延伸的加强与调整就可以扩充到不同的应用范畴。RealSense强调手势操控、机器视觉,甚至虹膜辨识,Project Tango以特制的电脑视觉晶片来做环境空间辨识,而Kinect则是加强了全身骨骼节点的演算法,让动作便是从手势拓展到全身。
经过数年的开发,手势操控作为人机介面,已经从研发、特殊应用阶段,逐渐往一般使用者可以经常看见的装置渗透。手势操控并不是要取代触控荧幕,而是以相关的感应器为基础,让手势可以如同触控荧幕般,成为另一个成熟的自然人机介面。而具“视觉”能力的感应器导入后,除了让装置具有判断使用者手势的能力外,也将让装置更具智能化。我们确实是在为智能型装置打造人机介面,但另一方面,我们也是在赋予“感官知觉”到这些装置上,这也是其智能化的关键。
终极的人机介面可能是基于具有人工智能的机器,让使用者以自然语言交谈的方式进行,使用者根本无需做任何的学习,全凭机器背后的人工智能来了解使用者。然而,人工智能不会在近期几年就成熟到可以应用到日常电子产品的程度;就算是有机会,相关的法律约束、道德问题都必然将引起社会的激烈讨论、甚至对立。比较接近目前实际的情况是:在触控荧幕成为新一代的人机介面之后,我们的电子产品、物联网、机器等装置,正在不断地安装感应器(sensors),这些感应器成为人机介面或是大数据的基础;而后端的演算法、甚至未来发展出来的人工智能,将会是这些装置真正具有“智能”的关键。
手势操控受到一般使用者的关注可以从2006年的Wii开始算起。到了2010年的Microsoft Kinect时,算是达到了一个新的里程碑,因为这是第一次使用者可以徒手、不需仰赖任何控制器的方式与装置互动。从2013年第4季起,主流的家庭游戏机,包含Microsoft Xbox与Sony PlayStation,都可以支援徒手的手势操控。相形之下,Nintendo Wii U的人机介面已经显得过于传统。Intel的RealSense经过连续两年在CES的展示后,终于在2015年正式安装到笔记型电脑等装置。不过,从目前手势操控本身的成熟度来看,手势操控的人机介面在效能与应用上,还未达到投射式电容在2007年时一开始就令人惊艳的地步。即使是能够达到,使用者行为的改变仍然需要时间,更何况在某些装置上,手势操控可能是一种辅助性的人机介面,而不是主要的介面。
手势操控跟触控荧幕不存在取代的关系,这两个自然人机介面会有各自合适的使用情境。触控荧幕适合用于手机与平板电脑,同时也是主要而直觉的使用者介面,然而由于使用者已经可以碰触得到荧幕,所以手势操控就显得有些多余,或只是辅助性的目的。对一些使用者无法接触到荧幕的装置来说,手势操控就是相当合适的人机介面。例如:智能型电视可以透过具有荧幕的装置,或是机顶盒来达成,但是在这两者的使用情境下,使用者都需要与荧幕保持一定程度的距离,因此,触控荧幕并不适合。相对而言,除非仍然坚持以遥控器的方式作为人机介面,否则徒手的手势操控会是相当合适的方式。
一些新兴的沉浸式应用,像是扩增实境(augmented reality)、虚拟实境(virtual reality)等,装置本身不会有面积够大的荧幕方便操作,因此就其使用情境而言,手势操控会是相当合适的人机介面。智能型手表其实也有类似的难题,穿戴式装置比起行动装置更讲究穿戴的舒适性;即使可以作曲面荧幕,操作情境比起手机来说还是相当的不方便,这时手势操控跟触控荧幕彼此间就可以搭配、成为相辅相成的角色。Google在2015年为Android Wear发表了Wrist Gestures,正是利用内建的惯性MEMS感测器,让使用者可以转动手腕的简单方式来操作智能型手表。
再者,未来许多以物联网为基础的智能家电(IoT-based home appliances)本身可能根本没有荧幕,或者仅有一个以指示功能信息为主的小型荧幕,除了集中到手机、机顶盒上透过语音操作外,手势操控也会是合适的人机介面。例如:Apple目前发表的HomeKit平台,搭配iPhone,已经逐渐让物联网的智能家电生态体系有更清楚的轮廓,而Apple早在2013年11月时也并购了PrimeSense,取得了手势操控技术,并且这两年间仍持续地巩固其专利。Google在2015年5月发表的Project Soli,更具创意;以雷达波反射的原理,将整个手势操控的功能缩小到一个长宽各小于1公分的单晶片中。
手势操控的技术可以有不同的功能范畴,因而影响感应器的设计。许多手机已经内建惯性MEMS感测器,因此可以利用来做一些简单的手势操控应用,例如:甩动手机来选取上一首或下一首音乐、甩动手机来玩掷股子游戏、翻动手机以拒绝接听等等。同样地,距离感测器(proximity sensor)也可以用来做手势操控。不过,这些都不是手势操控感测器的真正潜力所在,只是因为感测器已经内建、加上应用软件的创意,才有了这些应用。具有深度图(3D depth map)能力的手势操控感测器将有机会在未来大放异彩。当感测器能够建构深度图时,除了具有手势操控能力外,同时也可以为装置带来“视觉”。例如:Intel的RealSense、第一代的Microsoft Kinect和目前的Project Tango都采用了类似的深度感测技术原理(structured light),但是延伸的加强与调整就可以扩充到不同的应用范畴。RealSense强调手势操控、机器视觉,甚至虹膜辨识,Project Tango以特制的电脑视觉晶片来做环境空间辨识,而Kinect则是加强了全身骨骼节点的演算法,让动作便是从手势拓展到全身。
经过数年的开发,手势操控作为人机介面,已经从研发、特殊应用阶段,逐渐往一般使用者可以经常看见的装置渗透。手势操控并不是要取代触控荧幕,而是以相关的感应器为基础,让手势可以如同触控荧幕般,成为另一个成熟的自然人机介面。而具“视觉”能力的感应器导入后,除了让装置具有判断使用者手势的能力外,也将让装置更具智能化。我们确实是在为智能型装置打造人机介面,但另一方面,我们也是在赋予“感官知觉”到这些装置上,这也是其智能化的关键。