论文部分内容阅读
即便你坚持认为,你我的灵魂来自自然,然而只要想想你我一天24小时有多少时间被手机、电脑屏幕所俘虏。你就会立刻明白,“download or die”还在继续,并且大步奔向越发庞大的流动比特世界。这就是御屏时代,一个个鲜活的,不仅仅停留于技术或者商业的故事还在上演。
然而,何为革命?
这个时代,这个词本身具有的神圣般意义早就被亵渎了。
就像是R,舍雷在《技术帝国》一书中说:“我们的现代社会,正越来越多地被‘技术’所控制、所主宰。这些‘技术’不断升级,越来越复杂,而我们普通的公众,却对这些主宰我们生活的‘技术’所知越来越少。”虽然越来越多的电视内容将通过互联网传播,但我们认识到电视体验与网页体验是不同的,几乎没人喜欢在3米外的地方浏览网页。想想看为什么?
你知道问题的症结所在,机器冰冷,离我们太远。但是,请你相信,未来十年的产品体验一定会迥异于二十一世纪的第一个十年,第二个十年将会是人机交互变得更加智能化,拟人化、甚至具有一定深度学习能力的好时代。
一切从屏幕开始
美国当地时间2011年6月23日,美国专利和商标局公布了苹果的—项专利申请,揭露了苹果TV的下一篇章,苹果将专利中的系统称之为增强的TV插件系统。谷歌先于苹果推出了联网的电视机,但谷歌的电视机运行的基本上只是一些静态插件。由于Google TV体验过于复杂,并存在大量漏洞,用户正在疏远搜索巨头的Google TV。虽然Google TV只是一个软件平台,配备了Android操作系统和谷歌的Chrome浏览器,但必须购买罗技Revue机顶盒或索尼电视才能使用。最为关键的是,目前谷歌智能电视在人机交互上,并没有体现出未来感一目前给人的印象更像是把电脑或者网页的内容移植到电视屏幕。
苹果的电视插件系统将插件升级到另一个层面,可与电视节目进行交互,比如说,可与NBC的“The Voice”节目互动,让观众直接从他们的高清电视机轻松给自己支持的候选人投票。该系统还能还能与体育直播节目进行互动,比如说在直播足球比赛的同时还能播放其他的直播节目。该系统仍然需要用到苹果的机顶盒,但未来的使用将大不相同,苹果机顶盒终于可连接到有线电视网络。
在专利申请文件中,苹果陈述,他们意识到现有的电视机插件技术存在着局限性。传统的电视机插件不能识别用户最近经常观看的电视节目。于是,苹果设想并开发出一个增强型的电视插件系统,该系统的插件能够识别用户经常观看的媒体内容,以便能自动但不干扰地向用户提供相关或补充的信息。
乔布斯曾在Apple TV发布会上说:“我们曾经把它设计成了iTune5和电脑的附属品,那不会是人们想要的东西。我们现在知道的是_人们想要的只有电影、电影、电影。”真的是如此吗?至少,微软CEO鲍尔默不这样认为。尽管微软在电视领域是个落潮者,但不可忽视微软遥感技术的强大驱动力——它开发的最酷游戏机Kinect已热卖近千万台,更酷的是用户可以通过动作来播放Netflix、Hulu上的视频。如果这一技术应用在电视上,用户极有可能彻底抛弃按键复杂的遥控器。
机器进化——感性工学
我们可以预先设想一下这样的场景,各种炫目的APP在电视屏幕上滑动,遥控器被键盘取代,你可以一边观看精彩的电视剧,一边发微博观后感、实时分享朋友的旅行照片。这不就是大尺寸的平板电脑吗?事实上,无论是Smartphone、Smart pad还是Smart TV本质上无非是各种尺寸PC,互联网和各种APP应用的集合体。这其中的关键则是人机交互,如果依然是传统输入与输出模式,在操控乃至人机感知方面没有突破的话智能生活根本无从谈起。
回到症结,机器冰冷,离你很远。
比超iPhone,想想看你那可怜且实在糟糕的客厅体验吧,传统的遥控板让我们与电视的交互方式依然处于史前文明时代。这样的体验已经让消费者对电视产生了厌恶情绪,最新针对—万个家庭的调查数据显示,每周收看电视的时间比3年前下降了一半多,在新浪微博上,有人宣称已经一年半没有开过电视机,“但是我并没有感到与这个时代想隔绝”这位网友最后的话道出了电视危机的真正原因——在内容分享分享越来越分化的移动互联网时代,电视已经有被边缘化的危险,而智能电视的自强运动则刚刚开始,在内容获取方面目前智能电视与并不落后,除了普通的门户内容之外,甚至有专门的影视资源网站支持。剩下惟一的短板就是人机交互,这才是能否将消费者重新拉回客厅的关键。在这方面,技术领衔的是任天堂、苹果和微软。
4年前的1月10日,这一天,乔布斯宣告“我们不用触控笔,而用什么呢?世界上最好的指向方式——我们的手指。”这是感性工学的完胜的第一波,同样的事情,很快发生在电玩领域,你大概开始忘记两根手指按8个键,Wii之后,打网球直接用手挥拍,搏击就是出拳,钓鱼你得把握住鱼竿。Wii以遥控手把上下震动,使用者指向哪里就可以瞄准到哪里?符合你我真实生活中行为的经验模式。任天堂教父岩田聪,竞争者们都在打—场方向错误的战争,太过度强调科技功能、芯片速度(你也许还记得索尼PS3的云计算计划),这脱离了消费电子的本质,只会让游戏变得越来越难使用,变得不好玩fLess funl。感性工学,锁定那些即使从来不玩游戏的消费者,并且耍考虑女性消费者的需求,开发出连妈妈级顾客都喜欢的产品。Wii迈出了第二步,可事情还没结束,和乔布斯对触控笔的论断一致(我们不需要手写笔,我们干嘛要傻乎乎的挥舞棒子?)
北京时间6月23日,美国专利商标局授予苹果一项与移动设备触摸屏的手势功能有关的专利,可应用于配备触摸屏的多功能移动设备。简单描述其可在触摸屏上显示一部分页面内容,包括一个可显示部分框架内容以及页面其他内容的框架。例如,当用户在触摸屏上画出一个“N”形手势时软件会对此作出反应,屏幕显示的内容会相应进行调整。
身体就是控制器,Kinect重磅出击
过去365天,没有人能告诉你这一年中人们总共拍过了几次脑袋,想出了多少新点子就在2009年2月,来自麻省理工学院媒体实验室的普拉纳夫,米斯特里(PFarlav Mistry)向世界展示“第六感”的惊世骇俗,这个廉价拼凑起来的小设备能够将数字世界和真实世界连接起来,迷人之处,恰好在于把一切不符合直觉的操作部隐藏了起来,直截了当!你我以符合直觉的方式操纵机器,手指比划一个取景框就是拍照,只需要拿起—本书就可以在封面上看到亚马逊书店对这本书的评价,想把一段文字从书上输入到计算机中只需要用手指比划一下,一切回归直觉。
微软记得维纳斯之咒,并且要解开这个 结。要符合商业逻辑“第六感”很快就被商业化包装进化,在下一代的×box360游戏机的包装箱里,我们将会发现一个有摄像头和麦克风的小盒子。把这个盒子放在电视附近,你会立刻变成哈利,波特一样的魔法师。这像是你自己导演和主演的电影,摆摆手删掉—个文件,可以做个手势就把音量关闭,是的,另一个比划,电影就会全屏播放。也不再需要指挥电子设备,而是电子设备随时紧盯着他们的行为,亦步亦趋,加上微软一直寄予厚望的语音识别技术的进展——现在语音识别已经可以达到95%的准确率,当然,是在足够的训练之后,也许我们和计算机的关系将不再是像现在这样机械的输入和反馈一善解人意。
在游戏机上的成功无疑会让微软把体感识别技术蔓延出来,但难点在于相关软件的开发和匹配,6月17日,微软发布了由微软研究院开发的,基于WindOWS的Kinect软件开发工具包测试版(Kinect for Windows SDK beta)。KinectforWindowsSDK适用于Windows7.套装中包括驱动程序,用于获取原始传感器数据流的大量API、自然用户界面’安装程序文件及其他资源。这套SDK还允许开发者借助微软Visual Studi0 2010,利用C 、C#或VisualBasic等语言开发新的应用。这套SDK包含了100多页高品质的技术文档。除内建的帮助文件外一文档资料中还包含SDK所提供的大部分示例的详细解说。从公布的文件我们可以发现不少Kinect的杨心技术,比如原始传感器数据流(Paw Sensor Streams)骨骼跟踪(SKeIetaITracking):
原始传感器数据流使得开发人员可以获取来自深度传感器、彩色摄像头传感器和四元麦克风阵列的原始数据流。这些信息能够允许他们在Kinect传感器产生的底层数据流的基础上进行开发。而骨骼跟踪(SKeletalTracking)这套SDK能够跟踪在Kinect的视野中移动的一到两名玩家的骨骼影像,从而使构建以姿态驱动的应用成为可能。
基于体感的动作捕捉技术已经有了数十年的历史佣多部摄像机角度传感器、超声波发生器和接收器、电磁场接收器等设备实现对演员身体动作的跟踪,并且将这些动作轨迹传送到计算机中一再应用在人物模型上,这是非常成熟的技术。电影特效中使用的高精度动作捕捉技术使用标签来实现,而且往往需要演员穿上单一颜色的紧身衣以避免产生误差。然而缺点明确:你大概不太能接受,穿一件满身是传感器的紧身服,很明显,这样繁琐的技术并不适合走进家庭,然而这种技术带来的诱惑却令游戏机厂商难以抗拒。然而,从第六感开始,摄像头和软件标签替代了硬标签。通过放在不同位置的两部摄像头可以获得两幅略有不同的图像,将之进行运算,就可以获得立体图像,进而感知距离。这是我们的大脑每时每刻都在做的事情,现在得让计算机学习。原理一致,微软的Kinect通过一个彩色和一个黑白摄像头来获取这样的立体图像一再通过红外线来感知玩家离电视的大致距离,就可以判断玩家的身体动作。
从简单到复杂,单一到连续。Kinect在游戏领域的牛刀小试已经掀起了滔天的波澜,一方面消费者对于抛开一切控制器的创意具有一种本能的接受,另外—方面,业界也从微软也从中看到了未来人机交互的发展方向,游戏并不是Kinect的边界,背后反映出微软在人机交互领域独树一帜的研究实力。
人机交互的未来轨迹
无论是苹果的最新专利,还是微软对于Kinect潜能的继续挖掘。他们都在试图回答以下几个问题:如何轻松地确定某一个功能的设定?有哪些可能的操作?具体如何操作?如何建立系统状态与用户解释之间的匹配关系?如何才自己建立操作意图与操作行为之间的匹配关系?用户如何知道系统是否处于所期望的状态?如何建立系统状态与用户解释之间的关系?
任何一个未来的人机交互设计必须解决以上所提的问题,设计人员提供给用户个正确的概念概念模式,使得操作按钮的设计与操作结果保持一致。而正确的匹配则要着力于解决用户的操作与结果具有天然的、容易感知的设计。我们可以回想—下,任何一个数码产品上让你感觉优良的人机交互设计无不遵循了以上原则,例如诺基亚最新N9所搭配的MeeGo 12 Harmattan系统采用了诺基亚独有的用户界面。与英特尔提供的版本不同,诺基亚N9以划动操作作为重点以在程序列表多任务管理、聚合信息的动态更新之间实现快速切换。它以简单的滑动操作代替了主屏键功能。无论你打开哪个应用,只需要从屏幕的边缘轻滑过去一即可回到主视窗。俄勒冈大学的学生通过手势,让一部直升机玩具起飞。这个就是Kinect针对Windows SoftwareDeveJopment kit(SKD)软件开发工具应用。
当年IBM总裁托马斯,沃森预计全世界只需要5台电脑的故事,已经成为科技预测方面的经典笑柄。不过这并不妨碍我们通过目前已经掌握的技术趋势和应用方式对未来的人机交互进行揣摩与梳理,见微知著,当这些前瞻性的应用也许很快就会变成现实,真正来临的时候,我们会发现——未来,你就是遥控器!
然而,何为革命?
这个时代,这个词本身具有的神圣般意义早就被亵渎了。
就像是R,舍雷在《技术帝国》一书中说:“我们的现代社会,正越来越多地被‘技术’所控制、所主宰。这些‘技术’不断升级,越来越复杂,而我们普通的公众,却对这些主宰我们生活的‘技术’所知越来越少。”虽然越来越多的电视内容将通过互联网传播,但我们认识到电视体验与网页体验是不同的,几乎没人喜欢在3米外的地方浏览网页。想想看为什么?
你知道问题的症结所在,机器冰冷,离我们太远。但是,请你相信,未来十年的产品体验一定会迥异于二十一世纪的第一个十年,第二个十年将会是人机交互变得更加智能化,拟人化、甚至具有一定深度学习能力的好时代。
一切从屏幕开始
美国当地时间2011年6月23日,美国专利和商标局公布了苹果的—项专利申请,揭露了苹果TV的下一篇章,苹果将专利中的系统称之为增强的TV插件系统。谷歌先于苹果推出了联网的电视机,但谷歌的电视机运行的基本上只是一些静态插件。由于Google TV体验过于复杂,并存在大量漏洞,用户正在疏远搜索巨头的Google TV。虽然Google TV只是一个软件平台,配备了Android操作系统和谷歌的Chrome浏览器,但必须购买罗技Revue机顶盒或索尼电视才能使用。最为关键的是,目前谷歌智能电视在人机交互上,并没有体现出未来感一目前给人的印象更像是把电脑或者网页的内容移植到电视屏幕。
苹果的电视插件系统将插件升级到另一个层面,可与电视节目进行交互,比如说,可与NBC的“The Voice”节目互动,让观众直接从他们的高清电视机轻松给自己支持的候选人投票。该系统还能还能与体育直播节目进行互动,比如说在直播足球比赛的同时还能播放其他的直播节目。该系统仍然需要用到苹果的机顶盒,但未来的使用将大不相同,苹果机顶盒终于可连接到有线电视网络。
在专利申请文件中,苹果陈述,他们意识到现有的电视机插件技术存在着局限性。传统的电视机插件不能识别用户最近经常观看的电视节目。于是,苹果设想并开发出一个增强型的电视插件系统,该系统的插件能够识别用户经常观看的媒体内容,以便能自动但不干扰地向用户提供相关或补充的信息。
乔布斯曾在Apple TV发布会上说:“我们曾经把它设计成了iTune5和电脑的附属品,那不会是人们想要的东西。我们现在知道的是_人们想要的只有电影、电影、电影。”真的是如此吗?至少,微软CEO鲍尔默不这样认为。尽管微软在电视领域是个落潮者,但不可忽视微软遥感技术的强大驱动力——它开发的最酷游戏机Kinect已热卖近千万台,更酷的是用户可以通过动作来播放Netflix、Hulu上的视频。如果这一技术应用在电视上,用户极有可能彻底抛弃按键复杂的遥控器。
机器进化——感性工学
我们可以预先设想一下这样的场景,各种炫目的APP在电视屏幕上滑动,遥控器被键盘取代,你可以一边观看精彩的电视剧,一边发微博观后感、实时分享朋友的旅行照片。这不就是大尺寸的平板电脑吗?事实上,无论是Smartphone、Smart pad还是Smart TV本质上无非是各种尺寸PC,互联网和各种APP应用的集合体。这其中的关键则是人机交互,如果依然是传统输入与输出模式,在操控乃至人机感知方面没有突破的话智能生活根本无从谈起。
回到症结,机器冰冷,离你很远。
比超iPhone,想想看你那可怜且实在糟糕的客厅体验吧,传统的遥控板让我们与电视的交互方式依然处于史前文明时代。这样的体验已经让消费者对电视产生了厌恶情绪,最新针对—万个家庭的调查数据显示,每周收看电视的时间比3年前下降了一半多,在新浪微博上,有人宣称已经一年半没有开过电视机,“但是我并没有感到与这个时代想隔绝”这位网友最后的话道出了电视危机的真正原因——在内容分享分享越来越分化的移动互联网时代,电视已经有被边缘化的危险,而智能电视的自强运动则刚刚开始,在内容获取方面目前智能电视与并不落后,除了普通的门户内容之外,甚至有专门的影视资源网站支持。剩下惟一的短板就是人机交互,这才是能否将消费者重新拉回客厅的关键。在这方面,技术领衔的是任天堂、苹果和微软。
4年前的1月10日,这一天,乔布斯宣告“我们不用触控笔,而用什么呢?世界上最好的指向方式——我们的手指。”这是感性工学的完胜的第一波,同样的事情,很快发生在电玩领域,你大概开始忘记两根手指按8个键,Wii之后,打网球直接用手挥拍,搏击就是出拳,钓鱼你得把握住鱼竿。Wii以遥控手把上下震动,使用者指向哪里就可以瞄准到哪里?符合你我真实生活中行为的经验模式。任天堂教父岩田聪,竞争者们都在打—场方向错误的战争,太过度强调科技功能、芯片速度(你也许还记得索尼PS3的云计算计划),这脱离了消费电子的本质,只会让游戏变得越来越难使用,变得不好玩fLess funl。感性工学,锁定那些即使从来不玩游戏的消费者,并且耍考虑女性消费者的需求,开发出连妈妈级顾客都喜欢的产品。Wii迈出了第二步,可事情还没结束,和乔布斯对触控笔的论断一致(我们不需要手写笔,我们干嘛要傻乎乎的挥舞棒子?)
北京时间6月23日,美国专利商标局授予苹果一项与移动设备触摸屏的手势功能有关的专利,可应用于配备触摸屏的多功能移动设备。简单描述其可在触摸屏上显示一部分页面内容,包括一个可显示部分框架内容以及页面其他内容的框架。例如,当用户在触摸屏上画出一个“N”形手势时软件会对此作出反应,屏幕显示的内容会相应进行调整。
身体就是控制器,Kinect重磅出击
过去365天,没有人能告诉你这一年中人们总共拍过了几次脑袋,想出了多少新点子就在2009年2月,来自麻省理工学院媒体实验室的普拉纳夫,米斯特里(PFarlav Mistry)向世界展示“第六感”的惊世骇俗,这个廉价拼凑起来的小设备能够将数字世界和真实世界连接起来,迷人之处,恰好在于把一切不符合直觉的操作部隐藏了起来,直截了当!你我以符合直觉的方式操纵机器,手指比划一个取景框就是拍照,只需要拿起—本书就可以在封面上看到亚马逊书店对这本书的评价,想把一段文字从书上输入到计算机中只需要用手指比划一下,一切回归直觉。
微软记得维纳斯之咒,并且要解开这个 结。要符合商业逻辑“第六感”很快就被商业化包装进化,在下一代的×box360游戏机的包装箱里,我们将会发现一个有摄像头和麦克风的小盒子。把这个盒子放在电视附近,你会立刻变成哈利,波特一样的魔法师。这像是你自己导演和主演的电影,摆摆手删掉—个文件,可以做个手势就把音量关闭,是的,另一个比划,电影就会全屏播放。也不再需要指挥电子设备,而是电子设备随时紧盯着他们的行为,亦步亦趋,加上微软一直寄予厚望的语音识别技术的进展——现在语音识别已经可以达到95%的准确率,当然,是在足够的训练之后,也许我们和计算机的关系将不再是像现在这样机械的输入和反馈一善解人意。
在游戏机上的成功无疑会让微软把体感识别技术蔓延出来,但难点在于相关软件的开发和匹配,6月17日,微软发布了由微软研究院开发的,基于WindOWS的Kinect软件开发工具包测试版(Kinect for Windows SDK beta)。KinectforWindowsSDK适用于Windows7.套装中包括驱动程序,用于获取原始传感器数据流的大量API、自然用户界面’安装程序文件及其他资源。这套SDK还允许开发者借助微软Visual Studi0 2010,利用C 、C#或VisualBasic等语言开发新的应用。这套SDK包含了100多页高品质的技术文档。除内建的帮助文件外一文档资料中还包含SDK所提供的大部分示例的详细解说。从公布的文件我们可以发现不少Kinect的杨心技术,比如原始传感器数据流(Paw Sensor Streams)骨骼跟踪(SKeIetaITracking):
原始传感器数据流使得开发人员可以获取来自深度传感器、彩色摄像头传感器和四元麦克风阵列的原始数据流。这些信息能够允许他们在Kinect传感器产生的底层数据流的基础上进行开发。而骨骼跟踪(SKeletalTracking)这套SDK能够跟踪在Kinect的视野中移动的一到两名玩家的骨骼影像,从而使构建以姿态驱动的应用成为可能。
基于体感的动作捕捉技术已经有了数十年的历史佣多部摄像机角度传感器、超声波发生器和接收器、电磁场接收器等设备实现对演员身体动作的跟踪,并且将这些动作轨迹传送到计算机中一再应用在人物模型上,这是非常成熟的技术。电影特效中使用的高精度动作捕捉技术使用标签来实现,而且往往需要演员穿上单一颜色的紧身衣以避免产生误差。然而缺点明确:你大概不太能接受,穿一件满身是传感器的紧身服,很明显,这样繁琐的技术并不适合走进家庭,然而这种技术带来的诱惑却令游戏机厂商难以抗拒。然而,从第六感开始,摄像头和软件标签替代了硬标签。通过放在不同位置的两部摄像头可以获得两幅略有不同的图像,将之进行运算,就可以获得立体图像,进而感知距离。这是我们的大脑每时每刻都在做的事情,现在得让计算机学习。原理一致,微软的Kinect通过一个彩色和一个黑白摄像头来获取这样的立体图像一再通过红外线来感知玩家离电视的大致距离,就可以判断玩家的身体动作。
从简单到复杂,单一到连续。Kinect在游戏领域的牛刀小试已经掀起了滔天的波澜,一方面消费者对于抛开一切控制器的创意具有一种本能的接受,另外—方面,业界也从微软也从中看到了未来人机交互的发展方向,游戏并不是Kinect的边界,背后反映出微软在人机交互领域独树一帜的研究实力。
人机交互的未来轨迹
无论是苹果的最新专利,还是微软对于Kinect潜能的继续挖掘。他们都在试图回答以下几个问题:如何轻松地确定某一个功能的设定?有哪些可能的操作?具体如何操作?如何建立系统状态与用户解释之间的匹配关系?如何才自己建立操作意图与操作行为之间的匹配关系?用户如何知道系统是否处于所期望的状态?如何建立系统状态与用户解释之间的关系?
任何一个未来的人机交互设计必须解决以上所提的问题,设计人员提供给用户个正确的概念概念模式,使得操作按钮的设计与操作结果保持一致。而正确的匹配则要着力于解决用户的操作与结果具有天然的、容易感知的设计。我们可以回想—下,任何一个数码产品上让你感觉优良的人机交互设计无不遵循了以上原则,例如诺基亚最新N9所搭配的MeeGo 12 Harmattan系统采用了诺基亚独有的用户界面。与英特尔提供的版本不同,诺基亚N9以划动操作作为重点以在程序列表多任务管理、聚合信息的动态更新之间实现快速切换。它以简单的滑动操作代替了主屏键功能。无论你打开哪个应用,只需要从屏幕的边缘轻滑过去一即可回到主视窗。俄勒冈大学的学生通过手势,让一部直升机玩具起飞。这个就是Kinect针对Windows SoftwareDeveJopment kit(SKD)软件开发工具应用。
当年IBM总裁托马斯,沃森预计全世界只需要5台电脑的故事,已经成为科技预测方面的经典笑柄。不过这并不妨碍我们通过目前已经掌握的技术趋势和应用方式对未来的人机交互进行揣摩与梳理,见微知著,当这些前瞻性的应用也许很快就会变成现实,真正来临的时候,我们会发现——未来,你就是遥控器!