论文部分内容阅读
如果你听了施浩德对于英特尔重塑计算体验的战略部署,那就会有一个不得不被你记住的词—感知计算。感知计算是一个听起来感到神秘又复杂的名词,但其实它并不难理解。顾名思义,感知计算就是用我们人类的感官去和电脑交流沟通。比如说触摸体验实际上就是一种感知计算,因为触摸是人类的本能,而用鼠标键盘却不是本能。
梦想的开始
今天,我们还在用熟悉的键盘和鼠标与计算机进行交互。这些设备为计算机提供了一个直接的、可识别的输入集合,并为软件环境提供了简单的数据点以进行评估。当用户按键或点击鼠标时,这些操作不会被误判或曲解。然而,这些操作会将用户限制在单一界面,当然,初级的触摸也是被限制在单一界面里的。如何能让计算机像我们人一样认知周围的环境,使它们能够处理周围的大量信息,并根据用户的意图得出合乎逻辑的结论呢?而这就是英特尔将要为我们塑造的“芯“使命。
简单来说就是把感觉注入电脑:眼睛、耳朵、声音、触摸、感情以及情境,从而实现更加自然、直观以及身临其境的真实体验。
试想一下,语音识别、动作识别、环境识别、生物识别等等……怎么样,这一定是一个梦想的开始!
而关于梦想,来自英特尔公司的邓慕理说:“有一句名言称:预测未来的唯一方法就是创造未来。”未来,不仅是英特尔的梦想,也是我们的梦想。
梦,是什么?
英特尔要为我们塑造的梦,就是赋予冰冷的计算设备像人一样的思考与感知能力,目前,它、计算设备思考计算的能力在某些方面可以说已经超越了人类,那么感知计算的能力又是什么呢?对此邓慕理在这里给出了解答。
首先,感知计算就是要自然(Natural)。例如我们与机器交互的时候,就像跟普通人互动一样,都是通过听、说、看、摸,以及各种表情,包括微笑、生气、愤怒等等,所有的这些方式就是自然,不要控制感,也不要操纵感。跟计算机的互动要与跟人的互动是一样的。例如我们用嘴与其他人交流,英特尔也希望能够以这种方式与机器交互互动。
另外就是要直观(Intuitive)。在与计算机交互时,不要想着要有说明书、指令、指南,就像我们跟人交流的时候不需要有指令,不需要有手册一样。其实人机之间的交互跟人与人之间的交流很类似,都是直观、自然,不需要有说明书和指南。这就是“你”和“我”交流的方式。从这一刻开始,要想理解什么是感知计算,就想着“你(NI)”这个字就行了。自然(Natural)、直观(Intuitive)、你(NI)。不仅是语言交流的自然,我们的手、身体也没有任何的说明书、指令或是指南。
所以我们还有另外一个I,就是身临其境(Immersive)。什么叫身临其境?也就是说,现实社会与虚拟社会之间的界限已经模糊了,做梦的时候,有的时候会心跳加快,有的时候会出汗,这个梦到底是虚拟环境,还是在真实环境?我们分不清是在外面,是一个旁观者,还是在里面,游戏的参与者,这就是身临其境。N是自然,I是直观,另外一个I就是身临其境。感知计算就是NII,自然(Natural)、直观(Intuitive)跟身临其境(Immersive)。
未来的梦
我们在预测未来的时候,首先要回顾一下历史。看看过去5年这个大背景。如今的计算机语音的识别还并不完美,但是它已经能够识别你的语言。视觉方面已经实现了3D、智能电视、远程沟通、手势识别,还有视网膜屏显示技术。这些技术能够让你感觉更好、体验更佳,真正做到栩栩如生。此外,人机交互方式就是利用触觉,比如触摸、触屏、传感器等等。这些虽然还并不是完美的应用,但这起码是一个很不错的起步。
在未来,我们要把虚拟与现实社会交错结合起来,从而有现实社会跟虚拟社会。另外就是多元模式。交互应该是更加全面的,各种各样的五官都利用起来,我们不仅要看,不仅要听,也不单是说触摸。例如,别人能看到我们的面部表情,听到声音,看到场景。在看到我们的表情时就能够辨别出我们的表情是快乐的,或者是愤怒的,我们可以用多种模式进行沟通。除此之外还有个人助理,就是说计算机能够帮助我们做很多事,它对我了如指掌。比如当你想回家时,计算机告诉我们说路边正好有一个花店,而且你女朋友要过生日了,你要是不给她买花可就要麻烦了。而计算机只需要识别我的声音就可以了,其他的声音均可以被计算机视为背景噪音。
另外就是自动转换语言,在你出国或与其他国家的朋友交流的时候,机器能够把你的话或者其他人的话翻译成你自己的母语。这其实离我们并不遥远,只是让实时的机器翻译变得更加完美而已。
此外还有生物特征识别,事实上目前已经有很多利用了各种不同感官的相关技术。比如我们可以去触摸,在触屏上点击一下,比如计算机还能够知道我们喜欢的颜色、了解到我们的心情状况。生物特征能够在很大程度上帮助计算机去进行各种识别,因为它能够读取我们的血氧含量、心率脉搏等等数据,从而判断出这个人是否有问题,是不是要打电话找医生急救。比如我们的计算机会说,你有点不舒服吧,看上去有点不妥,跟2个月前相比有点不太一样,身体是不是出现状况了,咱们去看医生吧。这些都有可能在未来成为现实的。
而这一切都是可以用于平板、手机,甚至是咖啡机,甚至你的视频或者是你的音响设备等等。例如当你想去播放音乐的话,你不用先去找到这个文件然后再点击,再用键盘控制,而是很简单地用语音就能够控制。
“NII”—自然、直观、身临其境,英特尔希望这种人与人之间沟通的方式,也能够在人机交互里面得到实现,这样的计算方式也能够是无处不在的。
当梦想照进现实
而在我们正实现梦想的当下,让我们来看看英特尔都做到了什么。在感知计算交流会的现场,邓慕理邀请了他的同事为我们做了一个能与计算机进行互动游戏的演示,演示中首先计算机会去识别她的手,她会和计算机进行互动,之后给游戏中的个小动物一些指令,小动物都可以一一做出理解进行反映。 语音是全球最方便的沟通方式。英特尔认为,语音未来将会逐步代替触摸屏。例如现在我们想在百度上搜索内容,我们的操作步骤是:打开浏览器-输入网址-输入搜索的内容-筛选搜索结果。而如果有智能化的语音控制和识别系统,我们通过简单的口头发送指令,电脑便会自动调出最合适的搜索结果。
英特尔与Nuance合作的声龙助理(Dragon Assistant)语音控制应用已经在超极本等设备上实现,并将支持中文输入。这一应用充分利用英特尔酷睿处理器的计算能力,为我们提供了更加有趣和易用的声音控制方式,进行人机交互。通过语音控制,消费者能够让设备搜索百度、淘宝等热门网站,更新新浪微博,完成迅雷、快播等影音播放器的视频回放,或是在优酷上进行视频搜索。
当然英特尔对于面部识别的支持也是必不可少的,英特尔与合作伙伴开发的FastAccess Anywhere是一款面部识别软件,在使用该软件的超极本上,用户可以选择通过面部识别开机、浏览密码保护的网站等。用户因此能够摆脱繁琐的操作,将科技的便利性与安全性完美结合,真正实现“你本人就是你的密码”。
再来看英特尔使用的3D摄像头和反欺骗技术,它可以探测肌肉运动,并通过7点进行确认。这提高了面部识别技术的竞争力。而由于摄像头距面部的距离已不是很远,因此眼球追踪系统也成为了可能。利用摄像头,眼球的运动可以被转化为鼠标指针的移动。而即使头部的位置发生了移动,摄像头和屏幕也可以相互配合,确定鼠标指针的位置。
梦由“芯”生,“芯”由梦现
而这所有一切梦幻搬的构想与体验都离不开一个强大的“芯”,反之,也正是由于这些强大的功能才体现出这颗微小的“芯”是那么的强大。让那些令人兴奋的梦想,并不会成为仰望星空的遐想。而这一切得益于英特尔创新的技术进步,是触手可及的未来。目前,基于第三代智能英特尔酷睿处理器的超极本已经能够实现触摸控制、声音控制、面部识别等感知计算功能。将于今年推出的第四代智能英特尔酷睿处理器(研发代号为“Haswell”)还将使计算设备的体验再度提高。而感知计算的发展将会推动全新的体验,以赋予消费者更加自由灵活的操作方式和更为天马行空的操作想象。
超极本生态新发展
英特尔感知计算软件开发套件(Intel Perceptual Computing Software Development Kit, SDK)。涵盖感知计算的多个方面,如面部识别、语音指令,和手势识别。开发套件包括手册、代码样本、算法、示例应用和教程,可帮助开发人员以尽可能简单的方式整合感知计算功能。英特尔是推动软件开发的坚定支持者,而此次,感知计算应用的发展将得益于传感技术和硬件计算性能相结合所创造的绝佳机会。英特尔感知计算软件开发套件支持多种最流行的人机沟通方式,并侧重于用户与设备在约15厘米到91厘米范围内的交互。该软件开发套件可用于许多平台,但它针对的是采用嵌入式麦克风和外接式手势识别摄像头的超极本、笔记本和平板电脑。
声龙助理(Dragon Assistant)
作为感知计算的一部分,语音控制技术已经取得了显著的的进步。在英特尔感知计算软件开发套件中,以Dragon Naturally Speaking语音识别软件而闻名的Nuance公司,帮助推动了利用声龙助理语音功能方面的工作。声龙助理软件(Nuance Dragon Assistant)将被集成在超极本上,以支持覆盖多种应用的语音指令,包括媒体播放器、浏览器和社交网络等。这一应用让用户能够通过语言向计算机“说出”指令。例如,当用户说出“在亚马逊上搜索椅子”后,网页浏览器会自动打开,链向Amazon.com网站,并搜索“椅子”一词。与社交网络上的朋友分享搜索结果或其它某个URL也同样简单,比如,下达“在某个社交网络上分享此页面”的语音指令,即可完成此操作脑。
创新与感知计算竞赛
英特尔设立了奖金总额高达100万美元的创新挑战赛—英特尔感知计算挑战赛,以展示英特尔感知计算软件开发套件所带来的无尽可能。该挑战赛邀请开发人员充分发挥其人机交互设计方面的创造力。围绕超极本和个人计算领域的生态系统,对于新的交互技术有着许多新创意和新想法,而英特尔希望引导他们进入一个公共的协作论坛。正如任何新的计算技术一样,英特尔正在寻找那些让消费者喜闻乐见、能够脱颖而出的应用,并吸引他们去了解,不断增长的感知计算的潜力。
梦想的开始
今天,我们还在用熟悉的键盘和鼠标与计算机进行交互。这些设备为计算机提供了一个直接的、可识别的输入集合,并为软件环境提供了简单的数据点以进行评估。当用户按键或点击鼠标时,这些操作不会被误判或曲解。然而,这些操作会将用户限制在单一界面,当然,初级的触摸也是被限制在单一界面里的。如何能让计算机像我们人一样认知周围的环境,使它们能够处理周围的大量信息,并根据用户的意图得出合乎逻辑的结论呢?而这就是英特尔将要为我们塑造的“芯“使命。
简单来说就是把感觉注入电脑:眼睛、耳朵、声音、触摸、感情以及情境,从而实现更加自然、直观以及身临其境的真实体验。
试想一下,语音识别、动作识别、环境识别、生物识别等等……怎么样,这一定是一个梦想的开始!
而关于梦想,来自英特尔公司的邓慕理说:“有一句名言称:预测未来的唯一方法就是创造未来。”未来,不仅是英特尔的梦想,也是我们的梦想。
梦,是什么?
英特尔要为我们塑造的梦,就是赋予冰冷的计算设备像人一样的思考与感知能力,目前,它、计算设备思考计算的能力在某些方面可以说已经超越了人类,那么感知计算的能力又是什么呢?对此邓慕理在这里给出了解答。
首先,感知计算就是要自然(Natural)。例如我们与机器交互的时候,就像跟普通人互动一样,都是通过听、说、看、摸,以及各种表情,包括微笑、生气、愤怒等等,所有的这些方式就是自然,不要控制感,也不要操纵感。跟计算机的互动要与跟人的互动是一样的。例如我们用嘴与其他人交流,英特尔也希望能够以这种方式与机器交互互动。
另外就是要直观(Intuitive)。在与计算机交互时,不要想着要有说明书、指令、指南,就像我们跟人交流的时候不需要有指令,不需要有手册一样。其实人机之间的交互跟人与人之间的交流很类似,都是直观、自然,不需要有说明书和指南。这就是“你”和“我”交流的方式。从这一刻开始,要想理解什么是感知计算,就想着“你(NI)”这个字就行了。自然(Natural)、直观(Intuitive)、你(NI)。不仅是语言交流的自然,我们的手、身体也没有任何的说明书、指令或是指南。
所以我们还有另外一个I,就是身临其境(Immersive)。什么叫身临其境?也就是说,现实社会与虚拟社会之间的界限已经模糊了,做梦的时候,有的时候会心跳加快,有的时候会出汗,这个梦到底是虚拟环境,还是在真实环境?我们分不清是在外面,是一个旁观者,还是在里面,游戏的参与者,这就是身临其境。N是自然,I是直观,另外一个I就是身临其境。感知计算就是NII,自然(Natural)、直观(Intuitive)跟身临其境(Immersive)。
未来的梦
我们在预测未来的时候,首先要回顾一下历史。看看过去5年这个大背景。如今的计算机语音的识别还并不完美,但是它已经能够识别你的语言。视觉方面已经实现了3D、智能电视、远程沟通、手势识别,还有视网膜屏显示技术。这些技术能够让你感觉更好、体验更佳,真正做到栩栩如生。此外,人机交互方式就是利用触觉,比如触摸、触屏、传感器等等。这些虽然还并不是完美的应用,但这起码是一个很不错的起步。
在未来,我们要把虚拟与现实社会交错结合起来,从而有现实社会跟虚拟社会。另外就是多元模式。交互应该是更加全面的,各种各样的五官都利用起来,我们不仅要看,不仅要听,也不单是说触摸。例如,别人能看到我们的面部表情,听到声音,看到场景。在看到我们的表情时就能够辨别出我们的表情是快乐的,或者是愤怒的,我们可以用多种模式进行沟通。除此之外还有个人助理,就是说计算机能够帮助我们做很多事,它对我了如指掌。比如当你想回家时,计算机告诉我们说路边正好有一个花店,而且你女朋友要过生日了,你要是不给她买花可就要麻烦了。而计算机只需要识别我的声音就可以了,其他的声音均可以被计算机视为背景噪音。
另外就是自动转换语言,在你出国或与其他国家的朋友交流的时候,机器能够把你的话或者其他人的话翻译成你自己的母语。这其实离我们并不遥远,只是让实时的机器翻译变得更加完美而已。
此外还有生物特征识别,事实上目前已经有很多利用了各种不同感官的相关技术。比如我们可以去触摸,在触屏上点击一下,比如计算机还能够知道我们喜欢的颜色、了解到我们的心情状况。生物特征能够在很大程度上帮助计算机去进行各种识别,因为它能够读取我们的血氧含量、心率脉搏等等数据,从而判断出这个人是否有问题,是不是要打电话找医生急救。比如我们的计算机会说,你有点不舒服吧,看上去有点不妥,跟2个月前相比有点不太一样,身体是不是出现状况了,咱们去看医生吧。这些都有可能在未来成为现实的。
而这一切都是可以用于平板、手机,甚至是咖啡机,甚至你的视频或者是你的音响设备等等。例如当你想去播放音乐的话,你不用先去找到这个文件然后再点击,再用键盘控制,而是很简单地用语音就能够控制。
“NII”—自然、直观、身临其境,英特尔希望这种人与人之间沟通的方式,也能够在人机交互里面得到实现,这样的计算方式也能够是无处不在的。
当梦想照进现实
而在我们正实现梦想的当下,让我们来看看英特尔都做到了什么。在感知计算交流会的现场,邓慕理邀请了他的同事为我们做了一个能与计算机进行互动游戏的演示,演示中首先计算机会去识别她的手,她会和计算机进行互动,之后给游戏中的个小动物一些指令,小动物都可以一一做出理解进行反映。 语音是全球最方便的沟通方式。英特尔认为,语音未来将会逐步代替触摸屏。例如现在我们想在百度上搜索内容,我们的操作步骤是:打开浏览器-输入网址-输入搜索的内容-筛选搜索结果。而如果有智能化的语音控制和识别系统,我们通过简单的口头发送指令,电脑便会自动调出最合适的搜索结果。
英特尔与Nuance合作的声龙助理(Dragon Assistant)语音控制应用已经在超极本等设备上实现,并将支持中文输入。这一应用充分利用英特尔酷睿处理器的计算能力,为我们提供了更加有趣和易用的声音控制方式,进行人机交互。通过语音控制,消费者能够让设备搜索百度、淘宝等热门网站,更新新浪微博,完成迅雷、快播等影音播放器的视频回放,或是在优酷上进行视频搜索。
当然英特尔对于面部识别的支持也是必不可少的,英特尔与合作伙伴开发的FastAccess Anywhere是一款面部识别软件,在使用该软件的超极本上,用户可以选择通过面部识别开机、浏览密码保护的网站等。用户因此能够摆脱繁琐的操作,将科技的便利性与安全性完美结合,真正实现“你本人就是你的密码”。
再来看英特尔使用的3D摄像头和反欺骗技术,它可以探测肌肉运动,并通过7点进行确认。这提高了面部识别技术的竞争力。而由于摄像头距面部的距离已不是很远,因此眼球追踪系统也成为了可能。利用摄像头,眼球的运动可以被转化为鼠标指针的移动。而即使头部的位置发生了移动,摄像头和屏幕也可以相互配合,确定鼠标指针的位置。
梦由“芯”生,“芯”由梦现
而这所有一切梦幻搬的构想与体验都离不开一个强大的“芯”,反之,也正是由于这些强大的功能才体现出这颗微小的“芯”是那么的强大。让那些令人兴奋的梦想,并不会成为仰望星空的遐想。而这一切得益于英特尔创新的技术进步,是触手可及的未来。目前,基于第三代智能英特尔酷睿处理器的超极本已经能够实现触摸控制、声音控制、面部识别等感知计算功能。将于今年推出的第四代智能英特尔酷睿处理器(研发代号为“Haswell”)还将使计算设备的体验再度提高。而感知计算的发展将会推动全新的体验,以赋予消费者更加自由灵活的操作方式和更为天马行空的操作想象。
超极本生态新发展
英特尔感知计算软件开发套件(Intel Perceptual Computing Software Development Kit, SDK)。涵盖感知计算的多个方面,如面部识别、语音指令,和手势识别。开发套件包括手册、代码样本、算法、示例应用和教程,可帮助开发人员以尽可能简单的方式整合感知计算功能。英特尔是推动软件开发的坚定支持者,而此次,感知计算应用的发展将得益于传感技术和硬件计算性能相结合所创造的绝佳机会。英特尔感知计算软件开发套件支持多种最流行的人机沟通方式,并侧重于用户与设备在约15厘米到91厘米范围内的交互。该软件开发套件可用于许多平台,但它针对的是采用嵌入式麦克风和外接式手势识别摄像头的超极本、笔记本和平板电脑。
声龙助理(Dragon Assistant)
作为感知计算的一部分,语音控制技术已经取得了显著的的进步。在英特尔感知计算软件开发套件中,以Dragon Naturally Speaking语音识别软件而闻名的Nuance公司,帮助推动了利用声龙助理语音功能方面的工作。声龙助理软件(Nuance Dragon Assistant)将被集成在超极本上,以支持覆盖多种应用的语音指令,包括媒体播放器、浏览器和社交网络等。这一应用让用户能够通过语言向计算机“说出”指令。例如,当用户说出“在亚马逊上搜索椅子”后,网页浏览器会自动打开,链向Amazon.com网站,并搜索“椅子”一词。与社交网络上的朋友分享搜索结果或其它某个URL也同样简单,比如,下达“在某个社交网络上分享此页面”的语音指令,即可完成此操作脑。
创新与感知计算竞赛
英特尔设立了奖金总额高达100万美元的创新挑战赛—英特尔感知计算挑战赛,以展示英特尔感知计算软件开发套件所带来的无尽可能。该挑战赛邀请开发人员充分发挥其人机交互设计方面的创造力。围绕超极本和个人计算领域的生态系统,对于新的交互技术有着许多新创意和新想法,而英特尔希望引导他们进入一个公共的协作论坛。正如任何新的计算技术一样,英特尔正在寻找那些让消费者喜闻乐见、能够脱颖而出的应用,并吸引他们去了解,不断增长的感知计算的潜力。