论文部分内容阅读
每天从早到晚,眼睛是人们使用时间最长、频率最高的器官。我们所完成的事情——读报、上网、工作、玩游戏、看电影等等,几乎都要通过眼睛。眼睛是心灵的窗户,它能反映出人们的意向、想法和行动。
现在眼睛还能发挥更大的作用,它可以代替双手做事,代替嘴巴说话。不远的未来,我们看一眼电视它就自动换台,瞄一眼吊灯它就自动打开;开车时,瞅一眼右边它就自动转向;用电脑时,扫一眼屏幕它就自动开机……这些情景绝不是科幻,而是一项技术的广泛应用。
眼动追踪技术
这项技术就是眼动追踪技术,又叫凝视互动技术,起源于科学家对残疾人和某些认知障碍人士的帮助。这些人行动不便,甚至生活不能自理,科学家设想让他们靠眼睛控制电脑,进而控制身边其他东西,使生活更独立、更丰富。
顾名思义,眼动追踪就是捕捉一个人看东西时眼睛的活动轨迹,比如目光落在电脑屏幕的哪个位置,停留了多长时间……通过记录这些位置和停留时间,就能知道一个人看东西时,他注意什么,不注意什么。
工作原理也非常简单,只需要两样东西:带摄像头的追踪仪和分析软件。首先,追踪仪发出一种近红外光,光线射到眼睛并被反射。这种光人眼看不到,但它的原理很好懂,与平时拍照打闪光灯所出现红眼效果的原理一样。然后,摄像头捕捉到眼睛反射后的光,经软件分析,就能给眼球定位。同时眨眼频率、瞳孔大小等数据,也会被追踪仪观测、记录,并汇总分析。这样就能精確地定位,并知道眼球的活动轨迹了。
攻克两大难题
眼动追踪技术的价值非常大,现在相关研究如雨后春笋般蓬勃发展。在日常实践中,有两方面的难题必须解决,眼动追踪才会得到长足的发展。
首先,要保证人们能自由移动头部。技术是为了人们工作更便捷,绝不能本末倒置,为了追踪眼球而限制活动范围。这需要追踪仪能适应各种不同的角度,采集眼球的形状、反射和折射率等数据,保证眼动追踪的精确度。而且只有这样,才能适应某些脑瘫、肌萎缩患者,因为他们需要每天调整不同的姿势。
然后,要保证人人都能适用。每个人的眼球并不完全相同,瞳孔大小、角膜厚度等都不一样。因此要考虑不同的眼球情况,再加上年龄、环境明暗度等因素,追踪仪应当能适时切换不同的追踪模式(如近红外光的强度),针对使用的每个人,使追踪效果都达到最佳状态。
可喜的是,科学家们一直在努力,基本解决了这两个难题。这样追踪仪就显得更简单小巧,使用起来也更方便舒适。
技术使生活更便利丰富
眼动追踪技术属于一项辅助科技,只要应用得当,我们就会更独立能干,生活也会更丰富多彩。
首先,它能帮助人们操控电脑,以及电视等家用电器。眼动的轨迹实际上就代表着一个人的关注点,也代表了他的意图。通过眼动追踪,科学家可以将这种意图转换成控制命令,进而控制电脑等智能设备。
比如在电脑上浏览网页,我们常常需要滑动鼠标滚轮,使页面不断往下滚动,但是利用眼动追踪,当我们阅读页面上的信息,读到屏幕下方时,页面会随眼球移动而自动向下滚动。看电影时,我们会因为上厕所、接电话而暂停播放,但是利用眼动追踪,只要我们一扭头把目光移离屏幕,电影就会自动暂停,等再扭头回来就继续播放。
同样道理,人们也可以籍此控制电视、空调等家用电器。现在大部分家电都配有红外遥控器,只要把这种遥控设备与眼动追踪仪整合在一起,人们就可以用眼睛控制了。比如看一眼,就相当于发出了“开”的命令,电灯、空调、电视等等就自动打开,再看一眼它们就关闭待机,甚至还可以调节灯光明暗,调换电视节目等。
第二,眼动追踪技术能帮助人们“说话”。这也是开发这项技术最重要的初衷。由于疾病、灾祸等原因,有些人丧失了一些器官机能,比如失去了双手,失去了说话能力。但是利用眼动追踪,他们就可以控制电脑和家用电器。假如家里有智能机器人,这些人也可以用眼动追踪技术,控制机器人照料自己的生活。更重要的是,他们可以把自己的意图通过眼睛表达出来,追踪仪从眼睛“读出”这种意图,把眼动信号通过电脑转换成文本信息,甚至是语音信息并播放出来。
对于智障、残障这类特殊人群而言,他们就多了一条沟通的渠道。尤其在智障儿童的教育上,通过眼动追踪,他们不仅可以表达自己的意思,其他人还可以直接看到他们所看到的“真实”世界,了解其内心。这对于家长、特殊教育教师来说,非常有帮助。
第三,眼动追踪技术能促进更有效的沟通。在微信的朋友圈里,如果好友分享了照片,我们就能看到好友所看到的美景。与此类似,只要一个人利用眼动追踪,并同意分享他所看到的场景,其他人就能看到同样的场景,简直就是身临其境!也就是说,人们可以相互看到对方所看到的东西。
接入眼动追踪的逼真体验
随着技术的成熟,眼动追踪也会给其他行业带来进步和发展,最明显的就是游戏行业。瑞典拓比公司是眼动追踪技术的领跑者,它已经向游戏开发商推广这项技术,建议开放游戏接口,给玩家带来颠覆性的游戏体验。
以CS射击游戏为例,这是第一人称视角的3D游戏。在游戏里,玩家通过移动鼠标,来控制人物视角进行上下左右任意方位的变换,同时控制枪瞄准目标。但是游戏接入眼动追踪后,玩家就可以用眼睛代替鼠标,使游戏场景随玩家眼睛上下左右的移动而转换,同时也可以直接用眼睛瞄准目标,这比鼠标瞄准要容易多了。
游戏里还有更吸引人的,就是与游戏人物的互动。如果眼动追踪代替鼠标,游戏人物就能对玩家的目光做出反应,像真人一样。游戏里,玩家(扮演的游戏角色)走进一家武器店,发现一把上好宝剑,目光停留在上面;然后武器商(游戏人物)就直接告诉玩家更多这把剑的信息,跟真实购物一样。还有,当玩家目光落在武器商的妻子身上,武器商会表现得很不高兴,也不搭理玩家,不论玩家这时要买什么。
语言沟通之外,眼神沟通应该是内容最丰富的一种沟通方式。通过眼动追踪,游戏玩家可以与虚拟人物进行逼真的沟通、互动,如同真人一样,这或许就代表了下一代游戏发展的水平吧。
除了游戏,智能眼镜也是眼动追踪技术应用的热门领域。谷歌眼镜是这一行业的先驱,估计下一代产品上市时,就会接入这项技术。当人们戴上智能眼镜,既不用靠语音,也不用靠手势,直接靠眼睛就能确定选项、调节音量、控制功能等等,这种操控方式更便捷;而且通过眼动,还能实现自动导航,以及屏幕的自动滚动、切换,彻底解放双手,这对驾车来说非常方便。
还有虚拟现实头戴设备,有的已经接入了眼动追踪技术,用户可以更方便地操控,体验到更逼真、更自然的视觉效果。
眼动追踪也是把双刃剑
通过追踪眼球的活动轨迹,就能捕捉用户的意图,这给用户带来了便利的操控体验,但同时也给商家、政府带来了“便利”。
对商家来说,眼动追踪就成了精确投放广告的利器。在科幻电影《少数派报告》里,当人走进商场、公共场所,无所不在的追踪仪立即扫描人的眼球(兼识别身份),利用增强现实技术马上向人们精确地投放广告。如果眼动追踪技术得到普及,我们是不是也会迎来“狂轰滥炸”的广告?这会不会成为一种无所不在的广告骚扰?
有些科学家开发了眼动追踪的认知活动量表,用来分析一个人的认知状态和工作量。比如对颜色的认知,有学者通过观测眼球活动,分析出受测者的视觉注意点,再利用量表就得到了受测者对颜色的认知偏好。
那么除了颜色这类客观的自然存在,科学家应该还能得到人们对信仰、政治等主观意识的认知偏好。如果这样的话,将来眼动追踪使用面越来越广,它会不会成为技术开发商、政府部门对全体百姓的监控利器?只要使用眼动追踪,用户的意图、兴趣、心思几乎都能被捕捉到,届时我们还会有隐私吗?
现在眼睛还能发挥更大的作用,它可以代替双手做事,代替嘴巴说话。不远的未来,我们看一眼电视它就自动换台,瞄一眼吊灯它就自动打开;开车时,瞅一眼右边它就自动转向;用电脑时,扫一眼屏幕它就自动开机……这些情景绝不是科幻,而是一项技术的广泛应用。
眼动追踪技术
这项技术就是眼动追踪技术,又叫凝视互动技术,起源于科学家对残疾人和某些认知障碍人士的帮助。这些人行动不便,甚至生活不能自理,科学家设想让他们靠眼睛控制电脑,进而控制身边其他东西,使生活更独立、更丰富。
顾名思义,眼动追踪就是捕捉一个人看东西时眼睛的活动轨迹,比如目光落在电脑屏幕的哪个位置,停留了多长时间……通过记录这些位置和停留时间,就能知道一个人看东西时,他注意什么,不注意什么。
工作原理也非常简单,只需要两样东西:带摄像头的追踪仪和分析软件。首先,追踪仪发出一种近红外光,光线射到眼睛并被反射。这种光人眼看不到,但它的原理很好懂,与平时拍照打闪光灯所出现红眼效果的原理一样。然后,摄像头捕捉到眼睛反射后的光,经软件分析,就能给眼球定位。同时眨眼频率、瞳孔大小等数据,也会被追踪仪观测、记录,并汇总分析。这样就能精確地定位,并知道眼球的活动轨迹了。
攻克两大难题
眼动追踪技术的价值非常大,现在相关研究如雨后春笋般蓬勃发展。在日常实践中,有两方面的难题必须解决,眼动追踪才会得到长足的发展。
首先,要保证人们能自由移动头部。技术是为了人们工作更便捷,绝不能本末倒置,为了追踪眼球而限制活动范围。这需要追踪仪能适应各种不同的角度,采集眼球的形状、反射和折射率等数据,保证眼动追踪的精确度。而且只有这样,才能适应某些脑瘫、肌萎缩患者,因为他们需要每天调整不同的姿势。
然后,要保证人人都能适用。每个人的眼球并不完全相同,瞳孔大小、角膜厚度等都不一样。因此要考虑不同的眼球情况,再加上年龄、环境明暗度等因素,追踪仪应当能适时切换不同的追踪模式(如近红外光的强度),针对使用的每个人,使追踪效果都达到最佳状态。
可喜的是,科学家们一直在努力,基本解决了这两个难题。这样追踪仪就显得更简单小巧,使用起来也更方便舒适。
技术使生活更便利丰富
眼动追踪技术属于一项辅助科技,只要应用得当,我们就会更独立能干,生活也会更丰富多彩。
首先,它能帮助人们操控电脑,以及电视等家用电器。眼动的轨迹实际上就代表着一个人的关注点,也代表了他的意图。通过眼动追踪,科学家可以将这种意图转换成控制命令,进而控制电脑等智能设备。
比如在电脑上浏览网页,我们常常需要滑动鼠标滚轮,使页面不断往下滚动,但是利用眼动追踪,当我们阅读页面上的信息,读到屏幕下方时,页面会随眼球移动而自动向下滚动。看电影时,我们会因为上厕所、接电话而暂停播放,但是利用眼动追踪,只要我们一扭头把目光移离屏幕,电影就会自动暂停,等再扭头回来就继续播放。
同样道理,人们也可以籍此控制电视、空调等家用电器。现在大部分家电都配有红外遥控器,只要把这种遥控设备与眼动追踪仪整合在一起,人们就可以用眼睛控制了。比如看一眼,就相当于发出了“开”的命令,电灯、空调、电视等等就自动打开,再看一眼它们就关闭待机,甚至还可以调节灯光明暗,调换电视节目等。
第二,眼动追踪技术能帮助人们“说话”。这也是开发这项技术最重要的初衷。由于疾病、灾祸等原因,有些人丧失了一些器官机能,比如失去了双手,失去了说话能力。但是利用眼动追踪,他们就可以控制电脑和家用电器。假如家里有智能机器人,这些人也可以用眼动追踪技术,控制机器人照料自己的生活。更重要的是,他们可以把自己的意图通过眼睛表达出来,追踪仪从眼睛“读出”这种意图,把眼动信号通过电脑转换成文本信息,甚至是语音信息并播放出来。
对于智障、残障这类特殊人群而言,他们就多了一条沟通的渠道。尤其在智障儿童的教育上,通过眼动追踪,他们不仅可以表达自己的意思,其他人还可以直接看到他们所看到的“真实”世界,了解其内心。这对于家长、特殊教育教师来说,非常有帮助。
第三,眼动追踪技术能促进更有效的沟通。在微信的朋友圈里,如果好友分享了照片,我们就能看到好友所看到的美景。与此类似,只要一个人利用眼动追踪,并同意分享他所看到的场景,其他人就能看到同样的场景,简直就是身临其境!也就是说,人们可以相互看到对方所看到的东西。
接入眼动追踪的逼真体验
随着技术的成熟,眼动追踪也会给其他行业带来进步和发展,最明显的就是游戏行业。瑞典拓比公司是眼动追踪技术的领跑者,它已经向游戏开发商推广这项技术,建议开放游戏接口,给玩家带来颠覆性的游戏体验。
以CS射击游戏为例,这是第一人称视角的3D游戏。在游戏里,玩家通过移动鼠标,来控制人物视角进行上下左右任意方位的变换,同时控制枪瞄准目标。但是游戏接入眼动追踪后,玩家就可以用眼睛代替鼠标,使游戏场景随玩家眼睛上下左右的移动而转换,同时也可以直接用眼睛瞄准目标,这比鼠标瞄准要容易多了。
游戏里还有更吸引人的,就是与游戏人物的互动。如果眼动追踪代替鼠标,游戏人物就能对玩家的目光做出反应,像真人一样。游戏里,玩家(扮演的游戏角色)走进一家武器店,发现一把上好宝剑,目光停留在上面;然后武器商(游戏人物)就直接告诉玩家更多这把剑的信息,跟真实购物一样。还有,当玩家目光落在武器商的妻子身上,武器商会表现得很不高兴,也不搭理玩家,不论玩家这时要买什么。
语言沟通之外,眼神沟通应该是内容最丰富的一种沟通方式。通过眼动追踪,游戏玩家可以与虚拟人物进行逼真的沟通、互动,如同真人一样,这或许就代表了下一代游戏发展的水平吧。
除了游戏,智能眼镜也是眼动追踪技术应用的热门领域。谷歌眼镜是这一行业的先驱,估计下一代产品上市时,就会接入这项技术。当人们戴上智能眼镜,既不用靠语音,也不用靠手势,直接靠眼睛就能确定选项、调节音量、控制功能等等,这种操控方式更便捷;而且通过眼动,还能实现自动导航,以及屏幕的自动滚动、切换,彻底解放双手,这对驾车来说非常方便。
还有虚拟现实头戴设备,有的已经接入了眼动追踪技术,用户可以更方便地操控,体验到更逼真、更自然的视觉效果。
眼动追踪也是把双刃剑
通过追踪眼球的活动轨迹,就能捕捉用户的意图,这给用户带来了便利的操控体验,但同时也给商家、政府带来了“便利”。
对商家来说,眼动追踪就成了精确投放广告的利器。在科幻电影《少数派报告》里,当人走进商场、公共场所,无所不在的追踪仪立即扫描人的眼球(兼识别身份),利用增强现实技术马上向人们精确地投放广告。如果眼动追踪技术得到普及,我们是不是也会迎来“狂轰滥炸”的广告?这会不会成为一种无所不在的广告骚扰?
有些科学家开发了眼动追踪的认知活动量表,用来分析一个人的认知状态和工作量。比如对颜色的认知,有学者通过观测眼球活动,分析出受测者的视觉注意点,再利用量表就得到了受测者对颜色的认知偏好。
那么除了颜色这类客观的自然存在,科学家应该还能得到人们对信仰、政治等主观意识的认知偏好。如果这样的话,将来眼动追踪使用面越来越广,它会不会成为技术开发商、政府部门对全体百姓的监控利器?只要使用眼动追踪,用户的意图、兴趣、心思几乎都能被捕捉到,届时我们还会有隐私吗?