HCI,敲开未来科技的门

来源 :中关村 | 被引量 : 0次 | 上传用户:lfs888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  当人机互动技术遭遇云计算、遭遇移动互联网,或许还有新材料、新能源时,会迸发出什么样的精彩呢?
  
  据悉,在微软的“未来之家”的体验屋里有一个特殊的角落:看似普通的厨房墙面,可以变成电脑屏幕,上面有天气预报、日程提醒等重要事项。当房屋的主人收到别人的派对邀请函时,他可以很简单地选择接受或者拒绝,他的朋友可以从这个“墙面”上接到回复,同时,日程表也会自动生成,如果主人开口问,例如,今天我需要做什么?会有一个发声动听的机器人随时回答他的各种问题。
  而微软2010年底推出的Kinect也开创了游戏的新模式。借助Kinect,玩家不需要使用任何手柄、摇杆、鼠标或者其他遥控器,即可用身体直接控制游戏。比如在玩体育游戏的时候,你只需要接通电源,不管是乒乓球的挥拍还是保龄球的击打,你只需要像现实中那样摆出动作即可指挥屏幕里的游戏。
  不难理解Kinect推出的两个月就破了销售800万台的纪录的奇迹。它也被赋予了一个更高层次的意义:第三次人机交互革命的原点。
  人机交互(HCI,Human-Computer Interaction)是一个跨学科的技术领域,从广义上理解就是用户体验,在直观意义上理解是指人与机器之间的互动方式。
  眼下,在人逐渐适应计算机再到计算机不断适应人的互动过程中,人机交互技术已不再局限于键盘输入、手柄操作,而是以更加新奇的方式出现:手指的微小动作、声波在空气中的振动、眼珠和舌头的转动,都可以实现信息传递,完成人与机器之间的“对话”。而随着技术的精进,“有机用户界面”(organic user interface)也开始悄然兴起——生物识别传感器、皮肤显示器,乃至大脑与计算机的直接对接,无疑都将给人类的生活带来重大影响。
  
  “灵云”推出为哪般?
  和美国等先进国家相比,中国的HCI技术主要应用在语言文字领域。但不管怎么说,HCI“中国军团”也在行动。2011年12月8日,北京捷通华声语音技术有限公司在2011中国手机产业发展大会上宣布:在全球范围内首个推出全方位、个性化的人机交互感知云—灵云。该公司董事长张连毅称,灵云是一种可以用语音、手写、拍照,手势,将来甚至可使用脑波识别等智能手段来操作、感知手机、计算机等数字设备的网络云服务,让人机交互象人与人沟通一样的简单自然。
  据称,灵云可通过移动互联网、互联网等网络提供全方位、个性化智能人机交互技术的云服务,目前可提供语音识别、语音合成、手写识别、扫描识别、即时翻译等多种HCI应用服务。灵云,简单的说就是让手机、电脑等数字设备在与人的交互过程中,实现能说会听、能写能识,感知并完成人们过去通过键盘、鼠标发出的操作要求,从而使机器设备具有全方位、多样的人机交互能力,与用户之间的交互变得更轻松、简单、自然,更回归人性,促进人与机器之间的和谐互动。
  现在,捷通公司以hcicloud为域名的灵云平台已经上线。在上面,人们可以体验语音合成、手写识别、文字识别等人机交互技术应用。同时,2012年1月16日,捷通华声宣布推出名为“小唐龙”的软件——这是一款基于手机(或者PAD)的智能助手,为手机主人“提供工作、学习、生活、娱乐、交友等各个方面的助理服务。”
  显然这家已在人机交互技术领域耕耘、积累多年的企业已经意识到了产业变革的气息以及国内外HCI行业的激烈竞争态势,正试图以一种综合和集成性服务占领产业优势地位。
  在国内,除捷通华声外,人机交互技术产品供应商中还有汉王、科大讯飞等实力强劲的上市企业。其中汉王以手写技术闻名,科大讯飞在语音技术方面发展势头迅猛,而捷通华声在HCI的各个技术方面的发展相对较为均衡,由于一直没有上市,而且客户以行业用户居多,市场占有率不小却大众知名度不大。然而,这个企业最近却动作频频,曝光率颇高。张连毅告诉本刊记者,继不久前引入华软战略投资之后,捷通也将在产品升级和品牌运作方面加大力度,进一步挺进个人用户市场。
  
  激动人心的行业变革
  显然捷通在加紧HCI整合的努力。其背景正是HCI技术展现出广阔前景:国内外企业的人际交互技术已经成熟起来了,伴随着移动智能终端的到来,它呈加速度方式走向每一个人。这个市场实在是太大太诱人了。而且,正如捷通所意识到的,HCI加上云计算,再加上移动互联网,早已不是传统意义上的语音合成、手写识别这样简单的应用。
  过去的两年,毫无疑问,众多HCI产品的革新令人叹为观止。神话般的苹果CEO乔布斯仙去后,苹果发布的第一款重量级产品IPHONE4S让许多消费者失望,但同时发布的语音助理Siri软件却越来越得到业内人士的高度评价。Siri 能做的,听起来相当不一般,使用者可透过声控、文字输入的方式,来搜寻餐厅、电影院等生活信息,同时也可以直接收看各项相关评论,甚至是直接订位、订票;另外其适地性(location based)服务的能力也相当强悍,能够依据用户默认的居家地址或是所在位置来判断、过滤搜寻的结果。
  不过Siri最大的特色,则是人机互动方面产生了突破,不仅有十分生动的对话接口,其针对用户询问所给予的回答,非但不至于答非所问,有时候还让人意想不到的惊喜,例如使用者如果在说出、输入的内容包括了“drunk”、“home”这些词(甚至不需要符合语法,相当人性化),Siri 会判断为喝醉酒了、要回家,并自动建议是否要帮忙叫出租车。
  Siri展示出的是在准确语音识别的基础之上,进行语义的智能分析判断,并且实现系统功能和后代数据(包括个人偏好和历史记录)的调用,实现所答即所问与服务即所想——真正实现助理的功能,从识别,执行,再到互动之间的飞跃,这就是Siri的革命性所在。捷通推出“小唐龙|,显然是受到了Siri的启发。而Siri目前对中文语音尚无能为力,这就给了中国厂商以很大的机会。
  而2010年11月4日正式发布的微软kinect体感游戏设备,也在人机互动的市场化应用领域带来了突破性的进展。在这一设备中,玩家可以不通过任何控制器,单凭自己的动作和手势就能指挥电脑中的游戏。这个游戏系统也辨识人脸,让玩家自动连上游戏。它还可辨认声音和接受命令。在游戏示范中,玩家们可以用脚踢仅存在于屏幕中的足球,并可用伸手设法拦阻进球。在驾驶游戏中,玩家可以转动想像中的方向盘来操控电视游戏中的赛车。这种神奇的效果也属于HCI的一项应用,里面用到了动作感应、语音识别等,这些技术使人和机器之间更加亲密无间了。
  Kinect确实成了微软征战家庭娱乐市场的一把利器,但微软的目的显然并不想仅仅借此赢得“电子游戏的未来”。Kinect的真正潜力,将在电脑、手机乃至军队和医疗卫生事业上得到更加充分的发挥,从而创造更为可观的经济利益和社会效应。微软Kinect技术总监Alex Kipman曾强调说:“人们不喜欢手里总是握着个东西,比如鼠标和键盘。而Kinect还只是旅程的起点。” 果然,2012年1月10日,有消息传出,微软的体感游戏控制系统Kinect将在数周后登录Windows PC,而且其功能不仅仅局限于游戏。
  
  中国的奋斗者们
  以中国的HCI军团的整体实力而言,目前尚未能推出像Siri和Kinect这样的重量级产品,暂时也很难充当HCI创新潮流的领头羊。但是,国内的企业也有自己的优势,那就是,基于中国本土文字、语言的特性,中国企业可以在汉语的语音和文字识别等HCI应用方面做得更好。甚至,在此基础上,在一些项目上进行突破,获得世界性的“单项奖”。
  2010年10月28日,“科大讯飞‘语音云’发布会暨移动互联网语音创新论坛”在北京香格里拉饭店隆重举行。科大讯飞董事长兼总裁刘庆峰介绍了“讯飞语音云”的总体框架和主要构成,及其作为语音服务平台的特性,并现场演示了手机语音搜索、短信随意说等基于“讯飞语音云”的典型应用。此外,刘庆峰也介绍了科大讯飞公司的语音合成技术、发音模拟技术、口语评测技术,有些技术在世界性的比赛中获得领先的名次。
  据悉,“讯飞语音云”是基于云计算技术基础,为各类移动互联网创业者和创新性企业提供低门槛的语音合成及语音识别服务,合作伙伴可以像使用水、电那样“即开即有、按需取用”,在很短时间内构建出支持自然语音交互功能的特色移动互联网应用。
  眼下,讯飞旗下的讯飞语音输入法软件正在智能手机用户中传播。该输入法让人印象深刻的是它的识别率相当高。科大讯飞副总裁江涛表示,讯飞语音输入法的识别率已经接近90%。记者尝试了这个软件,感觉其确已具备应用价值。
  其实在以前,IBM 也推出过ViaVoice等语音识别产品,但那时的语音识别的准确率不高,很难替代键盘输入。现在,借助于云计算等手段,在智能手机上用语音输入代替键盘输入,已经有了应用的可能。据专家称,新旧两代语音识别技术之所以差别巨大,在于其不同的工作方式。语音识别从本质上来说,是一个基于统计模型的人工识别问题,数据对于语音识别是非常重要的,另一方面是算法,需要不断改进和提高。
  软件大鳄腾讯也出手了。2011年9月,腾讯研究院人机交互中心研究员刘海龙透露,云手写和云语音识别将登陆QQ,云手写对工整字符的识别率将达到99%以上,云语音更将挑战“发音习惯,用词习惯”等传统技术难以解决的技术难点,为用户带来全新的,极简的沟通体验。、人机交互中心模式识别组项目负责人陈波表示,基于云计算的移动通讯,在通话、短信这两大主流功能的主要部件中,将实现单独部件的“全能化”。如:用户对麦克风应用使用需求将全面覆盖至语音登陆、语音认证、语音识别、语音搜索、听歌搜歌、哼唱搜歌、制作歌曲、音乐类游戏等功能,在功能覆盖最大化的同时,必须简化用户在切换操作中的时间和过程。又如:在短信使用时,被云计算覆盖的手写识别、手势应用、语音输入,将为用户带来最为便利的输入体验。
  而捷通华声公司,早在2008年就已经与金山公司合作,将手写云服务嵌入到爱词霸网站中。2011年6月28日,由捷通华声倾力打造的云手写官方网站正式上线,并开始全方位地为用户提供各种手写产品体验及技术服务。此次推出灵云平台,显然是试图超越单项的HCI技术,以综合性、一站式的HCI云服务占领行业制高点。而各项HCI单项技术如何协同成为一个整体,以及如何应用并给用户带来更要效率,则是下一步面临的挑战。
  
  会是一场产业革命吗?
  2008年7月1日,微软主席比尔·盖茨将退出微软日常管理工作。他在佛罗里达州奥兰多市召开的Tech-ed大会上发表了最后一次在职演说。在演讲中主要谈到交互技术问题。在过去几年里,PC用户主要通过鼠标和键盘进行界面交互。未来十年的重点,将会更加强调连结人与人的关盖,人与计算机的交互变得越来越像人与人之间的互动。
  盖茨没有说错,不管是苹果的Siri、微软的Surface和Kinect,科大讯飞的语音云,还有捷通华声的灵云,都已经昭示了一个人机交互新的时代的到来。
  在CNN预测的2012年十大科技趋势中,新的人机交互方式——比如通过触摸屏和声控等——也列在其中。
  张连毅认为:在苹果的触控技术出现之前,人与机器的交互手段已走过两个阶段:50年代IBM这个蓝色巨人,把人类社会带进计算机时代,键盘一直成为人们操作计算机的一个非常关键性的、代表性的交互手段,这是第一阶段。第二阶段中的典型代表是鼠标。微软是这个阶段中很强大的推动者。第三个阶段是苹果所推动的触控时代。而下一个阶段,则将是一个更自然、更人性化的人机交互体系时代,即智能人机交互(HCI)技术时代。显然,在张连毅的计划里,灵云是为了这个时代而准备的。事实上,灵云正是被设计成拥有一个完整的自学习系统,在人们通过灵云实现人机交互过程中,记录、分析每个用户的使用习惯,不断提升为每个用户提供个性化服务的能力和水平,从而不断提升更好、更确准的智能服务效果。灵云将同时提供完整的云端组合式解决策略,用户使用起来更流畅自然,在各种带宽条件下都享有良好用户体验。
  智能人机交互的时代,我们将享受多少科技带来的便利和快乐?委实引人遐想。当人机互动技术遭遇云计算、遭遇移动互联网,或许还有新材料、新能源时,会迸发出什么样的精彩呢?其实美国《未来学家》杂志早在2010年中刊登的文章,就已对当前正在研发或者已投入商用的各类人机交互技术进行了盘点。这里列举一部分:无声语音(默读)识别:通过默读识别,使用者不需要发出声音,系统就可以将喉部声带动作发出的电信号转换成语音,从而破译人想说的话;电触觉刺激:通过电刺激实现触觉再现,可以让盲人“看见”周围的世界;仿生隐形眼镜:科学家希望将电路集成在镜片上,打造出功能更强大的超级隐形眼镜,它既可以让佩戴者拥有将远处物体“拉近放大”的超级视力,显示出全息图像和各种立体影像,甚至还可以取代电脑屏幕,让人们随时享受无线上网的乐趣。人机界面:也被称为“脑机接口”,它是在人或动物脑(或者脑细胞的培养物)与外部设备之间建立的直接连接通路,即使不通过直接的语言和行动,大脑的所思所想也可以借由这条通路向外界传达。
  好了,说到这里,类似《黑客帝国》里的科幻镜头或许都已经在实验室里酝酿里。我们得考虑未来世界的人们的安全问题了——如果我们的人机互动技术发展到了可以用脑电波直接控制外部世界,那么我们得提防“黑客入侵大脑”事件的发生了。
  不管怎么说,一个激动人心的时代正在到来。
其他文献
科技改变了我们每个人的生活,其力量和速度在当今尤为迅猛。科技也已成为经济社会发展强有力的支撑,在调整产业结构、转变经济发展方式中的支撑引领作用日益凸显。这源于创新的驱动。  创新是我们这个时代的主旋律。当前,全球正进入空前的创新密集和产业振兴时代,各领域的科技创新层出不穷,新的市场、新的需求和新的经济增长点正在形成。眼下,无论是发达国家还是发展中国家,都在大幅增加科研投入,把争夺科学技术制高点作为
期刊
这次“政策兑现大会”从政策体系、资金等方面,全方位地为海淀区建设全球有影响力的科技创新中心做了铺垫。    2011年12月27日下午,海淀区人民政府主办,中关村科技园区海淀园管理委员会、海淀区科学技术委员会承办的“中关村国家自主创新示范区核心区2011年支持科技创新政策兑现大会”在海淀区政府隆重举行。海淀区区长隋振江、区人大常委会主任关成启、中关村管委会纪检组长侯云、中共海淀区委常委、副区长穆鹏
期刊
前不久,东软刚刚庆祝完自己的20周年生日。虽然走过了20年的历程,但我认为东软还处于童年,刚走过认识自我的阶段。不过,10年后,我想东软的年营收将从现在的50亿元增长到250亿元,其中国际业务会占到60%。  一直以来,东软都是在夹缝里求生存,时常还逆主流而动。但进入2011年,面对云计算、移动互联、“APP经济”等热潮,我想,该是东软做出战略转型的时候了。  过去20年,东软从不涉足B2C市场,
期刊
“核能是最美妙的”,需要人类共同去探索,中国义不容辞。    《南方周末》记者亲历“弃核”后的德国,写出发人深思的文章,《德国弃核,先驱还是先烈》。德国被日本福岛的核灾害“吓破胆”,默克尔在举步维艰中,终于从政治的大局考量,做出“弃核”的决定。“扇动了一只欧洲蝴蝶的翅膀——整个欧洲都在考虑到底要不要弃核”。意大利“公投”后,紧跟默克尔的脚步;瑞典一改挺核常态,朝令夕改;比利时明确表态,15年后做“
期刊
作者提出新兴市场的市场开放和制度转变、人民币可自由兑换、本国金融机构和金融资产实力足够强大三个我国资本市场对外资开放的命题,完善H股和B股市场、进一步优化QFII与QDII制度、实施资本市场“请进来”和“走出去”两种政策等建议。    中国作为世界上经济发展最快、最大的发展中国家,一直面临着唱多与唱空的交杂。一会儿是唱多中国,列举出诸如强有力的政府、人口红利、后发优势等一系列理由,说中国崛起不可避
期刊
我国已经连续17年  成为遭遇贸易摩擦最多的国家  近日,华为和中兴遭遇欧盟调查的消息传出后,引发中国产业界高度关注。商务部专家梅新育表示,如果欧盟最终实施了比较高的反倾销和反补贴税率的话,中兴、华为在欧洲市场可能要受到比较大的打击。更有一些专家担心,随着中国正在进行的制造业转型升级,将低端制造业巨头的传统优势转变为利润率更高和减少对廉价劳动力依赖的高科技产品,发达国家一系列针对中国高科技和高附加
期刊
根据2011年12月15日世界科技园区协会网站报道的一则消息称,世界科技园区协会最新推出了一种“对等咨询服务”的方式。  咨询专家产生方式:咨询专家全部来自世界科技园区协会会员,通过个人申报和至少3名以上的专家推荐(其中2名专家必须是申请人所在国之外的专家),最后通过世界科技园区协会组织的专家评审委员会来产生。  咨询专家服务方式:当有会员提出需要这种服务申请时,他们所选择的专家将应邀到访他们的园
期刊
学校彻底地消失,老师永远地告别了乡村,农民为了未来的希望也洗脚上岸,农村的血脉还能够怎样的传承和发展呢?    从2006年起,教育部开始了对农村中小学的布局调整,主要目的是减少教育成本,集中利用教育资源,使学生不但“有学上”,还能“上好学”,给农村一个美好的未来。在国家的大力推动下,“学生进城”的事业被作为一个地方教育改革的坐标,各个地方都行动了起来,造成了一场轰轰烈烈的浩荡气势。“教育进城”在
期刊
北京首次公布紧缺人才目录  据《北京晨报》报道,前不久,北京市人保局、北京市发改委等部门昨天联合发布《“十二五”时期人才发展规划》,首次公布北京市紧缺专门人才开发目录。目录涉及17类重点领域280个具体行业,不仅包括经济学家、医卫专家、科技领军人物等传统高端人才,也包括处置突发事件的谈判人才、现代物流高管、网络安全公安人员等新型专才。到2015年,在战略性新兴产业(新一代信息技术、生物、节能环保、
期刊
上海一位教授张结海研究得出结论:李亚鹏和谢霆锋是西方女人眼中的典型“丑男”;北京语言大学的周思源教授研究出“梁山108将里43位不是好汉”,北京大学中文系李零教授研究出“孔子是丧家狗”,北京大学古代文学博士檀作文研究出“李白是大唐第一古惑仔”,武汉大学梅朝荣教授研究出“诸葛亮是中国最虚伪的男人”……    2011年12月24日上午,北大校长周其凤在长沙市一中举行演讲。他称美国的教育一塌糊涂,每一
期刊