谷歌助理,教语音助手做人

来源 :计算机应用文摘·触控 | 被引量 : 0次 | 上传用户:skal1125
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  尽管识别率已不再是问题,但无论是大名鼎鼎的Siri和Google Now,还是《讯飞语音》和Cortana等语音助手们,在被用户调戏几天之后纷纷被打入冷宫。而谷歌助理(Google Assistant)的出现,似乎为身陷困境的小伙伴们带来了转机。

  语音助手这四年
  2012年6月27日,一句“OK,Google.”将Google Now带入了公众的视野。而在4年之后,2016年5月19日,当谷歌在Google I/O大会上再次喊起“OK,Google.”时,Google Now终于脱胎换骨,成了谷歌助理。
  不得不说,Google Now这四年发展并不如预期中的那么美好。在初次亮相的发布会上,它便被“黑科技”产品Google Glass夺去了风头,更何况还有苹果的Siri珠玉在前。起初,Google Now只是谷歌地图团队的一个创意,让用户不需要点击屏幕即可完成对智能手机的操控。而在Siri出现后,Google Now才搭上了语音助手的东风。
  在Siri和Google Now之后,微软、讯飞、搜狗和奇虎360等厂商,纷纷推出了自己的手机语音助手APP。不久后,语音助手甚至开始成为智能手机的标配。然而,好景不长。即便是名声如Siri,如今也只有在用户无聊时,才有机会登台“讲个笑话”。
  语音助手们的落寞,最核心的问题还是在于自己的“智商不高”。有网友戏称,你原以为语音助手会是钢铁侠的Jarvis,然而事实上它只是一个高配版的金立语音王。
  如果你有深入使用过各类语音助手APP就会发现,这些机械的一问一答破绽百出。尽管表面上交互方式是语音,但其本质上与鼠标点击和手指触控别无二致,死板的语音反而让人感到膈应。不仅如此,语音助手们能够独立完成的手机操作也十分有限,仅限于部分常用的系统操作,完全不能深入到第三方APP当中。
  谷歌助理带来了哪些启示?
  同样是一句“OK,Google.”,同样的机器人“嗓”,但此次出现的谷歌助理似乎要靠谱了不少。从谷歌I/O大会的现场演示中可以看出,谷歌助理可以听懂更多口语化的表达,它甚至可以和用户进行日常聊天。谷歌表示,谷歌助理并非只是执行简单的一问一答,而是会联系上下文,给出更精准的答案,用户还可以进行追问。
  比如,当你“招呼”谷歌助理帮你搜索完热门电影之后,它会因为听到你刚说了这次会带小孩一起去,而筛选出那些适合孩童的电影。更强的是,谷歌助理要比此前的语音助手们更“主动”—它会顺势问你是否需要四张票,并帮你搞定订票和付费。如今,谷歌正在为谷歌助理接入更多的第三方服务,打车出行的Uber、在线听曲的Spotify以及线上订座的OpenTable都可以通过谷歌助理搞定。
  可以说,谷歌助理将语音助手提升到了一个新的段位。而这一切,都源自人工智能的功劳。事实上,人工智能也正是今年的谷歌I/O大会的一大主题。在发布会一开始,公司CEO Sundar Pichai便开始强调机器学习在生活中扮演的重要角色。在本次谷歌I/O大会上发布的Allo和Google Home中,都有谷歌助理的身影。在Allo中,谷歌助理甚至会根据对方发来的图片信息,给出回复建议。
  语音助手,接下来怎么走
  而在国内,以讯飞为代表的企业已经将中文的语音识别率提升到了很高的水准。可是,“能听清”的问题解决了,“能听懂”又成了新挑战。百度的人工智能研究目标之一便是要攻克这一难题,但目前进展缓慢。要知道,谷歌助理的背后,其实是谷歌在这一领域近十年的耕耘。除了谷歌,微软、亚马逊和Facebook等公司也在语音助手领域试水人工智能。更有传言称,苹果的Siri也将迎来重要升级。种种迹象表明,由人工智能引发的语音助手变革,已是山雨欲来风满楼。
  短期内,国内同行要“借鉴”谷歌助理并不容易。不过,由于一些众所周知的原因,留给国内语音助手们的追赶时间应该还十分充裕。我们认为,在语义理解方面还没有取得突破之前,国内的语音助手们或许可以从以下三个方面进行突破。
  其一是变得更“主动”。使用语音助手时,最让人费解的是,语音助手们每次回答完问题之后,并不会主动接收下一条语音命令,我们还得自己动手按下话筒图标。所谓“主动”,就是要从这些细节入手。
  其二是扩展第三方服务。目前,当我们打开手机上的XX语音助手,说一句最常见的“附近有什么吃的”时,得到的答案往往都是一个简单的列表。为什么不能进一步,提供餐馆和产品推荐并帮助用户完成点餐呢?也只有待这类第三方服务丰富起来之后,才能增强用户打开语音助手的意愿。
  其三是利用好手机传感器。如今,手机上提供了多种传感器,结合传感器手机其实可以实时感知到我们的状态。同样的,这些传感器可以部分弥补语音助手们“听不懂”的尴尬。比如,可以转述家里领导分派的任务:到小区时买瓶醋。或者,在用户出门时会主动问一句“带伞了没”。
其他文献
本文从华北落叶松人工林生长进程、株数分布规律及不同地区的人工林生长比较分析,探讨了华北落叶松人工林在内蒙古黄土高原适宜条件下造林成功的事实,用灰色关联分析研究了影响
丹噶尔(湟源)作为贸易重镇,不仅有久远的历史,且多元文化并存。历史上重教兴学的传统不仅在培育人才方面发挥了重要作用,而且也使当地形成开明的文化氛围与意识;“岁有栽种”的植
近日,市场研究公司IDC发布最新报告称,全球PC出货量今年将下滑7.3%,较最初预计的更加严重。而据另一家市场调研公司Gartner的报告显示,2016年第一季度全球PC出货总量为6480万台,不及
本文在前人研究的基础上,利用考古资料和文献记载对青海古,近代兵器演变的历史进行了系统考察,并从兵器演进史的角度揭示青海民族发展的历史。
WithingsThermo内置16个红外线传感器,能够寻找到额头温度最高位置的度数,只需将它的绿色部分对准额头就可以在两秒钟内完成测量,然后数值会用点阵直接显示在按钮旁边。此外,它还
在前段时间举行的2016中国北斗与物联产业技术研讨会上,中国卫星导航系统管理办公室总工程师张春领表示,中国自主研制的北斗卫星导航系统,已初步具备向全球拓展的基础。该系统将
2016年12月8日,中铝国际工程股份有限公司在北京总部隆重举行了”工程用铝”系列产品合作签字仪式。与国内包括地方政府、大型央企和知名民企在内的多家合作伙伴,成功签订了11
铝电解系列虽然是由大直流电流提供能源进行生产,但各部分电流载体的通流状态和变化影响着铝电解生产的稳定运行,由于电流栽体的电阻极小,属于微欧或更小级别,对这样的微弱电信号
审美心理是人的心理的高级形式,在产和瑟形式过程中,审美心理具有一定的规律;审美心理上有历史性,民族性,阶级性以及共同性。
日前,谷歌在GoogleMap中加入了一项新工具,将允许用户在地图上加入新地点或者对已有的位置标注进行校正。据了解,当选定已有的位置标注后,除了已有的具体地址、联系方式、营业时