论文部分内容阅读
尽管识别率已不再是问题,但无论是大名鼎鼎的Siri和Google Now,还是《讯飞语音》和Cortana等语音助手们,在被用户调戏几天之后纷纷被打入冷宫。而谷歌助理(Google Assistant)的出现,似乎为身陷困境的小伙伴们带来了转机。
语音助手这四年
2012年6月27日,一句“OK,Google.”将Google Now带入了公众的视野。而在4年之后,2016年5月19日,当谷歌在Google I/O大会上再次喊起“OK,Google.”时,Google Now终于脱胎换骨,成了谷歌助理。
不得不说,Google Now这四年发展并不如预期中的那么美好。在初次亮相的发布会上,它便被“黑科技”产品Google Glass夺去了风头,更何况还有苹果的Siri珠玉在前。起初,Google Now只是谷歌地图团队的一个创意,让用户不需要点击屏幕即可完成对智能手机的操控。而在Siri出现后,Google Now才搭上了语音助手的东风。
在Siri和Google Now之后,微软、讯飞、搜狗和奇虎360等厂商,纷纷推出了自己的手机语音助手APP。不久后,语音助手甚至开始成为智能手机的标配。然而,好景不长。即便是名声如Siri,如今也只有在用户无聊时,才有机会登台“讲个笑话”。
语音助手们的落寞,最核心的问题还是在于自己的“智商不高”。有网友戏称,你原以为语音助手会是钢铁侠的Jarvis,然而事实上它只是一个高配版的金立语音王。
如果你有深入使用过各类语音助手APP就会发现,这些机械的一问一答破绽百出。尽管表面上交互方式是语音,但其本质上与鼠标点击和手指触控别无二致,死板的语音反而让人感到膈应。不仅如此,语音助手们能够独立完成的手机操作也十分有限,仅限于部分常用的系统操作,完全不能深入到第三方APP当中。
谷歌助理带来了哪些启示?
同样是一句“OK,Google.”,同样的机器人“嗓”,但此次出现的谷歌助理似乎要靠谱了不少。从谷歌I/O大会的现场演示中可以看出,谷歌助理可以听懂更多口语化的表达,它甚至可以和用户进行日常聊天。谷歌表示,谷歌助理并非只是执行简单的一问一答,而是会联系上下文,给出更精准的答案,用户还可以进行追问。
比如,当你“招呼”谷歌助理帮你搜索完热门电影之后,它会因为听到你刚说了这次会带小孩一起去,而筛选出那些适合孩童的电影。更强的是,谷歌助理要比此前的语音助手们更“主动”—它会顺势问你是否需要四张票,并帮你搞定订票和付费。如今,谷歌正在为谷歌助理接入更多的第三方服务,打车出行的Uber、在线听曲的Spotify以及线上订座的OpenTable都可以通过谷歌助理搞定。
可以说,谷歌助理将语音助手提升到了一个新的段位。而这一切,都源自人工智能的功劳。事实上,人工智能也正是今年的谷歌I/O大会的一大主题。在发布会一开始,公司CEO Sundar Pichai便开始强调机器学习在生活中扮演的重要角色。在本次谷歌I/O大会上发布的Allo和Google Home中,都有谷歌助理的身影。在Allo中,谷歌助理甚至会根据对方发来的图片信息,给出回复建议。
语音助手,接下来怎么走
而在国内,以讯飞为代表的企业已经将中文的语音识别率提升到了很高的水准。可是,“能听清”的问题解决了,“能听懂”又成了新挑战。百度的人工智能研究目标之一便是要攻克这一难题,但目前进展缓慢。要知道,谷歌助理的背后,其实是谷歌在这一领域近十年的耕耘。除了谷歌,微软、亚马逊和Facebook等公司也在语音助手领域试水人工智能。更有传言称,苹果的Siri也将迎来重要升级。种种迹象表明,由人工智能引发的语音助手变革,已是山雨欲来风满楼。
短期内,国内同行要“借鉴”谷歌助理并不容易。不过,由于一些众所周知的原因,留给国内语音助手们的追赶时间应该还十分充裕。我们认为,在语义理解方面还没有取得突破之前,国内的语音助手们或许可以从以下三个方面进行突破。
其一是变得更“主动”。使用语音助手时,最让人费解的是,语音助手们每次回答完问题之后,并不会主动接收下一条语音命令,我们还得自己动手按下话筒图标。所谓“主动”,就是要从这些细节入手。
其二是扩展第三方服务。目前,当我们打开手机上的XX语音助手,说一句最常见的“附近有什么吃的”时,得到的答案往往都是一个简单的列表。为什么不能进一步,提供餐馆和产品推荐并帮助用户完成点餐呢?也只有待这类第三方服务丰富起来之后,才能增强用户打开语音助手的意愿。
其三是利用好手机传感器。如今,手机上提供了多种传感器,结合传感器手机其实可以实时感知到我们的状态。同样的,这些传感器可以部分弥补语音助手们“听不懂”的尴尬。比如,可以转述家里领导分派的任务:到小区时买瓶醋。或者,在用户出门时会主动问一句“带伞了没”。
语音助手这四年
2012年6月27日,一句“OK,Google.”将Google Now带入了公众的视野。而在4年之后,2016年5月19日,当谷歌在Google I/O大会上再次喊起“OK,Google.”时,Google Now终于脱胎换骨,成了谷歌助理。
不得不说,Google Now这四年发展并不如预期中的那么美好。在初次亮相的发布会上,它便被“黑科技”产品Google Glass夺去了风头,更何况还有苹果的Siri珠玉在前。起初,Google Now只是谷歌地图团队的一个创意,让用户不需要点击屏幕即可完成对智能手机的操控。而在Siri出现后,Google Now才搭上了语音助手的东风。
在Siri和Google Now之后,微软、讯飞、搜狗和奇虎360等厂商,纷纷推出了自己的手机语音助手APP。不久后,语音助手甚至开始成为智能手机的标配。然而,好景不长。即便是名声如Siri,如今也只有在用户无聊时,才有机会登台“讲个笑话”。
语音助手们的落寞,最核心的问题还是在于自己的“智商不高”。有网友戏称,你原以为语音助手会是钢铁侠的Jarvis,然而事实上它只是一个高配版的金立语音王。
如果你有深入使用过各类语音助手APP就会发现,这些机械的一问一答破绽百出。尽管表面上交互方式是语音,但其本质上与鼠标点击和手指触控别无二致,死板的语音反而让人感到膈应。不仅如此,语音助手们能够独立完成的手机操作也十分有限,仅限于部分常用的系统操作,完全不能深入到第三方APP当中。
谷歌助理带来了哪些启示?
同样是一句“OK,Google.”,同样的机器人“嗓”,但此次出现的谷歌助理似乎要靠谱了不少。从谷歌I/O大会的现场演示中可以看出,谷歌助理可以听懂更多口语化的表达,它甚至可以和用户进行日常聊天。谷歌表示,谷歌助理并非只是执行简单的一问一答,而是会联系上下文,给出更精准的答案,用户还可以进行追问。
比如,当你“招呼”谷歌助理帮你搜索完热门电影之后,它会因为听到你刚说了这次会带小孩一起去,而筛选出那些适合孩童的电影。更强的是,谷歌助理要比此前的语音助手们更“主动”—它会顺势问你是否需要四张票,并帮你搞定订票和付费。如今,谷歌正在为谷歌助理接入更多的第三方服务,打车出行的Uber、在线听曲的Spotify以及线上订座的OpenTable都可以通过谷歌助理搞定。
可以说,谷歌助理将语音助手提升到了一个新的段位。而这一切,都源自人工智能的功劳。事实上,人工智能也正是今年的谷歌I/O大会的一大主题。在发布会一开始,公司CEO Sundar Pichai便开始强调机器学习在生活中扮演的重要角色。在本次谷歌I/O大会上发布的Allo和Google Home中,都有谷歌助理的身影。在Allo中,谷歌助理甚至会根据对方发来的图片信息,给出回复建议。
语音助手,接下来怎么走
而在国内,以讯飞为代表的企业已经将中文的语音识别率提升到了很高的水准。可是,“能听清”的问题解决了,“能听懂”又成了新挑战。百度的人工智能研究目标之一便是要攻克这一难题,但目前进展缓慢。要知道,谷歌助理的背后,其实是谷歌在这一领域近十年的耕耘。除了谷歌,微软、亚马逊和Facebook等公司也在语音助手领域试水人工智能。更有传言称,苹果的Siri也将迎来重要升级。种种迹象表明,由人工智能引发的语音助手变革,已是山雨欲来风满楼。
短期内,国内同行要“借鉴”谷歌助理并不容易。不过,由于一些众所周知的原因,留给国内语音助手们的追赶时间应该还十分充裕。我们认为,在语义理解方面还没有取得突破之前,国内的语音助手们或许可以从以下三个方面进行突破。
其一是变得更“主动”。使用语音助手时,最让人费解的是,语音助手们每次回答完问题之后,并不会主动接收下一条语音命令,我们还得自己动手按下话筒图标。所谓“主动”,就是要从这些细节入手。
其二是扩展第三方服务。目前,当我们打开手机上的XX语音助手,说一句最常见的“附近有什么吃的”时,得到的答案往往都是一个简单的列表。为什么不能进一步,提供餐馆和产品推荐并帮助用户完成点餐呢?也只有待这类第三方服务丰富起来之后,才能增强用户打开语音助手的意愿。
其三是利用好手机传感器。如今,手机上提供了多种传感器,结合传感器手机其实可以实时感知到我们的状态。同样的,这些传感器可以部分弥补语音助手们“听不懂”的尴尬。比如,可以转述家里领导分派的任务:到小区时买瓶醋。或者,在用户出门时会主动问一句“带伞了没”。