论文部分内容阅读
阿里和小米智能音箱背后的语音交互解决方案提供商
“你们这个技术,先封闭一段时间,等我们的产品发布了,再开放给别的客户。”龙梦竹在思必驰负责市场的这些年里,总能听到客户类似的要求。而作为一家技术公司的CMO,她也很清楚公司的技术不能等。
今年7月,阿里和小米先后发布了各自的智能音箱“天猫精灵”和小米“AI音箱”,其背后的语音交互解决方案提供商正是思必驰。
思必驰创立于2007年,当时人工智能的概念还没普及,做语音交互的思必驰已经把自己定义为一家人工智能公司。随着公司业务的发展,人工智能热度逐渐攀升,尤其是亚马逊Echo智能音箱在国外大获成功,这让思必驰开始考虑:能不能把语音交互的能力完全开放给客户?
内置在Echo中的Alexa可以被看成是亚马逊版的Siri语音助手。同时,“Alexa”也是Echo的唤醒词。2015年6月,亚马逊宣布第三方开发者可以在Alexa平台上开发基于语音的技能(Skill),而这些技能可以通过Echo智能音箱被用户使用。
简单来说,开发者在Alexa平台上为音箱编写提醒、天气、查询、日历等功能供用户使用,而Alexa平台就像是“音箱的App Store”。
“现在Alexa平台上面有15000多个技能,但是活跃的技能不到1%。”龙梦竹对创业邦(微信搜索:ichuangyebang)谈道,“关联信用卡、配置语音账号已经是一个不小的门槛。”
技能开发这一块会耗费厂商大量的精力、人力和财力,所以国内厂商都纷纷发布了自己的技能开放平台:腾讯发布了小微,百度做了DuerOS,科大讯飞有AIUI,Rokid在推全栈语音开放平台,出门问问也发布了自己的AI开放平台。据不完全统计,目前国内约有40余家企业开放了“语音平台”。
小微Skill开放平台开放语义分析能力给第三方,由小微提供设备控制、内容资源、服务能力,其内置Skill以QQ音乐、腾讯视频等腾讯系产品为主。百度的DuerOS已经与国内外百余家家电、芯片和服务提供商建立了生态合作关系,并联合小鱼在家推出了视频通话机器人“分身鱼”。小米也为AI音箱发布了开放平台,呼吁开发者为“小爱同学”开发更多技能。
思必驰在推出开放平台上错过了最佳时机,但胜在走了一条“接地气”的路线。
9月初思必驰正式发布DUI开放平台,而在这之前,思必驰已经针对开发者举办过多次开发者沙龙。
思必驰VP、DUI负责人赵恒艺在和合作伙伴打磨产品的过程中发现了很多痛点需求,比如:“客户希望自行定义唤醒词,实时在线更新,而有些热词识别錯误或语义解析错误在当前需要重新训练模型(才能解决),效率很低。还有一些客户想做出有更大差异化的产品,对交互流程的各个环节也都有自己的想法。”
基于对痛点需求的分析,思必驰团队将DUI平台的可定制化范围扩及全链路,平台的每个功能模块均可自定义,包括唤醒词定制及参数设置、语音识别、语言模型、语义解析、多轮对话、自然语言生成和语音合成等。
相对Alexa的门槛,开发者在思必驰DUI平台一经注册即可体验可视化组件操作、网页在线编辑、快速生成Demo等功能。
每个客户都需要自己个性化的东西,而在针对客户需求进行定制化适配的过程中,思必驰也有了自己的思考,比如如何回复回话、对话的逻辑、图形用户界面等同样可以定制。此外,声音在DUI平台也可以定制,用户可以自己上传自己的声音,生成一个专属于自己的TTS个性合成音。也就是说,在取得授权的情况下,用户可以听到吴亦凡的Freestyle、鹿晗的“大家好,介绍一下……”这种个性化的语音。
在此前,客户使用思必驰的平台实现落地需要花费两三个月,而在DUI平台上,通过缩减客户在前端设备的调试时间,只需要一周即可。
除了提供智能语音语言交互技术以外,思必驰DUI开放平台还具有多种优秀特性以帮助减轻开发者的运营压力,例如:多版本管理,不同产品可对接不同分支;增量热更新,在线秒级更新,用户无感知;可视化大数据,提供用户画像和运营数据支持,更可自定义数据维度,让开发者快速优化产品体验。
赵恒艺总结,DUI平台是一整套技术模块,而他们则将这些技术模块全部转化成了产品侧的解决方案。比如针对车载解决方案、故事机、机器人等家居解决方案,DUI平台都匹配了不同的场景。而思必驰会在实现交互的整个过程中把这些链条都打散,使其变得更加灵活,因而能让客户更好地实现定制。平台上集成了百度地图、高德地图、腾讯音乐、酷爱音乐、大众点评、美团等,匹配后端的资源后,平台可以做到用户级的自适应。
据悉,思必驰为DUI平台专设了2亿人民币基金,用以扶持平台上优秀的开发者、应用案例和创业项目。
从亚马逊的Echo,谷歌的Google Home,到苹果的Home Pod,再到Rokid、天猫精灵、小米AI音箱,在人工智能的火热之下,智能音箱“百箱大战”中比拼的除了硬件和工业设计层面的差异性,更重要的是各厂商提供资源和服务的能力。
讯飞、思必驰、出门问问等公司在提供语音交互解决方案的同时也会与内容提供商进行资源合作,把内容商的资源打包输出给中小型厂商。
以有声读物为例,喜马拉雅和凯叔讲故事两者的体量、定位并不相同,为儿童、早教打造的智能家居产品更偏向与凯叔讲故事合作,因为其受众更加匹配和精准。
而在“百箱大战”的背后,厂商、技术提供方、内容商的竞合关系对产品的体验有着不可忽视的影响。
“你们这个技术,先封闭一段时间,等我们的产品发布了,再开放给别的客户。”龙梦竹在思必驰负责市场的这些年里,总能听到客户类似的要求。而作为一家技术公司的CMO,她也很清楚公司的技术不能等。
今年7月,阿里和小米先后发布了各自的智能音箱“天猫精灵”和小米“AI音箱”,其背后的语音交互解决方案提供商正是思必驰。
亚马逊版的Siri语音助手
思必驰创立于2007年,当时人工智能的概念还没普及,做语音交互的思必驰已经把自己定义为一家人工智能公司。随着公司业务的发展,人工智能热度逐渐攀升,尤其是亚马逊Echo智能音箱在国外大获成功,这让思必驰开始考虑:能不能把语音交互的能力完全开放给客户?
内置在Echo中的Alexa可以被看成是亚马逊版的Siri语音助手。同时,“Alexa”也是Echo的唤醒词。2015年6月,亚马逊宣布第三方开发者可以在Alexa平台上开发基于语音的技能(Skill),而这些技能可以通过Echo智能音箱被用户使用。
简单来说,开发者在Alexa平台上为音箱编写提醒、天气、查询、日历等功能供用户使用,而Alexa平台就像是“音箱的App Store”。
“现在Alexa平台上面有15000多个技能,但是活跃的技能不到1%。”龙梦竹对创业邦(微信搜索:ichuangyebang)谈道,“关联信用卡、配置语音账号已经是一个不小的门槛。”
技能开发这一块会耗费厂商大量的精力、人力和财力,所以国内厂商都纷纷发布了自己的技能开放平台:腾讯发布了小微,百度做了DuerOS,科大讯飞有AIUI,Rokid在推全栈语音开放平台,出门问问也发布了自己的AI开放平台。据不完全统计,目前国内约有40余家企业开放了“语音平台”。
小微Skill开放平台开放语义分析能力给第三方,由小微提供设备控制、内容资源、服务能力,其内置Skill以QQ音乐、腾讯视频等腾讯系产品为主。百度的DuerOS已经与国内外百余家家电、芯片和服务提供商建立了生态合作关系,并联合小鱼在家推出了视频通话机器人“分身鱼”。小米也为AI音箱发布了开放平台,呼吁开发者为“小爱同学”开发更多技能。
DUI可定制化扩及全链路
思必驰在推出开放平台上错过了最佳时机,但胜在走了一条“接地气”的路线。
9月初思必驰正式发布DUI开放平台,而在这之前,思必驰已经针对开发者举办过多次开发者沙龙。
思必驰VP、DUI负责人赵恒艺在和合作伙伴打磨产品的过程中发现了很多痛点需求,比如:“客户希望自行定义唤醒词,实时在线更新,而有些热词识别錯误或语义解析错误在当前需要重新训练模型(才能解决),效率很低。还有一些客户想做出有更大差异化的产品,对交互流程的各个环节也都有自己的想法。”
基于对痛点需求的分析,思必驰团队将DUI平台的可定制化范围扩及全链路,平台的每个功能模块均可自定义,包括唤醒词定制及参数设置、语音识别、语言模型、语义解析、多轮对话、自然语言生成和语音合成等。
相对Alexa的门槛,开发者在思必驰DUI平台一经注册即可体验可视化组件操作、网页在线编辑、快速生成Demo等功能。
每个客户都需要自己个性化的东西,而在针对客户需求进行定制化适配的过程中,思必驰也有了自己的思考,比如如何回复回话、对话的逻辑、图形用户界面等同样可以定制。此外,声音在DUI平台也可以定制,用户可以自己上传自己的声音,生成一个专属于自己的TTS个性合成音。也就是说,在取得授权的情况下,用户可以听到吴亦凡的Freestyle、鹿晗的“大家好,介绍一下……”这种个性化的语音。
在此前,客户使用思必驰的平台实现落地需要花费两三个月,而在DUI平台上,通过缩减客户在前端设备的调试时间,只需要一周即可。
除了提供智能语音语言交互技术以外,思必驰DUI开放平台还具有多种优秀特性以帮助减轻开发者的运营压力,例如:多版本管理,不同产品可对接不同分支;增量热更新,在线秒级更新,用户无感知;可视化大数据,提供用户画像和运营数据支持,更可自定义数据维度,让开发者快速优化产品体验。
赵恒艺总结,DUI平台是一整套技术模块,而他们则将这些技术模块全部转化成了产品侧的解决方案。比如针对车载解决方案、故事机、机器人等家居解决方案,DUI平台都匹配了不同的场景。而思必驰会在实现交互的整个过程中把这些链条都打散,使其变得更加灵活,因而能让客户更好地实现定制。平台上集成了百度地图、高德地图、腾讯音乐、酷爱音乐、大众点评、美团等,匹配后端的资源后,平台可以做到用户级的自适应。
据悉,思必驰为DUI平台专设了2亿人民币基金,用以扶持平台上优秀的开发者、应用案例和创业项目。
音箱厂商、技术提供方等不可忽视
从亚马逊的Echo,谷歌的Google Home,到苹果的Home Pod,再到Rokid、天猫精灵、小米AI音箱,在人工智能的火热之下,智能音箱“百箱大战”中比拼的除了硬件和工业设计层面的差异性,更重要的是各厂商提供资源和服务的能力。
讯飞、思必驰、出门问问等公司在提供语音交互解决方案的同时也会与内容提供商进行资源合作,把内容商的资源打包输出给中小型厂商。
以有声读物为例,喜马拉雅和凯叔讲故事两者的体量、定位并不相同,为儿童、早教打造的智能家居产品更偏向与凯叔讲故事合作,因为其受众更加匹配和精准。
而在“百箱大战”的背后,厂商、技术提供方、内容商的竞合关系对产品的体验有着不可忽视的影响。