论文部分内容阅读
语音交互技术落地为具体产品的过程中,遇到的第一道坎就是如何做到不同厂家间的设备在语音交互标准上的统一。云知声过这道坎的秘诀是,放慢节奏、培养用户体验、反向引导厂商。
人与智能设备的交互方式有很多种,比如按钮、触屏、体感等,很难判断这些交互方式中哪种会替换掉另外一种。更多的情况是,不同的场合下会有不同的交互方式与之相适应。比如类似开会这种需要安静环境的场合,触控是最合适的交互方式。而在智能家居设备所处的家庭生活环境中,声音的交互方式似乎更合适。
“一位家庭主妇正在做菜,在做红烧肉这道菜时忽然忘记了怎么做,这时候再去洗手去拿手机,或者使用PC上网搜索,都不是太方便。但如果是对着电视说一句‘红烧肉怎么做’,马上就看到了有关红烧肉的做法视频,这倒是一个比较方便的方式。”云知声CEO黄伟在接受中国计算机报记者采访时表示。
在黄伟看来,无论是在智能家居设备领域,还是其他设备领域,多种交互方式会并存,但语音的交互方式会成为更重要的方式。
“硬推”不可行
在智能家居设备领域,一些厂商有这样一个愿景:未来的智能设备一定是可以联网的,可以通过路由器连接在一起;每一个设备都需要一个遥控器,但当设备越来越智能,也意味着遥控器上的按钮越来越多,而使用智能语音的方式,就可以把按钮变少,把菜单变得扁平化。当家里所有的家电都通过网络传输的方式连接在一起,人们再通过语音遥控器就可以与设备之间进行非常自然地对话,实现把所有的智能家电设备都管理起来。
“这是一个非常美好的愿景,但实现过程中遇到的第一个障碍就是如何统一语音交互标准,比如传统电子设备方面是一种标准,但随着以后越来越多智能设备的出现,就又会出现很多不同的标准。而只有传统电子设备与智能设备的标准实现统一,才能连接在一起。”黄伟坦承,现在做出能统一所有家电的智能语音遥控器是不可能的,但可以从某些类家电开始入手,“比如先从Smart TV、空调、冰箱这些类家电入手,让用户感觉到语音这种交互方式非常新奇和方便,而不仅仅是好玩。等用户养成使用习惯之后,就会产生使用语音操控的体验需求,这时候也会让厂商觉得有必要对标准进行统一,最终再实现所有设备通过统一的设备协议管理起来。”
智能语音技术在设备上的落地目前在市场上有前装与后装两种方式,前装是指设备出厂前预先安装语音产品,反之则为后装。目前国内前装市场比较混乱,很多智能语音服务供应商在花费了大量资源,一步到位地将语音产品预装到到设备后,却发现产品未能满足用户的真正需求。而云知声则选择把从技术供应到产品落地的过程进行详细梳理并一步步落实。“比如此前我们推出过一个让用户不需要空调遥控器的产品,用户一进入房间,对空调说‘把温度调到26度’,空调就会自动调到理想的温度,目前这个产品已经前装落地,但这是一种脚踏实地的前装,而不是通过一些生硬的推广方式去满足用户需求。”黄伟如是说。
“芯”很重要
作为一家以技术驱动的智能语音公司,云知声成立两年多来,从最初选择移动互联网领域切入到现在,已在智能家电、车载、可穿戴设备、在线教育、智能客服等多个领域,选择了几千家的合作伙伴广泛开展了合作。今年10月,云知声制定的“云、端、芯”战略也正式全面启动;11月,由云知声与合作伙伴共同推出的一款智能眼镜也正式发布。
鉴于智能语音未来的应用场景将呈现软硬结合的趋势,如果能够在芯片层面上实现深度的智能语音集成,对于用户体验的提升将具有更大的意义。“市面上有些语音产品,使用流程上要经过解锁、查找App、点击麦克风说话,但其实这已经不符合用户对语音交互便捷性的预期,如果语音产品能与芯片结合,就能实现只要把设备放在桌子上,然后直接对设备说‘定一张明天下午去上海虹桥的机票’,设备就会自动去完成动作,而且整个过程用户不用去触控设备。”黄伟介绍说。
目前,全球最大的芯片供应商英特尔已选择与云知声进行合作。今年英特尔预计出货的几千万部平板电脑,将能够使用云知声的智能语音功能,部分英特尔的芯片将高度集成语音识别、声纹识别、语音唤醒等多项云知声智能语音的强大功能。相对于从前基于软件层面的语音解决方案,从系统层级的深度直接将语音交互集成在芯片上无疑在提升用户体验上有着更明显的优势:第一是处理速度更快,第二是更加省电。
多生态圈并行发展
在智能电视领域,云知声也是很早就进入了。“乐视是国内智能电视出货量较大的一家厂商,目前乐视独家使用的就是云之声提供的处理器。我们推行从云到端的战略,就是从与乐视的合作开始的。因为有时候云端的服务在某些设备上不一定都能适合用户体验,比如用户想搜索某个节目,这个时候通过云端提供服务的话就很合适,而如换台、调音量这些要求又快又准的操控功能,就需要我们把一部分功能引擎从云端搬到终端上面,即搬到乐视电视的遥控器上面。”黄伟表示。
而在智能手机领域,因为云知声整体发展才刚刚起步,所以在过去的两年中,无论从资源投入和研发力量投入上,云知声并未更多发力。不过,目前国内智能手机寡头垄断的新市场形势,有利于云知声节省与手机厂商合作时涉及的各种研发、适配、测试成本。“原来我们在智能手机上发力并不多,但现在看这恰恰是节约了我们本来就有限的资源,未来我们会加大在智能手机上的投入。”黄伟称。
此外,从去年开始,国内很多创业公司也都在做可穿戴设备,云知声也在一直关注。上个月云知声发布了中国首款可穿戴ROM——UniWear,聚合芯片、声学等上下游产业链,为开发者和硬件厂商提供一站式软硬件解决方案。据黄伟介绍,云知声之所以把服务从云端延伸到芯片和终端,不仅是因为看到了智能家居的未来发展前景,更重要地也是看到了未来可穿戴设备的发展前景。
链接 有关云知声
云知声专注于智能语音识别及语言处理技术,拥有完全自主知识产权的世界顶尖的智能语音识别技术。借助云计算平台和移动互联网技术,云知声目前已推出了一系列语音识别服务中间件和语音识别服务云平台,广泛应用在移动互联网、智能家电、可穿戴设备等领域。目前云知声已围绕云、端、芯三个方向在移动应用、智能硬件、智能家居等多个领域布局语音生态系统:云知声开放平台是国内首个永久免费的开放语音云平台,为开发者提供最便利的语音接口;云知声UniWear是国内首个可穿戴式ROM,主要面向可穿戴设备,除提供软件 云服务之外,还聚合芯片、声学等上下游产业链,为开发者和硬件厂商提供一站式软硬件解决方案。
人与智能设备的交互方式有很多种,比如按钮、触屏、体感等,很难判断这些交互方式中哪种会替换掉另外一种。更多的情况是,不同的场合下会有不同的交互方式与之相适应。比如类似开会这种需要安静环境的场合,触控是最合适的交互方式。而在智能家居设备所处的家庭生活环境中,声音的交互方式似乎更合适。
“一位家庭主妇正在做菜,在做红烧肉这道菜时忽然忘记了怎么做,这时候再去洗手去拿手机,或者使用PC上网搜索,都不是太方便。但如果是对着电视说一句‘红烧肉怎么做’,马上就看到了有关红烧肉的做法视频,这倒是一个比较方便的方式。”云知声CEO黄伟在接受中国计算机报记者采访时表示。
在黄伟看来,无论是在智能家居设备领域,还是其他设备领域,多种交互方式会并存,但语音的交互方式会成为更重要的方式。
“硬推”不可行
在智能家居设备领域,一些厂商有这样一个愿景:未来的智能设备一定是可以联网的,可以通过路由器连接在一起;每一个设备都需要一个遥控器,但当设备越来越智能,也意味着遥控器上的按钮越来越多,而使用智能语音的方式,就可以把按钮变少,把菜单变得扁平化。当家里所有的家电都通过网络传输的方式连接在一起,人们再通过语音遥控器就可以与设备之间进行非常自然地对话,实现把所有的智能家电设备都管理起来。
“这是一个非常美好的愿景,但实现过程中遇到的第一个障碍就是如何统一语音交互标准,比如传统电子设备方面是一种标准,但随着以后越来越多智能设备的出现,就又会出现很多不同的标准。而只有传统电子设备与智能设备的标准实现统一,才能连接在一起。”黄伟坦承,现在做出能统一所有家电的智能语音遥控器是不可能的,但可以从某些类家电开始入手,“比如先从Smart TV、空调、冰箱这些类家电入手,让用户感觉到语音这种交互方式非常新奇和方便,而不仅仅是好玩。等用户养成使用习惯之后,就会产生使用语音操控的体验需求,这时候也会让厂商觉得有必要对标准进行统一,最终再实现所有设备通过统一的设备协议管理起来。”
智能语音技术在设备上的落地目前在市场上有前装与后装两种方式,前装是指设备出厂前预先安装语音产品,反之则为后装。目前国内前装市场比较混乱,很多智能语音服务供应商在花费了大量资源,一步到位地将语音产品预装到到设备后,却发现产品未能满足用户的真正需求。而云知声则选择把从技术供应到产品落地的过程进行详细梳理并一步步落实。“比如此前我们推出过一个让用户不需要空调遥控器的产品,用户一进入房间,对空调说‘把温度调到26度’,空调就会自动调到理想的温度,目前这个产品已经前装落地,但这是一种脚踏实地的前装,而不是通过一些生硬的推广方式去满足用户需求。”黄伟如是说。
“芯”很重要
作为一家以技术驱动的智能语音公司,云知声成立两年多来,从最初选择移动互联网领域切入到现在,已在智能家电、车载、可穿戴设备、在线教育、智能客服等多个领域,选择了几千家的合作伙伴广泛开展了合作。今年10月,云知声制定的“云、端、芯”战略也正式全面启动;11月,由云知声与合作伙伴共同推出的一款智能眼镜也正式发布。
鉴于智能语音未来的应用场景将呈现软硬结合的趋势,如果能够在芯片层面上实现深度的智能语音集成,对于用户体验的提升将具有更大的意义。“市面上有些语音产品,使用流程上要经过解锁、查找App、点击麦克风说话,但其实这已经不符合用户对语音交互便捷性的预期,如果语音产品能与芯片结合,就能实现只要把设备放在桌子上,然后直接对设备说‘定一张明天下午去上海虹桥的机票’,设备就会自动去完成动作,而且整个过程用户不用去触控设备。”黄伟介绍说。
目前,全球最大的芯片供应商英特尔已选择与云知声进行合作。今年英特尔预计出货的几千万部平板电脑,将能够使用云知声的智能语音功能,部分英特尔的芯片将高度集成语音识别、声纹识别、语音唤醒等多项云知声智能语音的强大功能。相对于从前基于软件层面的语音解决方案,从系统层级的深度直接将语音交互集成在芯片上无疑在提升用户体验上有着更明显的优势:第一是处理速度更快,第二是更加省电。
多生态圈并行发展
在智能电视领域,云知声也是很早就进入了。“乐视是国内智能电视出货量较大的一家厂商,目前乐视独家使用的就是云之声提供的处理器。我们推行从云到端的战略,就是从与乐视的合作开始的。因为有时候云端的服务在某些设备上不一定都能适合用户体验,比如用户想搜索某个节目,这个时候通过云端提供服务的话就很合适,而如换台、调音量这些要求又快又准的操控功能,就需要我们把一部分功能引擎从云端搬到终端上面,即搬到乐视电视的遥控器上面。”黄伟表示。
而在智能手机领域,因为云知声整体发展才刚刚起步,所以在过去的两年中,无论从资源投入和研发力量投入上,云知声并未更多发力。不过,目前国内智能手机寡头垄断的新市场形势,有利于云知声节省与手机厂商合作时涉及的各种研发、适配、测试成本。“原来我们在智能手机上发力并不多,但现在看这恰恰是节约了我们本来就有限的资源,未来我们会加大在智能手机上的投入。”黄伟称。
此外,从去年开始,国内很多创业公司也都在做可穿戴设备,云知声也在一直关注。上个月云知声发布了中国首款可穿戴ROM——UniWear,聚合芯片、声学等上下游产业链,为开发者和硬件厂商提供一站式软硬件解决方案。据黄伟介绍,云知声之所以把服务从云端延伸到芯片和终端,不仅是因为看到了智能家居的未来发展前景,更重要地也是看到了未来可穿戴设备的发展前景。
链接 有关云知声
云知声专注于智能语音识别及语言处理技术,拥有完全自主知识产权的世界顶尖的智能语音识别技术。借助云计算平台和移动互联网技术,云知声目前已推出了一系列语音识别服务中间件和语音识别服务云平台,广泛应用在移动互联网、智能家电、可穿戴设备等领域。目前云知声已围绕云、端、芯三个方向在移动应用、智能硬件、智能家居等多个领域布局语音生态系统:云知声开放平台是国内首个永久免费的开放语音云平台,为开发者提供最便利的语音接口;云知声UniWear是国内首个可穿戴式ROM,主要面向可穿戴设备,除提供软件 云服务之外,还聚合芯片、声学等上下游产业链,为开发者和硬件厂商提供一站式软硬件解决方案。