语音交互及语音智能设备

来源 :电脑爱好者 | 被引量 : 0次 | 上传用户:sccd920141
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读

语音交互与语音识别


  与我们已经习惯的所见即所得操控交互方式不同,语音操控可以让用户无需接触输入设备进行远程操控,在很多情况下设备也会以语音方式进行回馈,所以用户也无需注视设备。无需接触和注视设备的交互和操控方式,在很多情况下有着非常重要的意义,例如在运动、驾驶时,可以对多媒体、通讯设备等进行操控(图1),无需使用双手和转移视线,显然更加安全。



  与PC时代和早期的语音识别技术不同,目前语音交互中最关键的语音识别和语义解释能力,大部分并不是基于本机的数据库和计算能力,而是通过互联网连接到厂商的语音引擎,甚至可能是厂商购买的各大语音引擎提供商的相应服务器上进行处理的。借助服务器端提供的超大数据库和强大的计算能力,现代语音交互的能力当然可以远超单机端,不过不同的智能产品,实际的交互能力还是从限定的单词到比较随意的日常语言都有,其使用的方便程度恰恰就反映出这些智能产品的智能程度。

语音交互能力實测


  在选择语音设备的时候,应该注意哪些问题呢?其实从很多发布会的演示就可以看出来,影响语音交互能力的主要就是识别能力,而识别能力的内在是数据库和计算能力,外在则是拾音效果。不过,科技大佬们在展台上的讲话和演示实在距离我们太远,因此我们自己也进行了一些测试,来看看不同设备和使用状况究竟会对语音交互能力造成怎样的影响。
  外部环境测试中,我们采用手机安装识别率非常好的讯飞语音引擎进行测试,分别在特意靠近至离嘴部仅有30cm,以及距离1m左右的典型使用距离下,还使用了外接蓝牙耳机。同一台手机在30cm距离上的语音识别效果很好,基本可以做到不遗漏地执行所有操作和输入任务(图2),在1m处则出现了一些识别错误,且加大声音也不能获得完美效果,这应该与外界干扰和拾音的定向能力有关(图3)。需要注意的是,我们的测试为相对安静的室内环境,如果在室外或行车途中,因为会收录到更多的环境噪声,识别率还会下降。



  在外设测试中,我们使用了多款蓝牙和有线耳麦,测试过程中出现了非常有趣的问题,部分蓝牙与有线耳机的识别效果与在近处使用手机麦克风类似,识别能力很不错,但也有通话质量非常好的耳机出现了与语音软件的兼容性问题。另一方面,有些耳机自带语音控制键(图4),可启动大部分手机、平板电脑等设备自带的语音软件,也可以明显提升语音互动功能的易用性。
  内在能力的测试与各个厂商的技术有关,由于各个厂商甚至各个版本的着重点不同,在各个方面的表现可能出现特别明显的差异,我们更需要的是与设备定位最适合的能力,而难以判断哪一个厂商的产品是最好的。所以我们尝试进行了另一项测试,那就是使用同样引擎的产品,是否会有性能差异,例如内地厂商广泛采用的讯飞引擎,在不同的设备和APP中是否会有不同的表现。
  我们使用多个基于讯飞语音引擎的手机自带语音互动程序和基于讯飞语音引擎的APP,如语点数码、咪咕灵犀、讯飞输入法等等。另外笔者也有幸接触过一些机器人生产商,并进行过一些实际体验,这些机器人产品的语音智能部分,同样大都是使用讯飞的技术。从笔者的测试看,这些产品除了定位功能不同外,竟然也存在着语音识别的差异,这可能与各个软硬件厂商自身的一些优化设计有关,也可能与其购买的讯飞服务等级有关系。
  从以上的结果可以看出,即使是使用同一技术或同一品牌,甚至同型号不同档次的语音互动设备,都可能存在着性能的差异,大家在实际选购时应该予以重视。


语音交互设备


  前面已经提到,语音交互是目前智能化产品中使用最广泛的智能交互方式,几乎所有类型的智能设备,如智能手机与平板电脑、智能穿戴设备、智能家居等,都大量使用了这一交互模式。我们以下介绍的只是其中一些常见或典型的产品,仅供大家了解或参考选择。

小米AI音箱


  AI音箱是近期智能硬件的热点之一,市场嗅觉一向灵敏的小米当然也不会放过这个领域,小米AI音箱就是一款性能全面、价格实惠的产品。虽然价格并不昂贵,但这款音箱的定位却相当高,它并非是简单的陪伴式互动产品,而是加入了智能家居控制、自我学习与记忆能力,大大提升了实用性(图5)。



  小米AI音箱的最基本功能是各种语音交互和陪伴能力,例如可以用语音操控其音量、播放,也可以要求它播放一首歌、念一首诗、读一篇童话故事或是询问今天的天气等。如果家中有兼容的智能家居,还可以将其与智能家居连接,作为智能家居的中心,通过语音直接操控这些智能家居产品。通过学习与记忆能力,用户可以让其逐渐了解自己的欣赏习惯、保留语音备忘、设置闹钟等。再进一步,用户可以让它提供更智能化的服务,例如起床、离家或回家后,只需要一个特定命令,就能通过小米AI音箱同时指挥多个智能家居提供服务。如离家时向小米AI音箱道别,就会自动关闭一些电器和灯光等,而归家后只需打个招呼,就可以开启灯光、热水器、咖啡机等。

科大讯飞阿尔法小蛋


  目前很多所谓的机器人,实际上就是一种基于语音交互的智能前端设备,例如科大讯飞自己推出的阿尔法蛋系列产品。阿尔法蛋有多种产品,尺寸差异较大,但外形设计和基本能力類似,搭载讯飞淘云TY OS智能系统,主打陪伴市场(图6)。
  阿尔法小蛋主要面向儿童市场,可以提供语音互动、云端资源、双语教学、生活查询等功能,其中语音互动则包括与家长的远程聊天和通过讯飞技术与阿尔法蛋进行语音交流。其前端的屏幕可以显示多种表情或播放视频,让孩子获得更好的交互体验。


● 暴风Real 6智能投影机


  暴风电视系列已经全面进入了AI智能时代,全面采用语音操控,而其面向大屏需求推出的“无屏电视”,即Max 6和Real 6投影机也具有相应的功能。相对于Max 6,更新的Real 6除了在亮度、投影性能等方面进行了升级,也提升了语音交互能力和智能表现,用户可以用日常语言对Real 6进行操控,并且可以同时布置多个任务。而Real 6除了能够自行分析用户语言,更准确地理解操控指令外,还可以分辨家庭内多个用户的语音,并通过各个用户的常用操作,猜测用户的喜好,针对性地进行个性化推荐(图7)。





  暴风的其他电视机(图8)在语音互动和AI方面的表现也比较突出,相对于使用遥控器进行语音操控的很多其他品牌产品,暴风更强调直接语音操控,特别适合无法使用遥控器的场合,如厨房,或者不适合学习使用遥控器的用户,如儿童或老人。因此其“暴风大耳朵”系统就需要使用更灵敏、聚焦范围更广的拾音装置,并且能够更好地分辨人声与噪声、日常对话和命令语句。

Ticwatch 2悦动智能手表


  智能手表,特别是偏向运动的智能手表,也是非常适合语音互动的智能设备,毕竟手表表盘的面积相对于我们的手指来说过于狭小了。Ticwatch 2悦动智能手表是一款高性价比的全能型产品,它在不足千元的价位上,提供了计步、心率、GPS定位等运动功能,同时支持手表听歌和离线支付功能,并且有多款色彩和大量表带设计可选。在不同的使用状况下,Ticwatch 2悦动智能手表的续航时间在12小时~48小时之间,基本可以满足日常使用和出游的需要, IP65的防护级别可以保证用户在户外运动时无惧雨雪,但不能佩戴它游泳和洗澡(图9)。
  这款手表的语音助手支持拨打电话、查询地图和各种信息、翻译、设定闹钟等多种功能,配合其特色的手势操作、表壳触控等,可以快捷地进行各种操控。Ticwatch还提供了多个系列和定位的智能手表产品,均支持语音互动,对自主通话、NFC、高端防护等有需求的用户,可以选择Ticwatch的其他智能手表产品(图10)。




其他


  作为一种特色鲜明,同时门槛相对较低的智能互动方式,语音互动设备和相关产品非常多。例如一些蓝牙耳机就自带语音互动按键,在与兼容的手机配对后,可以很方便地呼出语音助手。另外还有一些大家可能很少了解的产品,例如支持语音的鼠标(图11)、可通过语音进行遥控的电视遥控器等,它们同样会带给用户新鲜便捷的使用体验,而且大都价格并不昂贵,对语音互动方式感兴趣的朋友不妨考虑入手。


其他文献
Q:平时使用的是谷歌浏览器,现在想将浏览器中的某一个书签文件夹分享给别人,但是利用浏览器自带的书签导出功能无法实现。通过什么方法可以解决这个问题?  A:在谷歌浏览器里面安装一款名为Onetab的功能扩展,打开需要分享的浏览器书签目录,然后点击这个功能扩展的图标,所有的书签链接都会显示到一个全新的列表里面,将这个列表中的文件复制给要分享的用户就可以了。  其他用户也需要首先安装这个功能扩展,然后将
期刊
假设有5个数据,分别为30%、25%、15%、25%、5%,要用饼图来表示。首先,新建一张空白幻灯片,设置好背景色,利用自选图形,画出一个椭圆,纯色填充,无线条,设置它的三维格式,顶部棱台宽度为2磅,高度为16磅,在三维旋转的预设中选择“透视:适当宽松”(当然也可以自定义透视效果,如将它的X旋转设置为352度,Y旋转设置为315度,Z旋转设置为10度,透视为45度),这样一个基本的饼图效果就制作好
期刊
惠普战66 Pro高色域版是针对商务用户量身定制的笔记本家族,它通过了业界最严苛的美国国防部MILSTD-810G军标测试。为了提升可靠性,新战66 Pro并没有采用时下流行的超窄边框设计,在轻薄属性上远远不如惠普自家的ENVY家族。对一款14英寸的笔记本而言,19.95mm厚和1.64kg重的新战66 Pro算得上轻薄,但却谈不上极致。  这款产品采用了14英寸IPS雾面屏幕,分辨率为1080P
期刊
戴尔Latitude 7390在设计上的特色就是继承了前辈特色的“商有度,创无边”的理念,将屏幕两侧的边框压缩到了不足5mm,304.5mm的机身宽度堪比很多传统11.6英寸笔记本,而Latitude 7390却是一款有着13.3英寸视野的机型。这款产品采用了金属材质的机身,机身表面添加了一层类肤质的涂层,A面外壳引入了类似碳纤维的纹理,看起来显得更加高档,同时整机还通过了全面的军用级MILSTD
期刊
1. 通过Windows 10设置进行阻止  对于使用最新版Windows 10的用户,可通过系统设置来完成阻止。  首先,通过“开始→设置”,选择进入“个性化”设置窗口,然后选择“开始”项(图1)。在接下来弹出的“开始”设置列表中,将“偶尔在开始屏幕显示建议”下的开关设置为“关”(图2)。这样,当卸载了自己不再用的应用之后,系统就不会再自动安装这些应用了。 2. 通过注册表禁用自动推送  如果所
期刊
传统屏幕的结构  如今99%的笔记本屏幕都是标准的LCD,只有极少数顶级笔记本才会尝鲜OLED材质的屏幕。对LCD而言,由于屏幕面板无法自发光,想要显示内容就必须借助背光LED灯管,而灯管的数量、位置、亮度会影响到屏幕的对比度、可视角度和是否漏光。  从结构来说,常见的笔记本LCD屏幕主要是由金属加固基板(可选,如果有,按压A面屏幕不会出现水波纹)、背光源(LED灯)、偏光板、玻璃基板液晶体、微彩
期刊
1. 自动创建音乐照片视频  打开“照片”应用,选择要合成为音乐视频相册的原始照片文件(可用复选框多选),然后点击窗口顶部的“添加到…”按钮(或直接按下Ctrl+D组合键)(图1)。  接下来选择要将照片添加到的目标,这里我们要创建视频相册,因此选择“带有音乐的新视频”(图2)。接着为新视频起一个名字,点击“创建视频”按钮,即可自动开始创建音乐视频(图3)。 2. 创建自定义的音乐视频  若需要创
期刊
1 尝试可否用系统更新解决  Windows系统更新中会包括Windows Defender及其病毒库的更新。如果系统升级程序检查到Windows Defender不是最新版本或存在问题,会自动将其更新为最新版本。  从“设置”窗口中选择“更新和安全”,点击“Windows更新”进入选择自动更新系统(图1);继而选择Windows Defender,进入防病毒设置窗口,点击“启用Windows D
期刊
随着Linux的发展,现在Linux已经应用在很多方面。比如很多个人或者企业网站使用的阿里云空间就在使用Linux系统,企业部署的服务器也有很多在使用Linux系统。因此很多朋友有学习Linux系统的需求,但是对于很多新手来说,安装和配置Linux系统都是一个难题。Windows 10系统现在已经集成Linux运行环境,让我们可以在Windows 10中运行Linux系统,轻松学习常见的Linux
期刊
荣耀音乐小巨蛋在设计上引入了小巨蛋体育馆犹如鹅卵石般圆润的元素,提供红、蓝、灰三种时尚配色可选,并在上半部分的扬声器表面包裹了一层柔软布料,具备防水、耐磨和防腐蚀的特性,在提升手感之余也不会影响声音的通透性。荣耀音乐小巨蛋的下半部分则采用了类肤质的工艺,手感非常细腻,四周分布着按压式的电源、蓝牙、音量加减和暂停按键以及MIC孔。  在荣耀音乐小巨蛋前端配有一个防尘防水的盖板,里面隐藏着Micro
期刊