基于智能语音交互技术的智慧语音助理系统实现

被引量 : 0次 | 上传用户:songxinda
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的到来,各种移动终端设备正在越来越多被应用到人们的日常生活中,尤其是智能手机的应用,它让人们可以随时随地娱乐、上网等,但随着手机功能增强,人们和智能手机的交互复杂度也越来越大。近年来对语音交互技术已逐步被应用到智能手机中,人们可以使用语音实现语音拨打电话、发送短信等功能;也可以收听手机新来电话、信息等,使用者不用转移双眼就可以完成电话接听、信息查看。目前的手机语音应用一般采用多次语音交互完成特定任务,这从根本上来讲并没有提升人机交互的效率,反而由于多次语音交互降低了语音识别率,增加交互的次数。多次语音交互无法体现语音技术的便捷性,并且增加了人机交互的复杂度。课题针对安卓智能手机应用场景提出一种语音交互方案,用户通过说出多命令词控制智能手机完成基本通讯、日常使用信息查询等复杂的任务,如“打电话/发短信给XXX”、“我想听XXX的歌”等,智能手机终端也自动将任务执行结果播报给用户,整个语音交互过程摒弃了繁琐的多步对话确认,解放了用户的眼睛和手,相比于传统点击、触控交互方式,该语音交互方案很大程度提升了人机交互的便捷性。同时,本课题将基于安徽科大讯飞信息科技股份提供的语音技术开放平台研制的语音交互系统应用到Android智能手机上,开发了智慧语音手机助理软件,软件结构主要由语音识别、语音合成、音频任务调度、语音交互服务管理等子模块构成,语音交互管理模块负责整体的任务调度,首先调用语音识别服务识别用于语音,并将识别结果发送给相应的业务流程,然后根据业务需要调用语音合成模块对业务结果进行播报;而音频任务调度模块随时监听音频任务的变化,当有新的用户音频数据进入时,调度模块根据业务设计逻辑决定是否结束当前任务流程,开始新的任务流程。通过模块之间有序的任务协调及管理,避免了多次语音交互时相互之间的干扰。经过大规模数据验证,语音交互系统在智能Android手机上运行稳定。系统在办公室等相对安静环境下的识别率达到90%,在驾车关窗低车载噪音环境中识别率达85%,单次语音交互时间小于3S,很好的验证了语音交互系统的可用性。
其他文献
区域物流与区域经济之间协调发展,成为区域经济持续、快速、稳定、健康发展的重要因素。本文利用因子分析法,对河南省18个市的物流能力进行综合评价,并提出相应建议。
DDoS(Distributed Denial of Service,分布式拒绝服务)攻击是一种通过耗尽受害者主机资源而使得它不能提供正常服务能力的攻击。随着最近几年云计算的高速发展,DDoS也渐渐的
改革开放和经济全球化背景下,多元文化和多级价值平等、自由、民主地“共生共享”于同一社会场景,在现实的文化实践中无法期望形成一种具有引导性价值的、知识论意义上的“统
当今世界,互联网已深入人们生活的各个方面,对人们传统的生活方式进行着解构的同时又重塑着互联网环境下新的生活方式。互联网对于城市居民生活的影响力,已是不言自明,那么它
澳大利亚女作家考琳.麦卡洛以"荆棘鸟"为她的长篇小说命名,这其中蕴含了作者对于爱情的理解:"最美好的东西只能用深痛巨创来换取。""荆棘鸟"作为一个文学意象在整部小说的开
知识经济的发展对传统的政府人力资源管理方法提出了挑战,传统的人事管理思想不能够最大限度的发挥政府的效能。胜任力模型的研究为政府人力资源管理提供了新的视角和技术方
啤酒在中国的发展可谓迅猛,现在啤酒作为一种最常见的酒精饮品已经融入了国人的生活当中。随着啤酒行业的快速发展,啤酒供给问题也逐渐的凸显出来。由于各地对啤酒品牌的喜好
企业电视新闻是企业管理、宣传、信息通报的重要手段和形式。本文通过对企业电视新闻制作流程各个环节和注意事项的经验总结,帮助同行从业人员更好地熟悉和把握企业电视新闻
俄国农村公社走向问题是马克思和恩格斯在19世纪70到90年代一直关注的一个重要社会问题,这一关注有一个突出的特点,就是始终把西欧现代化资本主义社会产生的巨大影响,作为判
"女色消费"作为一个古老的话题,其内涵和外延在当今的大背景下是迅速发展,且日渐丰富多彩;而现代文明的不断前行,更让人们看到了"男色消费"这道极具时代特色的风景线,本文试