基于语音识别的IVR系统的研究与实现

来源 :南京工业大学 | 被引量 : 0次 | 上传用户:wolfop
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交互式语音应答系统(IVR)是呼叫中心中的重要组成部分。被广泛应用于语音增值业务。通过IVR系统,用户不仅可以从系统中获取预先录制的语音信息,而且可以获取TTS合成的动态语音信息。其通过对后台数据库的访问和脚本的处理,可以完成复杂的业务逻辑。然而传统的IVR系统仅能接收有限个DTMF信号。这使得用户使用时非常麻烦,并且限制了IVR系统在很多领域的应用。随着语音识别的发展,在新一代呼叫中心的IVR系统中引入语音识别作为用户输入手段已成为必然趋势。因此本课题对语音IVR系统以及高性能语音识别算法的尝试性研究,具有一定的理论价值和现实意义。   本文中,我们首先实现了语音点歌IVR系统的基本功能如:电话振铃的检测与摘机,忙音的检测与挂机,系统导航语音的播放,用户按键请求或语音请求的接收与处理,与后台数据库的通讯,检索结果的语音合成与播放。然后选用基于覆盖思想的构造型神经网络作为语音识别模型,实现了语音点歌的功能。之后我们从离线学习和在线学习两个方面对语音识别系统的总体性能进行了改进。   离线学习方面,我们首先分析了基于覆盖思想的构造型神经网络模型存在的几个难以解决的问题如:初始样本点的选择问题,覆盖算法中球邻域的划分问题。其中球形领域的划分,是一个NPC问题,目前尚未有很好的解决办法。本文通过引入粒子群优化算法来求解该问题,使得覆盖数量大大减少,从而使系统在识别速度和识别率上都有了一定的提高。   在线学习要求在不影响系统使用的情况下,对用户输入并确认的语音样本进行快速学习。本文在覆盖构造型神经网络模型基础上给出了一种增量学习算法,并在分类性能和学习时间上对其进行了测试。最终我们将该算法应用于语音点歌系统的在线学习上,取得了较好的效果。   此外,系统在实际使用中,为了提高噪声环境下正确结果的检出率,往往需要给出若干备选结果供用户选择。因此如何根据网络状态,产生容易混淆的若干识别结果,也是本文研究的内容之一。文中我们给出了两种多选结果的产生方法,试验结果表明动态多选方法,可以在只提供很少备选结果的情况下,大幅度地提高正确结果的检出率,因而使得系统更加具有实用性。
其他文献
21世纪是信息时代,电子商务作为信息时代的产物正在改变人们的思维方式、经济活动方式、工作方式和生活方式。电子商务的高效率、低成本为企业的发展带来了新的机遇。电子商务
关于植物种类自动识别,其对于业余植物学家、植物爱好者、教育工作者等都是非常重要和有必要的,以往的植物叶片识别都是在相对大型的设备上进行,存在诸多缺点。随着科技的发
无线移动自组网是一种特殊的无线移动通信网络。在没有网络基础设施的情况下,无线移动咱组网可以快速组网,其节点可以移动,网络中的每个节点既充当主机又充当路由器。由于无线移
本文是对基于JXTA平台的P2P网络通信技术的研究与应用,论文中详细地阐述了基于JXTA-P2P网络通信的技术原理,对基于JXTA的对等网络通信技术进行了深入的研究与探讨,并在此基础
随着Web技术和数据挖掘技术的广泛发展,越来越多的基于电子商务技术的组织从对网站交易数据和点击数据的深入洞察中获益。因此如何对这些数据进行分析和挖掘,充分了解客户的喜
随着无线移动通信和移动终端技术的高速发展,无线自组网作为一种新型多跳自组织网络逐渐成为研究的热点。无线自组网快速灵活的特性也给网络组网方式和运行维护带来了新的挑战
随着计算机网络技术的迅速发展和成熟,网络服务日趋多样化和个性化,业务选择网关为客户提供个性化的服务定制,也为服务提供商创造新的利润增长机会。为了保证业务选择网关个
WWW无论是在访问量、大小还是在网站设计的复杂度上都以惊人的速度增长着,Web站点设计、Web服务设计和Web模式设计也都增大了难度,Web挖掘就是运用数据挖掘的思想来解决上面的
随着面向对象分析技术和面向对象设计技术的不断成熟与推广,面向对象系统设计已经成为软件设计的主流方法。设计模式是面向对象技术的最新进展之一,更是软件领域中的研究热点之
本文提出了基于主动网络技术的面向业务的网络管理框架模型,具体研究了故障管理的内容、故障管理的特点、故障管理的实现策略、故障管理的实现模型、故障管理的理论分析、故障