VoiceXML语音浏览器的实现与整合

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:DZLYSSY
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人们可以使用电话或移动电话、PC、PDA和其它智能设备通过语音识别、语音合成的交互技术,以及语音浏览、智能信息处理技术等实现访问互联网,实现个人服务和商业服务的语音应用。其中,作为建立于网络与语音通讯之间的桥梁,语音浏览技术发挥着重要的作用。而作为语音浏览技术以及语音互联网的核心,VoiceXML突破性地实现了互联网与电话网的融合,为语音应用领域展现了一个更为广阔的未来。本文在分析VoiceXML、语音识别、语音合成、文档解析等技术的基础上,完成了基于窄带智能网的VoiceXML语音浏览平台的原型系统设计并对系统结构、设计思想进行了详细介绍。本语音浏览平台以卡耐基梅隆大学的开源项目OpenVXI为核心,分为执行平台,VoiceXML语音浏览器和文档服务器三部分,本文重点介绍了VoiceXML语音浏览器的设计、实现、优化以及与执行平台的整合。针对语音浏览器与执行平台高度耦合的局限,本语音浏览器采用标准的INAP/UIScript消息与执行平台进行交互,使其很容易、快速地部署到现有的窄带智能网平台中,并可以轻松地在不同设备制造商的智能网平台间迁移。本语音浏览器的设计充分考虑了大规模商业应用的需要,通过采用多线程多通道的呼叫控制模型满足了商业应用环境下的大话务量并发呼叫请求。由于OpenVXI没有对语音文件播放进行缓存,常常导致不必要的语音文件重复下载,严重地影响语音浏览平台的性能。因此本文提出了一种对语音浏览器的优化方案,通过引入VoiceAgent模块实现对语音文件的缓存,从而极大地提高了整个语音浏览平台的性能。为了更方便快捷地测试语音本浏览器的功能和性能,本文提出了自主开发的自动测试工具VxmlEmul,该工具可以模拟窄带智能网的功能,在不需要SCP、SSP、媒体处理等智能网设备的参与下对语音浏览器进行测试。文章的最后使用VxmlEmul完成了对语音浏览器的测试和性能分析,证实了其实际可行性。本论文的研究工作为进一步的产品化研究和商业应用奠定了一定的基础,并具有实际的参考价值。
其他文献
P2P系统因其分布性、易拓展、负载均衡等优势,正在赢得广泛的关注。其核心思想是使应用从中央服务器向网络边缘的终端设备扩散,充分利用互联网中蕴含的潜在资源,减轻主干网络
随着Internet技术持续突飞猛进地发展,网络上的信息安全问题日益突出。特别是电子商务、数字货币和网络银行等新业务的深入开展,信息的保密性、完整性和可用性等安全问题成了
随着国家有线数字电视网络建设和网络技术的快速发展,以及网络规模不断的扩大,数字电视的普及必然成为今后电视产业的发展趋势。所谓数字电视技术,是将传统的模拟电视信号经
随着P2P计算模式的兴起、网络带宽的大幅增加和Internet端系统计算力的迅速增强,原先被忽视的终端系统成为了一种宝贵的资源。如何充分利用这端系统资源,在高动态的P2P网络环
随着国际互联网的高速发展,电子商务等网络服务已经渐渐成为人们工作和生活的一部分,并对传统的商业模式产生巨大的冲击。招投标活动中,传统的通过邮寄等手段获取资料以编制
随着互联网技术、信息技术和多媒体技术的不断发展,网络应用的种类越来越丰富,以流式传输为特点的流媒体系统逐渐成为研究的热点。同时,无线网络研究的发展以及嵌入式设备在
作为威胁当前网络安全、影响网络服务质量最严重的攻击方式之一,DDo S网络攻击是依靠其攻击原理简单、攻击形式多样、攻击效果明显,已经成为众多学者研究的焦点。同时由于其
计算机通信技术和计算机网络技术的高速发展,使得我们当前的互联网体系的局限性日益凸显。针对目前互联网存在的安全性差、缺乏可信度、不支持移动性和流媒体业务承载能力低
近年来,微博因为交友和获得信息的便利性,逐渐成为人们广泛接受的在线社交方式之一。然而这种便利性也给垃圾用户带来了可乘之机。每天微博中都包含大量的广告微博,这些信息
无线传感器网络作为一种新的信息获取方式和信息处理模式,通过大量部署在监测区域内的传感器节点,采集网络覆盖区域内感知对象的信息,采用多跳的无线通信方式,将收集、处理后