分布式语音识别前端关键技术研究

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:juejue_wang1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动通讯技术的迅速发展,移动电话等便携设备成了语音识别的重要应用领域。对于便携设备来说,运算量和网络带宽始终是制约语音识别应用的瓶颈。分布式语音识别的特点是:在手持终端设备上仅需要执行语音检测和参数提取等计算量小的工作,复杂的识别算法交给服务器完成,有效解决了这一问题,随着计算机网络和无线移动网络的发展,分布式语音识别技术越来越得到重视。   分布式语音识别(DSR)是语音识别与分布式计算相结合的产物,虽然它总体上还是采用客户机/服务器的结构,但是这里所指的服务器不仅限于网络中的某一台特定的服务器,而是分布在网络中的许多服务器的合集,用户可以把这些服务器透明地看作一台服务器。系统中多个微处理器的集合不仅能产生比单个处理器更高的性能价格比,还能产生单个处理器所不能达到的绝对性能;分布式系统允许多个用户共享系统资源而提高了系统资源的利用率,在实现相同功能的情况下相当于降低了成本。此外,由于工作负荷被分散到多台的机器上,某一台机器出现了故障,往往可以改由其它机器完成相应功能,因此分布式系统具有更高的可靠性,同时可以在不中断系统使用的前提下更新或扩展系统功能。   分布式语音识别前端的工作主要包括预处理工作,端点检测工作,特征提取工作以及数据压缩及封装工作。本文对特征提取、端点检测和数据压缩等方面进行了较为深入的研究,获得了一些有益的结果。具体的章节安排如下:   第一章是绪论,介绍了课题的研究背景,国内外研究概况,并对本文的参考文献进行了综述,还点出了本文研究的目的及意义。   第二章介绍了分布式语音识别的一些独特性,以及相关的关键技术,包括数据压缩,帧格式化以及传输的一些基本技术。   第三章先对语音信号的特征提取的加速问题进行简单的研究,目的是尽量减少复杂的浮点运算和非线性运算所花费的时间,接着讨论BP神经网络的基本结构和常用的训练算法,提出一种基于MFCC系数和神经网络的端点检测方法,并对BP网络进行相应的改进,提高算法的高效性和鲁棒性。   第四章主要讨论常用的数据压缩方法——矢量量化的基本原理,评价准则和一些常用方法,然后选择一种收敛速度比较快的量化算法,并对其进行一些相应的改进并进行实验,优化系统性能。   第五章是对本文进行了总结,提出本文工作的不足和对未来的工作的展望。
其他文献
随着现代医学的不断进步,超声心动图在临床诊断领域的应用越发广泛。如何针对采集到的超声心动图完成进一步处理,以增强其作为辅助诊断方式的可靠性,成为近年来国内外研究的热点
近年来,我国正处于突发公共事件高发时期,如自然灾害、事故灾难、社会安全、公共卫生等。为了积极应对突发公共事件,国务院常务会议于2005年1月26日通过了《国家突发公共事件
以多媒体、网络技术为代表的现代信息技术促进了教学的快速发展,使教学环境、学习方式发生了巨大变化。与此同时,人们对于支撑网络教学的应用程序的需求持续增长,要求也越来越高
伴随着教育信息化的发展,Web技术与e-Learning使人类学习环境发生了根本性的变革。为构建跨组织、跨系统平台的海量知识融聚共享环境,人们提出了学习对象(LearningObject)的
随着博客影响力的不断增加,博客被更多领域的人作为交互和表达思想的工具,并以站点的形式在万维网上形成了博客空间。面对博客空间的急剧膨胀,博客搜索也变得必要迫切。尽管
数据仓库是数据存储和数据管理技术,是实现基于特定分析主题的数据存储、数据汇总、数据分析和应用的复杂系统。数据仓库中存储了海量的数据,如果这些数据遭到非法访问或破坏
随着软件产业的发展,越来越多的行业领域需要专业软件的支持,软件需求也越来越领域化、专业化,随之而来的是客户需求的快速变化和软件复杂度日渐增高。然而传统的软件开发方
作为电子商务的重要组成部分,基于Internet的电子交易受到了广泛的关注。SET交易过程十分复杂,在完成一次SET协议交易过程中,需验证电子证书9次,验证数字签名6次,传递证书7次
在储存海量数据的数据仓库中,由于其潜在的数据价值随着数据挖掘技术的发展与应用而被各研究领域所关注,包括商业、军事及科研等,涉及范围广泛,随着数据仓库安全性问题也得到
面向特定主题的信息采集是垂直搜索引擎的关键技术之一,直接影响到搜索结果的速度和相关性。研究面向特定主题的信息采集,应用分步骤判断方法计算页面相似度,改进PageRank链