论文部分内容阅读
随着移动通讯技术的迅速发展,移动电话等便携设备成了语音识别的重要应用领域。对于便携设备来说,运算量和网络带宽始终是制约语音识别应用的瓶颈。分布式语音识别的特点是:在手持终端设备上仅需要执行语音检测和参数提取等计算量小的工作,复杂的识别算法交给服务器完成,有效解决了这一问题,随着计算机网络和无线移动网络的发展,分布式语音识别技术越来越得到重视。
分布式语音识别(DSR)是语音识别与分布式计算相结合的产物,虽然它总体上还是采用客户机/服务器的结构,但是这里所指的服务器不仅限于网络中的某一台特定的服务器,而是分布在网络中的许多服务器的合集,用户可以把这些服务器透明地看作一台服务器。系统中多个微处理器的集合不仅能产生比单个处理器更高的性能价格比,还能产生单个处理器所不能达到的绝对性能;分布式系统允许多个用户共享系统资源而提高了系统资源的利用率,在实现相同功能的情况下相当于降低了成本。此外,由于工作负荷被分散到多台的机器上,某一台机器出现了故障,往往可以改由其它机器完成相应功能,因此分布式系统具有更高的可靠性,同时可以在不中断系统使用的前提下更新或扩展系统功能。
分布式语音识别前端的工作主要包括预处理工作,端点检测工作,特征提取工作以及数据压缩及封装工作。本文对特征提取、端点检测和数据压缩等方面进行了较为深入的研究,获得了一些有益的结果。具体的章节安排如下:
第一章是绪论,介绍了课题的研究背景,国内外研究概况,并对本文的参考文献进行了综述,还点出了本文研究的目的及意义。
第二章介绍了分布式语音识别的一些独特性,以及相关的关键技术,包括数据压缩,帧格式化以及传输的一些基本技术。
第三章先对语音信号的特征提取的加速问题进行简单的研究,目的是尽量减少复杂的浮点运算和非线性运算所花费的时间,接着讨论BP神经网络的基本结构和常用的训练算法,提出一种基于MFCC系数和神经网络的端点检测方法,并对BP网络进行相应的改进,提高算法的高效性和鲁棒性。
第四章主要讨论常用的数据压缩方法——矢量量化的基本原理,评价准则和一些常用方法,然后选择一种收敛速度比较快的量化算法,并对其进行一些相应的改进并进行实验,优化系统性能。
第五章是对本文进行了总结,提出本文工作的不足和对未来的工作的展望。