论文部分内容阅读
在语音信号处理中,利用语音的某种特性将有话部分和无话部分区分出来,称为语音端点检测。准确的语音端点检测将提高信道的利用率和减少语音处理的数据量。早期的端点检测算法有基于短时能量和过零率、倒谱距离、谱熵检测等。但是这些方法难以在识别性能和处理速度方面达到平衡。随着通信和信息技术的迅速发展,在信息安全防护领域中对电话信道语音处理的应用正在不断扩展和深化,为了解决不断增长的海量语音数据,产生了大容量实时语音处理系统的需求。本课题旨在解决大规模环境下多路电话信道语音实时端点检测的难题。论文针对大容量实时语音处理系统中端点检测的设计实现展开研究,研究主要内容包括:1、针对经典双门限检测抗噪性能不强的缺点,提出EWZCD算法。改进后的算法抗噪性能有了很大提高,能够满足信噪比较高的电话信道语音检测需求。2、基于时域能零积和频域谱熵分级检测的思想,提出EZV-EGD算法。针对部分线路上语音信噪比较低的实际,引入谱熵进行分级检测,将算法在时域和频域逐级进行收敛。算法的主要思想是,用时域能零积对语音信号进行一级判决,检测出部分确定的语音和噪声;再用频域谱熵对一级处理后的疑似语音的帧进行二级判决。实验仿真结果显示,改进后的算法能在低信噪比的环境下实时准确地检测出语音信号。3、提出基于FPGA+DSP架构的硬件设计方案,重点研究了PCB设计过程中的布局布线和电源处理等难点问题,最终设计实现了语音处理硬件平台,并基于该平台将改进型端点检测算法在FPGA上实现。总之,课题目的是要完成能在电话网中大规模应用的多路电话信道语音实时端点检测系统,所以大规模实现、多路、实时和精确检测是必须解决的主要问题。实现的最终验证结果表明,EWZCD算法能够满足信噪比较高的电话链路的实时检测需求,EZV-EGD算法能对信噪比较低的电话链路进行实时精确检测。根据话路语音特征,采取对算法的灵活调用,满足了实际电话信道语音实时、多路、大规模实现和精确检测的需求。