实时语音端点鲁棒检测

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:quanxi111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种适应复杂环境下的高效的实时语音端点检测算法,给出了每帧声信号在滤波中的噪声功率谱的推算方法。先将每帧语音的频谱进行迭代维纳滤波,再将它划分成若干个子带并计算出每个子带的频谱熵,然后把相继若干帧的子带频谱熵经过一组中值滤波器获得每帧的频谱熵,根据频谱熵的值对输入的语音进行分类。实验结果表明,该算法能够有效地区分语音和噪声,可以显著地提高语音识别系统的性能,在不同的噪声环境条件下具有鲁棒性。该算法计算代价小,简单易实现,适合实时语音识别系统的应用。
其他文献
提出了一种从遥感影像中分割出道路的新策略,其最大的创新之处在于充分考虑了道路的形状特点及沿道路方向的灰度分布特性。比较多个方向上纹理和灰度的一致性,得出一致性最优方向,此方向上的Gabor滤波响应和作为衡量一致性指标的均方差值共同构成本方法的特征矢量。从每一像素出发,沿该点的一致性最优方向绘制一条短线,用短线对应的区域代替现有空间信息FCM模型中的邻域以获取改进的分割模型。实验表明:这一建立在新的
乳腺癌是妇女最常见的疾病之一,近年来发病率有逐年上升的趋势。一般来说,乳腺癌的手术可按范围的大小分为根治术、仿根治术、扩大根治术和范围更小的手术(如肿块切除术)。乳腺癌
针对中高速传感器网络中混合业务QoS(Quality of Service)要求,跨层考虑物理层和数据链路层参数,提出了一种保证混合业务服务质量的调度算法AM-LWDF。该算法同时考虑时延优先级
利用势为5的均匀概率空间的无穷乘积在一种五元格值逻辑系统中引入了公式的真度概念,给出了真度的一些推理规则,证明了全体公式的真度值之集在[0,1]上是稠密的,给出了全体公
无菌手术在术后发生切口感染的原因并非单一,在手术期间,手术台上的无菌器械受空气中细菌的污染亦是一个不可忽视的环节。现就空气对无菌手术器械的污染问题进行分析探讨。
静脉留置针作为一种新型输液器材,具有减少血管损伤、减轻病人痛苦,已广、泛应用于临床输液治疗,深受广大儿科家长的欢迎,也为儿科护士多部位静脉输注穿刺提供技术支持。小儿输液
航空电子全双工交换式以太网(AFDX)是下一代航空数字网络的首选。AFDX的端系统可以保证数据在航电系统网络之间交换的安全性和可靠性,基于ARINC664规范的第7部分,提出了符合该
研究了基于不同颜色空间的人脸检测算法,并在此基础上针对较强光照条件下或肤色与背景色比较接近时检测算法可能会将人脸检测为背景的情况,提出了一种新的基于肤色和发色的人脸检测自适应算法。实验结果表明,即使在较强光照条件下或肤色与背景比较接近时,该算法一样能准确地检测到正面或略有倾斜的人脸。
本文主要针对我国高职院中校旅游、酒店管理专业学生就业现状进行分析,讨论影响该专业就业的主要原因,并找到相关解决措施。
提出了一种基于LBP算子和Isomap相结合的人脸图像识别算法。利用ε-LBP算子提取人脸图像纹理特征,然后用Isomap对高维的纹理特征进行数据降维,得到人脸数据的本质几何结构。最后将降维后的数据作为分类器的输入进行人脸分类识别。实验结果表明,该算法能够对人脸图像进行良好的分类识别,尤其是小样本的情况下。