论文部分内容阅读
基于电话的自动语音应答系统或说话人识别系统需要将实际的说话人语音与其他的非语音信息区分开。区分电话语音和非语音是一个有挑战性的问题。本文提出计算声音信号帧间谱熵的相似度,由此区分电话语音和非语音的方法。在对41个电话非语音信号段和包含11个说话人的914个语音信号段(段长200-700ms)的检测中,本文得到几乎100%的正确识别率。方法简单,效果好,这是本文提出方法的优点。