说话人识别系统的研究

被引量 : 0次 | 上传用户:guoxxjie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是指通过说话人的语音来自动识别说话人的身份,它在许多领域内有良好的应用前景。本文通过分析语音特征参数的特点和说话人识别的基本方法,提出了以美尔倒谱差分和线性预测差分为特征,通过动态时间归整算法来识别的文本相关说话人辨认系统。 本文从语音信号的预处理开始分析,对语音信号进行了端点检测,滤除了语音信号的无声段,为语音特征参数的提取提供了有用的语音段。文中还比较了双门限语音端点检测方法与能频值端点检测算法的性能,实验证实能频值端点检测算法能很好的区分含噪语音端点。 本文应用全极点模型,提取语音信号的线性预测系数,并推导出其倒谱系数,获得线性预测倒谱差分,用以描述说话人声道的动态变化。利用听觉频率非线性特性的美尔倒谱作为语音识别的特征参数,来辨识说话人提供的输入口令。 本文通过MATLAB语音处理工具箱,提取输入语音的特征参数,采用动态时间归整算法来匹配参考模板和测试模板,获得了很高的识别率。本文考虑到系统的安全性,采用美尔倒谱系数识别密码,线性预测倒谱差分识别说话人声道动态变化的双重判决方法,为系统应用在高度机密场合提供了可能,具有运算速度快,模板更新容易,计算量小,差错率低等优点。 为了比较各种识别算法,本文还开发了文本无关说话人识别系统,以美尔倒谱及其差分为特征,建立高斯混合说话人模型,取得了较高的识别率,可应用在识别率要求不是太高的场合。
其他文献
国内多数啤酒生产厂家使用回收瓶,由于回收瓶的污垢成份较为复杂,因此给清洗工作带来了一定困难.本文着重探讨了清洗回收瓶的重要工艺控制点及提高清洗质量的措施.
本课题任务是进行一个超声仪的控制系统的研究,主要实现以下技术指标:①输出占空比(0~100%)和频率(0.1~10Hz)可调的PWM信号;②产生可控定时的开关量信号;③检测信号源的频率值(20K~10
党性党风建设历来是我党高度重视的一个问题。高校领导干部亦不例外。目前 ,高校基层党员干部普遍存在政治理论水平不高 ,道德修养变形 ,党的意识淡薄等现象。要想提高高校基
风险投资被广泛认为是高科技企业成长的孵化器,而高科技领域的角逐已经成为国家之间经济实力较量的焦点,因此,大力发展风险投资已经成为我国经济发展和结构优化的必然要求。从19
从20世纪七八十年代开始,西方现代商业银行形成了一股开发新业务的浪潮,作为金融创新重要组成部分的表外业务空前活跃,绝大多数商业银行都把表外业务的发展作为主要的经营取向。
柔性作业车间调度问题是经典作业车间调度问题的扩展,它允许工序在多台机器中的任意一台上加工。针对柔性作业车间调度问题的特点,提出一种扩展的基于工序的编码及其主动调度
如何确定物流业务的多元化程度以及具体业务的经营范围,使企业平稳良性发展,是目前中国物流企业转型升级亟待解决的关键问题之一。基于2003-2012年中国上市物流企业财务数据
采用Kriging和径向基函数等2种GIS空间插值方法对梁子湖的水质污染现状进行分析研究,结果表明,梁子湖的大片水域水质都处于Ⅱ类和Ⅲ类,在湖泊的中部以及宁港附近的水域起水质可
该文通过对《关雎》一诗的分析,认为诗的第三章不是写"君子"既得"淑女"或在想象中得到,而是写"君子"在苦苦相思以后终于想出了追求到"淑女"的方法。
研究背景 结肠癌是人体常见的恶性肿瘤,致死率高、发病率呈增加趋势,对人类健康危害极大。癌细胞的恶性侵袭和淋巴转移是癌症致死的主要原因。研究表明在癌症发生、淋巴转移过