说话人识别技术的研究与改进

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:dotnetgroup
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是语音信号处理中一个重要的研究内容,是根据包含在说话人语音中表征说话人特征的参数来识别说话人的过程。随着语音处理和相关技术的进步与发展,说话人识别开始广泛地应用于金融、商务、公安司法及安防系统等领域,说话人识别技术越来越受到重视,具有广阔的研究和应用价值。  在安静环境下,说话人识别的效果都较好,但是在实际的低信噪比环境下,系统的识别率下降,对此进行了研究实践。主要工作如下:  1.首先阐述了说话人识别的原理及分类,分析了说话人识别技术的研究历史、现状以及今后研究方向。  2.主要研究了语音信号的端点检测,详细讨论了几种检测方法,通过在不同信噪比下的实验结果表明:基于子带能量的方法在低信噪比下具有良好的端点检测能力。  3.对于不同的说话人识别系统,详细讨论了基于ANN、DTW以及GMM的识别算法,对比研究了ANN和DTW的识别性能。对于GMM系统,改进了端点检测的方法,取得了较好的识别效果。  4.研究了说话人识别的改进方法,说话人语音特征参数的提取、新理论的应用以及语音增强。
其他文献
该文引入ID3算法做分类预测工作,许多研究表明决策树分类法是一种有效的、准确率高的、并且鲁棒性好的方法.但ID3算法存在不能处理海量数据及连续型数据的缺陷.鉴于此,该文提
该论文对OCDMA技术在光接入网中的应用以及OCDMA网络的节点结构进行了较为深入的探讨,完成了OCDMA网络节点中部分结构的研制.该文的创新工作在于:1.提出了一种基于OCDMA技术
在地球物理与信息技术领域,将科学计算中产生的大量非直观的、抽象的或者不可见的数据,以图形图像的形式,直观、形象地表达出来,除了可为工程设计提供方便好用的模型资料,而且可为
在国家自然科学基金项目(基金号:60132030)资助下,该文对IP QoS和接纳控制算法进行了相关研究.文中讨论了QoS标准业务模型以及实施QoS操作的具体机制,分析了它们的原理和作用
该文的工作以北大数据库实验室开发的CoDB DBMS为基础.CoDB以国家"八五"、"九五"科技攻关支持并获电子工业部科技进步特等奖的COBASE数据库管理系统为技术基础,采用了当前先
该论文的主要目的是讨论蜂窝系统的越区切换对移动通信服务质量的影响,通过对当前的研究成果进行比较,提出了一种基于测量的资源预留算法和相应的接入控制技术.第三代移动通
随着社会经济的快速发展,对无线定位服务精度的要求越来越高。在室内环境下,由于存在着菲视距的影响以及大量的多径干扰,导致室内定位精度大大降低。而超宽带脉冲信号(IR-UWB
本文通过对荣华二采区10
期刊
说话人识别又称声纹识别,是指根据说话人的声音特征来识别说话人的技术。近年来,声纹识别技术以其独特的方便性、经济性和准确性等优势受到瞩目。本文研究的是与文本无关的说
多媒体同步是多媒体播放时的一个重要问题,直接关系到用户对播放效果的满意度。在传统的 IP网络中,需要 OSI参考模型各层的支持才能实现,需要针对不同的应用环境/条件,采取不