采用遗传算法的码本设计及说话人识别

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:birdobird
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术作为生物认证技术的一种,是根据语音波形中反映说话人生理和行为特征的语音参数自动鉴别说话人身份的一项技术。说话人识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式。因此,研究一种识别率高、鲁棒性强的说话人识别方法是国内外众多研究者努力的目标。本文的说话人识别系统,采用了矢量量化和遗传算法相结合的方法,利用美尔倒谱系数及其扩展参数,选用欧式距离进行识别。在特征提取中常用ΔMFCC来分析各维参数的变化量,用ΔΔMFCC来表达各维参数变化的加速度,论文引入一阶美尔倒谱系数的平方和及其差分,表示多维倒谱参数在某一帧的总的变化量,按照这个思路,又添加了2维新的特征参数,一个是二阶美尔倒谱系数的平方和,一个是平方和的差分。通过实验证实,引入的新的特征参数对识别率有所提高。采用矢量量化与遗传算法相结合的方法,避免了经典的LBG算法极易陷入局部最优解的可能性,弥补了初始码本的选择对码本结果的影响的缺陷。为了防止遗传算法也陷入局部最优解的可能,采取加大迭代代数、使用了选择部分最优个体,尝试用判断群体中个体的相似度来改变变异率的方法,从一定程度上防止了所得的结果是局部最优解。通过实验可以得知,采用遗传算法后,相比采用LBG算法,识别效果有所提高。而且,随着训练语音长度的增加,识别效果越好。通过实验发现,识别效果并不是一直随着码本中心个数的增加而增加,而是达到一定数目之后,识别效果开始变差。
其他文献
随着便携式计算机的普及和移动通信技术的发展,AdHoc网络应运而生。AdHoc网络是一种不依赖于固定基础设施、自组织的无线网络,节点之间通过多跳转发机制进行数据交换。该网络具
随着网络技术的迅速发展,网络规模不断扩大,复杂性不断增加,异构性不断增加,网络业务多样化和业务数量剧增,网络动态变化,这使得网络管理面临着巨大的挑战,人们对网络管理提出了新的
随着英特网的爆炸性增长,网络系统必须在满足不断增长的网络链接速度的同时,能够灵活的应对网络的不断演化。对速度和灵活性的双重需求催生了新一代的网络硬件——网络处理器
流媒体技术作为一种新的网络媒体传输方式,很好的解决了视频数据在互联网上的传输问题,并越来越广泛地应用到视频点播系统中。流媒体视频点播技术的出现,在某种意义上说是视
在面向服务的系统架构中,单个web服务的有限功能已无法满足用户日益复杂的业务功能需求,从而催生了组合已有的简单服务来构建满足用户复杂需求的增值服务的方式,即服务组合。
长期以来,人们一直希望运输工具和机器自身能实现自主导航。从早期的科幻小说到2003年6月奔赴火星的“勇气号”,再到近来兴起的智能化高速交通系统,自主移动智能机器人系统已成
模糊现象是客观世界普遍存在的现象,也是经典数学难以用数学模型描述的问题。从上世纪60年代由Zadeh创始而被发展起来的模糊集理论,标志着数学研究对象由精确性量性对象到模糊
随着计算机及Internet的发展,远程教育越来越受到人们的青睐。作为远程教育平台中不可缺少的组成部分,答疑系统对提高教学质量起着至关重要的作用。智能答疑系统是当前自然语言
随着着高校信息化建设的快速发展,跨部门应用集成与独立异构系统之间的矛盾日益突出,建立一个能够集成现有异构应用系统且灵活兼容新系统的数字化校园服务集成平台的需求越来
多智能体系统(Multi-Agent System,MAS)体系结构及协作机制是多智能体理论研究的核心与热点问题,作为一种新兴的研究方法,基于协进化机制的多智能体协作具有广阔的研究前景。论