基于多级小波神经网络的模糊说话人识别

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:raoxinyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文从实际出发,提出了一种任意文本的说话人识别的新方法.该方法首先采用小波包分析进行语音信号的消噪处理,然后提取说话人语音信号的静态特征和动态特征,再建立多级小波神经网络进行模式识别,最后结合模糊理论进行多种特征识别信息的数据融合.实验结果表明,本文提出的方法有一定的积极效果和良好的可借鉴性.该文主要做了以下几方面的工作:◆采样语音信号,建立包括6个说话人,每个人6段语音,共36个语音文件的语音库.录制的语音库考虑了语速快慢、音量、时间间隔等影响说话人识别系统性能的主要因素.◆利用小波包变阈值分析方法进行采样信号的消噪处理,并对语音信号进行适当的滤波处理.◆提取常见的说话人语音信号特征,比如:基音周期、Mel倒谱特征参数、Mel倒谱差分动态特征参数、线性预测系数LPC以及线性预测倒谱参数LPCC等等.◆研究BP网络、RBF网络和小波神经网络算法,结合模糊数学方法,建立基于多级小波神经网络的模糊说话人识别系统.◆综合分析说话人识别的系统,改善各环节的技术参数,以提高系统的识别率和鲁棒性.◆最后给出详细的实验结果与分析报告.
其他文献
关联规则挖掘算法使用格理论中的组合特性来将原始问题分解为许多更小的互相独立的问题.最有名的和最有影响力的算法包括Apriori算法和FP-growth算法.这些算法在所有的最大频
论文以山东路政管理系统为政务背景,综合分析了其网络现状面临的威胁和风险,从系统安全和信息安全两个角度提出了山东路政内网安全机制的整体设计方案。 路政工作涉及的信息
近几年来,由于优秀的Java语言和J2EE体系结构的快速发展及成熟,越来越多的框架技术迅速出现,这些框架多处于低层应用平台(如J2EE)和高层业务逻辑之间的中间层,且大多采用MVC模式
皮影艺术由戏剧和造型两种艺术结合并发展而来,是民间传统艺术的瑰宝。然而,目前皮影戏的现状却不容乐观,特别是在“影人”的制作、皮影戏的表演、传播等很多方面存在不可避免的
本文从分析电子商务目前所面临的困境出发,提出当前电子商务发展的主要障碍是在Internet上企业间数据格式混乱,无法进行有效的信息交换的问题。然后从XML及HTML的技术比较入
当前,手机短信引起社会各界的关注.服务提供商(目前多为短信内容提供商)作为手机短信内容的主要来源,在短信增值业务价值链条中扮演着重要的角色,短信业务的繁荣特别是今后的
针对目前语音通信软件设计中的困难,该文对通信流程形式化逻辑描述方法进行了研究.根据语音通信软件中呼叫控制过程的特点,该文使用状态推导图对通信流程进行建模,并结合人工
本文针对电信业务的需求,在项目组的共同努力下,建立了一个面向IP业务的综合决策支持系统。依据决策支持系统基本原理和数据库数据仓库技术,以及微软的.NET架构,构建了包含四库系
随着Internet日益渗入社会的每个领域,融入人们的工作、学习和生活,构建安全的电子政务、电子商务等Web应用成为当前网络安全领域研究的热点之一,其实现具有重大的实用价值和
普适计算中的上下文感知为用户提供其所在环境的上下文相关信息,其中80%的信息和位置有关,因此定位问题在上下文感知中占据举足轻重的地位。普适计算中设备的许多行为都与其所在