基于时频分布与MFCC的说话人识别

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:Sampan_nb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对MFCC不能得到高效的说话人识别性能的问题,提出了将时频特征与MFCC相结合的说话人特征提取方法。首先得到语音信号的时频分布,然后将时频域转换到频域再提取MFCC+MFCC作为特征参数,最后通过支持向量机来进行说话人识别研究。仿真实验比较了MFCC、MFCC+MFCC分别作为特征参数时语音信号与各种时频分布的识别性能,结果表明基于CWD分布的MFCC和MFCC的识别率可提高到95.7%。
其他文献
主要针对虚拟广告系统设计了简单而有效的算法来实现体育视频中场地检测,首先通过基于颜色空间直方图统计的方法实现了场地主区域的自动提取,再通过Top-Hat变换和改进的最大类间方差法实现了场地边缘检测,最后通过Hough直线检测和最小二乘拟合相结合的方法精确检测到所有的场地线。大量的实验表明,本文提出的场地检测方法对于羽毛球场地,网球场地,乒乓球场地等都有很好的检测效果,提取结果可用于摄像机定标和比赛
设计并实现了一种基于母体腹部表皮电极的胎儿心电提取系统。系统由硬件采集电路和分析软件两部分组成。硬件模块包含8路心电放大器(可扩展)、模拟滤波器和A/D转换电路;软件模块
医疗行业信息化和人民的医疗保健水平息息相关,目前国内医疗行业信息化现状却不容乐观,主要问题集中在就诊者的医疗信息无法互通、医疗资源无法共享、行业内系统异构情况严重、
在基于视觉图像的人体运动目标智能监控中,为了实现快速实时跟踪,使目标跟踪更为准确,利用Kalman方程的递推预估计能力,采用基于Kalman预测的目标跟踪方法,进行二维空间的运动仿真研究和室内环境下的实验测试分析。理论分析与实验结果都表明,该方法对目标的运动趋势和方向能够做出正确的预测估计,有效地提高目标跟踪的实时性,为后续的图像处理和分析提供了保证。
随着个人计算机和互联网的普及以及电器产业的迅猛发展,越来越多的消费者表达了对智能家居的渴望.然而由于缺乏统一的标准和市场规范,智能家居产业步履维艰.着重研究了以模块化的
结合测试系统理论和虚拟仪器技术的研究,提出了以PXI检测设备为核心的LabVIEW8.5的专用综合测试系统。系统以LabVIEW为软件开发平台,用图形化程序语言设计了系统对电子设备测
研究生调剂是研究生招生中的重要环节。传统的调剂方法都是通过手工操作的,考生很难从往年大量的调剂数据中分析出规律,选报合适的学校。提出了基于半监督学习的数据挖掘方法
K均值算法是最通用的划分聚类算法,然而它有高度依赖初始值和收敛于局部最小的缺点,K调和均值算法采用数据点与所有聚类中心的距离的调和平均替代了数据点与聚类中心的最小距
提出了一种新的视频语义分析算法,着重对情感内容识别进行了研究。算法考虑了人的认知行为具有模糊性和不确定性的特点,融合了未确知数学理论,建立了视频低层特征和情感类型之间的关系模型。视频低层情感特征提取部分,详细介绍了特征选取的依据和具体方法。视频情感类型判定部分,描述了未确知情感测度矩阵的构建和情感类型判定方法。实验结果表明,该算法是有效的、可行的。
VLIwDSP通过软件流水获得时间并行性,通过指令分簇获得空间并行性.指令的分簇本质上是资源分配问题.传统的指令分簇假设一条指令分到某一簇执行,而某些体系结构提供SIMD指令,传统