智能分析方法在声音识别中的应用研究

来源 :华北电力大学 | 被引量 : 0次 | 上传用户:tanshuyao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据的不断发展,越来越多的多媒体数据充斥着我们的生活。声音作为多媒体数据中的重要组成部分,其中蕴含了大量的信息。通过对所收集的声音数据进行处理和分析,可以从中分析挖掘出对我们有用的信息。因此声音信号的处理和分析一直是国内外学者的研究热点,其中声音识别作为声音信号处理和分析的重要应用方向更是得到了广泛的研究。声音识别是提取待识别声音信号的声音特征并将其与样本声音特征进行匹配,从而得到待测声音和样本声音是否一致的判断。声音识别被广泛应用于说话人识别、音频资料检索、异常声音检测等众多领域。声音识别的研究关键包括预处理、特征提取、模式匹配等问题。本文主要针对特征提取和模式匹配问题展开了相关的研究。首先对声音信号进行预处理,然后对声音信号的特征提取做了广泛的研究。描述了短时能量、线性预测倒谱系数(LPCC)、梅尔倒谱系数(MFCC)的提取方法。提出了基于相关距离Fisher比的组合参数提取算法,并通过仿真实现了短时能量、线性预测倒谱系数(LPCC)、梅尔倒谱系数(MFCC)以及组合参数的提取。其次,为了提高声音识别系统的识别率,在比较了不同的智能分析方法之后采用改进的支持向量机(Support Vector Machine,SVM)作为本文的模式识别方法。因为同其他模式识别方法相比,支持向量机采用分类间隔最大的最优分类超平面来进行分类,从而实现结构风险最小化。核函数是支持向量机模型的核心机制,核函数类型以及参数的选择对支持向量机的分类准确度至关重要。本文采用遗传算法对SVM核函数的类型以及参数的选择方法进行改进,使SVM参数更加优化,从而提高声音识别的识别率。
其他文献
随着被测对象和电子设备的复杂化和多样化,并且复杂的系统测试又要求测试软件在测试过程中可以控制多台通讯设备、仪器设备,并且需要执行更加繁琐的测试操作。现代社会对测试
作为缓解能源危机和大气污染的有效措施,新能源汽车逐渐成为汽车工业的发展趋势,也是我国战略性新兴产业之一。为了缓解消费者的里程担忧,优化车辆设计和制造环节,实现路网交
分布式估计是分布式信号处理领域的一项重要分支,它通过节点间合作的方式从噪声环境中估计感兴趣的参数值。分布式估计因具有更强的灵活性,鲁棒性以及更好的能量有效性已成为
在许多实际应用中,要求阵列具有高分辨率(即:阵列方向图的主瓣较窄),而对扫描波束的增益要求不高,如:抗环境干扰卫星接收天线。阵列的高分辨率与阵列的孔径有很大关系,因此可
当今社会视频监控已经广泛应用,随着国家“平安城市”政策的实施,以后会安装更多的视频监控设备。安装视频监控设备的一个重要目的是为了确保社会平安,有效地预防和侦破违法
增程式电动汽车是一种可增加续驶里程的纯电动汽车,兼有混合动力汽车和纯电动汽车的特征,是现阶段解决纯电动汽车所面临技术问题的可行方案之一,对我国新能源汽车的发展与推
维克托·什克洛夫斯基是俄国形式主义代表人物之一,他在《作为手法的艺术》中提出了陌生化这一尤为重要的理论。根据俄国形式主义的观点,文学性是文学作品最重要的特征,文学
伴随着计算机技术的发展,人机交互的方式也不断革新,从传统的鼠标键盘到现在流行的触摸屏,再到更先进的语音控制,人机交互技术也越来越人性化。手势交互相对于传统的人机交互
胶凝砂砾石坝(Cemented Sand and Gravel Dam),简称CSG坝,是一种介于重力坝与土石坝之间的新型坝,采用坝趾开挖弃料,并掺入适量胶凝材料,经搅拌振捣碾压而成。CSG坝强调“宜材适构”的设计理念,在现如今追求环保绿色的大形势下,其安全性高、绿色环保等特性逐渐凸显出来。目前,国际上,如日本、土耳其等国早已应用于工程实践,国内正处于研发初期,应用前景明朗。随着CSG坝不断发展与
本文以笔者在韩国担任CPIK教师的教学实践为契机,以克拉申的“语言输入及情感过滤假说”、“学习动机”为理论基础,结合“视听法”、“多模态”等教学法,针对韩国顺天第一高中的课后课现状及这一特殊课型,根据崔永华先生的对外汉语教学设计理论以及前期对韩国顺天第一高中的学生进行的学习需求问卷调查做出了一个学期以及一节课的教学设计。一学期的教学设计包括了课程设计大纲、课程单元设置、课程考核内容等。一节课的教学