音频信号分类算法研究

被引量 : 0次 | 上传用户:moovent_chrisx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术和网络技术的发展,人们日常生活中接触到的多媒体信息越来越多。如何有效的对这些海量的数据尤其是如音频之类的多媒体数据进行分析、存储和分类是一个亟待解决的问题。音频分类作为当前音频分析研究领域的一个热点,在音频检索领域有着广泛的应用。音频分类技术研究集中在两个方面,一个是表征音频内容的特征信息的提取,另一个是分类器的实现。本文在现有音频特征提取和音频分类技术基础上,研究了音频特征的分析和抽取,设计了基于GMM和HMM的音频分类系统,实现了对静音、纯语音、音乐和带背景的语音四类音频信号的分类。本文的主要工作和研究成果包括以下内容:(1)音频分类以提取的音频特征为基础,音频特征的选取要能充分体现出音频的重要的分类特征。音频特征分析和提取是音频分类问题的基础和关键所在。本文在分析音频信号的时域、频域和声学特征的基础上,提取了音频的帧特征和段特征,包括短时平均能量、过零率、频谱质心、带宽、子带能量比、Mel频率倒谱系数和基音等特征。(2)基于内容的音频分类器的难点是如何构造分类器,建立音频的低级声学特征和高级类别特征之间的映射关系。本文在分析现有的典型分类算法的基础上,分别提出了基于高斯混合模型和隐马尔可夫模型的分类器,实现了对静音、纯语音、音乐和带背景的语音四类音频信号的分类。(3)实验表明,本文提出的特征有效,分类器的性能良好。
其他文献
文章通过对两汉政府经营开发西域的研究,对这一时期两汉中央政府的政策、汉通西域前后西域经济构成、地理环境与西域各国的社会经济关系、西域社会经济的特点、西域社会经济
旅游业的快速发展,一方面给旅游地社会经济带来巨大的发展契机,另一方面也给当地的自然环境和社会文化环境的破坏带来隐患。不少地方旅游业的发展不仅加剧了当地环境资源和地
让·鲍德里亚(Jean Baudrillyard 1929-2007),法国著名的哲学家、社会学家、后现代理论家。其一生著述颇丰,有许多思想和观点影响深远。1976年出版的《象征交换与死亡》是鲍
作为王尔德唯一的长篇小说,《道林?格雷的画像》是19世纪末英国唯美主义文学的经典代表作。“为艺术而艺术”的唯美主义思想在这部小说中得到了充分的体现。自出版起它便遭到
公交车扒窃作为盗窃的一种特殊的形态,具有显著的特点,笔者作为一名在公交车反扒战线战斗多年的公安民警对如何预防此类犯罪进行研究,首先通过对公交车扒窃犯罪现状的相关工
本课题是黑龙江省自然科学基金资助项目:再生混凝土力学性能及其显微结构试验研究(项目批准号:D0314)的重要子课题之一。本文在国内外关于再生混凝土收缩徐变性能最新研究进
现今,随着世界范围内经济全球化、世界一体化的进程不断加深,越来越多的企业走出国门参与市场竞争,因此企业不可避免的就要面临文化差异问题。文化对绩效管理的影响是企业需
随着爆破拆除技术在深基坑支撑拆除中的逐步应用,爆破振动对周围建筑物以及基坑内半成品和围护结构构成的危害也越来越受到关注。过去,我们以质点振速作为评价爆破地震波对建
在太阳能路灯控制系统中,引入最大功率跟踪技术(简称为MPPT),不仅降低了成本,还提高了太阳能路灯的可靠性。太阳能路灯的控制系统采用C8051F330D作为核心器件。其主电路为Buc
迁移在教育中是不可避免的。以语言学习中的迁移理论为基础,本篇论文集中讨论了外语教学中母语的正迁移。为了说明外语与母语的关系,本文主要讨论了以下三个问题。1)母语与外