RBF神经网络和HMM用于音乐识别的算法研究

被引量 : 6次 | 上传用户:LJX22766966
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音乐信号处理是信号处理领域中的重要组成部分。为了能让计算机与人类能够用音乐自由的沟通,有关计算机音乐处理的研究,意义日益凸显。音乐的计算机自动识别是新兴的交叉学科,其研究涉及物理学、信号处理、人机交互、音乐理论等诸多学科知识。本文研究的音乐识别正是将计算机多媒体技术、信号处理与模式识别的相关知识和技术同音乐理论相结合,用计算机模拟人对音乐认知和分析的过程。论文首先介绍了计算机音乐的发展,并对基本乐理及音乐信号的特性进行了简单的描述。围绕音乐相关理论,论文对比了音乐信号与语音信号的特性,选取MFCC(Mel-Frequency Cepstral Coefficients)作为单音信号的特征,并对特征矢量维数的选择进行了讨论,利用RBF神经网络对钢琴88个单音进行识别,实验取得了100%的识别结果。实验结果表明所选特征对识别钢琴单音信号是有效的。其次论文研究了在西方音乐和弦识别中使用频率较高的音级轮廓(Pitch Class Profile简称PCP)特征及其计算方法,给出了具体的计算公式。论文基于HMM构建了音乐和弦识别系统,定义了36个状态,每个状态代表一类和弦;通过一个12维的多元高斯函数拟合观察向量的概率分布,该模型分别由高斯函数的均值向量和和协方差向量来定义。论文借助Chris Harte制作的标签文件训练得到有监督的HMM。识别过程通过Viterbi算法,对输入信号依照极大似然法来寻找最佳路径,即最佳的和弦序列。为了克服系统处理快节奏音乐时出现的如下问题:识别空和弦时系统常发生混淆,论文采用了得到很多学者认可的节拍同步分析算法。实验以帧为单位对三首不同音乐的和弦进行了识别,平均识别率达到76.81%。最后论文对实验过程及结果进行了细致的分析和讨论。
其他文献
民俗文化的地方性特征表现在:依自然环境被创造和强化,依托生活方式被传承和改造,依民众的认同而融合与延续。民俗文化在传承过程中不断地被强化而成为地方文化的象征,地方特
工频电压比例标准器是开展工频电压量值溯源和传递工作的关键设备,本文以串联式电压互感器为主要研究对象,研制出了1000kV串联式标准电压互感器,并对其各方面性能及其在实际
电流互感器是电力系统中用于继电保护和电测量的重要设备,其精确度和可靠性对电力系统的安全、稳定和经济运行有着重要影响。光电式电流互感器和传统的电磁式电流互感器相比
This thesis investigates a much discussed,yet often misunderstood topic:Confucius Institutes(CIs)and their influence on foreign audiences.With more than 500 CIs having opened worldwide during the last
在英国《银行家》杂志每年公布的全球1000家大银行中。保持强劲优势的各家银行集团大多依托零售银行业务提升公司收入和利润。近年来。美国排名前10位的大银行零售资产占总资
地震给我们带来的灾难是有目共睹的,尤其是遭遇超出设防烈度的罕遇地震作用。一直以来,人们都在积极努力的探索更有效的抗震措施。随着生活水平的提高,最初传统的抗震设计只
科学技术日新月异,计算机已经深入到了各行各业,为人们多元化的学习、生活、工作带来了更多的乐趣,同时也促进了我国国民经济的增长。随着计算机技术、计算机网络技术的飞速
在红外图像信息处理中,首先要对采集到的图像信号进行预处理。以SOFRADIR公司的320×240元红外探测器芯片为例,介绍基于DSP处理器和FPGA的图像预处理系统的硬件设计,以及图像
马克思世界交往理论是国际话语权发展的前提和基础。在当前国际交往中,以习近平同志为核心的党中央,在国际舞台上积极发出中国声音、讲述中国故事、传递中国价值,使我国国家整体形象认可度稳步提升、经济发展的影响力逐渐扩大、对世界的理念贡献能力逐步提高、参与国际规则制定的主动性不断增强,进一步提升了我国的国际话语权。但由于我国国家硬实力仍有上升空间、国际话语体系尚不完善、对外传播体系尚不健全,导致我国国际话语
本文从试验和数值模拟两方面对声光调Q Nd:YAG脉冲激光径向修锐树脂结合剂CBN砂轮进行研究。试验研究了单个激光脉冲烧蚀树脂CBN砂轮和脉冲激光对其修锐的情况,分析了修锐机理,