基于钢琴音符事件段的多基频估计研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:sherry77677
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络和多媒体技术的发展,音乐信息检索在计算机科学领域中已成为国内外学术界和工业界一个热门研究方向,其中的音符起点检测和多基频估计都是重要的研究课题,也是基于内容的音乐信息检索中其他研究方向的基础,对于进一步的音乐结构分析、音乐检索、音乐风格分类、翻唱识别等方面具有非常重要的意义。本文的研究对象主要是WAV格式的钢琴音乐,由于钢琴演奏中每一次弹奏琴键都可以看作一次音符事件,因此本文主要包括两个子任务:音符事件检测和音符事件段的多基频估计。钢琴音乐信号通过音符事件检测后被划分为多个音符事件段,再经过音符事件段的多基频估计提取每个音符事件段的音符数量及其基频值。主要研究内容和创新点如下:(1)针对本文研究的音符起点检测和多基频估计的方法,目前大多数方法在信号分析中常使用短时傅里叶变换或常数Q变换作为时频表示,但是短时傅里叶变换由于窗口长度固定导致频率分辨率问题,常数Q变换虽然在低频具有较高的频率分辨率,但其时间分辨率也随之降低。本文使用的变Q变换在低频不但具有较高的频率分辨率,而且还具有较好的时间分辨率,使得音乐信号经过变Q变换后具有更为准确的频谱特征。(2)研究音符起点检测算法。对以往常用的几种音符起点检测方法进行分析,发现它们几乎都没考虑过那些比较柔和的音符起音,从而导致出现大量的漏检。本文采用对每帧频谱进行功率缩放,不仅增强音乐信号中较弱的起音而且抑制较强的起音,同时采用频带分割加权,增强检测方法的鲁棒性;进一步通过加窗求差处理,增加正确检测到的音符起音和减少误检,从而提升整体的检测性能,其F度量的平均值达到96.65%。(3)针对音符事件段研究基于非负矩阵分解的多基频估计算法。本文提出的多基频估计算法是基于音符事件段进行分解估计的,提前考虑了钢琴弹奏过程中音符的打击瞬间、音高值和结束瞬间,避免出现伪弹奏的错误;又考虑到音乐信号的连续性和音符的时变性,将音符随时间的变化过程划分为瞬态阶段和稳态阶段,分别从音符的瞬态阶段和稳态阶段构建相应的音符特征字典;同时从代价函数和稀疏约束两个方面分析基于非负矩阵分解的方法,并对待测音符事件段的瞬态阶段和稳态阶段应用基于lp,qq范数组稀疏约束的非负矩阵分解算法,其F度量达到85.22%。
其他文献
行为识别是计算机视觉领域中一项广受关注且极具挑战的重要任务。其中,基于人体姿态序列的行为识别在近年来引起了广泛关注。与图像信息相比,人体姿态序列非常稀疏,其保留了场景中人物运动最主要的全局运动信息,剔除了图像中人物外形信息和与人体运动无关的背景信息,这使得基于人体姿态序列的行为识别方法的神经网络模型较为轻量,且占用较低的计算机运算资源。同时,因为人体姿态序列信息在一定程度上是一种脱敏的信息,不会涉
神经元个体的动作电位及它们之间的相关性编码大量的神经信息,对神经元不同放电簇模式的动力学研究有助于理解神经信息的编码.本文使用了鸭解理论的思想,结合理论分析与数值模拟对三类神经元模型的簇放电机理给出合理的动力学阐述.首先解释单峰发放的产生机理,而后证明鸭解引起的混合模式振荡以及它和簇与峰相互转迁之间的关联.主要工作如下:第一章为绪论部分.简述本文的研究背景、研究理论和方法.介绍鸭解和神经元放电节律
随着电力电子技术及功率开关器件的快速发展,电阻点焊逆变电源的电路可靠性等基础技术趋于成熟。与此同时,欧盟出台了IEC-62135-2标准,对电阻焊设备的电磁兼容性提出了新的要求,因此电阻点焊逆变电源的功率因数校正技术逐渐受到国内外学术界和工业界的关注。自2009年起中国逐步依据IEC-62135-2标准,出台了GB31251.2-2014电阻焊设备第2部分:电磁兼容性要求标准,进一步规范电阻焊设备
动力总成悬置系统由动力总成与其同车身或副车架的连接元件共同组成,是影响一辆汽车NVH(Noise,vibration and harshness)性能的重要系统之一。对动力总成悬置系统进行优化设计,是衰减动力源向车内传递振动与噪声的一种行之有效的手段。常见的动力总成悬置系统分析方法一般建立于确定性模型之上,即视所有系统参数均为确定值。然而,由于悬置在生产与使用过程中不可避免地发生材料退化,且在制造
随着计算机技术的发展,医疗行业开始使用计算机辅助诊断技术,许多简单的病症可以通过计算机进行辅助诊断。其中皮肤病的早期检测主要依赖于皮肤镜图像的分析,因此,中大型医疗机构对早期皮肤病的智能化识别需求日益增加。然而,皮肤病图像受采集环境、病人肤色、病症阶段等影响,同类型皮肤病也会存在较大的差异,导致分类准确率较低。而且目前对皮损分类的研究主要依赖神经网络进行特征提取,难以准确提取到特定的对分类有重要贡
在本文中,我们主要证明了在有界且带有周期边界的区域内的三维可压缩MHD方程组的弱解的能量守恒.分析是基于可压缩Navier-Stokes方程的弱解的能量守恒中的方法.然而相比较Navier-Stokes方程,MHD方程组中由于多了磁场这一项的作用,从而使问题变得更加复杂.故在本文中我们主要聚焦在对磁场项的处理.值得指出的是尽管出现了磁场这一项,但是在定理的结果中为了使弱解的能量等式成立,我们仅仅通
学位
作为一个软硬件结合的智能自动化系统,智能驾驶技术的推广应用仍然存在诸多难题等待解决,而其中的自动代客泊车技术,则具有更可靠的实际应用价值和技术借鉴意义。作为自动泊车的关键技术,传感器融合目标检测技术,目前仍存在检测系统欠实时性和输出周期波动的问题;路径规划技术,仅考虑距离最优或时间最优,未考虑车辆操纵难易问题。本课题来源于实习项目,自主引导泊车项目,作者主要负责多传感器融合目标检测模块及区域导航规
在全球范围内,疲劳驾驶已经成为导致交通安全事故的重要原因之一。对疲劳驾驶进行有效监测有助于改善交通安全状况。驾驶疲劳的本质是驾驶员长时间连续驾驶而产生的心理和生理机能失调,可通过生理指标进行监测。在众多生理指标中,脑电信号作为中枢神经信号,是人脑机能的宏观反应,能客观有效反映驾驶员精神状态。因此,本文基于脑电信号进行可穿戴疲劳驾驶监测系统的研究。据调研,目前基于脑电信号的疲劳驾驶检测相关研究存在以
学位