钢琴音乐的多基频估计研究

来源 :电子科技大学 | 被引量 : 10次 | 上传用户:blueeyes
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的快速发展使音乐得以广泛传播,有效的提取、检索、组织音乐信息的方法,即音乐信息检索的研究受到了学术界和信息界的广泛关注。多基频估计是音乐信息检索领域的研究热点之一,基本任务是估计复调音乐中同时发声的多个音符,从而得到每个音符基频值、起始时间和终止时间的信息。目前的多基频估计方法还不能满足实际需求,因此对多基频估计方法的进一步研究显得尤为重要。本文以钢琴这种多声部乐器的复调音乐为研究对象。在基于非负矩阵分解的多基频估计方法的框架下,对音乐信号的时频表示、音符字典构建和谱分解算法进行了分析,研究采用基于多原子音符字典的,lp,qq范数块稀疏约束的非负矩阵分解算法,有效提高了单帧信号多基频估计的准确性;最后在非负矩阵分解的基础上研究直接在音符事件层而不是信号帧层面上的多基频估计方法。主要研究工作和创新点如下:1、对音乐信号分析中常见的多分辨率时频表示常数Q变换(CQT)进行了研究,发现虽然CQT在低频具有较高的频率分辨率,但同时也导致时间分辨率降低,首次引入变Q变换作为多基频估计音乐信号时频表示的工具,它相比CQT在相同的频率分辨率下有更好的时间分辨率,和高效的系数计算。2、研究基于单原子和多原子音符字典谱分解的方法。研究采用lp,qq范数稀疏约束的多基频估计,通过对单原子字典谱分解的实验表明p pl范数比常见的1l范数的多基频估计效果更好;针对音符在不同时刻的频谱变化非常明显,指出单原子音符字典并没有考虑到音符谱基原子动态变化的特点,然后分别从建模和学习两个角度介绍多原子音符字典的构建方法;最后在多原子音符字典基础上研究采用,lp,qq范数块稀疏约束的非负矩阵分解算法,实验结果表明,当原子个数为2时该算法对MAPS数据库音乐片段的单帧信号多基频估计的F值达到了近78%。3、基于非负矩阵分解的多基频估计方法都是对单帧信号处理,它没有提前对音符起始点进行检测,而是通过后处理检测结果得到音符起始点,这可能会出现伪起始点和在两个音符起始点之间将一个音符分成多个音符的错误。研究基于音符事件的方法,即首先对音乐信号进行音符起始点检测,然后采用基于NMF的方法对音符事件进行多基频估计,最后对音符事件中每个音符的终止点进行检测。
其他文献
武器仿真系统的建立既可以为新型武器系统的研制进行综合性能的分析、测试和验证又可以用于模拟训练,被视为信息时代提高部队作战能力和加强军队质量建设的有效途径。  
学位
互联网的快速发展给用户带来大量信息。随之而来的信息过载问题导致用户难以找到适合自己的信息,并且降低了信息查找效率。推荐系统是解决信息过载问题的有效解决工具。  协
一、福利对员工和企业的不同影响1.福利对于企业的影响福利是一种很好的吸引和保留员工的工具,有吸引力的员工福利计划既能帮助企业招聘到高素质的员工,同时能保证已经被雇佣
随着对数字无线通信领域研究的不断深化,非协作通信也越来越受到人们的关注。非协作通信是一种不干扰收发双方正常通信的情况下,实现通信系统的非授权接入。因此非协作通信系
卫星自跟踪技术在卫星通信研究中占有重要地位。相控阵自跟踪技术相比于机械扫描式跟踪技术,具有扫描速度快、抗干扰能力强、波束指向灵活等优点。而相控阵自跟踪系统信号处
阿瓦娜“AwANA”,一家2004年诞生于伦敦的现代派国际性马来西亚餐厅,当她带者浓郁的热带雨林的风情于2006年出现在北京的女人街星吧路内时,她便成为全京城第一个演绎正宗马来
随着网络技术和多媒体技术的快速发展,各种视频及视频服务(如数字电视、视频点播、视频会议和视频监控等)得到日益普及和广泛应用。数字多媒体产品具有易于传输、无损复制和
随着计算机技术、半导体技术和微电子技术的发展,在汽车仪表领域,嵌入式系统引入了网络通信、智能控制等先进技术,形成了集通信、显示、控制等功能于一体的全数字智能汽车仪
2008年6月30日上午,由法国波尔多展览委员会,蓬菜市人民政府和华夏酒报社联合举办的“2008中国国际葡萄酒·烈酒设备技术,葡萄种植博览会、国际葡萄酒·烈酒品评赛暨第二届中
智能识别技术在监控系统中得到了越来越广泛的应用。现有监控系统已经能够自动识别人的某些活动和对危险活动自动报警,但专门针对事件进行视频识别和检测的还是比较少,很多成