基于OMR技术的乐谱数字化系统的研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:xym1013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乐谱数字化是指将纸质乐谱由扫描仪输入到计算机,经过处理,把乐谱图像自动转化为计算机能“读懂”的数字音乐,即标准的数字音乐格式文件,它的原理是“记谱”,记录的不是乐谱所表达的具体的音乐内容,而是其表现形式。在计算机软、硬件强大功能的配合下,人们可以轻松地对其进行编辑、加工、打印、传播或实时演奏。利用计算机强大的处理能力和海量的存储空间,人们可以对海量的乐谱进行查询、检索和保存,并且可以利用现代模式识别技术与人工智能技术对乐谱进行分析,使计算机产生类似于人类的音乐的情感。数字化乐谱在计算机音乐、计算机辅助音乐教学、数字音乐图书馆等众多领域有着广泛的应用前景。 OMR(Optical Music Recognition)是本文中乐谱数字化系统的核心组成部分,本文的OMR系统主要包括图像预处理、谱线的定位与分割、音符的分割、音符的识别、音符数据结构的建立五个部分,在图像预处理部分,对图像的增强、降噪技术进行了研究,并采用能增加对比度的彩色图像灰度化技术。在谱线的定位与删除部分,采用了区域扩张、多次投影与游程编码等技术来删除歌词,定位谱线从而删除谱线。在音符分割部分,采用了先粗分割后细分割的办法来处理音符,获得了较好的效果。在识别音符的部分,对基于SVM的模式识别技术进行了研究,对LIBSVM(Library for SVM)在不同模型下的识别效果进行了分析,并采用LIBSVM来对音符进行识别。对谱线进行定位与分割,并在不影响音符的情况下删除谱线。最后,对乐谱的语法在乐谱识别中的应用进行了研究。针对每一种音符设计了不同的音符都设计了一个数据结构,并且对这些结构进行了改进,以提高整个乐谱数字化系统的性能。
其他文献
WCDMA是世界范围内应用最广也是最成熟的3G技术,是各个通信设备厂商的主要利润来源。从3G设备的部署角度看,基站NodeB的数量最多,也是合同中最大的部分。NodeB-Tester是我国
本文讨论了轴向压力和一致分布的径向压力作用下粘弹性柱壳的动力稳定性问题.利用Laplace变换,得到了常载作用下粘弹壳的稳定性条件.综合利用动力学的经典方法,得到了由粘弹
基于IEEE802.16e标准的移动WiMAX(WorldwideInteroperatingblityforMicrowaveAccess)技术是目前普遍关注的一种宽带无线接入技术,它选用正交频分多址接入(OFDMA)作为其物理层
双/多基地雷达具有较强的抗电子干扰、抗打击、隐蔽性好等特点,具有较好的电子战能力。由固定式岸基收发系统、机动式岸基接收系统构成的双/多基地高频地波超视距雷达系统,不
DTTB(数字电视地面传输)是现有数字电视广播方式中的一种,它的传输是通过地面无线进行的,其独具的简单接收和移动接收的能力,能够满足现代信息化社会对多媒体广播的需求。地面传
MC-CDMA技术是正交频分复用(OFDM)和码分多址接入(CDMA)结合的产物,兼具两者的优点。将其与动态资源分配结合,可以有效的利用频率资源,显著提高系统性能。本文主要研究了MC-CDMA
路由器是互联网络的枢纽,目前已经广泛应用于各行各业。与此同时,网络电话也已经占有了相当比重的市场份额。SIP协议以其灵活,简单,可扩展性成为网络IP电话最重要的协议之一
通信对抗是信息战的重要组成部分。通信情报系统作为通信对抗的电子支援措施之一,用来监视战场的电磁频谱活动,进行威胁识别,帮助选择电子干扰策略,直至截获敌方的有用军事情报。
学位
在N≥2情况下构造了一种性质良好的小波母函数,这种小波母函数N阶可导并且趋于零的阶数为O|t|-N(|t|→∞),同时具有N-2阶消失矩和某种对称性.文章还就N=4的情况给出了计算实例