基于深度学习的端到端乐谱音符识别

来源 :天津大学学报(自然科学与工程技术版) | 被引量 : 0次 | 上传用户:youtubo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光学乐谱识别是音乐信息检索中一项重要技术,音符识别是乐谱识别及其关键的部分.针对目前乐谱图像音符识别精度低、步骤冗杂等问题,设计了基于深度学习的端到端音符识别模型.该模型利用深度卷积神经网络,以整张乐谱图像为输入,直接输出音符的时值和音高.在数据预处理上,通过解析Music XML文件获得模型训练所需的乐谱图像和对应的标签数据,标签数据是由音符音高、音符时值和音符坐标组成的向量,因此模型通过训练来学习标签向量将音符识别任务转化为检测、分类任务.之后添加噪声、随机裁剪等数据增强方法来增加数据的多样性,
其他文献
视觉识别系统是企业形象设计中重要组成部分之一,也是企业传播经营理念、建立知名度、塑造形象、加强凝聚力的快速手段,因此研究、借鉴企业形象识别系统建立的方法与成功经验
结合武汉地铁2号线盾构掘进沉降监测统计及变形特点,分析武汉地区地铁盾构下穿对铁路设备设施的影响和可能产生的风险,结合铁路设备设施相应维修规则,合理制定盾构下穿施工铁
肺结核大咯血的原因,主要是结核空洞在扩大的过程中损坏周围的血管,或空洞壁上的小血管瘤空洞里的血管梁破裂,引起大咯血。其次,硬结钙化的结核病灶,通过其机械刺激作用,损坏血管引
随着深度卷积神经网络的快速发展,基于深度学习的目标检测方法由于具有良好的特征表达能力及优良的检测精度,成为当前目标检测算法的主流.为了解决目标检测中小目标漏检问题,往往使用多尺度处理方法.现有的多尺度目标检测方法可以分为基于图像金字塔的方法和基于特征金字塔的方法.相比于基于图像金字塔的方法,基于特征金字塔的方法速度更快,更能充分利用不同卷积层的特征信息.现有的基于特征金字塔的方法采用对应元素相加的
目的探讨早孕妇女应用异丙酚芬太尼行无痛人工流产术的效果。方法将选择自愿行人工流产的早孕妇女350例随机分为2组:治疗组行无痛人流150例和对照组200例,观察术中扩宫、镇痛
课程内容的教学衔接优化是影响"概论"课程教学实效性的重要因素。由于"概论"2018版教材编印时间紧、任务重,难免存在部分内容前后衔接不尽科学、个别知识体系逻辑不甚严密和
高速铁路联调联试是新建高速铁路开通前动态验收的关键环节,采用综合检测列车对高速铁路各系统的功能、性能和系统间匹配关系进行综合测试、调试和优化,是一项过程复杂、需要
既有铁路枢纽站区牵引供电方式复杂,运输生产繁忙,供电设备天窗修组织困难;在发生故障时,波及影响范围大,不利于应急处置,需要进行优化改造。以武汉、襄阳枢纽为例,针对既有
铁路领域重要信息系统安全保障工程是铁路领域有史以来最大的网络安全建设工程,建设范围包括铁路综合信息网、列车调度指挥专网、客票专网、旅服网和资金专网等5个网络系统,
为了优选槲寄生中总黄酮的最佳提取工艺,采用超声波提取法和回流提取法进行对比,以槲寄生总黄酮含量为考察指标,紫外分光光度法测定槲寄生中总黄酮的含量。通过单因素实验考