基于深度学习的实时乐器演奏纠错系统研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:aerbinbayaer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,音乐与计算机领域二者交叉的趋势愈发兴起,而音乐教育中最重要的领域“音乐陪练”却始终进展不大,归根结底在于自动音乐转录和曲谱匹配两个子领域对于音乐的解析成果有限,难以应用于真实场景。本文分析确定了目前最主要的挑战并给出了对应的解决方案,提出了一种在实际场景中切实可行的通用实时音乐演奏纠错系统。本文的创新点为:
  1、提出了频谱片段级别转录方法。本文分析主流“帧级别”转录后逐帧拼接的方案精度难以达到实用标准的根本原因在于:单帧频谱信息不足,难以支持高精度转录。本文根据“相邻音符起始点之间的音高是平稳的,不会发生变化”这一现象,将音乐转录再次细分为音符起始点检测和和弦音符识别两个子问题,实现了频谱片段级别的识别,信息量的提升促进了精度的提高。
  2、提出了以流水线耦合的纠错系统。本文提出的实时乐器演奏纠错系统由流水线连接,拥有高内聚低耦合的特征。模块与模块之间都设置有等待队列,每个模块之间并行运作仅需要完成各自负责队列的任务。频谱段级别转录方法与流水线系统相结合,兼顾了高效性与高精度。
  3、提出了结合噪音处理的隐式马尔科夫匹配算法以定位错误。本文在隐式马尔科夫匹配算法中将难以避免的噪音因素作为建模参数,使其在定位错误的同时削弱噪音的影响。最后在匹配结束后根据泛音规则和噪音音域范围对匹配结果进行了处理,提升了系统整体精度。
其他文献
人工智能技术的再度兴起,促进了诸如增强现实、移动式机器人、无人机、自动驾驶等行业和领域的快速发展,而传统的同时定位与地图构建(Simultaneous Localization andMapping,SLAM)技术也随之有了更广阔的应用前景和更多的研究契机。自动驾驶作为一个十分热门的研究方向,对于定位和环境感知的需求十分强烈,不仅需要能够精确、鲁棒地估计车辆自身在环境中的位置和姿态,同时还要密切关注环境中有什么物体、分别处于什么状态,这样才能确保车辆能够做出安全、正确的决策。
  本学位论文针对这两
摘要:随着时代的发展和进步,我国的国际地位不断上升,中餐文化近年来已经得到了国际的认可和发展,在国际上的地位也日益提高。我国作为中式烹调的发源地,掌握着中式烹饪的内涵。在新的文化背景之下,人们对于食品的追求不再仅仅局限于味觉方面,更重要的是视觉方面的菜品的色彩和造型艺术等,这也为中式烹调的菜品带来了新的挑战和机会。为了使得中式烹调的菜品能够更加满足人们对于食物品质的追求,需要重视菜品色彩的搭配和造
期刊
互联网与物联网技术的发展改变了链接方式,服务化成为各行业的发展趋势,也成为企业业务开放的重要模式,IBM更是提出了API经济的战略,这一战略模式要求把硬件、软件、数据、人力等资源封装成Web服务,以API的方式供第三方使用,从而支撑生态体系的孵化。Web应用是一种重要的软件与数据资源,随着互联网的快速发展和普遍应用,Web应用数据和资源的数量出现了爆发式的增长。面向Web应用资源,研究智能化服务封装方法,实现以服务请求的方式执行Web数据的采集和处理任务,将会简化用户的工作量、促进产业生态的孵化。
近些年来,随着移动设备的普及和移动通讯技术的大力发展,服务的使用场景发生了巨大的变化,越来越多的服务开始以移动设备为载体。这时,移动网络质量的不稳定性、移动用户位置的变动性、以及移动设备资源的局限性等因素都给服务的高效运行带来了挑战。基于此,研究者提出了“移动服务计算”这一概念,并在服务计算研究的基础上结合对移动场景所造成的影响的分析提出了各种补充方案,从一定程度上缓解了传统服务计算技术的缺陷。
  然而变化的并非只有使用场景,随着人们对“现实世界信息化”的需求的逐渐强烈,服务的复杂性也急剧增长。在
目标检测是计算机视觉领域的热门方向之一,具有广泛的应用场景。随着移动嵌入式设备性能的不断提升,将深度学习方法应用其上的需求日益增加,因此针对移动端目标检测算法的研究不断深入。本文针对PeleeNet的缺点,提出了一种轻量级卷积神经网络模型CSCNet(Context Selective Convolution Network),并结合移动终端电表部件检测的应用场景,开发一款移动终端应用。
  在模型检测精度方面,CSCNet一方面通过全局上下文信息选择性卷积模块结合通道间依赖关系和上下文信息,增强特
随着信息的爆炸式增长,从海量数据中提取出关键信息已经成为当下研究的热点。作为信息抽取中重要的子任务,关系抽取能够帮助分类文本实体之间的关系,服务于知识图谱构建、自动问答、知识推理等多个任务上,受到学术界和工业届的广泛关注。
  传统的关系抽取方式主要基于模板或者特征工程,非常耗时耗力。随着深度学习的蓬勃发展,基于深度学习模型在大部分领域已经取得了超越传统抽取方法的良好效果,也是关系抽取目前的主流做法。但是基于深度学习的方法通常都需要构建大量均匀分布的训练数据,这样的条件在实际场中很难满足。
 
跨域图像转换的应用领域非常广泛,计算机视觉和计算机图形学中的许多问题都可以归结为跨域图像转换问题,该技术是计算机视觉领域的热点研究方向之一。目前基于卷积神经网络的深度学习方法被广泛应用于跨域图像转换中,大大提升了转换效果,但是这些方法还存在以下问题:生成图像模糊、跨域转换效果不理想、难以学习不同图像域的本质规律、转换受图像背景的影响较大等问题,本文针对上述问题展开研究,具体工作如下:
  (1)提出了基于自交叉自编码器的跨域图像转换算法:该算法将来自不同领域的图像统一处理,简化生成器结构,减少参数数
建筑立面的语义分析是计算机视觉和图形学应用中的重要问题,对于三维城市建模、场景可视化、城市场景理解等任务是必不可少的一环。窗户作为建筑立面中最为主要的组成部分,从立面中检测窗户,是立面分析任务中最为主要的组成部分之一。建筑立面窗户检测的目标是,给定一张彩色建筑立面图像,从中定位窗户的位置。窗户位置可以由其关键点、包围盒、语义像素区域等方式所描述。由于立面与窗户的多样性,本文采用更为通用、鲁棒的语义关键点来描述所检测的窗户区域。
  本文研究提出了一种基于多特征图融合以检测建筑立面窗户的方法。特征图包
摘要:危险化学品仓库多存有易燃、易爆、有毒物品,一旦发生火灾将会造成重大的财产损失,甚至人员伤亡。危险化学品火灾事故让人触目惊心,为尽量避免此类事故,本文将详细分析危险化学品火灾事故的特点,并且提出几点预防危险化学品事故的策略,希望能够实现预防要为主,将隐患消灭于萌芽中的目标。  关键词:危险化学品火灾;特点;预防  危险化学品是指化学品中符合有关危险化学品标准规定的化学品。依据国标“《常用危险化
期刊
随着城市的发展,堵车已经成为城市生活中日益严重的一个问题,从过去的交通广播,到接受实时路况信息的电子地图,再到对交通情况进行持续检测并及时告警的智慧交通系统,人们应对堵车的方式也越来越先进,但是这些系统仍然无法对于交通堵塞区域的形成与交通流量的发展变化给出足够的预测与预警,以供交通管理部门提前预防交通堵塞的形成。交通流量预测是解决该问题的有效方法,准确的交通流量预测可以帮助交通参与者提前规避拥堵,节约时间与驾车成本,降低道路拥堵发生的机率与严重程度。
  首先,本文利用采集获得的杭州市出租车轨迹数据