基于深度学习的多轨道音乐与吉他和弦自动生成研究

来源 :兰州理工大学 | 被引量 : 0次 | 上传用户:AJGSUN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习在音乐与计算机技术领域的广泛应用,音乐自动生成研究作为艺术与科技的结合逐渐成为研究热点,它利用神经网络学习音乐样本中的音乐特征与风格,生成符合乐理规则的新音乐。该任务可以不依赖专业音乐人,快速高效的定制音乐,生成的可以用于抖音、快手等平台短视频的背景音乐,游戏场景音效、音乐治疗等众多场景。本文针对流行音乐的两类音乐进行生成:多轨道音乐生成和吉他和弦生成,主要研究内容如下:(1)在多轨道音乐生成中,利用序列模型生成的钢琴音乐约束多轨道音乐的生成。针对现有多轨道音乐生成模型生成旋律不够悦耳、轨道间不够协和的问题,提出了一种Transformer XL-Span BERT序列条件的多轨道音乐生成模型。模型为生成对抗网络结构,由于生成的音乐有多个音轨,因此,首先以Transformer XL为生成器,Span BERT为鉴别器生成钢琴轨道音乐,其余音轨每个音轨有1个生成器,而多个音轨协同的效果由同一个鉴别器评判,所以,生成器有多个,而鉴别器有1个。首先,以钢琴轨道音乐为输入,让各音轨生成器生成各自的音乐;然后,使用共同的鉴别器进行评判,评判每个音轨所生成的音乐质量和音轨之间的协和性;最后,利用全局注意力机制对音乐特征进行关注,保证音乐的总体效果。使用音乐的客观评价指标和听众主观的评分对模型进行验证,与Transformer-GAN模型和Muse GAN多轨道顺序符号音乐进行对比,结果表明,所提模型所生成的音乐具有各音轨更协和,音乐的旋律、节奏以及连贯性更好的优点。(2)在吉他和弦生成中,利用和弦结构和曲式结构搭建网络模型。针对现有和弦自动生成网络没有考虑和弦结构与流行音乐的曲式结构问题,提出了一种双层双向Transformer吉他和弦自动生成模型。模型包括和弦走向生成与和弦结构生成两个模块。和弦走向生成模块由两层双向Transformer结构组成,分别生成主歌与副歌和弦走向,其中,用于生成主歌和弦的网络中添加了自注意力机制层,用于关注主歌与副歌连接处的和弦;和弦结构生成模块被分解为和弦着色与和弦发声两个模块,分别由多头注意力机制网络进行学习与生成。为了能够表示出所有和弦及和弦结构,使用钢琴卷帘数组的形式表示和弦数据。模型生成效果由音乐人问卷评分与作品分析两种方式进行评判,结果表明,所提模型能够学习到主副歌和弦进行与和弦结构,可应用于实际和弦编曲中。
其他文献
目前,旅游业已成为我国国民经济战略性支柱产业,尽管新冠疫情对旅游业产生较大影响,但是不可否认,旅游业在经济发展、促进就业、提高人民生活水平等方面发挥了重要作用。旅游积分服务是提升旅游服务质量、增加用户粘性、降低营销成本的一个重要手段。但是现有积分系统通常存在积分流通性差、公信力不足、维护成本高等问题。区块链是一种分布式账本数据库技术,具有不可篡改、公开透明、可溯源的技术特性,可以在产业链之间搭建分
学位
人工智能与计算机硬件技术的快速发展,推动了计算机视觉相关任务的热潮。通过单张图片重建的人体模型在人们的日常生活中得到了广泛的应用。本文综合考虑了基于单张图片的人体姿态和体型三维重建过程中存在的时间开销、重建精度等问题,利用深度学习和人体关键点检测的相关理论与技术,并结合人体参数化模型,实现对人体姿态和体型的三维重建。最后,实现了一套非接触式人体体型测量系统。本文主要研究内容如下:(1)针对现有基于
学位
随着社交媒体和短视频平台的爆炸式增长,越来越多的人们通过拍摄视频记录分享日常或者发表自己对于某些事物的观点和看法,由此产生了海量的多模态数据。多模态情感分析任务则是利用这些多模态数据中提取和整合的语义信息来识别其中所表达的情感和情绪。多模态数据一般包含三种模态的信息,分别是文本信息,音频信息,视觉信息。每个模态的信息都具有各自独立的情感特征,而不同模态的信息之间又存在着相互影响和联系,能够为最终的
学位
近年来,工业物联网(IIo T)推动各种智能应用迅速崛起,在制造业、医疗保健和智能交通系统等多个领域受到了极大的关注,并成功地融入了人们生活和工作。为了节约本地服务器的存储空间和更加便于数据共享,大量工业设备将业务中产生的实时感知数据和用户的敏感信息存储到云端,这为数据的储存和计算提供了高质量的按需服务。但在数据上传、网络访问和数据共享过程中,数据泄露事件频繁发生,隐私保护问题面临严峻考验。服务器
学位
在高光谱遥感图像的采集技术发展中,新型的高光谱传感器能够实现对光谱和空间特性连续的采集。由于高光谱图像地物特征丰富,在农业、军事和环境监测以及城市的改建规划等方面有着广阔的应用前景。降低光谱数据之间的冗余、减少数据参数量和提取高光谱图像中的空间光谱联合特征是目前高光谱图像分类研究的重要内容。近年来,深度卷积神经网络在高光谱图像分类领域成为研究的热点,但是深度卷积网络模型的构建中仍然存在对高光谱图像
学位
联邦学习可以让数据在不出本地的情况下参与模型训练,从而得到更好的模型并保护了数据和隐私安全。在《数据安全法》等旨在保护数据和隐私安全的法律法规不断出台的大背景下,联邦学习日益受到重视和广泛应用。但是联邦学习在应用过程中也容易遭到攻击,特别是后门攻击。研究联邦学习中的后门攻击方式,可以促进对于联邦学习自身安全的重视,促进联邦学习更加安全的发展。本文首先提出一种高效的正反向分裂迭代算法。本文提出的基于
学位
报纸
随着我国现代化进程的不断增速,人们的生活水平及生活质量日益提高。美丽新农村建设、乡村振兴逐渐成为我国高质量发展的关注点。为加快改善传统农村的生活现状及人居环境,近年来,钢结构装配式农房已经成为现代化城镇建设的主要技术手段。本文旨在我国钢结构装配式建筑的大发展背景之下,充分利用装配式建筑的优点及其特性,应用BIM技术完成对户型及空间布局的优化设计,实现装配式钢结构建筑体系和新型绿色围护建材产品的完美
期刊
高光谱图像是通过高光谱遥感传感器或者成像光谱仪获得的,含有二维空间信息,第三维中包含丰富的光谱信息。因此高光谱数据被广泛地应用到地质矿产业、农林业、环境保护、综合考察和食品分析等实际应用中,已成为国内外科研、经济和国防建设的高科技技术,但是高光谱图像本身存在维度高、标记样本少、波段间相关性高、光谱空间特征提取不充分等问题,给高光谱图像地识别和分类带来了很大的困难。目前,利用卷积神经网络(Convo
学位
微信、抖音、微博等社交媒体已渗透入人类生活与社交的方方面面,频繁地使用社交媒体成为现代人的常态,使得网络中的交互变得复杂与多元。网络通常呈现复杂的结构,且网络结构会随时间,或随人类社会活动而动态变化。信息化迅速发展的今天,在线社交网络中亿万规模的用户群体于信息传播活动中扮演着不可或缺的角色,且为学者们提供了海量的研究数据。社交网络作为信息传播最重要的载体,对其结构的研究便显得尤为重要。因此,本文重
学位