双轴LSTM神经网络与混沌理论在音乐生成系统中的研究与应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:bill119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来现代科学技术的飞速发展,人工智能相关的技术与应用受到越来越多的关注。算法作曲或者自动音乐生成系统作为人工智能的一个重要研究领域,目前已经取得了诸多研究成果。其中,基于人工神经网络的音乐建模方式由于具有较大的灵活性与扩展性,得到了广泛的应用。本文针对现有的人工神经网络模型无法保持对于训练数据集的移调不变性的情况,提出了一种双轴LSTM神经网络结构,同时引入混沌理论作为音乐创作过程中的灵感部分,设计了一种混合音乐生成系统,并通过实验说明了系统的可行性与实用性。本文主要包括以下内容:第一,提出了一种用于训练多声部的音乐数据集的双轴LSTM神经网络的设计结构,模型在生成多声部音乐结果的同时,也可以为单音模式提供有效的和弦进行。在网络结构设计上借鉴了卷积神经网络在图像处理中保持多个方向上不变性的结构,使得双轴LSTM神经网络能够同时保持多声部训练数据在时间以及移调方面的不变性质。通过实验对比了多种神经网络模型在音符序列的预测上的准确率,说明了双轴LSTM神经网络在训练数据在未进行调性统一预处理情形下的优势。同时,使用该模型生成了具有丰富音乐结构特征的多声部音乐段落。第二,提出了一种基于混沌理论的旋律合成算法。该算法将混沌动力学系统的解分别映射至预定义音阶中音符的音高与时值之上,经过归一化和量化过程,生成具有混沌特性的旋律。随后通过实验分别对比了连续系统与离散系统模型下的生成结果,从主观与客观方面对结果进行评价,对实验数据进行分析得出混沌吸引子的动力学特征参数对生成的旋律结果的影响。此外,该结果作为LSTM网络的数据集的来源之一进行训练。第三,设计了一种可控的音乐生成系统。该系统将混沌模块与LSTM神经网络模块进行了融合。LSTM模块具有单音和复音两种模式,复音模式用于训练和生成多声部复调音乐与和弦进行数据,后者的结果将提供给单音模式作为保持音符不变性的条件之一。在单音模式下,LSTM模块接受来自混沌模块生成的具有混沌特性的旋律集合,同时也接受用户输入的单音旋律训练集。然后,计算系统输出旋律的欧拉旋律度,同时反馈至输入端,与用户设置的参考旋律度数值进行比较,将偏差值进行放大并输入到混沌模块之中,对混沌系统参数进行调整。此外,通过调整两种训练集的比例,也可以对旋律结果的特征进行改变。最后,通过实验结果对系统的性能进行评价,说明了提出的模型以及算法的有效性。
其他文献
<正>质子交换膜燃料电池(PEMFC)汽车被认为是替代常规化石燃料汽车的理想解决方案之一。目前主要使用高压钢瓶为其供H2,但此法储存量少、危险系数高、添加燃料麻烦。使用微反
<正>子宫原始神经外胚叶肿瘤(PNET)是小圆细胞恶性肿瘤,分化程度差,恶性程度高,病情进展快,放化疗治疗效果差,是一种极其罕见的肿瘤。依其生长部位的不同,可分为中央型原始神经
中国古代歌颂真挚情谊的诗篇,在内容上可以分为三类:一是抒发挚友之间互相眷恋的无限深情;二是抒发挚友之间依依惜别的深情;三是抒发对挚友的慰勉和赞美之情。中国古代这些歌颂真
痛经是女性经常遇到的问题,严重者影响日常的工作生活和学习,因此痛经的诊治对改善女性个体健康,提高女性生活质量有重要意义。针对现代医学在治疗痛经过程中的一些不足,有必
虽然经过多年的发展,但作为新兴力量,我国心理咨询师队伍还存在许多问题,比如数量不足、覆盖率低、专业水平欠缺、保障机制尚未健全等。对此,笔者提出了较为完善的方法,包括
目的探讨老年结直肠癌(CRC)患者的术后监护。方法针对42例老年CRC患者的临床资料,寻找有效的术后ICU监护方法,预防并发症的发生。结果经过对42例老年CRC患者术后ICU全面细致
成本会计由于计算量大,一直被会计学专业学生认为是最难学的课程之一,但只要掌握这门课程的精髓,把握好各章节之间的关系,相信学习起来会非常轻松。本文用图表的形式介绍了学
CO催化氧化的研究具有重要的学术和实际应用价值。在该催化反应过程中,起主要作用的为催化剂载体和催化剂表面的金属氧化物。研究认为,二者(载体和金属氧化物)的协同作用共同
大数据环境和"互联网+"理念促进了社会信息服务机构在服务方式、服务理念、服务内容上的发展。图书馆作为信息服务机构,可通过树立基于大数据的信息服务理念、构建联合信息服
数据科学正在改变着人们的生活。从百度搜索推荐到今天网上的推荐资讯。对数据科学的构建,数据来源则是千里行之始。本文介绍用JAVA结合分布式技术实现的一个高效爬虫系统,希