论文部分内容阅读
随着近年来现代科学技术的飞速发展,人工智能相关的技术与应用受到越来越多的关注。算法作曲或者自动音乐生成系统作为人工智能的一个重要研究领域,目前已经取得了诸多研究成果。其中,基于人工神经网络的音乐建模方式由于具有较大的灵活性与扩展性,得到了广泛的应用。本文针对现有的人工神经网络模型无法保持对于训练数据集的移调不变性的情况,提出了一种双轴LSTM神经网络结构,同时引入混沌理论作为音乐创作过程中的灵感部分,设计了一种混合音乐生成系统,并通过实验说明了系统的可行性与实用性。本文主要包括以下内容:第一,提出了一种用于训练多声部的音乐数据集的双轴LSTM神经网络的设计结构,模型在生成多声部音乐结果的同时,也可以为单音模式提供有效的和弦进行。在网络结构设计上借鉴了卷积神经网络在图像处理中保持多个方向上不变性的结构,使得双轴LSTM神经网络能够同时保持多声部训练数据在时间以及移调方面的不变性质。通过实验对比了多种神经网络模型在音符序列的预测上的准确率,说明了双轴LSTM神经网络在训练数据在未进行调性统一预处理情形下的优势。同时,使用该模型生成了具有丰富音乐结构特征的多声部音乐段落。第二,提出了一种基于混沌理论的旋律合成算法。该算法将混沌动力学系统的解分别映射至预定义音阶中音符的音高与时值之上,经过归一化和量化过程,生成具有混沌特性的旋律。随后通过实验分别对比了连续系统与离散系统模型下的生成结果,从主观与客观方面对结果进行评价,对实验数据进行分析得出混沌吸引子的动力学特征参数对生成的旋律结果的影响。此外,该结果作为LSTM网络的数据集的来源之一进行训练。第三,设计了一种可控的音乐生成系统。该系统将混沌模块与LSTM神经网络模块进行了融合。LSTM模块具有单音和复音两种模式,复音模式用于训练和生成多声部复调音乐与和弦进行数据,后者的结果将提供给单音模式作为保持音符不变性的条件之一。在单音模式下,LSTM模块接受来自混沌模块生成的具有混沌特性的旋律集合,同时也接受用户输入的单音旋律训练集。然后,计算系统输出旋律的欧拉旋律度,同时反馈至输入端,与用户设置的参考旋律度数值进行比较,将偏差值进行放大并输入到混沌模块之中,对混沌系统参数进行调整。此外,通过调整两种训练集的比例,也可以对旋律结果的特征进行改变。最后,通过实验结果对系统的性能进行评价,说明了提出的模型以及算法的有效性。