论文部分内容阅读
随着数字音乐数量的快速增长,如何在海量音乐中发现自己喜好的音乐日益成为用户的难题。音乐推荐算法通过分析用户点播音乐的历史行为进行个性化推荐,能减轻用户的信息疲劳,提高用户体验。本文以基于内容的推荐为主要思路,研究基于深度学习技术的钢琴数字音乐推荐算法,具体工作包括三部分:(1)钢琴音乐的频谱特征提取、音符特征提取。频谱包括时域、频域和振幅三类特征,隐式刻画音乐的节奏、音符和高亢或舒缓等性质。此外,探索了音符自动识别方法,作为显式的分类特征。针对已有的自相关识别法存在的倍频波干扰问题,用帧移法设计了改进的音符识别方法。将频谱与音符的综合特征作为分类依据,是本工作的特色。(2)基于卷积神经网络(Convolutional Neural Network,CNN)的钢琴音乐分类。设定了四种音乐分类:Blues、Classical、Jazz和Pop。对于CNN网络的训练,探索了ELU和ReLU两种激活函数,以及RMSProp和Adam两种梯度下降方法,并比较了它们在训练过程中的性能和特点。由实验得出:ELU较ReLU更稳定,Adam较RMSProp梯度下降更快。对比以频谱作为分类依据和频谱与音符的综合特征频作为依据这两种配置下的分类方法,后者在前者分类正确率为96%的基础上提高了1.5%。(3)基于CNN分类的钢琴音乐推荐方法。首先分析了CNN的分类不适用于直接进行音乐推荐的原因,然后提出了基于音乐片段分类的推荐方法。将音乐分割为若干片段,将各片段在预设分类上的概率分布作为新的分类依据。提出了可区分伪离散和真离散的阈值模型,用于提高钢琴音乐分类的准确性。结合音乐分类与用户偏好历史,设计了基于用户特征综合评价和用户特征多类评价的推荐方法。选取“环球钢琴音乐网”和“网易云音乐”的钢琴音乐作为测试数据,采用“隐马尔可夫模型”(Hidden Markov Model,HMM)模拟用户行为,对本文推荐方法进行了测试。结果表明本文推荐方法的准确率在50%以上,接近国际同类方法的性能水平。