融合多模态信息的音乐情感分析

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:donna1105
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着情感分析领域研究的不断发展,音乐作为人们日常生活中常见的多模态信息载体,其往往通过歌词和旋律传递情感,因此也被逐渐纳入到情感分析的研究范畴之中。除了歌词和旋律,音乐的结构,如主歌和副歌也在传递音乐情感中扮演者重要的角色,起到了情感指示器的作用。音乐的这些特性使得音乐能够在短时间内准确地捕捉到听众的情感,进而引发共鸣。为了更好的探寻音乐与情感之间的关系,本文利用深度学习的方法从音乐情感分类及基于情感约束的音乐生成两个维度展开研究工作:(1)融合多模态信息的音乐情感分类。为了更好地分析音乐中蕴含的情感,本文首先提出了一个层次化的音乐分析框架用于分析音乐的结构。然后,构建了一个新颖的多模态交互框架,抽取每个时间步上当前的情感向量,再对情感向量进行融合更新,从而约束多模态之间的情感保持一致。最后,本文融合音乐结构分析和多模态交互的结果实现对音乐情感的分析。实验在构建的音乐数据集合上开展,实验结果表明所提出的融合多模态信息的框架在音乐情感分析任务上取得良好的实验结果。(2)基于情感约束的音乐生成。在音乐情感分析结果的基础上,本文进一步开展了音乐生成的任务。基于音乐的词曲间往往存在一致的情感表达这一特点,本文构建了一套基于强化学习的对偶Seq2Seq框架,通过引入情感一致性的奖励值和内容保真性奖励值,实现所输出的旋律与输入歌词具有一致的情感。对于音乐生成任务,不仅需要客观地探寻模型的准确性,而且还需结合人的主观评价,即听众对于所生成音频中蕴含的情感是否和歌词情感一致。在构建的数据集合上的实验结果表明,本文提出的音乐生成框架取得了不错的结果。音乐作为人们情感表达的主要载体之一,其蕴含的多种模态信息与情感类型为本文的音乐情感分类及音乐生成工作提供了重要的研究基础。本文开展的融合多模态信息的音乐情感分类和基于情感约束的音乐生成工作,不但可为如音乐创作、音乐推荐等实际应用场景提供有效的技术支持,而且同样可以在一定程度上推动音乐情感分析领域的研究与发展。
其他文献
在采集图像的过程中,受到各种因素的干扰,导致图像质量下降的这种现象称为图像退化;如果存在多种类型的降质因素,如噪声、畸变、离焦、抖动等,这时称为多重退化。图像复原是
目的:应用Revolution CT一站式冠状动脉CT造影+心肌灌注成像,分析NLR、hs-CRP与高海拔人群冠脉狭窄和心肌灌注的相关性,并探究Revolution CT一站式成像评估冠脉形态结构和心肌灌注的价值。方法:收集行Revolution CT一站式CCTA+MPI检查的高海拔人群92例,记录年龄、性别、民族、海拔等一般资料及3日内的NLR、hs-CRP值。根据CCTA结果进行Gensin
顾客感知价值被认为是能够促进消费者品牌忠诚、提升企业竞争力和影响企业长足发展的重要因素,受到了广泛的关注和重视。而口碑营销作为消费者自发的、宣传费用低且针对性较
深度卷积神经网络在机器视觉的各个领域都取得了显著的效果,在图像识别、语义分割、行为检测、图像跟踪等任务上,获得了超过人类能力的性能表现。高性能的网络模型往往对硬件
热电材料是一类能够在热能和电能之间实现直接相互转换的新型能源材料。现如今传统能源日渐枯竭,温室效应和环境污染亟待控制。以热电材料作为核心元件的热电器件拥有稳定、
扶贫开发与我国“两个一百年”重要目标的实现有着密切联系,关系着千万贫困人口的生计。目前,我国的扶贫开发工作虽然取得了不错的成绩,但扶贫形势仍然比较严峻。精准扶贫的
图像语义分割技术其目的是为图像中每个像素分配类别标签,由于此项技术与无人驾驶等多种智能应用密切相关,因此成为了计算机视觉中一个研究热点。深度学习的迅速发展推动语义
锆钛酸铅(PZT)压电陶瓷是一种可将机械能和电能相互转换的陶瓷材料。利用其压电特性设计成的压电传感器广泛应用于声纳系统、气象探测、遥感环保、家用电器、医疗和通信等领
随着秘鲁的建筑业持续发展,公司之间的竞争力也随之增长,一些重要指标,诸如企业社会责任(CSR)是企业战略决策的主要关键因素。秘鲁的建设工程管理质量相比其他国家还不够好。
柔性传感器的主要功能是将外界声、光、力和热等信号转化为可视的电信号,因此无论在人体健康监测、生物医学、电子皮肤等医学相关领域,还是对新一代机器人等电子设备的升级都