基于歌词的音乐自动标注算法研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:bbyyqq555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着信息化和数字化时代的到来,海量数字化音乐数据的涌现,如何组织这些海量的音乐数据,便成为了工业界和学术界急需攻克的难题。音乐标注以生成音乐标签的形式对音乐语义进行描述,从而实现对大量音乐信息的快速检索、高效管理以及个性化推荐,进而解决可这个难题。当前,音乐标注主要有专家标注、社会化标注以及基于机器学习的自动标注三种方式:其中专家标注具有标签准确率较高的优点,但其成本高,且标签丰富度不足;而社会化标注标签丰富度很高,但是标签的准确率较低。基于机器学习的自动标注可以有效地解决前两种方法中的问题,因此该方法便成为了目前工业界和学术界的一个研究重点。歌词,作为歌曲的重要组成部分,具有丰富的语义信息;因此,通过歌词信息来实现对音乐歌曲的自动标注引起了研究者们的广泛关注。本文将基于歌词的音乐自动标注问题转化为基于短文本的多标签分类问题。在传统的中文文本分类方法的基础上,本文提出了改进的文本分类方法,利用字袋模型(bag-of-characters)替代了传统的词袋模型(bag-of-words)以进行短文本特征提取,从而减少了中文分词等文本预处理过程中引入的特征噪声;然后利用n-gram bag-of-characters的特征提取方法更加充分的利用中文文本信息,通过引入联合n-gram bag-of-characters的方法弥补了传统n-grams单元的稀疏性缺陷。同时,本文在利用字袋模型提取短文本特征的基础上进一步采用深度神经网络模型自动提取短文本深层语义特征,从而优化了基于歌词的中文音乐自动标注算法。本文所使用的深度神经网络模型主要是基于深度置信网络框架和卷积神经网络模型框架,通过实验进一步验证了基于深度神经网络模型的音乐标注算法的优良性能。最后,本文进一步将歌曲的音频信息引入到基于深度神经网络模型的音乐自动标注算法中搭建出基于混合语义特征的音乐自动标注算法,通过分别提取歌词和音频的深层语义特征,然后将两类语义特征联合起来共同训练音乐歌曲的深度混合特征以用于音乐的自动标注。实验证明,该基于混合特征的分类方法相比于仅利用歌曲音频信息或仅利用歌词信息进行音乐标注,效果均有所提高。
其他文献
近日,随着十八届五中全会的召开,"十三五"发展规划建议正式出台,农业部已经编制了全国草食畜牧业"十三五"发展规划,明确草牧业包括牛羊等草食畜牧业、饲草料产业和草原生态保护三
近年来,互联网与金融业不断融合,由最初的网上银行、互联网第三方支付到P2P网络借贷、股权众筹等,互联网金融发展势头迅猛,业务形态日趋多样,在满足客户多元化投融资需求,促
血小板输注是临床有效输血的治疗方法之一,可用于临床患者血小板数量减少或功能异常引起的出血情况,是临床再生障碍性贫血患者、白血病等患者的重要治疗手段[1].传统输血患者
2月17日,美联储公布1月份FOMC会议纪要,提出全球经济前景和金融市场动荡等不确定性因素导致美国经济增长、就业、通胀和总需求等面临下行风险.此外,美元逐步走强也将对通胀造
2015年,是适应经济新常态,全面推进转方式、调结构,加快发展现代畜牧业的关键之年。6月15日,农业部在山东召开了全国现代畜牧业建设工作会议,会议传达了中共中央政治局委员、
习近平总书记从2013年提出"一带一路"战略后,得到了国际社会的热烈响应。"一带一路"战略的提出,对完善区域政策,促进各地区协调发展、协同发展、共同发展有重要意义。"一带一路"是
<正> 临床上口腔科常用的牙托粉是甲基丙烯酸甲酯类的合成树脂,属于化学反应成型法的一种牙科造型材料。商品牙托粉和牙托水有两种:普通牙托粉和牙托水、成型后要用水浴加温
本研究将积极心理学和偶像崇拜两个领域结合,通过问卷调查的方式,以五月天的大学生歌迷为调查对象,研究证明了通过网络媒介,偶像崇拜能够产生积极的情绪体验,并给大学生带来
“十二五”期间,中国债券市场发展迅速。2015年各类债券净融资达10万亿元,较2010年翻了近两番。这代表了债券市场对资本形成和稳增长实实在在的贡献,也推动中国债市存量升至全球第三位。债市的提升空间还很大。2015年我国债券存量占GDP的比例约70%,大大低于发展中国家100%以上的平均水平,债市的定价功能、支持人民币国际化功能、风险管理功能尚未得到充分发挥。  在新常态下,中高速增长、结构优化、
目的 探讨密闭式吸痰法不同吸痰深度对呼吸机相关肺炎(VAP)的影响。方法 选取河南省人民医院呼吸与危重症ICU 2016年12月—2018年6月需要行机械通气治疗的237例患者,按随机数字