音乐情感检索下音频感知哈希方法的研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:zhang5832
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在音乐信息检索及音乐推荐等领域中,如何对音乐情感进行高效、准确的识别及检索,是该领域研究的关键课题。音乐所表达的情感以及人们听音乐时的情感反应,可以被量化到一个统一的情感模型中,实现基于情感需求的音乐检索。本文充分挖掘Web2.0用户对音乐情感的评价信息,构建音乐情感数据库,通过检索数据库的方式实现音乐情感检索。运用信息抽取方法,虽然能够从网页中得到音乐情感的文本信息,但由于数字音频的不唯一性,如何基于数字音频的感知内容,将文本信息与音频数据一一映射,是构建音乐情感语料库必须要解决的关键科学问题。基于此,本文研究快速音频感知哈希方法,旨在追求区分性和鲁棒性的同时提高感知效率。本文研究了两种高效的音频感知哈希方法:(1)运用向量投影以及随机搜索策略,先从大量训练数据中搜索得到合适的投影向量,然后将高维的感知特征投影到一维空间,并进行哈希编码,实现快速的音频感知哈希。实验结果证明,该方法在不降低哈希向量区分性和鲁棒性的前提下,时间性能相对于传统方法有很大的改进。(2)运用深度置信网络,通过DNN-Bottleneck特征框架,从音频数据中提取鲁棒的感知特征,然后编码实现快速的音频感知哈希。实验结果验证了该方法的可行性,区分性和鲁棒性相比VP-FFT方法有所提升。进一步分析发现,VP-FFT方法和单层的NN-Bottleneck-FFT方法在数学形式的描述上,是完全一致的,为VP-FFT方法的理论解释提供了参考。
其他文献
教师的评价语是把双刃剑,恰当的教学评价语能有效地调动学生的学习热情,拉近师生距离。反之,不当的教学评价语会挫伤学生的积极性,阻滞学生的发展。
下丘脑是调节机体内脏活动和内分泌活动的高级中枢。近年来的研究发现,下丘脑通过起源于结节乳头核(tuberomammillary nucleus, TMN)的组胺能神经纤维支配许多皮层下运动结构
分别合成了乙二醇、二甘醇、三甘醇、四甘醇、聚乙二醇400和聚乙二醇600的二苯磺酸酯.用FTIR,1HNMR,UV-VIS光谱和TLC色谱等对产物进行了表征,并对产物进行了溶解性能及结晶分
近现代以来随着我国国民经济越来越快的发展,也推进了市政建设的不断发展。城市空间不断扩大和外延,对于整个城市的交通需求、经济需求和文化需求正在不断的进步,这也给市政
目的:探讨新生儿期不明原因惊厥患儿的惊厥发作特点和脑电图(electroencephalogram,EEG)改变与近期结局的关系,为患儿预后的早期评估提供依据。方法:以中国医科大学附属盛京
中科院动物所段恩奎和王海滨实验室首次通过小鼠遗传学模型,揭示了植入初期胚胎-子宫轴向建立对胚胎发育的重要性,并首次证实了子宫信号可指导胚胎植入时的正确定向。相关成
本文从相关概念内涵分析入手,紧密结合新课标要求,阐述了信息技术在创建初中语文高效课堂中的独特作用及其实践应用,有一定的借鉴意义。
得益于经济全球化的发展,产业进化不断加速,企业之间的竞争正由产品的竞争逐渐转变为供应链的竞争,而供应链的整合离不开金融的支持,物流服务与金融服务相结合便产生了物流金
利用层次分析法,构建了关于民族贫困地区乡村旅游扶贫绩效评价的指标体系,并对湘西土家族苗族自治州(下称湘西州)乡村旅游扶贫绩效进行了评价。结果表明,2015年湘西州乡村旅
同素同义单双音节趋向动词是现代汉语词汇系统中的一个特殊小类,笔者在前人研究的基础上从本体研究、使用情况、偏误分析、教学策略等方面对同素同义单双音节趋向动词进行细致的分析研究,以求提高汉语学习者使用这类词的正确率。绪论分为四个部分,选题意义、研究现状、研究方法和语料来源。在选题意义中笔者阐述了同素同义单双音节趋向动词在汉语国际教育背景下的研究价值。研究现状部分笔者查阅了相关资料,梳理了学者们对于同素