基于内容的音频匹配研究

被引量 : 0次 | 上传用户:kueixing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术和互联网的发展,数字化的音乐音频的数据量急剧增多,如何对音乐音频信息进行快速准确的分析显得日益迫切。当前音乐信息的分析与检索还是基于文本标签信息为主,这需要繁重的人工代价,且极易出现错误而影响结果。与此同时,基于内容的音乐信息分析检索技术正蓬勃发展,其重点是如何使计算机能够像人一样能够理解、分析音乐中所包含的丰富内容。本文从京剧音乐音频的匹配问题展开,根据音乐特征的音色信息,提出了一个提取音频音色序列的方法,以音色序列的形式再现音频数据。而音色序列包含了音乐音频的听觉感受信息,采用基于时间序列技术的音色序列匹配方法,解决音频间的匹配问题。通过分析发声体发声机理以及不同音色的音频特征间的差异与联系,本文引入了音频的音色分布度量,从整体上分析音频信号在音色上的特征。利用发声过程的特性和京剧音频的特点,提出了一个结合高斯混合模型与隐马尔可夫模型技术的音色序列提取方法。在音乐音频匹配方面,结合声音音色的听觉感受和时间序列的相似性度量,引入京剧音乐音频片段的音色序列相似性度量。在匹配过程时,音频片段的时间长度不尽相同,为了解决不同时长音频的匹配问题,本文提出基于滑动窗口技术的音频匹配算法框架。以此建立了一个京剧音乐音频匹配系统,在该系统中,可以使用不同的音频信号特征提取方式,选取不同的时间序列相似性度量,实现快速灵活的音频片段匹配。实验结果表明,以该算法来进行音频片段匹配速度快、可控性好、反应延迟小;对原始查询音频片段的部分缺失问题及噪音所造成的影响来说,均具有很好的鲁棒性。
其他文献
近年来,学业投入作为国外的研究热点,也逐渐受到国内学者越来越多的关注。作为学业倦怠的反面,学业投入从积极心理学的角度出发,扩大和丰富了学业倦怠的研究范围和领域,为理
面对严峻的就业形势,鼓励高校毕业生自主创业作为解决就业问题的重要途径之一,逐渐引起了社会各界的广泛关注,为其构建一个良好的创业支持体系扶持其开展创业活动是目前迫切
景观水体生态修复技术由于成本低、效果持久、符合生态环境可持续发展理念且具有美景功能成为近些年的研究和应用热点,而相关的数学模型能够将理论与实践有机结合起来,并具体
红色资源是中国各族人民在伟大的中国共产党的领导下,经过不懈的革命战争和顽强的奋斗,经历了新民主主义革命和社会主义革命斗争、改革开放和社会主义现代化建设新时期的奋斗
幼儿时期是孩子成长中非常重要的阶段,孩子开始学习各种知识和能力,孩子在幼儿时期的学习和成长,对孩子以后的影响是非常大的,所以幼儿教师在教学时要注意自己的教学方式。而
<正>由绵阳师专晏茂心、钟贤权、贾林成等同志主研的初中生四级台阶速读训练法及其深化研究”系四川省教委普教科研资助金项目.曾先后三次荣获国家教委、四川省教委、绵阳市
钢琴的即兴伴奏是一种最实际、最快捷、最能考验学生基础钢琴知识能力和创新思维模式的一种钢琴演奏技能,是一种在旋律条件的限制下进行瞬间艺术再创作的即兴钢琴创作能力的
影片《国王的演讲》中所展现的个性的语言特征以及在语言交流中所展现的丰富的英国文化氛围,为影片人物形象的成功塑造以及电影主题的有效表达起到重要的促进作用;与此同时,
定位于具体的地域,在城市综合公园设计的基础上进行更系统的分析,总结出生态美学下长沙城市综合公园本土化设计研究的原则策略和手法是作者的核心研究内容。国家将生态文明建
网络游戏作为互联网时代的新兴娱乐方式,逐渐成为当代人不可缺少的生活必需品。面对庞大的游戏市场,游戏开发商们为了赚取更多的利益,常常在游戏中加入大量的暴力元素来吸引更多的游戏玩家,众多大学生迷恋上了暴力网络游戏甚至发展成为游戏成瘾,对其身心健康带来严重的威胁。近年来,有关暴力网络游戏对个体攻击性影响的直接因果关系受到了质疑,越来越多的研究者们将关注点放到了游戏者自身的人格因素和外部的环境因素上。本研