【摘 要】
:
随着多媒体技术和网络技术的不断发展,多媒体信息的数量迅猛增长,为了充分利用已有的多媒体资源,研究多媒体检索技术变得越来越重要。音乐检索技术研究的是如何从大量音频信
论文部分内容阅读
随着多媒体技术和网络技术的不断发展,多媒体信息的数量迅猛增长,为了充分利用已有的多媒体资源,研究多媒体检索技术变得越来越重要。音乐检索技术研究的是如何从大量音频信息中快速准确地检索出满足要求的音乐数据,是多媒体检索技术的主要方法之一。本课题研究的目的在于通过分析用户的哼唱输入,提取出音符序列,检索出相应的歌曲名返回给用户,实现基于内容的音乐检索。主要内容包括以下几个方面:1)基音周期是识别音符的基础,分析了现有的一些基因周期提取算法,考虑到音乐检索的实时性,确定了采用基于YIN算法和CUEX算法的识别方法,并在此基础上对算法进行了改进。2)研究了从MIDI文件中提取旋律的方法。提出了基于MIDI文件音轨统计特征,运用改进的人工神经网络的主旋律自动提取算法。3)设计并实现了一个基于内容的哼唱式音乐检索系统,其中包括了MIDI文件自动爬虫系统。在下载的MIDI文件基础上运用旋律提取算法,得到MID文件的旋律库。在旋律音高序列的基础上运用中文分词的方法,建立音乐词旋律轮廓库。再根据音乐词旋律轮廓库和旋律词库建立检索系统的倒排索引,将文字检索的方法运用到了音乐检索中。本文在音符识别和MIDI主旋律提取中都取得了较高的准确率,并在此基础上获得了一个能较好反映歌曲旋律特点的音乐词库和索引系统。由于音乐词库是一个很新的概念,目前还处在实验阶段,对歌曲的检索准确率可到达约46%。由实验得到的结论反映了哼唱音乐检索的一些特性,为进一步的研究提供了理论基础。本文的研究方法还可适当地用于其他的语音研究中,对哼唱的研究方法可快速应用到其它领域,这也在一定程度上展示了系统的良好扩展性。此外,本文的算法研究也可为其它的检索、分类等技术带来一定的参考价值。
其他文献
随着移动互联网技术的发展与移动终端的普及,社会生活的信息化日益深入,人们越来越依赖于手机、平板电脑等智能移动设备。笔记类软件是传统纸笔记录行为在科技进步的环境下衍生
Web信息量的急剧猛增以及广大互联网搜索用户信息检索需求的不断提升,使得搜索引擎技术由原来的面向全体互联网用户,提供公用信息服务的通用搜索引擎发展到面向特定领域,为用
近些年来,由于互联网技术的迅猛发展以及通信网络带宽和处理能力的大幅提高,使得网络能够提供形式多样的多媒体业务,同时也使得支持“点对多点”或“多点对多点”的组播通信方式
有向标签图作为重要的数据表示模型,广泛应用于社交网络、生物信息学、语义 web等信息技术相关的研究领域。目前,随着上述领域数据规模的快速增长,如何高效管理较大规模的有向标
近年来,以互联网为传播介质,以数字化多媒体内容为主体的数字媒体产业在全球范围内快速崛起,并逐渐改变了人们娱乐休闲的方式。本文以数字音像内容集成分发平台为依托,构建一
XML(eXtensible Markup Language)已经成为Web上数据表达和数据交换的新标准。XML文档的大量出现,产生了XML数据管理的需求。XML所描述的Web数据所具有的半结构化特性对传统
当前,科技信息领域的现状是:各省级科技情报单位收集了大量区域内的科技信息资源并建立了各自的信息系统。随着我国“科教兴国”战略的推进,对科技资源的信息化建设也提出了
身份认证是计算机和互联网世界里最基本的要素之一,也是整个信息安全体系的基础。生物识别技术应用于身份认证是未来发展的趋势,相对于基于口令和智能卡的技术来说,生物识别
医院信息系统的迅速普及,为医疗行业积累了海量有价值数据。对这些数据的有效利用、分析,挖掘其中隐含的信息、知识及模式,可为疾病患者提供更好的诊疗及保健,为管理者提供更好的
我国社会经济的高速发展离不开日益发达的道路交通运输,发达、快速的道路交通运输已经成为经济发展的必备条件。同时,随着人们的购买能力的增强,私家车的数量大幅上升,密集的道路