基于典型相关的音乐跨模态检索

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:yy6590
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网和多媒体技术的飞速发展带来了网络音乐数量的爆炸式增长,使得用户有了很大的选择空间,但同时也给音乐检索系统带来了新的挑战。传统的音乐检索系统多使用提交音乐属性相关的文本作为检索词的方式进行检索,这种音乐属性关键字匹配的音乐检索算法显然已经不能满足人们日益智能化、个性化的检索需求,因此基于内容的音乐检索技术也应运而生。在基于内容的音乐检索技术的研究中,哼唱检索是主流方式,然而这种方式由于过于专业化,很难普及到一般的用户。随着Web2.0技术的发展,研究人员逐步提出了基于语义的音乐检索方式。在诸如Last.fm等音乐网站上,用户可以使用标签对其感兴趣的音乐进行标记和描述,通常这些标签有着比较高的语义信息。然而如果完全根据标签检索会忽视多媒体数据在内容层面的相似性关系,因此如何能够考虑多个模态的特性,让各模态之间互相补充信息,来提高检索准确率,这就需要有一种新的检索方式能够处理不同模态的数据,因此本文的目的就是提出一种跨模态检索音乐方式。跨媒体检索技术是在基于内容的检索技术的基础上发展起来的,通过对来自不同模态的信息进行综合分析,弥补了单一模态检索的弊端,提高了信息检索的效率。本文利用能够表征音乐内容的文本信息和音乐本身的内容信息去综合检索音乐,针对文本特征和音乐内容的底层特征之间的异构和不可比拟性使得跨媒体相似性难以计算的现状,提出了一种基于典型相关的跨模态音乐检索方法,分析了文本特征和音乐内容特征潜在的统计关系,通过子空间映射解决了不同模态之间的特征异构问题,再根据欧氏距离的大小衡量两者的相关性,从而实现了音乐跨模态检索。并且引入查询相关的概念通过权重分配优化了检索结果,进一步提高了检索准确率。本文选取了Rock、emotion、jazz、folk、dancing5种音乐风格语义的文本-音频作为实验数据库,结果表明本文提出的跨模态音乐检索方法能取得较好的效果。
其他文献
云计算作为一种新兴的计算模式,具有强大的分布式计算能力和海量数据存储能力。然而,查询技术作为云计算系统中数据管理的核心技术,如果没有高效的数据存取能力,将严重影响云
期刊
鬼成像是基于空间强度关联获取物体信息的一种新型成像方法,随着计算鬼成像的提出和实现,鬼成像的应用得到了极大地拓展。鬼成像与其它技术相结合,不仅充分利用了已有技术的
期刊
RSA密码算法作为一种重要的公钥密码算法,在电力市场运营系统的身份认证中占有重要地位。本论文主要研究RSA密码算法在电力市场运营系统身份认证中的应用,在论述RSA公钥密码
移动互联网技术的发展带动着多媒体技术的发展,视频应用的类型也越来越多。在很多视频应用场景中,移动终端的能量有限,如移动视频会议。能量有限的移动终端不能处理复杂的运
数字技术的飞速发展以及互联网的普及在给人们的工作生活带来便利的同时,也为一些恶意行为,诸如侵犯版权、信息篡改等提供了更为便捷的途径,这严重损害了数字作品的创作者和使用
世界各地蜂窝网络和移动电话的使用量正在快速增长。作为朝着第三代(3G)网络演进的战略组成部分,无线网络运营商现在正把或已经把W-CDMA/UMTS网络投入商业服务中。手机用户已经
煤岩破坏过程中的声发射事件数与岩石性质有着密切的关系。在巷道中,如果能提取出浅表围岩破裂处所产生的声发射信号,对确定突出位置,预测矿震灾害方面是非常必要的。想在预
期刊