基于音频内容的多媒体文件相似性快速比对研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zhaojiagu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,网络和多媒体技术迅猛发展,多媒体信息急剧增长,网络多媒体数据中数据重复现象很常见,尤其是一些大型多媒体分享网站中,用户上传了大量重复的多媒体数据。重复数据不仅增加了数据库存储和管理代价,也严重影响网站访问者的用户体验。因此,多媒体数据的重复检测显得尤为重要。本文围绕多媒体数据库重复检测问题展开研究,在分析现有技术的基础之上,提出了利用直方图、GMM和K-L散度的两级重复检测方案,设计了多媒体数据库重复检测系统。围绕以上问题,本文主要完成了以下工作:首先,提出了基于直方图的文件快速匹配方法,以文件为单位进行相似度比对,在很大程度上提高了重复检测的速度。由于直方图忽略了文件的时序信息,并考虑长度差异大的文件,容易误识,影响检测效果。因此,借鉴分段检索的思想,将较长的多媒体文件分成若干段,每段建立一个直方图模型,形成直方图序列。通过计算直方图序列间的总体相似度,判断文件是否相似。实验结果表明,通过直方图方法可以提高重复检测的速度。其次,直方图方法虽然提高了重复检测的速度,但是牺牲了检测精度。针对直方图方法检索结果不精确的缺点,提出了基于GMM和K-L散度的相似性比对方法,用于文件的相似性确认。实验结果证明,该方法能够有效提高结果的正确率。最后,介绍基于直方图、GMM和K-L散度的二级检索机制的多媒体数据库重复检测系统的设计与实现。本系统主要作为大规模数据库管理的一种数据重复检测手段,以便将重复的多媒体文件检测出来,便于数据库管理者根据需要对重复数据进行管理。本系统采用分布式检索方法,可以满足网络多媒体数据库的实际需求,通过实验测试,验证了系统的可实用性。
其他文献
学位
随着医学领域影像数字化进程的推进,医学影像成像技术和设备不断发展,数字医学影像已日益成为现代医疗最重要的基础手段之一。每天都会有大量包含生理、病理相关信息的医学图像
人脸表情识别是计算机视觉和模式识别领域的一个研究热点,引起越来越多的国内外研究者的广泛关注。人脸表情识别的目标是让人工智能产品能够自动识别出人的表情,进而分析人的内
微博作为一种新兴的社交媒体被广泛使用,其每天的数据交流数量呈现爆炸式的增长,这些数据为自然语言处理提供了良好的语料环境。微博文本具有和短文本一样的长度较短、情感表
人脸表情识别是一项极富有挑战性的研究课题,由于其潜在的应用价值,受到了许多学者的广泛关注。随着多媒体技术和网络视频的发展,对人们的情感分析,了解用户情感变得越来越重要。
因特网技术的快速发展,推荐系统由于能够帮助用户快速做出适当决定,被广泛应用于各大电子商务网站,推荐服务的使用能促进用户由浏览者到购买者之间的转换,给生产商带来商机的
学位
随着应用系统的急剧扩张和网络技术的迅速发展,用户对系统提供实时数据更新的要求越来越高。然而在系统的集成过程中,底层的数据库之间在实现数据资源的共享和变换时会出现一
在数字化时代的今天,由众多服务器构成的云计算数据中心中,物理服务器的负载较高或者较低,都将会影响系统整体的利用效率。为了实现整个架构的负载平衡,就须要使用虚拟机的动
随着计算机技术的飞速发展,计算机图形学被越来越多地应用到数字电影和游戏中。其中,人脸动画是计算机图形学中最典型的研究方向。近年来数据驱动形式的人脸表情动画也受到了