基于ANN的数字内容版权检索技术研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:skynan2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展,数字内容在许多领域都得到了广泛应用,比如教育、医学以及娱乐等,这就不得不涉及到数据内容版权管理的问题。在基于内容的数字版权检索系统中,由于数字多媒体容易编辑,合理编辑或非法篡改多媒体导致提取出的版权标识符或内容特征码与原始记录存储的数据会存在一定的偏差,这就需要在版权特征数据库中查找与某给定数字内容“相似”的版权信息,这样的查找过程叫“相似性检索”。如何在大型版权数据库中快速检索到基于内容的相似性检索就显得越来越重要。传统的最近邻查询受到“维度灾难”的影响,随着数据维度的增加,传统的索引结构性能急剧下降。针对以上问题,考虑到近似最近邻(ANN)搜索算法是为了解决高维空间的快速搜索问题。通过近似最近邻的方法可以快速获取与检索要求大致相似的点集,一种实现ANN算法的重要方法就是局部敏感哈希(Locality Sensitive Hashing,缩写为LSH)算法。LSH算法是建立在哈希索引基础上的ANN搜索算法,它不依赖于数字内容特征维数,与其它基于Tree的数据结构,诸如R-Tree、KD-Tree、SR-Tree相比,它较好地克服了维度灾难,能够将最近邻查询的时间复杂度缩减到次线性,可以有效地解决高维特征向量的ANN搜索问题。本课题的主要工作为:研究并学习LSH算法的基本原理和方法,通过更快哈希函数的计算和跳过重复点等方法对LSH算法进行了优化,然后通过实验数据对改进后的LSH算法和传统的索引方法的查询性能进行了详细比较,实验结果表明,改进后的LSH算法在不降低准确度的情况下,耗费时间更短,提高了查询效率。进而分析得到如下结论,将改进后的LSH算法应用于基于内容数字版权检索中,其性能优于传统的索引方法。
其他文献
我国目前煤矿开采业存在机械化、自动化、信息化程度低等技术不够成熟的问题,是导致煤矿事故频发的主要因素之一。矿井机车运输作为煤矿井下开采过程中的重要一环,它对提高生产
场景图像分类在图像检索和视频检索领域得到广泛的应用,已成为计算机视觉领域的一个研究热点。场景图像分类的主要难点问题是低层视觉特征与高层语义之间存在―语义鸿沟‖。近
无线传感器网络通常由部署在特定区域的数量庞大的微型传感器组成,这些传感器节点之间互相协作对需要监测的目标区域进行监控并实时采集需要的数据。节点采集到的数据通过节点
随着网络的广泛应用和即时通信(Instant Messaging, IM)软件的迅猛发展,利用即时通信系统和即时通信协议的漏洞或者技术特征进行攻击,并在即时通信网络内传播的即时通信蠕虫(IM
信息技术在现代生产生活各方面的应用越来越广泛,作为信息技术核心支撑的软件系统也变得越来越重要,其应用正在逐步渗透到社会的各个领域中去。时至今日,现在各行各业中的应
随着科技的不断发展、技术的不断进步,在计算机、互联网后,物联网(Internet of Things, IOT)逐渐得到广泛的研究和发展。然而,由于物联网的自身的特性,传统意义上的互联网的
相对于传统光学图像,深度图像能直接给出距离,几何特征等信息,并且不受纹理,光照等环境因素的影响。飞行时间法三维无扫描传感器通过测量发射信号与反射信号之间的相位差来产生目
随着信息技术的不断进步和计算机网络的飞速发展,每天在互联网上传播的信息和知识达到以往数倍。同时,现实领域中也产生了海量的双语数据,这些数据对于统计机器翻译研究无疑是一
遥感具有快速获取全球以及大区域空间信息的独特优势,而且空间信息资源的掌控权是国家综合国力和核心竞争力的重要标志,发展遥感对地观测系统与占领未来战略性新兴产业制高点
在自然科学、社会科学和工程技术的很多领域中,都不同程度地涉及到对不确定因素的处理。目前已有许多处理不确定性的数学工具,如粗糙集、模糊集和概率论。其中,Pawlak粗糙集作为