【摘 要】
:
多媒体数据是网络大数据的一种主流表示形式,并呈现出海量、高维、异构等特性。如何在大规模多媒体数据中,快速、准确地检索出目标数据是计算机研究领域的一个基本问题,其解决方案被广泛地应用于诸如物体检索、身份识别、三维重建等场景中。不过,高效的近邻查询一般需要借助数据的提前索引,而多媒体数据的高维特性使得多数传统索引技术失效,并导致精确近邻的查询效率急剧下降。近似最近邻检索技术脱颖而出,逐渐成为解决上述问
论文部分内容阅读
多媒体数据是网络大数据的一种主流表示形式,并呈现出海量、高维、异构等特性。如何在大规模多媒体数据中,快速、准确地检索出目标数据是计算机研究领域的一个基本问题,其解决方案被广泛地应用于诸如物体检索、身份识别、三维重建等场景中。不过,高效的近邻查询一般需要借助数据的提前索引,而多媒体数据的高维特性使得多数传统索引技术失效,并导致精确近邻的查询效率急剧下降。近似最近邻检索技术脱颖而出,逐渐成为解决上述问题的有效方法。其中,基于乘积量化的近似近邻查找和基于哈希技术的近似近邻查找是最具代表性的两类方法。近年来,基于原型的量化方法引起了越来越多研究人员的兴趣,代表性工作包括K-均值哈希和自适应编码哈希。该类方法试图兼具上述乘积量化和传统哈希两种技术的优点,达到在保持检索精度的同时,又能提高检索的效率。首先,类似于乘积量化,基于原型的量化方法把原始高维空间进行子空间划分,然后在每个子空间内对训练数据进行聚类量化。同时,结合哈希技术,该类方法把类别中心进行哈希表示,并尽量保持原始空间和二进制空间上类别中心之间距离的一致。这样,基于原型的量化方法,既通过聚类量化保持了数据表示的精度,又可以借助数据的二进制表示直接通过汉明距离进行近邻计算。不过,由于原始空间和二进制空间的距离度量本身并不一致,基于原型的量化方法引入一个常量尺度因子把二进制空间的度量放缩到原始空间中进行比较。我们在实验中发现,多个子空间的尺度因子其实并不相同,如果能在二进制聚类中心的优化过程中,同时平衡多个子空间的尺度因子,将能够进一步提高基于原型量化方法的表示和检索精度。基于这种思路,我们改进了传统基于原型量化的优化目标,并把多个子空间尺度因子的方差为零,作为目标函数的约束条件。进一步,我们提出了一种参数交替优化的求解方案来寻找上述优化问题的近似最优解,并给出了该求解方案的算法复杂度分析。最后,我们在八个公开数据库上进行了大量的数值实验,对本文算法的参数进行了性能分析,并与多个现有的近似最近邻检索方法进行了性能比较。实验表明,本文方法在子空间数目较多的时候,算法性能优于多种目前流行的方法。
其他文献
在信息数据快速传播的时代,数字图像传输的频率很高。在保护图像信息的各种方法中,对图像进行加密是一种非常有效的措施。与文本和语音相比,图像表示的信息更加生动,但这也意味着图像信息量很大,冗余度很高,相关性很强。因此,传统的加密方案不能保证加密的安全性要求。遗传信息分为脱氧核糖核酸(Deoxyribo Nucleic Acid,DNA)和核糖核酸(Ribonucleic Acid,RNA),DNA计算
税收是国家组织财政收入的主要形式与工具,税务持续受到社会公民的广泛关注。伴随我国税务信息化建设的全面开展,税务办理效率显著提升,但目前税务存在业务内容复杂、征管关系繁多、时效性较差等问题。纳税人无法全面了解税务政策,税务办理存在的问题主要通过咨询客服专员得以解决,方式单一且人力资源投入较大,无法在较短时间解决大量用户的税务咨询需求。针对当前税务办理存在的问题,论文基于自然语言处理技术与系统开发相关
无监督学习因为有着能够利用未标记的数据进行训练的特性,成为人工智能领域讨论的热点之一。基于能量模型的生成对抗网络就是一种学习数据的非规范对数密度的无监督学习方法。针对现有的能量模型框架,本文提出一种非参数估计邻域熵算法的能量模型(NEEM),主要工作如下:(1)提出非参数估计邻域熵算法的能量模型(NEEM),算法在考虑每个样本点附近k近邻区域的非均匀概率密度的情况下,通过给经典熵估计方法增加局部高
在计算机视觉领域中,对处于复杂光线场景或者极端运动状态下的目标物体进行跟踪是一项重要且充满挑战的任务。相比于传统相机,基于事件相机的视觉感知系统更关注每个像素的光强变化,表现出了更加出色的感光能力,更低的延迟和更小的功耗。本文针对基于事件相机的运动目标跟踪问题展开研究,主要工作是基于相关滤波跟踪框架设计了一种针对于异步事件流的跟踪方案,具体包括外观模型建立和跟踪算法设计两部分。在外观模型建立部分,
航空运输是现代化运输体系的重要组成部分,民用航空运输是国民出行的重要交通方式。伴随民用航空运输的全面普及,航班数量激增致使航班延误与波及延误事件频发,严重影响乘客出行计划、降低航司经济效益。此外,因航班延误带来的纠纷与冲突常引发群体性事件,影响社会和谐与稳定。基于此,制定鲁棒性的飞机排班调度方案具有重要的应用价值。本文针对鲁棒性飞机排班调度计划问题展开研究,具体地,本文主要研究内容如下:(1)针对
近年来,为了解决图像相关性强和冗余度高等问题,基于混沌理论的图像加密成为了一个热门的研究课题。另一方面,随着3D打印的兴起,基于混沌理论的三维模型加密的研究也迫在眉睫。且现有的三维模型加密存在着加密过程复杂,加密速度慢等问题,故本文提出了一种基于混沌理论的三维模型加密算法。另一方面,基于现存的混沌图像加密算法所存在加密效率过低和密钥敏感性较弱的等问题,本文分别提出了两种基于混沌理论的图像加密算法。
当前,陆上环境目标检测技术的发展已经趋于成熟,在检测速度和精度上都有了较大的提升,而水下目标检测的相关研究则进展缓慢,其主要原因有以下两点:首先,不同海域、不同深度、不同时间以及不同浑浊度状态下采集到的图像风格差异较大;其次,用于目标检测训练任务的图像需要预先进行人工标注,而人工标注不仅费时费力,长时间持续标注也可能会由于主观因素导致出现错标和漏标等问题,这些“问题数据”将会直接影响训练出的目标检
随着我国对外贸易总量的飞速增长,港口的集装箱吞吐量呈现井喷趋势,如何在满足一定填充率的前提下,实现快速装箱,成为亟待解决的问题。集装箱三维布局优化问题本质上属于NP-Hard问题,其解空间过于庞大,难以找到最优解,且当待装载货物种类较多(即异构性较强)时,求解速度较慢。针对此问题,本文提出一种多策略动态融合启发式算法(DHHA),在保证填充率的前提下实现快速求解。首先,考虑现实约束条件,建立装载模
近些年,城市道路网络中基于车辆等移动对象所产生的轨迹数据的相关研究在智能交通领域掀起了一片研究热潮。轨迹异常检测作为路网轨迹模式挖掘的一个热门研究课题之一,其主要目的是识别出轨迹数据中异常但有价值的数据信息,对路网中欺诈和不良事件的监测具有重大意义。现如今,大多数针对路网的轨迹异常检测算法都倾向于采用基于密度或基于距离的检测方法,并未考虑时间信息对异常轨迹检测结果的影响;并且在检测过程中,通常选择
船舶交通管理(Vessel Traffic Service,VTS)系统是集雷达、通信、计算机网络、信息处理技术于一体的多技术融合与集成的系统,近20年来我国在沿海和长江各港口引进国外的技术建设了大量的VTS,随着水上交通的不断发展、国家信息安全的加强和用户对系统运行效率的提高以及智能化的需求,对VTS系统进行国产化已经势在必行。目前的VTS系统对于船舶的识别、交通安全指挥、风险提示和告警、船舶进