高维数据的哈希索引技术研究

来源 :北京交通大学 | 被引量 : 5次 | 上传用户:songyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据检索是计算机科学领域中的一个重要问题。近年来,随着互联网技术、通讯技术及多媒体技术的快速发展,高维的多媒体数据呈现出指数级增长。如何对这些大规模高维多媒体数据进行高效检索,对传统的检索技术带来了新的挑战。因此,开展高效的大规模高维数据索引技术已成为数据挖掘领域的研究热点,具有很好的理论研究意义和实际应用价值。基于哈希的索引方法已经被证明是一种有效的索引技术。本文在基于迭代量化哈希索引算法的基础上引入局部约束,实现了聚类驱动的迭代量化,从而获得更为紧凑的哈希码书;在此基础上,将其扩展到多视角数据索引。本文的研究成果主要包括:1.提出了基于聚类驱动的迭代量化哈希模型。迭代量化哈希算法只考虑了原始数据集映射前后整体结构的保持,而忽略了数据集局部结构的变化,造成原始数据的结构在哈希空间没有得到有效的保持。为解决该问题,本文在迭代量化哈希的基础上引入聚类驱动的局部约束,从而使原始高维数据在映射前后的整体结构和局部结构得以有效保持,此外,本文还提出了一种高效的针对外点的哈希码生成方法,满足在线检索的实时性要求;2.针对目前大量存在的多视角数据,本文提出了一种基于共享子空间(Shared Subspace)的多视角关联模型,该模型在获得多视角数据显性共享表示的同时,能够对多视角数据形成一致性表示,并指出传统的典型相关分析是该共享子空间方法的一个特例;基于以上共享子空间分析方法,本文提出了基于共享子空间(Shared Subspace)的多视角哈希模型。该模型利用共享子空间方法实现多视角数据间的语义关联性挖掘。在共享子空间中通过结合基于聚类驱动的迭代量化哈希模型,有效实现了多视角数据的联合索引。
其他文献
自美国联邦通信委员会发布E-911定位法规以来,蜂窝网络无线定位技术成为近年来的一个研究热点,各种移动定位技术标准和定位算法相继被提出。虽然各种算法已经取得了一定的成
采用第三代移动通信技术的优势在于,网络运营商可以依赖于更高的频带利用率和更高的传输速率,为用户提供丰富的业务。随着移动通信网络与互联网(Internet)之间的业务交互在通
随着社会经济的发展,人们对水资源需求逐步增加与水资源短缺的矛盾日益突出,经济主体多元化的局部利益与水资源的合理开发、综合利用及防洪排涝的整体利益之间的矛盾也日渐增
自动人脸表情识别(AFER)是近年来发展起来的研究热点,其目的是让计算机等机器辨认出人类特有的情感表现之一——表情。由于人表情的复杂、微妙等特性使得表情识别变得异常的具
随着科技的不断进步,协议的不断优化,移动通信技术经历了从模拟通信时代到数字通信时代的转变,其在通话质量、通信速度乃至覆盖范围等方面都在飞速地进步着。在如今的民用市
近期,由于长江等流域性河道开始全面禁止采砂,大批采砂船聚集到沂沭泗流域江苏境内的直管河湖内,非法采砂活动十分严重,有的河段在不到100米宽的河面上竟然聚集了几十条船,给
本文对远动信道监测系统所涉及的关键技术进行了细致的研究。主要有基于交流采样原理的电平算法;基于过零点周期检测法的频率测量方法;在电平测量和频率测量中使用的数字滤波技术,以及本监测系统使用的网络协议栈等。本课题设计的电力远动信道监测系统采用“嵌入式Internet”技术、数字信号处理技术、数据采集技术等先进技术,实现对电力远动信道的实时监测。系统可以采集16路远动信号的电平和频率,并完成对其的测量。
随着无线通信的飞速发展,无线频谱的需求量正在急剧增加。目前静态频谱分配方式凸现出来频谱效率低下的弊端,使得学术界和工业界都纷纷开始探索新的频谱管理方式。认知无线电
分布式MIMO系统综合了MIMO系统和分布式天线系统的优点,在不增加带宽的前提下,可以成倍地提高系统容量。前人对于一定天线分布方式下,分布式MIMO系统的性能已经做了较多的研究,但
近年来,数字视频的应用表现出迅猛的发展趋势。在数字视频系统中,数字视频的采集、编码、传输、解码等过程中会不可避免地引入各种噪声,噪声的存在不但严重影响了视频的主观