面向大规模异构数据的哈希表征学习研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:zhqr1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着异构数据的快速增长,异构数据间的检索出现效率瓶颈。本文提出引入哈希这种简单的表征形式来加速异构数据间的检索。然而,传统哈希方法无法对异构数据的异构性建模,因此,无法应用于异构数据检索。本文针对异构数据的三个异构性(包括数据特征的异构性,数据对象的异构性以及数据网络的异构性)提出了相应的哈希学习框架,从而实现了异构数据上高效而精准的相似检索。本文的主要贡献如下:1.提出面向异构特征的哈希学习:针对属性特征高维稀疏及二值的特性和内容特征连续低维稠密的特性,本文提出了两个定制的概率生成模型分别对两种不同的特征建模,从而,充分地融合了两种特征的信息,使得哈希方法的精度得到显著提升。2.提出面向异构对象的哈希学习:本文提出了基于关联的异构哈希方法(Ra HH),实现了跨数据域的高效相似检索。Ra HH将不同数据域分别映射到不同的汉明空间,并基于异构关联关系学习汉明空间之间的映射。从而既保持了不同数据域的特性,又实现了跨数据域的检索。3.提出面向异构网络的哈希学习:本文主要关注关系不可传递的网络和有向网络。本文分别提出了基于相似成份的哈希学习方法及保持高阶相似度的哈希学习方法,对两种网络进行了合理建模,从而实现了异构网络数据上的高效相似检索。
其他文献
<正> 摄影,已成为本世纪科学上许多重大发现的一个无声伴侣。在开拓人类的知识方面,从亚原子微粒到宇宙星系,其贡献并不亚于数学和测量。随着摄影在自然科学、社会科学、社会
为对美国静力学教材有较为全面的理解,以便于在教学和教材建设中参考借鉴,本文研究这些教材的历史发展与现状。概述美国静力学教材的起源与演变。选择有代表性的7本仍在使用
从品牌服装文化的内涵、内容及重要性的分析入手,着重从品牌名称的确定、服装设计的个性化、店面装修风格以及产品外包装四个方面探讨文化内涵的成功体现.针对国内品牌服装设
政策执行是政策循环中的关键阶段,是实现公共政策目标的基本途径。而政策执行的核心就在于如何选择和设计有效的政策工具。作为政府政策工具和政策执行环节的政策宣传,直接影
埃博拉病毒(EBOV)于1976年在恩扎拉(苏丹)和扎伊尔(现刚果民主共和国)同时暴发的两起疫情中被首次发现,并以后者所在的埃博拉河而得名。EBOV因流行性强和致死率高被认为是目
在农民工政治参与研究中,大部分文献关注农民工的制度环境和工作环境,很少有文献关注作为参与主体的农民工自身的现状。这种强调外部世界的研究路径忽视了对作为政治参与主体
通过对园林植物配置的分析,探讨在环境的影响下园林植物与人的心理发生的作用以及在安全性、实用性、宜人性、私密性、公共性等方面,园林植物与环境的如何合理配置,才能恰到
给出了一种小型飞行器定位误差修正方法。由飞行器运动方程 ,推导出了斜距和飞行状态之间的关系。根据所测得的飞行状态 ,利用 Kalman滤波方法可得斜距估计。根据实测值、最
针对一起电气线路短路引发的出租屋火灾事故的调查,探讨了火灾现场勘验、调查询问、技术鉴定等环节对认定火灾原因的重要性,并阐述了做好火灾善后工作及出租屋消防管理工作的
论文基于云存储概念,首先具体分析了云存储系统构架模式、典型拓扑结构、技术优势及特点,并与传统的存储架构模式进行了对比,然后提出了一种基于云计算的新的存储策略。新的