一种基于LSH面向二元混合类型数据的相似性查询方法

来源 :计算机学报 | 被引量 : 0次 | 上传用户:fugoolisk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
局部敏感哈希方法(LSH)已经被广泛用于高维数据和大规模数据集的最近邻查询,然而现有方法大多将LSH方法用于单一类型的数据,文中尝试将LSH方法用于二元混合类型数据,如图像-文本数据,空间-文本数据等.文中提出了一种基于LSH混合索引结构的相似性查询方法,该方法可有效地管理含两种数据类型的数据,并且融合两种数据类型的相似性进行最近邻查询.文中提出的查询方法主要有三个特点:首先,结合LSH方法为混合数据构建混合哈希值,该混合哈希值保留有数据对象之间内容相似性的信息,基于混合哈希值构建哈希索引,进行快速准确的
其他文献
评价对象-情感词对是情感词及其所修饰评价对象的组合,评价对象-情感词对的识别是细粒度情感分析的一个原子任务和关键任务.现有的研究大多集中在商品评论上,随着金融大数据
集成电路数字电压表具有结构轻巧精度高的特点,已在科技和工业各领域大量应用。由于日积月累的故障不断出现,维修工作亦显得日益重要。本文以 PF5型数字表为例,结合多年的维
1.前言目前,大多数色谱分析所能得到的是二维色谱图。从谱图上测定的峰高或峰面积是定量分析的依据,但应用谱图进行定性分析的研究则很少。因此,虽然不够充分,往往也只能凭保
本文提出了在光谱照相法的测光和数据处理中,采用PC286微机半自动测光处理系统法。显示了半自动测光系统在光谱分析的测光应用中的实用价值,提供了几组对比数据及曲线图表。
本文探讨了在常温条件下采用高效液相色谱(HPLC)法分离测定食品饮料中的糖分。选用Carbohydrate Analysis柱,乙腈/水作流动相,分离测定了保健品等食品饮料中的鼠李糖、果糖、
本文描述了高效液相色谱分离测定糙米粉中的水溶性和脂溶性的方法。水溶性维生素的分离用μBondapak C18作分离柱,以甲醇与含有Pic B6,冰醋酸和三乙胺的水作流动相。脂溶性维
输入向量敏感性的计算在电路的高可靠设计过程中有着重要的实际意义,尤其是针对有着特定应用场景的电路产品.该文以概率转移矩阵模型为主要技术手段,首先简要分析了输入向量对
在临床和法庭毒物学领域,广泛范围药物筛选是一项非常重要而又常被忽视的工作。这项工作的侧重点是所有毒物学相关的物质,无论其结构或极性如何,都能被分离、检测和鉴定。近
本文通过对三角异形有光POY色丝研制工艺的探索,着重讨论了干燥结晶温度、熔体温度、侧吹风等因素对纺丝的影响。
本文介绍了一种用于测定合成色素(胭脂红、苋菜红、柠檬黄、日落黄、靛兰、亮兰)、甜味剂(糖精纳)和防腐剂(苯甲酸钠、山梨酸钾)等碳酸饮料中常用的添加剂的反相高压液相色谱