基于动态聚类的序列保持哈希算法的研究

来源 :山东理工大学 | 被引量 : 0次 | 上传用户:teamworkhlc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的高速发展引起了数据的爆炸式增长,使得检索复杂度高,为解决这一难题,基于哈希的图像检索方法将高维数据映射为紧凑的二进制编码,利用检索速度较快的汉明距离做相似性计算。虽然哈希方法在降低内存、提高检索速度等方面表现优异,但是其检索准确率相对较低。为了提高哈希算法的近邻检索准确率,本文将从如何获得较低量化损失和提高排名靠前数据点相似性两个方面展开研究,其主要研究内容和创新成果如下:1.提出了迭代自组织哈希算法,使用乘积量化方法划分特征空间,在每个子空间中使用迭代自组织数据分析方法对子数据集进行聚类,并利用码字索引之间的汉明距离近似其欧氏距离。为解决随机初始化聚类中心引起的局部最优问题,提出最远平均距离方法,通过依次划分样本数多且方差大的类,来确定初始聚类中心点。因分裂阈值和合并阈值需要通过交叉验证获得,引入最小生成树来获取合并阈值,通过计算每类分量中标准差的最大值得到分裂阈值。最后,为解决固定编码长度表示范围有限的问题,构建了多重编码机制,为每个数据分配多重二进制编码。2.提出了顶部优化的序列约束哈希算法,旨在汉明空间中保持数据间的四次序列关系,由于通过比较的方式获得的排序元组复杂度太高,引入张量积来构建数据间的序列关系图。因训练数据集规模较大,使用全部数据点来构建上述序列关系图,其内存占用率太高。为了降低空间复杂度,采用迭代自组织数据分析方法缩小数据集规模,并利用聚类中心点之间的序列关系近似整个数据集的序列关系。为了提高返回结果中排名靠前的数据点的准确率,建立了惩罚机制,对排名靠前的错误排序的惩罚大于排名靠后的惩罚,并根据数据点在欧氏空间和汉明空间中的排序差值,对其给予不同的权重值,排序差值越大,权重值越大,反之,权重值越小。在SIFT、GIST和CIFAR10数据集上设置了近邻检索对比实验,实验结果表明,迭代自组织哈希算法使用迭代自组织数据分析方法划分特征空间,可有效降低量化误差;顶部优化序列哈希设置的惩罚机制可显著提高排序列表顶部数据的相似性。大量实验证明,两种算法均有效提升了近邻检索性能。
其他文献
中国有着几千年的陶瓷历史,陶瓷艺术随着社会的发展而演变,以其特有的物质形态呈现着中华文明的发展历程。陶瓷一直以来都是中国传统文化的象征,随着国家经济的发展,人们文化素养的提高,人们对生活的品质的要求也越来越高,也更讲究,有物质和精神层面两种需求,并有偏向于精神层面的趋势。礼品瓷承载的不仅仅是一种传统技艺,更是一种社会文化现象。弘扬母爱,是中国的传统文化,也是中华民族的传统美德。传统节日是中华民族共
图像分割是指根据图像自身特征(如强度、纹理、对比度等),将图像分割成不重叠感兴趣区域的技术。目前图像分割技术已经应用于各种图像如地形图像、卫星图像、医学图像等。在
“看病难”是我国医疗卫生服务体系长期以来面难的难题之一,为进一步优化就医流程、缓解就诊时“三长一短”的现象、改善就医体验,通过移动医疗,打破医院围墙的阻隔,在诊前、
移动自组网具有网络自动组织、自动愈合、多跳传输、支持高速移动等特点。移动自组网在军事,无线传感网,农业灌溉,应急通信,无人机,车联网等领域有广泛的使用前景。移动自组
内蒙古达茂旗乌兰陶勒盖铜镍矿床位于华北地块与华北地块北部边缘增生带的结合部位偏华北地块一侧,属华北地块北缘金、银、铜、铅锌、铂、钼、硼、石墨、滑石成矿区之黄花滩-小南山铜、镍、铂成矿带,是内蒙古自治区地质测绘院近年来发现的一处中型铜镍矿床。区内共圈定工业铜镍矿体4条,编号为Ⅰ、Ⅱ、Ⅲ、Ⅳ,其中Ⅰ号铜镍矿体规模较大,为矿区主矿体。矿体赋存于角闪石岩(脉)中,其产状和形态严格受岩脉控制。矿体呈不规则弧
水貂阿留申病病毒(Aleutian mink disease virus,AMDV)引起的水貂浆细胞增多症对动物毛皮产业的发展构成威胁。中和抗AMDV抗体能够导致持续感染,但是不能抵抗AMDV强毒攻击。迄今为止,尚未制定预防或治愈这种疾病的具体方法。为了消除水貂的浆细胞增多症,抗体检测技术筛选AMDV阳性水貂已被广泛应用。本实验旨在摆脱繁琐的提纯工艺和昂贵的成本制备出重组蛋白抗原,为AMD的检测和
永磁同步直线电机(Permanent Magnet Synchronous Linear Motor,PMSLM)伺服系统由于其响应速度快、功率损耗小、高可靠性、行程不受限制等一系列优点,被广泛应用于增材制造、
由于我国城市化进程不断加快和人口的大规模迁移,越来越多的农村剩余劳动力由农村转移到城市,部分家长会选择把孩子带到身边照顾,这就形成了一个庞大的流动儿童群体。流动儿
光响应材料是指吸收光能之后,可以在分子内产生化学变化或者物理变化的一类智能材料。加之光能在瞬时性、远程可控性、环保性等多方面性能中表现优异,使得光响应性材料受到了更多的关注。随着现代社会的不断进步与发展,这类材料将逐渐成为我们日常生活中的主导材料,因而研究和开发新型光响应材料具有重大意义。四面体烷及其同分异构体环丁二烯一直深受理论化学家与实验化学家的关注。除了其独特的成键性能之外,它们还可以通过光
无源互调是无线通信系统中由于无源器件的非线性产生的信号干扰。随着无线通信系统的发展,系统正实现对高灵敏度高测试标准的提升,而它对系统工作效率及通信质量造成的隐患也