论文部分内容阅读
随着互联网和数字多媒体技术的高速发展,社交平台和即时通信软件的迅速普及,图片、视频等多媒体数据出现爆炸式增长,这些数据普遍具有高维度和海量的特点。目前,云计算或大数据研究领域对这些数据处理技术的研究也正如火如荼地进行。研究如何管理这种海量高维数据库,并能同时在数据库中快速地查询到所需数据十分重要。对数据建立索引结构,然后在这些高维索引中研究有效的查询技术是其中一种解决方案。传统的索引方案在面临高维且海量数据时都会表现出一系列问题:树形结构索引有“维度灾难”问题;降维类索引会出现信息丢失;哈希类索引设计出优秀的哈希函数比较困难。基于小世界网络的高维索引技术是针对这些问题的一个有效解决方案,能够应用于高维海量数据检索,具有广阔的研究和发展前景。本文将增长网络模型应用于高维索引技术的研究与优化中,主要研究内容分为两部分:(1)基于增长网络的索引结构及生成算法优化。在深入研究小世界基本理论及增长网络模型、传统高维索引技术以及原有基于小世界网络的索引技术的基础上,提出基于增长网络模型的索引结构模型,同时理论分析该索引结构的基本特征参数,证明该索引模型具有小世界特性;其次,基于增长网络模型提出新的索引生成算法,该算法具有更低的时间复杂度,并且实现更简单。通过实验验证该索引结构模型及相应索引生成算法不仅高效,还具有与原有索引模型相似的查询性能。(2)基于增长网络的高维索引更新维护研究。在研究原有基于小世界网络的索引技术更新维护算法和其他高维索引技术的更新维护算法的基础上,本文借鉴增长网络模型,提出高效的插入和删除节点后索引的更新和维护算法。本文算法包括插入或删除一个或多个节点后,索引的更新操作,并确保插入或删除节点后索引可以继续维持小世界特性及算法的收敛性。实验结果表明,本文提出的基于增长网络的高维索引技术相较于原有基于小世界模型的索引技术具有更好的索引生成性能,同时提出的更新维护算法确保了该索引技术是动态的。