面向内容语义相似性查询的图像存储系统元数据组织方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wqsemail
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据量及其内容复杂性的急速增长,存储系统作为海量异构数据的后端变得愈加难以管理。其中,查询操作作为管理和分析数据的重要方式面临着前所未有的挑战。存储系统中大量的查询操作是通过元数据完成的。当今存储系统中广泛使用的目录树结构和简单的元数据不能满足基于内容的语义查询的要求,即用户无法通过文件内容本身的相似程度进行有效地查询,从而限制了存储系统的功能以及数据管理与分析的能力。面对上述问题,提出一种新的语义元数据组织方式SwiftGraph用于支持存储系统快速且相对准确的语义查询。该方式能够适用于大数据场景和应用。SwiftGraph首先通过深度哈希算法提取得到存储系统中文件或者对象的二值定长语义哈希码,以此作为元数据使用基于图的数据结构进行组织,使得语义相似的文件在元数据图结构上被聚集到邻近区域。SwiftGraph支持两种语义查询操作:语义范围查询和语义top-k查询。SwiftGraph实现于开源的云存储系统上,并且SwiftGraph作为一种中间件,可以以独立分支的形式应用于任何的文件系统和存储系统中,不会影响系统本身的元数据组织结构和功能。在三种不同的图像数据集上对该系统进了测试,测试结果表明,SwiftGraph不但能够获取内容语义表达准确的元数据,而且相比于树形元数据结构可以显著降低基于语义的查询开销。另外,虽然SwiftGraph带来了额外的时间和空间开销,但实验测试结果表明这些开销对系统性能的影响较小。同时,在大规模数据集场景下,数据量的扩增对查询时间的影响很小,表明了SwiftGraph针对数据增长具有较强的适应性和可扩展性。总体来讲,SwiftGraph不仅是一种通过语义元数据来支持图像存储系统中内容语义查询的方法,同时也为存储系统的智能化服务和大数据分析提供了一种有效可行的方案。
其他文献
<正> 一、引言自90年代中国市场进入买方市场以来,"顾客满意度"就大行其道,成了企业经营中最基本的战略。研究发现,顾客满意(CS)是企业成功的重要因素。一个高度满意的客户往
目的研究妊娠高血压疾病孕妇护理中循证护理的应用效果。方法选取144例妊娠高血压疾病孕妇,按照随机数表法分成观察组和对照组,每组72例,对照组采用常规的护理方式,观察组采
党的各项民生政策的贯彻与落实需要建立在对财政资金的有序管理基础之上,只有对财政资金进行科学、高效的管理,才能够保障各项公共建设支出能够为广大人民群众所用。随着我国
“中国制造2025”计划的提出极大地促进了我国制造业对高新技术的应用,而云制造便是以云计算、物联网等多种新兴技术为基础的一种制造新模式。借助云制造平台,分布在各地的制
<正>每门艺术都有自己独特的语言表达方式,能否把握住这种独特的方式并加以充分地发挥,往往是艺术作品成败的关键。在快节奏的现代生活中,要尽可能快捷地向人们传递设计的信
<正>没有亲手制造一件奢华产品,但伯纳德·阿诺特却得心应手地控制着全球奢侈物品的半壁江山;没有亲自打造一个豪华品牌,但伯纳德·阿诺特却怡然自得地占领着国际顶级品牌的
环状化合物因其独特的化学结构以及特殊的化学性质被广泛应用于分子识别、分子络合、主客体化学、超分子化学、自组装微纳米材料等领域。自1967年Charles Pedersen首次获得人
<正>金秋时节,在黑龙江省宝泉岭农场一望无际的水稻田中,记者看到,不同颜色的水稻"种"出了"中国粮食中国饭碗" 8个醒目的大字。这背后,蕴含的是从"北大荒"到"北大仓"、沉寂的
目的:探讨如何提高穿刺成功率及减轻病人穿刺过程中的疼痛.方法:抽取2008-06~12本科接受输液治疗且符合标准的患者720例,每人接受观察组和对照组穿刺各两次,共接受静脉穿刺2880