基于Berkeley DB的图像信息索引机制的设计与实现

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:bdwldy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网环境下,产生了大量的图像文件数据,为了提供这些图像文件信息的检索和分析,首先要解决检索过程中索引存储问题,而目前已有的图像文件信息检索引擎的检索效率和精确度都不高,已成为应用系统的瓶颈。本文在分析了基于文本的图像信息检索技术之后,重点对检索过程中的索引机制进行研究。基于文本的图像信息检索的索引机制的建立主要分为三个部分:索引关键字的提取、索引数据库的存储和检索结果排序。本文主要研究了这三个方面的内容,重点对前两个过程中相关数据结构和算法进行了研究和设计。关于关键字提取过程,研究了三种经典的分词词典机制,针对现有的分词词典机制中的结构构造复杂、分词效率不高的问题,提出一种改进的分词词典机制;在分析了开源的Berkeley DB基础上,为进一步提高索引数据的存储和检索效率,对Berkeley DB的索引机制进行了改进,设计出一种不分裂的桶分配机制,以减少分裂过程产生的昂贵开销。本文将数据库索引技术与图像信息检索技术进行融合,设计并实现了一个高效的索引机制,实验结果表明新索引机制提高了在大数据量存储情况下的图像信息检索效率。
其他文献
近年来,随着移动通信的快速发展,GSM网络运行的有效运维与管理,成为移动通信运营商的重要工作。GSM网络优化直接面对被管网络中的各种实体和资源。这些被管对象种类众多,性能
无人机航拍图像序列自动拼接是指将一组内容上相关的无人机航拍图像自动拼接为一幅能够更为全面描述场景内容的全景图像的过程。单幅的无人机航拍图像对应的地理场景区域通常
基因表达式编程(Gene Expession Programming)是由葡萄牙科学家F.Candida于2001年提出的一种新的基于基因型(genotype)和表现型(phenotype)的自适应进化算法,并成功的运用于
计算机电信集成技术(CTI)是计算机技术、通信技术与网络技术的融合,是一种非常活跃的技术。呼叫中心是CTI技术最典型的应用。呼叫中心是以电话接入为主的呼叫响应中心,能够更
近年来,随着IP网络和现代通信技术的迅速发展,VoIP技术作为传统的PSTN网络与IP网络的融合方案,在下一代网络(NGN)的发展中起着举足轻重的作用。中继网关作为连接PSTN网络与IP
网络的普及和广泛应用极大地方便了人们的日常工作和生活,与此同时各种网络攻击和网络犯罪活动也日益严重,网络的安全问题就显得尤为重要。入侵检测技术作为一种能主动探测攻
近年来,随着无线电体制的快速发展,传统的以硬件为主体的无线通信系统设计方法逐渐不能适应多模式的通信需求,软件无线电的思想应运而生。但由于理想的软件无线电系统在当前
随着网络技术的飞速发展,网络安全占据着越来越重要的地位,单纯的被动的静态安全防御策略已无法满足现实的需求了,而采用动态防御的入侵检测系统随着技术的发展逐渐显示出其
作为社会文化的组成部分,图书馆经历了从手工到自动化,从自动化到网络化再到数字化的发展过程。而迅速增长的文献量和全开放的阅览、外借模式引发了文献服务与文献管理之间的矛
本文以无线传感器网络为研究背景,主要研究在以数据为中心的存储策略(Data-Centric Storage,DCS)中如何高效利用传感器节点的有限能量进行数据查询的问题,设计了划分区域的DC