海量多媒体数据库的高效查询处理

来源 :浙江大学 | 被引量 : 0次 | 上传用户:fat1984yy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体和网络技术的迅猛发展,互联网已经形成了一个巨大而复杂的多媒体信息空间。其所包含的海量多媒体信息资源具有以下的特点:1)数量巨大,增长迅速;2)内容丰富,形式多样;3)结构复杂,分布广泛;4)无序混乱,杂乱无章。面对这些互联网中浩翰的多媒体信息资源,如何对其进行快速准确地检索及高效地处理已经成为一个很重要的研究课题。本论文以数字图书馆作为目标应用,面向海量多媒体数据,提出并解决了海量数据高效查询处理的一系列问题。对海量高维多媒体信息的索引及查询技术进行深度和广度上的研究,重点解决了以下5个方面的问题:●针对海量高维多媒体数据查询存在的“维数灾难”的问题,提出两种高维索引方法,即基于复合距离转换的高维索引(CDT)方法和基于编码的双距离树索引(EDD-Tree)方法,以提高海量多媒体检索效率;●针对书法字数据特点,分别提出基于局部距离图(PDM)的交互式书法字索引方法及基于混合距离树(HD-Tree)的书法字索引方法;●针对在单机环境下,海量多媒体数据查询性能低下的问题,进一步提出了基于数据网格的可扩展并行查询技术。该技术包括优化海量数据在网格结点中的分布、基于索引的快速高维数据集的缩减、并行流水线处理及高效的数据传输机制。理论和实验表明该技术能显著提高相似查询效率;●针对频繁的用户查询请求,提出基于网格环境的高维相似查询的多重查询优化技术,进一步提高在查询密集条件下海量多媒体检索的并发性;●针对海量跨媒体检索的特点,提出一种跨媒体数据的统一索引框架——CIndex。需要特别指出的是,目前国际国内学术界对海量跨媒体检索与索引的研究工作刚刚起步,相关研究还几乎没有。本文对该问题进行了系统而深入的研究,提出针对跨媒体检索与索引的一系列方法和理论成果,具有很大的理论和实际意义;
其他文献
高血压对人群健康造成的严重危害已成为世界范围内重大公共卫生问题,目前也是我国患病率最高的心血管疾病。而在高血压的控制与管理过程中患者服药依从性发挥着举足轻重的作
空间关系主要包括拓扑关系、方向关系、距离关系等3类,是GIS学科中的重要理论问题之一。它们的研究内容又可细分为空间关系描述和空间关系推理。以往的研究集中在二维空间关系
教育使人富有教育使人高贵像洪泽湖一样钟灵毓秀,像洪泽湖一样宽广博大,江苏省洪泽中学如一颗明珠,镶嵌在洪泽湖畔。学校始建于1956年,是江苏省首批重点中学,四星级高中。在
一日三餐的就餐习惯,好像是约定俗成的,但实际上,如果你超过5 h不吃任何东西,就会饿得失去控制,反而顾不得健康目标和营养观念,看到什么就吃,无法抵抗食物的诱惑.
人物教学是初中历史教学的核心组成部分。在教学实践中基于正确的观点和科学的方法,让人物教学达到完善学生道德人格、提高思维能力,是历史老师的必备素质,现针对这个问题发
<正> “神舟”五号载人飞船在太空飞行14圈、21小时,远超前苏联首次载人飞行108分钟、美国首次载人飞行15分钟的纪录。据查证,美国发射第8次载人飞船时才飞了6圈、9小时,第9
<正>非酮症高血糖性舞蹈病是一组以非酮症性高血糖、偏侧舞蹈症及头颅MRI T1WI对侧基底节区高信号为特点的综合征[1]。由于对这一综合征认识较少,临床上常导致误诊。现将本院
心源性心脏骤停是循环突然完全停止的一种临终前状态,为心脏急症中最严重的情况,是当今对人类危害最大的疾病之一[1]。随着医学技术的发展,目前急诊复苏技术得到了广泛的进步
多词表达是自然语言处理中的难点,它是一种由若干词汇组成的语义单元,但其句法与语义属性并不能显式地由其构成词汇给出。经典的自然语言处理系统通常假设每个词汇为一个语义单