论文部分内容阅读
随着多媒体技术在网络和人们生活中的广泛应用,近年来,多媒体数据库管理系统(MMDBMS)方面的研究倍受关注。多媒体类型繁多,结构复杂,语义丰富。当前已有的MMDBMS 缺乏对各种媒体类型的统一管理和有效的语义检索。因此,设计一种支持各种媒体类型、面向多种媒体应用的通用多媒体数据库模型,并研究多媒体高级语义存储、管理和检索方法,具有重要意义。
重点研究了通用的多媒体数据库数据模型,并围绕该数据模型,研究对应的存储策略和查询方法(特别是高级语义上的智能查询方法),构建了原型系统。在总结通用多媒体数据库模型的要求,分析多媒体内容描述接口MPEG-7 优缺点的基础上,提出了一个基于MPEG-7的、支持多种媒体类型(包括音视频、图像、图形、文字及混合多媒体数据等)的通用多媒体数据库数据模型G3M,给出其形式化定义。当前已有的MPEG-7多媒体数据库(MMDB)方案存在的主要问题是:缺乏对元数据的有效利用,并缺乏对MPEG-7的先天缺陷——无规范化描述基础的解决方案。G3M 充分利用了MPEG-7 元数据信息,采用抽象分层思想,对多媒体数据分别从常规属性、段结构、低级特征、时空语义、高级语义等层面进行不同粒度的描述。同时,G3M模型支持知识本体的引入,建立本体与多媒体模式及实例之间的关联,不仅有效解决了描述缺乏规范的问题,而且增强了G3M模型中高级语义表达能力。通过分析G3M 对通用多媒体数据库模型要求的满足程度,从多方面验证了G3M模型的通用性。领域知识的加入,使得G3M能更好地为专用领域和应用服务。为了有效支持G3M模型的逻辑设计,对比当前已有的XML数据库方案和支持MPEG-7的MMDB 存储方案,提出一种动态的、基于混合SQL+XML 存储的G3M存储方案。G3M根据用户对多媒体不同层面的关注度,设计动态的存储方案,关注度高则细粒度存储。同时,分析MPEG-7 描述特征,对其中不同数据类型分别定制它们合适的存储方式。为多媒体本体定制了一组关系模式,也采用混合存储方式,以便有效的支持基于本体的查询推理。实验证明G3M 存储策略在语义剪枝查询、组合查询、数据规模化等方面综合效率优于DB2上的纯XML 存储方案和关系分解存储方案SM3+。
在查询方法方面,重点研究了带MPEG-7路径的Xquery 查询和基于本体的高级语义查询。用户无需了解G3M模式细节,直接输入Xquery 语句,系统自动实现Xquery 语句向G3M模式查询的等价转换,从而保证了本模型与其他支持MPEG-7的多媒体系统间的互操作性。在高级语义查询方面,重点实现传统关系数据库管理系统上基于本体的检索,将知识概念、属性、关系和规则运用于G3M 高级语义抽象描述和隐含语义提取,利用对用户透明的查询重写手段,有效增强了G3M的语义表达和检索能力。
设计并搭建了一个原型系统,后台在IBM DB2 V9上,增加了G3M模式生成部件、混合语法分析部件、知识本体查询重写部件和个性化处理部件,用来模拟G3M服务器;前台设计并部分实现了一个面向用户的个性化多媒体建模和检索工具,支持用户偏好设置、用户背景知识的引入、G3M 动态建模及基于本体的个性化语义检索。将上述涉及到的建模、存储、高级语义查询等各方面的技术均体现在该系统中,为通用多媒体数据库模型建模及语义查询研究提供了统一的实验平台。