论文部分内容阅读
随着多媒体技术的广泛应用,主要处理常规数据的不确定数据查询技术和个性化检索技术已无法满足多媒体应用的要求。因此,利用分布式数据处理和个性化查询处理技术提高海量不确定多媒体数据查询效率、满足用户个性化检索需求,进而实现一个不确定多媒体数据个性化查询处理系统具有重要的意义。对不确定多媒体数据个性化查询处理系统的功能和性能要求进行了分析,设计了系统的总体结构,给出了不确定多媒体数据个性化查询处理模型UG3M-UP。UG3M-UP模型以通用多媒体数据库模型(G3M)为基础,按照抽象分层的思想对不确定多媒体数据进行不同层面的描述,支持嵌套的、任意粒度的不确定性;建立了以领域知识为基础,采用混合反馈策略的用户个性化检索模型;采用SQL+XML的混合存储方案,实现了不确定多媒体数据和用户偏好信息的存储。实现技术方面,支持用户偏好的自动获取、隐式显式更新和领域知识管理,提供针对不确定多媒体数据创建信息、领域知识信息等高层语义信息的查询,设计并实现了集中式环境和分布式环境下的个性化查询处理算法。集中式算法以R树索引为基础,采用skyline的思想和最好优先的贪心策略;分布式算法以集中式算法为基础,采用分治的设计思想,能够适应不同的网络状况。实验结果表明,系统算法的查全率和查准率明显优于普通数据库查询;同Gui等提出的线性I/O skyline算法相比,集中式算法的性能更优异;分布式算法与集中式算法相比在大数据量时性能有较大的提升。所给出的模型和查询处理算法能够较好的满足用户的不确定多媒体数据个性化查询处理需求。