基于星型模式的top-k join算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xiaomayc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
top-k join查询返回用户最感兴趣的k个连接结果。近来top-k join已经成为一个重要的研究课题,其在Web数据库,信息抽取和数据挖掘中均有应用。星型模式的数据仓库在实际应用中也存在top-k join查询,如有时决策者只想查询星型连接结果中他最感兴趣的k个。然而,现有top-k join算法不适合星型模式。为了在星型模式上有效地支持top-k join查询,本文提出两种索引并基于这两种索引提出一个适用于星型模式的多路top-k join算法MTJS。该算法通过采用一个比现有算法更优的上界和一个剪枝策略获得了更高的效率。此外,实验也表明该算法比现有算法效率更高。获取精确的top-k join查询结果的代价是较高的,而且有时决策者希望牺牲top-k join查询结果的精确性来缩短查询的执行时间和资源消耗。更重要的是,我们发现现有的近似top-k join算法因没有充分考虑星型模式的固有特点而不适合星型模式,因而本文提出一个基于星型模式的近似多路top-k join算法MTJS? ?。MTJS ? ?是MTJS的一个变种算法,其通过引入一个参数ε来返回近似的top-k join结果。MTJS ? ?因使用了MTJS中的总上界和剪枝策略等优化,其性能优于现有近似的top-k join算法。此外,我们通过实验证明了MTJS ? ?的效率优于现有算法。而且还发现MTJS ? ?返回的结果的实际精确程度远远优于其近似度定义的精确程度。
其他文献
图像融合是信息融合中以图像为研究对象的分支,图像融合就是把多个不同模式的图像传感器获得的同一场景的多幅图像,或同一传感器在不同时刻或不同方式下获得的多幅图像合成一
社交是人类生活的本质需求之一。SNS(Social Networking Services,即社会性网络服务)平台是以分布式计算理论为基础,通过P2P(Peer-to-Peer,对等)技术构建的下一代基于个人的
天然气是目前主要的民用能源,其输送的可靠性直接影响着广大人民的切身利益。压缩机组作为天然气输送系统动力环节,其运行的可靠程度以及操作人员技术水平直接影响着整个系统的
网络基础设施的建设和视频编码技术的发展,催生了一系列的视频应用,包括视频电话、网络视频点播、高清电视广播等等。为了使视频编码的码流更好地适应各种网络环境和用户终端
信息时代的来临,使网络来到我们每个人的身边。而病毒、蠕虫、木马等恶意代码,也随着网络经济的蓬勃而迅猛发展。网络安全和人身安全对网民而言一样重要。恶意代码检测系统使
随着服务系统在现代服务业中的广泛应用,服务质量问题引起了人们越来越多地关注,服务质量监控与评价方法成了服务学研究的一个重点内容。服务质量功能展开(SQFD)是覆盖服务系
网络环境下说话人识别是指在互联网音频信息中查找出目标说话人的一种技术,在安全、刑侦等领域具有重要的实际应用价值。本文以搭建工程化的网络环境下说话人识别系统为目的,
随着互联网的发展,使用搜索引擎进行信息查找已经成为人们日常生活的一部分。人们只需要输入查询关键词,搜索引擎就可以将互联网上最匹配的网页链接返回给用户。但是搜索引擎
脑卒中为中老年人常见病和多发病,该病发病率高、致残率高、病死率高、治愈率低。在我国,每年大约有200万新发脑卒中病人,因脑卒中死亡人数约达150万人。存活者75%以上留有不
随着信息技术的飞速发展,桌面计算机系统已经广泛的应用于家庭、公司、政府机关与军队中。桌面计算机系统保存了越来越多对个人和公司具有不可估量价值的数据。但是通用操作