分布式数据的反skyline查询算法研究

被引量 : 0次 | 上传用户:falaong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
反skyline查询常用在数据挖掘和决策支持系统中,用于数据的多准则优化。但目前有关反skyline查询的研究仅限于集中式数据,分布式数据上的反skyline查询尚未有文献涉及。在现实应用中,基于更新成本、性能等考虑,数据经常是分散存放并通过网络互连的,现有的集中式算法无法满足分布式环境。本文将分布式数据上的反skyline查询作为研究重点,具体工作包括以下几个方面:(1)分析当前集中式数据集上的反skyline查询方法,设计了分布式数据集上的反skyline查询算法BBDRS。远程站点利用R树索引预计算反skyline点集的候选集和筛选集,并将其作为发往中央站点的数据摘要,一方面降低了总体反应延迟,另一方面避免发送全部数据,减少了大量的通信开销。(2)针对上述R树算法花费大量时间建立索引的问题,设计了分布式数据集上一种使用预排序的反skyline查询算法PDRS。该算法采用上述相同的通信策略,核心思想是将各数据点按与查询点的”距离”进行预排序,在避免建立索引的同时大大减少支配比较次数,节省了计算时间。在非很大规模数据上,PDRS性能较BBDRS好。(3)借鉴当前单数据流上的反skyline查询方法,设计了分布式数据流上的反skyline查询算法—DCDRS算法。客户端,利用DC树索引实时计算和维护当前窗口内最新的数据摘要信息;服务器端,则利用集中式算法计算最终结果。DCDRS算法能够正确并有效的解决分布式数据流环境下的反skyline查询问题。(4)设计并实现了分布式数据查询实验平台。该平台通过控制端的控制功能,实现了文中实验的自动化完成,避免了大量手工操作,在一定程度上保证了实验数据的真实性与精确性。本文对分布式数据反skyline查询算法进行的研究,在用户偏好、多条件决策系统以及数据挖掘中具有非常重要的现实意义。在数据存储越来越趋向于分布式的今天,本文的工作可以促进反skyline查询在分布式环境下的应用和发展。
其他文献
《全金元词》是金元词研究的重要参考文献,而全真道士词又是词学与道教研究两门学科的交点,其底本文字准确程度影响着相关研究的开展。《全金元词》中的王重阳词即为全真词的
微信作为在中国市场占有量极大的即时通信软件,与QQ、微博有着许多相似之处,都有娱乐大众、传递消息的功能。在数字媒体迅速发展的今天,媒介融合成为新媒体时代不可回避的问
《倾城之恋》书写的是所谓的"爱情"故事,然而本质上却是用"爱情"来揭示人生的苍凉。本文将通过分析白流苏和范柳原的个人状况与二人之间的关系来解读作品中建立在"飞扬"与"安
<正> 氰氟草酯系由陶氏益农公司研究开发的新颖乙酰辅酶A羧化酶抑制剂,用于稻田芽后除草。 1.理化性质 其通用名为cyhalofop-butyl(pa ISO,ANSI),商品名为Clincher,代号:XDE5
张中良在《论明代中期以来的三次启蒙主义思潮》一文中,对从明代中期到晚清的启蒙主义思潮,为什么步履维艰、三起三落,进行了较深入地剖析与探讨,发表了自己的独到见解,有参
本文以择偶配对的内婚性程度作为社会开放性的指标,使用中国综合社会调查2006年数据,通过对婚姻先赋性和自致性匹配在各历史时期变化的实证考察,评估不平等结构代际传递的过
<正>高考地理试题概况一、按地域类型分1.全国统一命题的省份黑龙江、吉林、辽宁、内蒙古、宁夏、甘肃、青海、新疆、西藏、贵州、云南、河北、河南、山西、陕西、湖北、湖南
目的采用高效液相色谱-四级杆-飞行时间串联质谱法(HPLC-Q-TOF-MS/MS)对雪峰虫草醇提取物的主要化学成分进行分析鉴定。方法超声法制备雪峰虫草醇提取物,月旭AQ-C18(250 mm×
2014年高考刚刚落下帷幕,今年各地的高考地理试卷情况如何?与以往相比有哪些异同和变化趋势?这些问题都是地理教师最为关注的焦点。本期专题策划特邀相炜地理研究室就这些问
中医学有着悠久的历史,是中国传统文化的重要组成部分。随着近些年来中西方文化交流的日益加深,中医英译在促进中国传统文化交流和传播中所起的作用越来越重要。《红楼梦》被