不确定数据聚集查询的分布式处理算法

被引量 : 0次 | 上传用户:jyk1987525
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不确定数据近年来受到广泛关注。在诸如经济、军事、物流、金融、电信等领域的具体应用中,数据的不确定性普遍存在。不确定数据管理技术,尤其是不确定查询技术的研究成为热点问题。目前不确定数据查询技术的相关研究涵盖了查询的语义,查询处理及优化等诸多方面。在不确定数据上进行的查询包括等值查询,区域查询等简单查询,以及Top-k,(k)NN,Skyline等基于排序的聚集查询。这些查询在诸如地理信息系统,移动对象跟踪查询以及定位等应用中有着非常重要的作用。不过目前为止多数不确定数据管理和查询技术都是在集中式数据库或数据流上进行的。事实上数据不确定性在传感器网络,分布式Web Server及P2P系统等分布式系统中广泛存在。从这些系统中收集所有数据进行集中式查询将带来巨大的通信开销、时间延迟和存储代价。同时,由于分布式系统的特殊性,大多数集中式不确定查询算法在分布式环境下并不适用。本文对三种在分布式系统应用中常见的不确定聚集查询:不确定最大(小)值查询、不确定Top-k查询和不确定kNN查询进行了研究,给出了三种聚集查询的形式化定义,分别提出了以减小分布式聚集查询通信开销为目标的过滤策略,并分别设计了支持这三种查询的数据存储和基于过滤策略的分布式聚集算法。这一系列算法的主要思想是根据概率计算和数据分布,将不可能成为最终查询结果的数据抛弃,并通过设计相应的机制保证查询结果的正确性。实验结果表明,在真实数据和生成的不确定数据上,以及多种系统环境下本文的过滤算法都能够正确地得到查询结果并显著降低系统的数据通信开销。
其他文献
女工权益保障水平受企业内在收益预期、内部制约与政府监管三方面影响,目前女工权益保障水平较低主要源于相关制度设计缺陷。因此,政府应鼓励企业职工成立"民间"工会组织,构
汉胜工业设备(上海)有限公司(本文简称HSIS公司)计量泵产品自从1993年进入中国市场以来,根据中国市场的特点,建立了自己独特的营销渠道和经销商体系,保持了很高的市场占有率,
研究背景与目的:SV40大T抗原是由SV40病毒早期编码区编码的一种多功能磷酸蛋白,在病毒复制过程中发挥着重要作用。SV40大T抗原具有活化宿主细胞核糖体基因、诱导DNA合成、修
肺炎支原体(Mycoplasma pneumonia,MP)是引起人类呼吸系统感染的重要病原之一。近年来研究分析,随着对非典型病原体感染认识的深入,MP不但引起呼吸系统炎症,且与许多人类的慢
随着经济的飞速发展以及改革开放政策的进一步深化,中国与世界各国的经济合作日益增多,对外联系和国际交流日趋频繁。中国正在加快融入全球一体化的步伐,并且逐渐受到来自世
政府出台的一系列支持、促进中小企业融资的政策和法规,为中小企业融资提供了更好的经济环境和制度保障。中小企业融资应从中小企业板市场、应收账款融资、资产支持商业票据
本论文设计合成了含硅聚电解质、超支化聚羧酸盐及其与纳米氧化锌复合物、超支化聚季胺盐等三种湿敏材料,采用1H-NMR、FT-IR、TGA、SEM、TEM、AFM等方法表征其组成和形貌结构
全球变暖、特大突发多样化的灾害事件频繁,生命财产损失惨重,使得自然灾害(以下简称:灾害)成为当代国际社会、学术界普遍关注的热点问题。在致灾因子论盛行后,灾害的风险研究
近年来,教师教育改革取得了极大成就,但同样也面临着一些困境。困境突出体现在,受到工具理性主义的影响,我们对教师教育的立场存在着模糊与误解,执着于技术理性取向的教师教
本文利用2002年和2007年的投入产出表资料,对我国旅游业的产业特征、经济效益和产业关联情况进行了分析。结果表明:旅游业是典型的劳动密集、最终消费型产业,对固定资产和出