基于混合处理模型的乱序数据流分布式聚合查询处理技术

来源 :广西科学 | 被引量 : 0次 | 上传用户:xiuxiumumu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决现有的乱序数据流聚合查询处理技术不能在降低查询处理延迟,同时保障聚合查询结果的最终正确性的局限性问题,本研究设计了混合嵌入分布式流处理模块和分布式批处理模块的乱序数据流分布式聚合查询处理技术.该技术一方面基于用户给定的结果质量,限制自适应地优化流处理模块所用的缓冲区大小,从而尽可能降低流处理的查询处理延迟;另一方面基于备份于分布式数据存储系统的历史流数据,并以批处理的方式实现对极其晚到流元组的查询处理,从而保障聚合查询结果的最终正确性.基于真实的乱序数据流数据集对该技术进行测试分析表明:该技术在平均查询处理时延、查询结果精度和系统可扩展性方面,比目前最好的基于缓存的乱序数据流处理技术均具有显著优势.“,”The existing out-of-order data stream aggregation query processing techniques cannot guarantee the final correctness of the aggregated query result while reducing the query processing delay. In order to solve this limitation,this paper designs a distributed aggregation query processing technique for out-of-order data streams based on both of the distributed streaming processing model and the distributed batch processing model. The proposed technique on one hand optimizes the buffer sizes used by the distributed streaming processing model based on a user-given constraint on query result quality,thereby minimizing the query processing delay of the stream processing as much as possible. And on the other hand,based on the historical stream data backed up in the distributed data storage system and in batch processing mode,the query processing of the extremely late tuples is realized,so as to ensure the final precision of the aggregated query results. The test analysis based on the real out-of-order data stream dataset shows that compared with the current best cache-based out-of-order data stream processing technique,the proposed technique has significant advantages in average query processing delay,query result precision and system scalability.
其他文献
我国内地股票市场发展至今在广度和深度等各方面都取得了很大进步,但仍暴露出一系列问题,尤其是在市场估值有效性方面。本文从与香港股票市场的比较入手,试图对内地股票市场估值
前不久,中央电视台播出的电视连续剧《当关》让人深思警醒。该剧围绕着腐败与反腐败的斗争,真实地反映了在市场经济新形势下,加强党风廉政建设,加强干部队伍建设的重要性、
目的 探讨中西医结合治疗糖尿病周围神经病变的临床疗效.方法 将120 例随机分为治疗组60 例和对照组60 例.治疗组予常规治疗加中药方剂加减治疗; 对照组采用常规治疗加肌内注
在我国,随着社会经济的发展和人民生活水平的提高,解决了温饱问题的公众对公共服务的需求呈现出不断增长的趋势。公众不仅对公共服务的种类和数量要求越来越多,而且对公共服务的
期刊
2006年12月26日发生的台湾地震造成海底光缆断裂,使得中国大陆地区联系外部的网络发生错乱:MSN拒绝登录,服务器在国外的网站大多无法使用……对于天灾人祸造成的损失,人们很
科技资源现已成为社会经济发展的第一资源,为了在科技竞争中立于不败之地,世界各国都越来越重视科技资源并不断加大对其投入。然而,资源是稀缺的,一定的科技资源因配置方式不同会产生不同的投入产出。在这种背景下,科技资源的优化配置成为各国、各地区所共同追求的目标。科研基地是各种科技资源集中的场所,是各国自主创新能力建设的核心,是国家创新体系建设的重要组成部分。行业科研基地是指全社会范围内研究领域属于同一行业
现实生活中,有极个别领导干部,为了个人的升迁和荣誉,特别重视提高自己的“知名度”,在任职期间急功近利,大搞“闪光点”。有的急于树立自己“有魄力”、“能办事”的形象,
目的 讨论滴虫、霉菌阴道炎分布规律及影响因素.方法 收集2011 年10 月~2012 年10 月,在我院妇科就诊女性随机抽取1200例进行研究.分别对受检时间内,患者四季内检出变化进行
质量社会共治是提高微观产品质量和宏观经济发展质量的新兴管理模式。它在质量学术界的兴起表明新的质量管理格局正在形成,原有的针对某一微观主体建立的质量管理科学体系已无法对新的质量现象做出科学解释,因此需要提出新的质量科学范式——质量治理。本文基于对质量管理理论、质量管理阶段演化和质量治理(方法、行业、主体)的文献研究,证明质量治理问题具有一定的研究基础,并且具有现实性和必要性。通过对社会治理和公司治理