【摘 要】
:
在连续的数据流上提供查询的应答对很多应用环境来说是一个极为重要的需求.本文主要探索了如何使用有限的内存在数据流上进行聚集SQL查询,以获得近似的结果.使用随机草图技术
【机 构】
:
复旦大学计算机科学与工程系,广东商学院
论文部分内容阅读
在连续的数据流上提供查询的应答对很多应用环境来说是一个极为重要的需求.本文主要探索了如何使用有限的内存在数据流上进行聚集SQL查询,以获得近似的结果.使用随机草图技术,计算非常小的数据流草图,以获得聚集查询的近似结果,并保证误差能在一定的范围之内.并讨论了在草图方法中如何利用已有的直方图统计信息来提高应答的质量.其关键的思想就是对属性域进行智能化的划分,分解草图化问题,确保所获得查询的结果具有合适的近似精度.不论从理论还是实验上都可以证明草图提供的聚集查询结果比传统的直方图更有效、更精确.
其他文献
详细分析了宁夏宁东煤田积家井矿区延安组含煤地层沉积特征:岩性组合、可采煤层、厚度变化、沉积构造、物性特征、含煤系数等。区内延安组含煤地层平均厚度400 m左右,可采煤层
为了进一步改善矿区地表水环境质量,针对污水排放特点,研究确定耐冲击负荷强的污水处理技术,提出了采用CAST工艺处理以煤矿生活污水为主,同时收集处理达标排放的工业废水,并
颅脑损伤是神经外科常见疾病之一。老年性颅脑损伤占神经外科各年龄组颅脑损伤的10%~15%。我院从1994年2月至1998年3月收治的老年性颅脑损伤70例。加强护理,有助于提高临床治疗的质量。1临床资料本
介绍了电加热柱形原煤自燃试验台测试原煤煤堆自燃性能的方法,并将测试结果与已有的判别指标进行了对比分析,指出了煤的品级对煤自燃特性的影响,并得出基于基本煤质参数的简易自
对各国和地区采用基氏塑性仪测定煤的流动度的相关标准进行了研究,美国、日本等国和地区的研究较为完善。比较分析了各国煤的基氏流动度测定标准的不同之处,除部件精确度要求
基于目前煤炭气化理论,提出了太阳能煤炭气化,将低能量的太阳光聚集成高能流密度的光线束直接照射无氧状态下的煤粉,使高温煤粉与水蒸汽发生系列反应。设计并多次进行太阳能
差别矩阵是Rough集理论中重要概念之一,使用差别矩阵可以计算决策表的核和约简.当前有多种定义差别矩阵的方法,导致差别矩阵有多种定义的原因是决策表的不一致性.本文分析一
有效地分析软件应用系统的执行性能对于系统的运行稳定和性能改善有着很重要的作用,特别是一些高性能计算,如大气预测、天体运动、海量数据处理、科学数值计算等.这些应用都
某奶牛养殖场因生产工艺改变,导致过量COD排入废水收集系统,使污水处理站不能正常运转。为达到GB 18918—2002《城镇污水处理厂污染物排放标准》一级A要求,需对现有污水处理
本文是关于多目标编译系统构造的目标机体系结构描述的一个综述.主要涉及的话题:机器描述应当描述什么和描述语言的设计原则,现行的体系结构描述语言的状况及分类,一个典型的