数据流与磁盘存贮表的连接计算算法

来源 :控制工程 | 被引量 : 0次 | 上传用户：jonathanwu

【摘要】

：

数据流与存贮表的连接查询经常出现在主动式数据仓库的维护中,与传统的关系数据库的连接计算不同,数据流快速处理的要求不允许将数据流先存入磁盘再计算,而计算机内存无法存

【作者】

：

杜威邹先霞

【机构】

：

广东警官学院计算机系,广州市公共安全重点研究基地,武汉大学软件工程国家重点实验室,暨南大学计算机系,

【出处】

：

控制工程

【发表日期】

：

2014年06期

【关键词】

：

数据流连接计算磁盘存储表逻辑分区速率 data stream join computing disk-based relation logical pa

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数据流与存贮表的连接查询经常出现在主动式数据仓库的维护中,与传统的关系数据库的连接计算不同,数据流快速处理的要求不允许将数据流先存入磁盘再计算,而计算机内存无法存储无界增长的数据流,因此数据流查询采用先处理再存储结果的计算方式。数据流与存贮表的连接计算算法重点要解决内存开销和处理速率二个问题。MESHJOIN算法最早提出将存贮表划分为若干个数据块,将数据块交替放入内存与数据流窗口完成连接计算。在MESHJOIN算法思想的基础上将存贮表的内存数据块也划分为若干逻辑分区,每次连接计算仅替换其中的一个逻辑分区,有效地降低了数据流滑动窗口所需的I/O代价,从而提高滑动窗口的计算速率。最后通过实验对二种算法在内存开销和计算速率进行了比较。 Data stream and storage table connection query often appears in the active data warehouse maintenance, and the traditional relational database connection calculation is different, the data stream processing requirements do not allow the data stream to be stored in the disk and then calculate, and the computer Memory can not store unbounded growth of data flow, so the data flow query using the first treatment and then store the results of the calculation. Data stream and storage table connection calculation algorithm to solve the memory overhead and processing rate of two issues. MESHJOIN algorithm first proposed the storage table is divided into several data blocks, the data blocks alternately placed in memory and data flow window to complete the connection calculation. On the basis of MESHJOIN algorithm, memory data blocks of storage table are also divided into several logical partitions. Each connection calculation replaces only one of the logical partitions, which effectively reduces the I / O cost required for data flow sliding window, Thus increasing the computing speed of the sliding window. Finally, the two algorithms are compared in terms of memory overhead and computing speed.

其他文献

锡兰红茶产区及市场研究

斯里兰卡2010年生产约32 2万吨茶叶,其产量居世界第三,但其出口量位居世界第一.锡兰茶的种植基地仅限于岛国的中央高地和南部低地,茶叶按生长的海拔高度不同分为三类,即高地

期刊

锡兰红茶6大产区茶叶市场

一种基于混合量子粒子群的快速运动目标跟踪算法研究

量子粒子群算法在优化过程中需要权衡局部探索性和全局开拓性,进化后期由于全局开拓能力的丧失使得种群多样性减少,设计了一种基于欧式距离的混合量子粒子群算法,通过计算粒

期刊

量子粒子群算法欧氏距离快速移动种群多样性目标跟踪quantum particle swarm optimizationeuclid distance

基于方位角权系数分配的独立变桨距控制

风力发电机组功率不断提升,风机桨叶随之增大,风机在额定风速以上运行时,桨叶所受气动载荷逐渐增大,为风机安全运行埋下了隐患,因此希望减小这一载荷.针对这一问题,在充分分

期刊

气动载荷方位角权系数独立变桨距模糊-PIDaerodynamic loadazimuth angleweight numberindividua

飞航导弹变论域自适应模糊PID控制方法

对于导弹飞行控制,当系统在大动态范围运行时,常规模糊PID控制由于固定论域、调整因子以及根据个别专家经验制定的有限控制规则不够完善,其固定的论域范围就会使得模糊控制对

期刊

变论域自适应控制模糊控制PID控制飞航导弹

一类热方程的边界控制及不确定性分析

基于对称群理论中的微分方程对称形式,研究一类热方程的边界控制问题,以及当边界条件中包含不确定控制系数和未知边界扰动时,系统控制目标的变化问题.首先,利用微分方程对称

期刊

边界控制不确定性控制系数边界扰动微分方程对称boundary controluncertaintycontrol coefficientboun

基于改进型PSO-BP神经网络的SVI软测量

针对曝气池污泥体积指数(SVI)难于在线测量的情况,提出了一种基于改进型的BP神经网络对SVI软测量的模型,该模型利用改进粒子群优化算法对BP神经网络进行权值调整。为了提高BP神经网络的学习性能,使粒子群的惯性权值按照对数规律变化,同时引入自适应变异算子对局部最优的粒子进行变异,然后利用粗糙集理论消除冗余信息,得到输入变量。该模型对实际污水厂的SVI值进行软测量预测,并与其它软测量模型进行比较,结

期刊

污泥膨胀污泥体积指数软测量改进型PSO-BP神经网络sludge bulkingsludge volume indexsoft measuremen

混沌混合蛙跳算法

针对基本混合蛙跳算法(Shuffled Frog Leaping Algorithm,简称SFLA),收敛速度慢,优化精度低的问题,提出了混沌混合蛙跳算法。将混沌优化思想引入到蛙跳算法中,利用混沌运动的

期刊

群体智能混合蛙跳算法混沌高斯分布swarm intelligenceshuffled frog leaping algorithmchaosgau

基于切换和混合策略的多模型自适应控制

混合与切换是多模型控制器的两种主要设计方法,混合控制不能及时响应参数突变,切换控制的暂态响应不理想。因此提出了一种新的多模型自适应控制结构。首先利用各模型子集的中

期刊

多模型自适应混合控制切换控制Multiple modelsAdaptiveMixingSwitching

基于细菌菌落算法的电力系统无功优化

电力系统无功优化具有非线性,多控制变量,多约束条件,连续变量和离散变量混杂的特点,针对现有算法或容易陷入局部最优解或收敛速度慢的缺点,提出了一种细菌菌落(bacterial co

期刊

电力系统无功优化细菌菌落优化算法power systemreactive power optimizationbacterial colony opt

改进动态分层资源索引自主混淆云计算模型

在多媒体资源索引中,需要构建云计算模型实现资源索引优化调配和共享,由于多媒体资源云计算索引中进行梯度边缘匹配引起自主混淆,影响多媒体图像的索引准确度。在传统的连续纹理虚化反混淆云计算模型的基础上,进行改进,在资源索引模板匹配过程中引入动态分层策略,提出一种改进的动态分层资源索引自主混淆云计算模型,设计优化的量子群多媒体资源动态分层预测算法,计算多媒体资源信息索引序列的平局动态分层互信息量,通过搜索

期刊

动态分层云计算混淆资源索引dynamic hierarchicalcloud computingconfusionresource index

数据流与磁盘存贮表的连接计算算法

与本文相关的学术论文