Sub-Join:一种闪存数据库的查询优化算法

来源 :NDBC2009第26届中国数据库学术会议 | 被引量 : 0次 | 上传用户:sk_only
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
和磁盘(HDD)相比,固态硬盘具有高速的随机读取速度、低功耗、体积小等特点,因而被认为将取代磁盘成为新一代的数据存储设备。但是闪存数据库的查询性能的提高却远小于固态硬盘相比于磁盘IO性能的提高.其原因在于现有的数据库是基于磁盘而设计的,使得现有的数据库不能充分发挥固态硬盘的高速性能。因此文章提出一种名为子连接(sub-Join)的连接算法。子连接算法首先将数据表的连接列和主键投影为新的子表,然后对子表进行接连操作,最后根据子表的连接结果再从原始数据表中回取查询结果。通过和开源数据库Oracle Berkeley DB的比较实验,结果表明子连接算法比原有的算法性能提高40%-100%,充分说明它的优越性。
其他文献
本文用高温同相法合成了Si掺杂的BaZr(BO3)2:Eu荧光粉,探讨了不同Si掺杂浓度对电荷转移跃迁的影响,发现由于Si的电负性较强,代替Zr离子后使电荷转移跃迁发生蓝移。由发射光谱得到当掺杂量为20%时发光强度达到最强:用Judd-Ofelt理论研究了不同Si掺杂浓度的Bazr(BO3)2:Eu荧光粉光谱性质。利用发射光谱从实验上确定了晶场强度参数Ωλ(λ=2,4),发现晶场强度参数Ω2随Si
本文利用聚合物海绵材料,开发研制了一种新型点阵式的光纤压强传感器,将作用在传感器上力的变化,转变为输出光纤的能量变化。将传感器获得列阵数据进行细化,以压强分布“积分中心”的时空变化为信息特征,实现步态识别研究。通过单体辨向、统计实验测试,传感器持续响应时间小于4毫秒,测试正确率高于98%。
用等离子增强化学气相沉积方法生长二氧化硅波导时,如果波导间距较小,会在波导芯层间产生空隙,并因此导致损耗增加。本文针对这个问题,提出一种新颖的简便方法,在上包层使用硼锗共掺,利用高温退火工艺,实现二氧化硅波导间隙填充,从而降低波导损耗。通过扫描电子显微镜观察到空隙填充的效果图,并在基于阵列波导光栅的三波分复用器制作实验上验证此方法,成功将通道损耗降低了约3dB。相对于传统的硼磷硅玻璃工艺,此方法避
本文主要介绍了AES-128算法原理,以及GPON中AES-128的加密处理和密钥交换处理,从而保证了GPON系统的安全性。
本文结合行波法和传输矩阵法,建立一个新型动态模型模拟取样光栅分布布拉格反射(SGDBR)激光器的波长切换特性。激光器有源区采用时域行波法,而无源光栅区则采用传输矩阵法,再通过数字滤波器将其变换到时域。利用该模型成功得到激光器波长切换图,并证实切换过程中的模式竞争特性。
本文在级联相位调制的100Gbit/s光信号传输系统中,提出了两种新码型-占空比为33%的光交错相移键控归零码(RZ—SDPSK)和占空比为67%的光交错相移键控载波抑制归零码(CSRZ—SDPSK)的产生和检测方案。通过50km的普通单模光纤(SMD)和8km的色散补偿光纤(DCF)传输后,当入纤功率相同时,CSRZ—SDPSK码具有较高的色散容限:如果仅考虑一阶偏振模色散,RZ-SDPSK信号
本文介绍了应用宽带ASE(放大的自发辐射)光源进行多波掺铒光纤放大器测试的一种简化模型。该简化模型可通过对掺铒光纤放大器的输入输出谱进行线性拟合求出其增益和噪声值。对两种不同的掺铒光纤放大器应用该简化模型得到的实验结果均与常规的应用多波光源结合内插减源法得到的实验结果一致。
本文先介绍了目前CMDM网络中使用的保护倒换技术方法,随后指出目前技术的不足,并提出新的保护倒换技术。针对新保护倒换技术的的基本原理、系统中的实验以及实验的结果做了详细介绍,最后得出结论。使用新技术的好处:降低线路衰耗;降低成本,新方法不仅可以省去光开关、耦合器以及光监测模块的成本;在保护倒换功能上,增加了新的功能,即增加了OTU单元以及3R功能。最后指出新技术的不足以及有待改进的地方。
异常发现是数据挖掘领域的一类重要任务,一直以来受到研究人员的广泛关注。针对高维对象的异常度量问题和异常点集合的冗余问题,本文提出了一种新的面向高维数据的异常点发现方法。该方法通过采用高维数据的二部图表示,以高维对象的压缩能力作为其异常程度的度量,能够有效支持包含多种不同属性的高维数据。为了解决top-k异常点集合中的冗余问题,我们提出了低冗余top-k异常点的概念。由于精确计算低冗余的top-k异
从序列数据库中挖掘频繁序列模式是数据挖掘领域的一个中心研究主题,而且该领域已经提出和研究了各种有效的序列模式挖掘算法。由于在挖掘过程中会产生大量的频繁序列模式,最近许多研究者已经不再聚焦于序列模式挖掘算法的效率,而更关注于如何让用户更容易地理解序列模式的结果集。本文受到压缩频繁项集思想的启发,提出了一种CFSP(CompressingFrequent Sequential Patterns)算法,