基于列存储的大数据采样查询处理

来源 :计算机科学 | 被引量 : 0次 | 上传用户:tonghe135612
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代的到来给传统的数据查询带来了性能挑战,即使查询算法有着O(n)的线性复杂度,但当n极大时其时间开销也难以满足用户需求。在很多实际应用中,人们并不需要精确的查询结果,但要求在给定时间内完成查询,因此可适当牺牲查询精度以满足性能约束。采样查询通过约简查询范围来提高查询性能,现有的采样方法多针对特定的算法和特定的应用场景,缺乏大数据环境下一般性的采样查询方法以及保证性能和精度的研究。文中研究大数据环境下列存储的采样查询处理,从数据划分和数据采样两方面改进大数据的查询效率。提出了基于加速比和势分布的采样
其他文献
福贵的人生中充满了苦难和死亡,福贵面对人生苦难时所呈现出来的状态告诉人们:面对不完全的生命状态,要想"活着"就要有能承受生命中苦难的毅力,时时挣扎在苦难深渊中也不放弃
<正> 由于受迫振动比简谐振动和阻尼振动更为复杂。因此要使学生在定性方面清楚地了解受迫振动,显然为一难题;但如果能讲好这一节,对讲共振那就方便得多,因为共振是受迫振动
糖尿病肾病是糖尿病严重的微血管并发症之一,也是导致糖尿病患者死亡的首要原因之一。糖尿病肾病早期无临床蛋白尿,仅出现尿微量白蛋白,疾病中、晚期可出现临床蛋白尿,继续发展可
现场复杂环境下电子式互感器误差影响量交叉作用,解耦困难,确定电子式互感器误差状态和各影响量之间的内在联系较为困难。为此,提出了一种基于高维随机矩阵理论的误差状态相关性
飞速发展的科学技术推动着机器人技术的蓬勃发展,机器人的应用领域也在不断的扩大。机器人运动学和动力学研究是双足机器人研究的核心问题。本课题以BIOLOID机器人组装套件为
导师王翠霞教授从事中医妇产科工作近十年,积累了丰富的临床经验,尤其对多囊卵巢综合征(PCOS)的治疗有其独特的见解,PCOS是妇科的常见病、多发病,主要以月经紊乱、不孕、肥胖、多毛
目的:本实验旨在通过动物模型实验观测温阳复脉中药复方对缓慢性心律失常大鼠cAMP和cGMP的影响,进而揭示温阳复脉中药复方治疗缓慢性心律失常的作用机理。方法:用普萘洛尔片灌胃
针对近年来超高清电视的崛起,介绍了超高清电视显示技术原理,分析了平板背光和曲面背光的产业定位、技术特点以及优缺点。在此基础上,引出主要显示性能的测量项目与方法,并对
目的:探索临床本科生创新能力的培养重点。方法:运用TOPSIS综合评价法,依据,临床医学生创新能力评价指标体系,对五个一级维度从科学性、重要性和可行性角度进行综合评价。结果与结
<正>2012年,宜春市人大常委会从建设幸福宜春、助推进位赶超发展、保障和维护人民群众根本利益出发,精心遴选经济监督议题,切实增强监督实效,取得了良好效果。督促和支持政府