压缩数据上的关系代数操作算法

来源 :计算机应用 | 被引量 : 36次 | 上传用户：jj2653026

【摘要】

：

针对在大数据管理中,在压缩的数据上无需解压即可进行相关操作的问题,在数据服从正态分布的前提下,根据列数据存储的特点,提出了一种新的面向列存储的压缩方法——CCA。首先,通过对列数据的长度进行归类;然后,采用抽样的方法获得重复度较高的前缀;最后,使用字典编码进行压缩,提出了列索引(CI)和列实体(CR)作为数据压缩结构来降低大数据存储的空间需求,从而直接有效地在压缩数据上支持选择、投影、连接等基本操

【作者】

：

丁鑫哲张兆功李建中谭龙刘勇

【机构】

：

黑龙江大学计算机科学技术学院,哈尔滨工业大学计算机科学技术学院

【出处】

：

计算机应用

【发表日期】

：

2016年01期

【关键词】

：

大数据压缩列索引列实体关系代数操作 massive data compression Column Index（CI） Column Reality（CR

【基金项目】

：

国家自然科学基金资助项目（81273649）, 黑龙江省自然科学基金资助项目（F201434）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

移动传感网分布式连通按需覆盖部署方法

针对移动传感器网络监测区域中目标覆盖所需传感器数不同且各目标之间没有形成通路的问题,提出了通过虚拟力方法实现对不同目标的按需覆盖方法。根据不同目标的覆盖需求设置对传感器节点的基于万有引力的吸引力、节点之间基于库仑力的斥力以及目标之间的引力线,节点在虚拟合力的引导下覆盖目标或连接成通路。仿真结果显示所提方法与已有代表性算法相比收敛时间短,节点移动公平性高达99%,且GPS误差的影响能够控制在1%以下

期刊

移动传感网按需覆盖虚拟力引力线mobile sensor network on-demand coverage virtual force gravit

关于基层电大教学督导的几点思考

教学督导既符合质量管理体系IS09000理论,也是电大教育发展的内在需要和实践需要,是电大教育教学质量的重要保障.教学督导实施中存在督导工作落实难度大,教学督导工作重视不

期刊

基层电大教学督导教学质量local TV University instruction supervision quality of instruct

两个电子货币方案的分析与改进

针对目前电子货币方案在匿名性和公平性等方面的不足,分别使用椭圆曲线和双线性对构造两个电子货币方案,方案在保证顾客匿名性的同时,又可以追踪二次花费的顾客,保证交易的公平进行。首先分析Chaudhry等提出的基于椭圆曲线认证加密的电子货币方案,其方案不能保证消费的匿名性,同时也无法有效解决交易纠纷;接着分析Liu等提出的银行委托离线电子货币方案,发现其方案中用户可以伪造电子货币。然后针对以上方案中的缺

期刊

电子货币密码学匿名离线二次花费

二氯·苯甲酰肼合锰(Ⅱ)等配合物的合成

本实验合成了二氯·苯甲酰肼合锰(Ⅱ)配合物,制得了此配合物的浅红色单晶,测得熔点为59～61℃,用日本产岛津红外光谱仪做了红外图谱.用类似方法还合成了苯甲酰肼与锌、镉、

期刊

苯甲酰肼四水二氯化锰二氯·苯甲酰肼合锰(Ⅱ)稀土离子与苯甲酰肼配合物

文化引领远程开放教育学生管理模式创新——以珠海广播电视大学为例

学校文化是凝聚人心、催人奋进的旗帜。从学校文化的概念以及远程开放教育学校文化特点入手，以珠海广播电视大学学校文化建设为例，围绕学生管理工作建设学校文化的实践探索，以文

期刊

学校文化学生管理创新实践university culture student management innovation practice

复杂环境中基于视觉词袋模型的车辆再识别算法

根据公共安全部门在复杂环境中搜索出特定目标的迫切需求,将目标再识别(re-ID)技术应用到车辆识别领域,提出了一种基于视觉词袋(Bo VW)模型的车辆再识别解决方案。首先,为解决复杂环境中遮挡、目标物位姿变化、目标物在图片中的大小位置存在差异等问题,提取出可基于不同尺度、不同位姿的改进基于部件的一对一局部特征(POOF);其次,通过基于欧氏距离的聚类算法获取视觉词袋中的词汇集合;接着,将训练和测试

期刊

车辆再识别视觉词袋模型一对一局部特征距离度量再排序vehicle re-identificationBag of Visual Words （BoVW

始终保持党同人民群众的血肉联系

密切联系群众是我们党的最大政治优势,脱离群众是我们党执政后的最大危险。防范和化解＂最大危险＂,保持和发展＂最大政治优势＂,是我们党面临的严峻考验和重大任务。在全党深入开展

期刊

人民群众马克思主义群众观点党的群众路线密切联系群众教育实践活动肉政治优势最大危险

面向用户偏好发现的隐变量模型构建与推理

电子商务应用中产生了大量用户评分数据，而这些数据中富含了用户观点和偏好信息，为了能够从这些数据中准确地推断出用户偏好，提出一种面向评分数据中用户偏好发现的隐变量模型（即

期刊

用户偏好评分数据贝叶斯网隐变量模型概率推理带偏置的矩阵分解user preference rating data Bayesian network

认知无线电中基于多址接入信道的多用户联合频谱感知算法

针对多用户联合感知场景问题,考虑次用户至决策中心之间有损信道的情况,提出了基于多址接入信道(MAC)的联合频谱感知算法。在系统结构和数学建模基础上,分析了传统MAC算法渐近性、中断概率等性能。在次用户平均发射功率约束下,以最大化检测概率为目标,对基于MAC算法中的发射增益进行优化;并考虑了一定服务质量情况下最小化次用户数目的问题。仿真结果表明,MAC算法能够保证良好的检测性能,以决策中心错误概率为

期刊

认知无线电频谱感知多址接入信道多用户Cognitive Radio（CR） spectrum sensing Multiple-Access Chann

云南高校高层次人才年薪初探——以云南大学为例

20世纪90年代后期产生于企业的年薪制，如今却已成为高校吸引高层次人才的普遍选择，这是高校之间人才竞争的必然结果，也是高校自身发展壮大的必然选择。为更好地吸引、稳定和激励

期刊

高校高层次人才年薪规范考核公平经费colleges and universities high level talents annual sala

压缩数据上的关系代数操作算法

与本文相关的学术论文