基于Hadoop平台的数据压缩技术研究

来源 :数字技术与应用 | 被引量 : 0次 | 上传用户:bibby_514
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电商企业、互联网+、智慧城市等新商业革命的发展和社会网络的广泛应用,带动相关信息的数据量极速增长,从大量的数据中搜索潜在的有效、全面的信息,预测未来的发展趋势显得十分必要。数据量越大挖掘到的价值就越多,进而有助于支持决策。为了提高数据库性能,改进数据库查询效率的同时采用数据压缩技术对数据进行压缩,减少文件所占存储空间并保证在压缩过程中不丢失信息。本文对Hadoop框架进行介绍,并对基于Hadoop的数据压缩技术进行分析和研究,对压缩算法进行比较及使用场景。
其他文献
桥梁工程在国内外已发展多年,桥梁建设技术越趋于成熟。各类桥梁以及各种桥型都有不同的施工方法,每一种施工方法都有其自身的特点并且适用于不同的情况。由于当今的桥梁越来
<正>目的探讨API 20NE,西门子MciroScan WalkAway 96 plus和VITEK MS对人苍白杆菌鉴定结果的准确性。方法1 API 20 NE系统鉴定API 20 NE系统包含61种非肠道革兰阴性杆菌。所
会议
改革开放二十多年来,中国的社会经济取得了巨大成就,举世瞩目,但是进入二十世纪末期以来,中国社会经济的进一步发展遇到了生态环境恶化、资源枯竭、人口压力过大等众多问题,在这样
本文论述了质子交换膜的特点及其发展方向,重点阐述了全氟磺酸型质子交换膜及其在燃料电池应用中存在的问题。针对这些问题,我们对质子交换膜进行了探索性的研究。在实验中采用
康普顿背散射(Compton Back-scattering)技术是一种新型的无损检测技术。其突出的优点是:射线源与检测器可置于被检测物体的同一侧,能够解决透射式CT所无法解决的一些无损检测
龙凤热电厂高温蒸汽管线大多数已经破损,热量损失严重的现状,直接导致企业能源成本增加、经济效益下降,而且由于车间温度过高,造成工人工作环境差。本文将对龙风热电厂现有设备及
自现代公司产生以来,围绕其产生了诸多问题。其中最为核心,争论也最为激烈的就数公司治理问题。一般认为,建立起有效的公司治理机制是建立现代企业制度的关键。就当前关于公司治
旨在编制适合中国成年人的一般自我概念测量工具。通过理论分析,建构了一般自我概念的四个维度,包括积极性、清晰性、悦纳性和调节性,并据此编制了中国成年人一般自我概念量
多源信息的融合处理问题是C~4ISR系统建设中的一个关键问题。随着实用系统的开发,信息融合系统的体系结构设计问题、融合系统的实现问题及融合系统开发的工程化等问题逐渐成为
联合国国际比较项目研究,是经济统计研究的新课题.它将各国的国内生产总值的比较,由过去的汇率换算法,改为更为准确的购买力评价法.国际比较项目调查,迄今只在1970年、1973年、1975