海量关系数据去重处理技术研究与优化

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:yougot_chen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文针对传统海量关系数据去重处理技术的局限性,选取上下线日志数据这种典型关系数据为研究对象,采用基于MapReduce的海量关系数据去重处理技术,对海量关系数据进行并行处理,并对该平台实现进行了论述。通过对Map阶段进行归并产生的中间结果实现数据共享,且在Reduce阶段重写partition的方式解决海量去重堆内存溢出的问题。最后通过实验对比不同海量关系数据处理的效率,验证了MapReduce技术在处理海量关系数据的高效性。
其他文献
1故障现象2012年05月31日00:26,35kV腊乌红线A相电缆被击穿导致线路故障。对电缆检查后发现,距离电缆终端15cm处的电缆被击穿,不锈钢抱箍有明显的烧伤痕迹,见图1。进一步检查发现,
目的研究大孔树脂吸附法分离纯化橙皮中橙皮苷的最佳工艺条件,通过熔点、橙皮苷的薄层(TLC)、UV及IR图谱进行结构表征。方法以橙皮苷的纯度为指标,比较HPD826、HPD417、AB-8、H
随着互联网和通信技术的飞快发展,信息呈指数式增长,而怎样在大量的网络信息中准确找到相关舆情信息是我们面临的一个新的挑战。论文是依托百度搜索引擎,主要研究爬虫、搜索
风力发电是最有效的风能利用方式,我国风力发电技术多年来得到了大力发展。风电特性对电网的影响也日益显著,尤其大型风电场并网运行将会对电网系统稳定性造成较大的影响。风
目的研究CD4^+CD25^+调节性T细胞(Treg)在胃癌组织中的分布数量及意义。方法采用流式细胞术检测胃癌组织及正常组织中Treg数量变化 同时用免疫磁珠细胞分选技术分选出高纯度的CD
据所接触到的材料,近十多年来国内大学中以物理学为专业的青年学子呈逐渐下降之势(国际上也基本是这种状况),即使主修物理学专业的大学生也大多在毕业后或读研究生阶段转向别