论文部分内容阅读
为解决传统大数据存储方法存在的存储响应时间长、数据聚类效果差的问题,提出云计算下分布式大数据智能存储算法。通过分析分布式大数据序列,得出归一化的RGB直方图计算大数据直方图的绝对差,映射数据序列的变化,以此对分布式大数据进行分类,再使用K-means算法选择聚类的中心,并拟定聚类数量和标准的测评阈值对数据进行聚类,把所有聚类集合内相应的数据通过长短缓存区将其补全,随后以数据流的形式存储到标签中使其组成完整的分布式大数据文件,从而达到对分布式大数据智能存储的目的。仿真结果证明,研究方法的大数据存储过程