Hadoop平台下加权马氏距离的Web大数据分析研究

来源 :电视技术 | 被引量 : 0次 | 上传用户:xiaozhi_1100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web大数据具有数据量大、数据异构性强、挖掘难度大等问题,针对如何提高Web大数据聚类分析准确性并保证数据分析的时效性,本文提出一种基于Hadoop平台和加权马氏距离的Web大数据分析方法。该方法在基于Hadoop平台架构上首先对Web大数据进行预处理和数据切片,然后通过计算得到方差贡献率并作为马氏距离计算的权重,最后通过加权马氏距离计算对数据判定聚类。仿真实验表明,所提方法可以有效地保证Web大数据聚类分析的准确性并具有较高的时效性。
其他文献
针对控制系统中由于存在限幅而产生的环绕现象,提出了基于模糊逻辑的抗环绕补偿器设计方法.对所设计的模糊补偿器和传统的基于反计算思想及基于条件作用技术的补偿器进行了仿
为了提高多点温度采集系统在数据采集与传输中的实时性与便利性,提出了一种基于PCI-9113A数据采集卡,C++Builder环境下,运用多线程技术设计出了一种制药罐温度监测系统.实践证明,该
湿地作为一个特殊的生态系统,在维持生物多样性、调蓄洪水、降解污染物、调节气候等方面发挥着重要作用。总结概括了当前湿地生态系统中有关地球化学研究的现状,包括湿地生态系