论文部分内容阅读
随着建筑行业的发展和信息化的建设,我国各省市已逐步建立起建筑市场信息管理平台,积累了大量的行业数据,主要涉及建筑企业信息、建筑从业人员信息、招投标信息、工程项目信息、信用评价信息等等,这些数据是建筑市场管理的重要资产,合理有效地分析利用这些数据,可以提高建筑市场治理效果,改善建筑市场环境,提升工程质量安全水平,并为企业决策提供参考。故本文对海量的建筑市场数据进行数据挖掘有着重要的实际意义。数据挖掘从技术层面完成了从数据到信息的提取过程,使得人们可以从更高层面上对数据进行分析,以更好的利用这些信息。但对于建筑市场的海量数据,利用单服务器或单处理器进行数据挖掘几乎是不可能实现的。而云计算技术具有强大的分布式并行处理能力和海量的存储能力,很好地解决了数据挖掘所面临的海量数据处理问题。本文基于上述背景,针对建筑市场数据所呈现的流量大、异构性、安全性等特点,提出了构建针对建筑业的数据挖掘云服务平台,给出了包括建筑业用户层、数据挖掘处理层、云计算服务层的三层层次结构图,并对模型原理进行了介绍。基于上述模型,本文以某网络电台的媒体仓库作为实验数据集对平台模型进行了测试,验证了平台模型的有效性。本文首先基于平台模型中的Map/Reduce框架构建了K-Means云计算化的系统模型,给出了Map/Reduce化后的K-Means算法流程图及具体步骤,然后用于网络电台媒体仓库的数据挖掘,实验结果验证了该模型的良好性能。针对云计算的分布式处理、海量存储、低成本、高可用性等优势,本文将云计算技术引入到建筑市场数据挖掘中,提出了针对建筑行业的基于云计算的数据挖掘模型,描述了模型的层次结构和工作原理,并以某网络电台的媒体仓库作为实验数据集对模型进行了测试,验证了模型的有效性和良好性能。综上,针对建筑行业的基于云计算的数据挖掘模型可以对海量的建筑市场数据进行高效地挖掘,进而为建筑企业决策提供重要参考。