论文部分内容阅读
随着数据库技术的逐渐成熟和计算机网络的迅速普及,人们采集数据的能力得到了极大的提高,导致全球范围的信息急剧膨胀,为了对这些海量信息的隐藏知识进行开发,数据挖掘技术应运而生。目前,数据挖掘技术愈来愈成熟,应用范围也日趋广阔,但是,在建设工程材料信息领域还缺乏专门的研究。随着新材料、新技术、新工艺和新方法层出不穷,各单位纷纷采取信息化运作,建设工程材料信息已经由以往的手工操作转化为依靠网络技术的自动化操作,并且已经积累了一定数量的信息。跟其他领域一样,建设工程材料信息中也蕴含着潜在的有价值的知识有待于发现,这些知识能够为企业经营和决策提供有力的帮助,所以对数据挖掘技术在建设工程材料信息管理中应用的研究就成为了当务之急。数据挖掘(Data mining,简称DM)作为20世纪末刚刚兴起的数据智能分析技术,由于其所具有的广阔应用前景而备受关注。作为数据库与数据仓库研究与应用中一个新兴的富有前途的领域,数据挖掘常常也被称为数据库知识发现(Knowledge Discovery from Database,简称KDD),是从数据仓库或海量数据库中挖掘有用的信息的技术,即从数据中发现知识的技术。其目的在于运用计算机自动化地对(经常是很庞大的)数据集进行深入地分析,获得关于数据的一些前所未知的有用特性,从而帮助数据拥有者更好地理解、预测、控制和优化与这些数据相关的行为。聚类是数据挖掘领域中的一个重要分支,正逐步运用在商业、地质勘探、图像处理等领域。因为它不仅可以作为其他算法的预处理,也可以作为独立的算法加以使用。它不需要预先的类标记,可在数据集上直接使用。本文的主要工作是在对现今建设工程材料的特点以及现有数据挖掘系统的分析和研究的基础上,结合数据库,数据挖掘以及聚类分析技术,完成了将K-Means聚类算法应用在建设工程材料信息中的数据挖掘信息系统设计。此系统针对建设工程材料信息数据库进行数据挖掘,并对材料价格进行聚类分析,找出不同的材料群及其各自的特点,进行材料细分,从而实现材料信息的资源共享,以利于制定相应的营销手段,提高客户的满意度,使企业在竞争中利于不败之地。其中材料的指导价格也是编制工程设计概算、施工图预(结)算、工程招标标底、工程拨款的参考依据。通过系统测试结果,表明此算法无论在理论上还是在实践上都对建设工程材料的价格分析有一定的指导意义。