论文部分内容阅读
房地产是一个综合性极强的系统工程,关系到国家、集体、个人的利益,影响到国民经济的发展,其兴旺与低落从一个侧面反映了国家经济发展状况。随着我国房地产业与互联网的迅猛发展,房地产信息系统的不断完善,房地产业的业务数据与互联网WEB数据积累得越来越丰富。如何利用海量的数据中有效的知识,是本论文研究的重点。房产信息集团为适应当前企业面临的竞争压力,将决策支持系统提高到一个重要的位置,构建适用于本企业的房地产决策支持系统,以提高企业的竞争力。本论文通过对企业的信息系统建设现状的分析,根据业务需求和功能需求构建了基于数据挖掘的房地产决策支持系统。首先是构建房地产决策支持系统的总体架构,将决策支持系统架构分为三个层次,即源数据层、数据转换层和报表展示层。根据企业现有的业务,将业务数据与WEB日志数据定义为源数据;数据转换层ETL(Extract、Transformation and Load)则是将WEB日志进行清洗(清扫网络爬虫),以及将业务数据重新整合成适合于数据挖掘的数据;报表展示层是根据各部门的数据需求,将处理好的数据以各种图表的形式展现给用户。然后是构建数据挖掘模型与层次结构,构建时间、地理(空间)层次,以及日志数据中URL的层次结构。同时结合Microstrategy的多维实体结构模型,构建多维在线分析处理即MOLAP(Multi-dimension online Analysis Processing)存储模式,自动化地实现模型层次上(包括时间、地理)的数据挖掘。最后是在房地产决策平台的前端报表展现端,用Microstrategy与WEB开发相结合构建各部门完整的报表系统,用户以登录模式即可访问到所需报表数据,为用户和各部门决策提供强有力的数据支持,真正做到实时决策。在完成此基于数据挖掘的房地产决策支持系统开发的同时,利用先进的数据挖掘与数据分析工具,对网络用户的行为进行分类分析,实时做好流量预警,优化网络门户的设计,以提升网络的用户粘着度,同时通过对用户行为与楼市热点的相关性进行分析,做了有关楼市热点与用户行为结合实现精准推送房源的研究,预测未来房地产业的发展方向。