论文部分内容阅读
随着我国经济的快速发展,人们对居住环境的要求越来越高,跨入了由原来的“居者谋其屋”到现在的“居者选其屋”的时代。宜居的生活环境越来越受到人们的重视,在购房或租房时,居民小区是否宜居已经成为人们决策时的重要参考依据。同时,国家也出台了许多措施提倡创建宜居的生活环境,自2007年起,我国每年都会评选出“中国十大宜居城市”。在全民参与创建宜居生活的大环境下,宜居评价标准不够完善和相关数据获取困难,严重影响了宜居生活环境的建设。此外,随着国家信息化程度的不断加深,房地产网络平台迅速兴起,为本文研究提供了海量数据。本文主要通过对Web文本信息进行获取和挖掘,建立基于Web文本信息挖掘的城市居民小区宜居性评价模型,对城市居民小区进行宜居性评价,最后以武汉中心区域为例进行居民小区宜居性评价,证明了所提出研究方法可行性,为城市规划和宜居社区建设等进一步的研究提供数据支持和理论帮助。本文主要贡献和创新点如下:1.给出了具有针对性的Web信息挖掘方法。在对居民小区客观评价指标数据(商业配套设施、教育配套设施等)进行量化处理时,利用特征词统计结合实际情况和相关标准,给出了一种比较科学和实用的量化方法。在对居民小区主观评价指标数据进行文本分类时,针对KNN分类算法分类速度慢的缺点,给出了一种利用局部敏感哈希方法来减少计算量从而提高文本分类效率的改进KNN分类算法。本文实验中,改进后的分类算法在保证分类效果基本不变的情况下,分类速度较原有分类算法有了显著提高。2.建立了基于Web文本信息的城市居民小区宜居性评价模型。该评价模型的所需数据均来自于互联网,故在确定模型评价指标时,立足于现有的宜居性相关理论,结合可获取相关互联网数据的特点,将评价指标分为客观评价指标(即居民小区软硬件数据)和主观评价指标(即居民对所住小区的主观评价)两类。对以武汉中心区域为例进行居民小区宜居性评价时,将评价结果结合实际情况比较分析,证明了评价模型操作的可行性,评价结果的准确性。3.完善了城市居民小区宜居性评价模型的综合评价方法。针对城市居民小区宜居性评价模型指标主客观结合的情况,提出了一种主客观权重结合的主成分评价方法。该方法相比于原有的主成分评价方法,既保留了客观性强的优点,即每个客观指标数据所占比重具均由其自身的相关性确定,又考虑了主观因素在评价中的重要影响,即可以人工调节主客观指标的权重系数。通过实验证明,改进后方法的评价结果更加符合实际情况。