论文部分内容阅读
房价满意度作为衡量社会发展的一个重要指标,正在引起社会的广泛关注但是由于难以量化数据收集繁琐时效性弱等困难,相关研究无法深入伴随着互联网技术的不断进步,在线讨论平台的快速发展壮大,如新浪微博主题论坛等,民众利用这些新兴渠道畅所欲言,在其中就包括与房价高度相关的大量言论信息这些信息背后就是民众对于房价的情感态度,是民众对于房价满意度的一种碎片式表达,这些碎片化的信息中就包含着民众对于房价的满意程度房价微博情感分类,是指利用数据挖掘的方法,对大数量级的房价微博进行情感倾向信息识别,借此为房价满意度研究提供支持本文以北京房价微博作为直接研究对象首先,采集了以北京房价为关键字的,2011年1月到2014年1月这个时间段内的所有微博数据,其中有效数据共计59957条然后,基于N-Gram语言模型构建情感倾向分类器通过不断优化训练集使分类准确率达到95%以上最后,在准确率达到要求的前提下,挖掘出蕴含在房价微博中民众对于房价的情感倾向依据本文前两章所取得的成果,对民众满意度与房价之间的关系进行实证分析首先,利用基于N-Gram语言模型的情感分类器对每月的北京房价微博数据进行情感倾向识别,计算情绪得分,借此量化民众对于房价的满意程度然后,联系北京市每月的新建住宅销售价格指数这一相对值住宅平均销售价格这一绝对值,以及推算出的每月住宅销售价格增长率这三个变量进行统计分析最终,统计分析结果表明民众对于房价的满意程度受到房价绝对值和相对值的显著影响,且房价相对值对其影响程度更强,相比于房价绝对值进而,联系所查阅文献与相关理论进行模型结果的解释最后,本研究利用所取得的成果,联系房地产实践领域,给予提高房地产领域民众满意度的建议本研究为中文文本情感倾向自动识别在房地产领域进行了新的探索,为政府制定公共政策提供数据支持和理论基础,也为学者继续研究文本情感倾向提供很好的思路