论文部分内容阅读
随着“互联网+”政策的深入推行,房地产等传统行业的转型速度逐渐加快,房产中介网站的数量不断增加,网站上的评分和评论数据都处于爆炸性增长的状态。海量的数据造成了信息过载,也因此产生了与推荐相关的研究。相比于粗粒度的用户评分,评论能够更细致地体现出用户的真实情感。对评论进行情感分析能够修正用户原始评分,给其它用户提供更精确的参考依据,同时也为企业制定发展战略、提高服务质量和提升用户友好度提供了重要参考。目前大多数房产中介网站并未实现推荐功能,仅提供了根据中介历史评分等指标上的排序。排序虽然能够节约用户的时间和精力,但忽略了评论中的情感信息对评分的修正作用,且针对单一指标进行排序,较为片面。针对上述问题,论文提出基于评论情感强度和协同过滤的房产中介推荐算法,旨在综合考虑评论中的情感信息和中介其它指标对用户进行个性化推荐。首先,由于中介评论常包含与其服务无关的信息,并且现有的评论情感分析算法大多未考虑情感词的强度值问题,直接将现有算法应用于中介评论领域会导致准确率较低,论文提出融合句法规则和情感强度的中介评论情感分析算法。从中介评论和开源情感词典中产生中介评论领域的情感强度词典集,并根据中介评论的语言特点提出句法规则,结合情感强度词典集进行情感分析并得到每条中介评论的情感倾向。其次,融合情感分析结果和中介其它指标对原始评分进行扩展,获得中介推荐总得分作为首要推荐依据,后根据KNN(K-Nearest Neighbor)算法和改进后的协同过滤推荐算法获取到中介的邻居集作为次要推荐依据。最终,结合首要和次要推荐依据进行TOP-N的推荐。论文使用从“我爱我家”房产中介网站爬取的中介评论数据集和中介其它指标数据集,对本文提出的算法进行验证,结果表明:融合句法规则和情感强度的中介评论情感分析算法能有效提高对中介评论进行情感分析的准确率;融合情感分析结果和中介的其它指标对用户原始评分进行修正并改进协同过滤推荐算法在房产中介推荐领域中具有合理性和有效性。