论文部分内容阅读
在当前的网络环境中,个性化信息推荐服务已成为时代潮流,代表着未来信息服务业的发展方向。目前协同过滤技术的应用范围比较广泛,多个网络平台的个性化推荐服务系统都应用此技术,本文在个性化检索以及推荐领域的各项技术的着重探讨的基础上对房产信息个性化推荐进行研究,主要分析了传统协同过滤技术存在的问题,本文将基于用户聚类的协同过滤与基于项目聚类的内容过滤进行组合运用,在协同过滤的数据预处理阶段综合用户行为特征与项目内容属性,并结合聚类技术,提出以协同过滤方法为框架、融合内容过滤的组合推荐算法,并设计了一个房屋中介智能管理系统来验证算法的有效性,本文的主要工作如下:1.查阅文献发现在数据预处理阶段,传统的协同过滤算法对于用户—项目评分矩阵得依赖性高,这使得用户项目评分矩阵中因为未评分数据的缺失而显得数据比较稀疏。本文为了对用户个人喜好进行深度挖掘并提高系统推荐效果的精度,必须将用户浏览、关注、购买、评价等行为特征和项目内容属性元数据进行特征组合。2.本文通过聚类模型的引入来提高传统协同过滤推荐的实时性和可扩展性指标,提出基于用户和房产信息内容双向聚类改进的思路。本文对用户行为与房产信息内容属性进行了全面利用,同时对用户和项目进行聚类,减少近邻用户或者项目的搜寻空间,不仅提高算法的效率和实时性,也降低了系统的耦合性。3.针对传统的协同过滤算法中面临的数据稀疏性差、准确率低等问题,本文以内容过滤为基础、协同过滤为框架,提出了融合项目内容与用户行为特征的组合推荐算法。首先基于项目聚类的内容过滤预测出原用户项目评分矩阵中未评分项目的分值并将结果添加到原有的用户—评分矩阵中,解决数据稀疏性和冷启动问题;其次,在填充完成后的用户评分矩阵的基础上融合项目聚类结果、房产信息内容属性以及用户行为,提出了一种新的相似度融合的计算方法,最后再通过基于用户聚类的协同过滤推荐,提高算法的准确性。最后,基于真实的某房产中介平台的实验数据集,利用仿真模拟软件对改进的算法进行试验与测试,并将结果与传统的协同过滤推荐算法进行了对比分析,实验证明本文中提出的改进算法在一定程度上提高了系统的实时性与与可拓展性,并通过用户行为特征和房产信息的内容属性深度挖掘了用户的兴趣偏好,在一定程度上使推荐算法的准确性得到了提高。本文将改进的算法应用到开发的房屋中介原型系统中,验证了改进算法在实际应用中的可行性与有效性。