论文部分内容阅读
随着互联网技术的发展,信息呈爆炸式增长,信息过载的问题日益明显。上世纪90年代,推荐系统的出现有效地帮助人们从浩如烟海的信息中提取有用的部分。如今在各个领域,随处可见推荐系统的踪影,如电子商务领域的Amazon,电影点评领域的Netflix,音乐领域的豆瓣[10]等,推荐系统通过收集和分析用户的行为数据,对用户或物品建模,从而智能地为用户做推荐。然而论坛和新闻类基于文本的推荐系统却很少涉及,有限的几个文章推荐系统如美味爱读[23],无觅阅读[26]等都不是针对新闻等有时效性的内容,并且没有考虑用户之间的关系,另一方面,尽管Facebook等社交平台吸引了大量用户,但论坛仍然是人们沟通交流的重要平台之一,其中包括技术类如Linux社区和生活类如校园BBS等。本文就是针对论坛类文章提出了一个个性化阅读的解决方案,主要工作和贡献如下:1.提出了论坛类文章个性化阅读推荐框架,我们从文章主题分类,相似文章合并,用户兴趣建模,用户关系挖掘和文章热度值变化等多个方面建模,综合了基于内容和基于社会化信息的多个因素。2.提出了一种新的文章热度值计算模型,有效刻画了文章热度随时间的变化过程。3.提出了一个面向群组的推荐算法,通过综合群组内成员的兴趣分布来建立一个虚拟用户,从而将问题转化为单用户推荐。4.针对南京大学小百合论坛[19]实现了一个原型系统,通过实现协同过滤的增量式并行算法提高了系统的可扩展性,另一方面使用了HTML5和Cache等技术保证了系统的效率。