论文部分内容阅读
如今随着互联网的快速发展,以及信息的爆发式增展,越来越多的用户面临着信息过载的问题。而互联网的信息越来越多,数据越来越庞大,我们要想从信息的海洋中脱离出来,获取我们最有价值的信息越来越困难。因此这就是需要一个信息过滤器帮助我们过滤掉那些没有价值的信息。通过调查发现,越来越多的用户已经习惯从传统的报纸、电视上获取信息转向了通过互联网获取感兴趣的信息。所以建立一个信息过滤系统具有广泛的应用前景和不菲的研究价值。一般而言,建立一个这样系统的常规方法是首先采集大量的数据样本,其次获取用户的基因,再通过一套成熟的推荐算法建立数据模型,最后把信息过滤出来给用户。本文的目标是依据用户的实际阅读需求,开发具有实际可操作的阅读软件系统。我们针对用户的实际需求分析,并依托国内外高效的推荐算法,研究基于自适应性的新闻传播模型和基于标签的冷启动算法,提出了利用户社会化信息的权值因子来建立系统推荐模型,给用户推荐精准的个性化信息。通过这样的一个系统,不仅可以让用户的阅读价值最大化,而且也验证了科学理论在实际系统中是否可行。本系统的实现对未来个性化的推荐研究也有非常重要的实际意义。在软件系统的实现上,本文开发了一套新闻抓取服务Bloodhoof和个性化推荐与冷启动推荐Carine三者协同作用的完整的个性化推荐系统,并命名为牛赞网。牛赞网采用B/S的三层架构模式,利用Python和LNMP开发环境,开发出了一套完整的个性化推荐系统。该系统从软件体系结构、系统模块、数据库、接口方面进行了设计与实现。最后通过测试表明系统的功能、性能、用户体验等均达到了基本的要求。