论文部分内容阅读
在这个网络无限发展的时代,最具有代表性的新兴网络平台就是微博。微博的出现让人们通过虚拟网络获取大量的实时的信息。微博作为一个新的传播平台,为用户提供越来越多信息和服务的同时,同时也出现了信息超载等一系列的问题。在微博的海量信息中,用户面对着如何能及时地获取所需要的信息等问题。本课题的意义就在于,可以为用户提供个性化的话题推荐,解决用户面对的信息超载等问题,为用户节省时间,更有效的使用微博,加强微博用户的使用体验。
本研究在学习国内外关于个性化推荐系统的基础上,将基于内容的推荐算法应用到国内的微博平台----新浪微博,完成了为特定用户推荐热门微话题的算法,并通过实证研究和用户访问验证了实验结果的准确度。具体研究内容包括:⑴研究了数据抓取技术和数据预处理技术;⑵采集新浪微博24个微话题和大量微博用户的微博内容,通过TF-IDF文本表征方法进行表示;⑶利用改进后的相似性计算方法计算微话题与用户微博内容之间的相似性,并得到相应推荐排名;⑷通过对微博用户的访问调查验证实验结果的准确度。在以后的研究工作中,笔者将不断改进本文中的推荐算法,与其他推荐算法相结合,得到更精准的推荐结果。