论文部分内容阅读
随着大数据时代信息量的快速增长,微博数据过载情况越来越严重,同时,微博数据结构也越来越复杂。这种情况导致微博用户很难从海量的知识中快速、准确地获取对自己有用的信息。针对上述研究背景,本文提出了基于知识流和用户选择的微博话题推荐。该推荐模型通过知识流的构建解决由于微博话题数据量过多、过杂而引起的微博话题推荐效率过低的问题,提高微博话题存取速度与存取效率,并通过用户选择提高微博话题推荐的准确度。具体研究内容分为以下几个方面:第一,微博话题的用户群聚类。本文通过分析用户的历史行为,得到每个用户有关微博话题的兴趣向量;再利用K-Means算法实现对微博用户的聚类,得到k个用户群和每个用户群的核心用户,保证这些用户群满足群内高相似度,群间低相似度。将微博用户进行聚类,可以提高微博话题推荐的效率。第二,微博话题知识流的构建。为了尽可能保证知识流中的微博话题都是值得推荐的,本文在微博话题知识流的组织之前,依次根据微博话题的兴趣度及其与用户群之间的关联度对微博话题进行了两次筛选。两次筛选有效改善待推荐微博话题知识流的质量,从而提高微博话题推荐的准确率。第三,基于用户选择的推荐与知识流的更新。本文根据用户群与知识流中微博话题的关联度进行排序,并将组织好的知识流推荐给该用户群;由于知识流中的微博话题随着时间的流逝兴趣度会发生改变,而用户的选择也会对两者的关联度造成影响,本文以此为依据实现知识流的更新,最后根据用户的反馈验证模型的有效性。实验结果显示,该算法能够在一定程度上提高微博话题推荐的准确度。本文创新地利用知识流对微博话题进行有效组织,以提高微博话题的推荐效率,并加入了用户选择以供机器学习,从而提高微博话题推荐的准确度。本文提出的方法在当前海量信息的环境下有较好的理论研究意义和实际应用价值,其不仅可以运用到各种社交平台,也可以运用到网络购物平台。