论文部分内容阅读
随着互联网及计算机技术的快速发展,信息时代面临着严重的信息过载问题,这就要求通过技术手段过滤无关信息,仅为用户提供其感兴趣的信息,以实现信息的个性化推荐。如何有效地挖掘用户的个性化兴趣,是实现个性化推荐的关键所在。近年来,随着微博的快速发展和广泛应用,微博已成为一种重要的社会化媒体。微博是以兴趣相近为纽带组成的网络社交平台,用户的兴趣、行为等都可通过其微博透露。微博凭借内容简洁性、终端扩展性、平台开放性和低门槛等特性迅速赢得网民青睐,已发展成为个人表达与社会交往,事件参与和内容分享的重要平台,深刻影响了经济社会的发展。因此,深入研究用户微博,挖掘用户的个性化兴趣,将为个性化推荐提供一种潜在的途径和渠道。微博有明显区别于其它社会网络之处,其特点有社会媒体性、大规模、噪音数据多样、非线性、快速传播演化、以及多关系,必须采用与其它社会网络的不同方式来进行分析挖掘。本文以用户兴趣挖掘为目标,针对微博内容的时效性、微博兴趣的社交特性以及用户兴趣的更新性等问题进行深入研究,本文的主要创新点及贡献如下:(1)针对微博内容的时效性问题,提出一种基于微博的T-LDA用户自身兴趣挖掘算法,有效地解决了随着时间用户兴趣会发生迁移,可能不再关注原来的兴趣的问题。本文提出一种时间敏感的T-LDA算法,该算法主要从三个方面挖掘用户自身兴趣,其一是用户长期兴趣,即长时间内用户微博内容中反复涉及的主题信息;其二是用户近期兴趣,即用户在近期内其微博内容中涉及的之前没有的主题信息;其三是用户的过期兴趣。综合考虑兴趣主题的时间和权重,挖掘用户自身兴趣。实验结果表明,该算法能挖掘出用户更满意的自身兴趣主题。(2)针对微博兴趣的社交特性,提出一种基于用户社交圈兴趣挖掘算法FInterest,有效解决了用户社交兴趣没有得到关注的问题。本文提出一种FInterest用户关注人兴趣挖掘算法,该算法首先对用户关注人进行分析,得出用户特别关注人列表,其次着重挖掘用户特别关注人的长期兴趣,它代表关注人长期稳定的兴趣范畴;最后挖掘所有用户关注人的即时兴趣,代表用户兴趣发生迁移的可能兴趣范畴。实现了用户社交兴趣的有效关注。实验结果表明, FInterest算法来进行挖掘用户关注人兴趣可以更有效的获取用户兴趣主题。(3)针对不能及时获取最新用户兴趣的问题,提出一种引入评价反馈机制的用户兴趣模型更新算法,解决了不能及时更新用户反馈的问题。本文提出一种引入评价反馈机制的用户兴趣模型更新算法,该算法通过让用户对系统所推荐的信息进行评分反馈或链接阅读反馈,记录下每个链接对应主题,然后对对应用户主题进行推荐值增益或消减,有效实现了用户反馈的及时更新。实验结果表明,引入评价反馈机制的用户兴趣模型挖掘更能挖掘跟踪用户最新兴趣迁移动向,获取更真实的用户兴趣,也更精确地实现了信息个性化推荐。本论文深入分析微博的特点,针对其内容的时效性、微博兴趣的社交特性以及用户兴趣的更新性等问题进行相关研究,通过实验结合利用新浪微博开放平台以及豆瓣网开放平台,对设计的相关算法进行验证和测试,为开展基于微博的个性化推荐研究奠定坚实的理论基础。