基于用户兴趣的微博个性化信息推荐研究

被引量 : 0次 | 上传用户:redghy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动智能和互联网的飞速发展,人们从信息匮乏的年代过度到了信息过载的时代。微博作为一种新型的社会化自媒体平台,近年来用户数量呈指数增长,每天生成大量的UGC(User Generating Content)。如何挖掘用户的个人兴趣建立用户兴趣模型,并将用户感兴趣的信息从海量信息中找出推荐给用户显得尤为重要。本文以微博用户的兴趣建模和微博个性化信息推荐为研究内容。主要包括:(1)传统的向量空间模型和TF-IDF方法没有考虑语义信息且存在用户特征高维稀疏的问题,而常用的基于文档级别词共现的潜在狄利克雷分配模型(Latent Dirichletallocation,LDA)并不适用于微博这种短文本的主题挖掘和用户兴趣建模。鉴于此,本文引入适用于短文本的主题模型BTM(Biterm Topic Model)挖掘用户的个人兴趣,结合用户兴趣的多变性,提出基于时间窗口的用户动态兴趣模型。(2)在用户兴趣模型的基础上,针对微博中用户收听列表信息过载的问题,提出综合考虑微博本身质量、用户个人兴趣和社交兴趣这三个主要特征的推荐模型,并在模型中引入协同过滤的思想。针对微博中用户主动获取的其他信息(非用户收听列表的信息),提出一种基于主题的信息推荐思想,并以美食主题为例,设计了整个应用。(3)通过Big Data平台获取实验数据,通过实验验证了BTM建立的用户兴趣模型在推荐性能上要优于LDA及TF-IDF模型且考虑用户兴趣的多变性能进一步优化推荐效果;在三个主要影响因素中,结合了协同过滤思想的用户个人兴趣特征推荐性能最优,用户社交兴趣特征次之,微博本身质量特征最差;本文提出的推荐模型从用户兴趣建模出发,针对不同的场景结合不同的特征构建推荐模型,任何UGC平台的信息推荐问题都能够在本文的研究基础上进行扩展利用。
其他文献
山西介休窑是山西著名的瓷窑之一。本文结合故宫所藏的百余片金代介休窑址标本,就该窑的相关问题加以论述。
本文以中国地调局“新疆1:25万三道岭幅区域地质修测项目”为基础,通过野外地质调查,选取新疆巴里坤地区上石炭统柳树沟组与七角井组地层为研究对象。从空间分布、接触关系、地
近几年中国房价只涨不跌与数次中央调控的收效甚微似乎已经不能仅仅用传统的经济学理论来解释中国房地产市场的畸形发展。种种经验表明在中国改革开放进程中,一些财政政策、货
太阳能由于具有安全性高、资源无限、不受地域限制、清洁可再生等优良属性而成为人类发展所必须的绿色清洁能源,光伏发电就是将这一绿色清洁能源转化为电能的过程,因此光伏行业
东南亚历史和文化的整体性和多样性经历了复杂的历史变迁。总体而言,东南亚各国在文化上有着重大差异,而把东南亚作为一个研究对象,与东南亚文化在历史上是否一直是一个整体
<正>为了实现"大而全的软件公司"的目标,红色甲骨文用收购的大棒横扫"千军",两年多以来,不到两个月时间收购一家公司的速度让业界震惊。在不顾一切、甚至不计后果地提升发展
对于船舶总体设计而言,它涉及到建造经济性、浮性、稳性、快速性、操纵性、工艺等,是一项设计周期长、涵盖范围广的复杂系统工程设计问题。随着结构、水动力、控制等学科理论不
目的观察针灸联合自拟中药方剂内服法治疗女性痤疮的疗效及其对患者生活质量的影响。方法将100例痤疮患者按照就诊顺序随机分为两组,其中针药联合组50例,按照辩证分类进行针
目的探讨腹围<90cm患者上腹部增强CT低剂量检查中低电压自动管电流调节技术(ATCM)与图像质量的相关性。材料与方法将100例上腹部CT增强的腹围<90cm患者随机平均分为两组(每组50例
目的观察高脂饲养的载脂蛋白E基因敲除小鼠动脉粥样硬化斑块表达Toll样受体2和血小板因子4的情况,探讨血小板因子4对内皮细胞Toll样受体2表达的影响。方法高脂饲料喂养载脂蛋