基于微博的用户兴趣分析与个性化信息推荐

被引量 : 0次 | 上传用户:wcyzlh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的十几年中,互联网上的信息量迅速增加,人们从信息匮乏时代进入了信息过载时代。随之而来的是人们获取信息的方式的转变,从传统的人工寻找,到搜索引擎,再到现在的推荐系统。如何有效地给用户推荐有用的信息,最重要的一个环节就是如何有效地获取用户兴趣。微博等社交网络的出现给我们提供了一个新的分析用户兴趣的巨大的数据源,成为近几年研究的热点。本文对如何使用微博数据分析用户兴趣,以及进行个性化推荐的方法进行了分析和探索。与现有的工作相比,本文主要有以下几点不同。首先,考虑到每条微博内容都比较短的特点,我们并没有直接在微博数据上使用主题模型,而是使用外部知识库构建主题模型,用以对微博内容进行语义丰富,同时也避免了在微博数据上主题数目不容易确定的问题。其次,我们认为并不是所有微博都是与用户兴趣相关的,也就是所谓的噪音微博,而这些噪音微博会对模型效果造成影响。因此,我们从多个方面分析了用以识别噪音微博的特征,构建了一个联合分类器过滤掉噪音微博。最后,我们认为用户兴趣是会随时间变化的,提出了时间加权的主题分布来描述用户兴趣。在实验中,我们把我们的算法同非负矩阵分解算法和直接在微博数据上使用主题模型的算法比较。实验结果表明,本文的算法能够更有效地发现用户的实时兴趣。而且,在用户微博数量比较少或者噪音微博比较多的情况下,依然可以有效地分析出用户兴趣。
其他文献
第一部分双源CT灌注成像在颈部淋巴结良恶性鉴别中的应用目的使用西门子双源CT对颈部淋巴结病变进行CT灌注成像,之后分析不同病变性质淋巴结的各个灌注参数及形态学指标,总结
基本情况双江街道富泉村委会大甸中自然村,位于村委会南3公里处,距峨山县城驻地双江街道14公里。在练江畔,依山傍水,与小甸中自然村隔水相对。彝族聚居村寨,村落坐东朝西,民
MEMS (Micro Electro Mechanical Systems)陀螺仪具有低成本、高性能、可批量化等特点,在军事和民用领域有广阔应用空间。但由于其精度低,极大的限制了MEMS陀螺仪的应用领域和
教育的均衡发展是要提高处于相对薄弱地区的办学水平。城乡结合部是农村新进入城市建设的一部分,在教育上存在着许多的不足和问题。只有提高处于相对落后地区的城乡结合部学
蒙古族民歌是蒙古族文化、艺术发展的直接表现,蒙古族民歌改编的多声部合唱是蒙古族民歌表现形式多样化的体现,复调因素的应用是作曲家对蒙古族民歌改编的多声部合唱表现形式的
利用高衬底电阻率的180nm绝缘体硅(SOI)CMOS工艺设计了一种全集成的可用于手机和无线手持设备的多模多频单刀十六掷(SP16T)天线开关。由于衬底电阻率高达1kΩ·cm,且在器件选
随着互联网门户网站的崛起,以及人们在选购商品时对于互联网的依赖,人们往往会在选购商品前在网络上查找商品的评价信息。但是面对海量的评论信息,感觉无从下手,需要一种能够自动
产业技术公共服务平台是围绕产业对共性技术和关键技术的需求,为产业相关机构提供研究开发、技术转移和技术资源共享等技术性服务的综合性系统,它不仅能有效集成和配置科技资源
随着社会、经济的高速发展,人类社会开始全面进入知识经济时代。在如今快速发展、竞争压力大的信息社会中要想生存和发展,我们需要不断提高自主学习的能力,因此在高中阶段的
数字图像的动态范围是指最大像素值与最小像素值的比。现实中的场景有很高的动态范围,但是一般的成像设备受到物理器件的限制,只能得到场景一部分动态范围内的信息。目前,对于监