微博中的文档扩展和好友推荐算法研究

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:jake9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博,一种强大有效的传播媒体和网络平台。随着微博用户的持续增加,产生大量的短文本,而针对短文本的信息处理也成为研究热点。如何在数以亿记的微博数据中信息中获取自己的所期待的内容成为一项严峻的研究。针对于微博用户发布的内容及操作行为进行研究,其中涉及到的信息扩展技术、个性化推荐技术等都成为研究重点。本文以微博短文本为主要研究对象,在深入了解微博特点的基础上,对微博内容的检索系统中的文档扩展子模块进行研究,对微博用户的行为进行挖掘,研究用户活跃度对个性化好友推荐的影响,主要的研究内容及工作包括如下:第一,调研现有阶段成熟的查询扩展的技术和个性化推荐技术。通过国内外查询扩展和推荐技术的发展,认识现有技术的发展现状,深入研究了多种经典算法,引出本文中涉及到的文档扩展算法和基于活跃度的用户推荐的算法。同时就算法的评价指标进行介绍,便于后续文中算法的衡量。第二,设计和实现了微博短文本的文档扩展模块。本章分析了因微博短小、关键词稀疏等原因导致的文档建模过程困难,提出基于微博文档扩展的检索算法,提升文档模型估计的精确度,将现有语料库作为文档信息增加的来源,根据文档的伪查询反馈获得相似近邻文档,并对现有语料库进行补充,提高语料关键词、热点词的概率分布,提升对于微博检索的潜在信息的发现,在已有的TREC微博数据上进行验证,表明对文档扩展能够改善检索的性能。第三,设计和实现了微博好友个性化推荐中的基于用户活跃度的子系统。研究用户活跃程度对推荐效果的影响,挖掘微博用户的行为特点以及操作行为,通过用户操作矩阵和活跃度矩阵的描述获得对于用户活跃度的描述,明确用户活跃度对于个性化推荐的影响因素,改善已有的微博推荐系统。这些技术的不断深入有效的改善检索和个性化推荐的效果,提高用户对于检索结果和个性化推荐命中率和满意率,提升微博检索效率,优化推荐的结果,提升用户体验。
其他文献
在学习母语时,我们中国人应该注意“阅读、理解、涵泳、欣赏和积累”.《语文课程标准》各学段关于朗读的目标中也要求“有感情地朗读课文”,要让学生在朗读中通过品味语言,体
一直以来,物理都是高中生学习的难点,这主要是由于物理本身具有较强的理论性与实验性,学生在学习过程中会感到吃力,因此他们的学习积极性普遍偏低,这样不仅影响了高中物理教
“探究与分享”贯穿于《道德与法治》教材始终,是教材的一大亮点,也是初中思想品德课教学的重要环节.在初中道德与法治教学中,探究与分享这一环节,具有鲜明的特征,通过探究与
心电设备检验标准是心电设备设计和检验的依据。好的心电设备检验标准不仅是心电设备性能和质量的保证,也意味着高的检验效率和低的生产成本。现有的心电设备检验标准五花八门
目前,高中语文教学活动目标直指高考,语文阅读缺乏深度,为了追求答题速度和答案的标准,各种阅读技巧应运而生.换言之,高中生的阅读行为具有很强的功利性和目的性,学生阅读的
核心素养背景下,传统“满堂灌”的教学模式已经无法满足当前的教学需求,必须要创新和优化课堂教学模式,借助任务型教学模式,以激发学生学习兴趣,提升高中地理课堂教学质量.本
星载合成孔径雷达是七十年代后期发展起来的,近年来午到广泛应用的先进技术.本论文先介绍了合成孔径雷达的回波模型、成像模型等基本概念,在此基础上对星载合成孔径雷达的成