基于图排序的微博个性化主题搜索

来源 :浙江大学 | 被引量 : 0次 | 上传用户:chenenm0702
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0技术的迅猛发展,互联网已经不仅仅是一个信息获取途径,更重要的,它已成为人们发布信息的平台。微博服务,作为一个新兴的互联网应用,受到用户的追捧。由于用户的广泛参与,微博上的信息呈现爆炸式增长,同时信息的结构也变得更加复杂和多元化,这使得微博上的信息检索变得越来越困难。传统的信息检索技术虽然在网页检索中取得了巨大成果,但却无法直接应用到微博上,这是因为,微博上的关系结构相比网页的链接关系要复杂很多,而且微博的内容短小,主题杂乱,不适合基于字词的简单匹配和查找。  为了解决微博上的信息检索问题,本文提出了一种基于图排序的个性化主题搜索算法。该算法将微博中的实体进行分离,得到微博,用户以及字词三种实体,通过三种实体之间的关联,建立微博的图模型。在微博图模型基础上,算法将三种实体及其关系结构映射到一个最优的语义空间,新的语义空间能够最大程度的保持对象在原始空间的关系,使得原始空间中关系越紧密的对象在新的语义空间中距离更近。在新的语义空间中,可以对不同的用户和查询词,快速找到主题相似的微博,从而提供个性化的主题搜索功能。  在微博主题搜索算法中,需要建立微博和字词之间的联系,本文通过主题建模的方法,同时结合微博的结构特征以及用户的语法习惯,提出了一种带偏置的词排序算法,该算法可以有效的提取微博字词,从而更好的支撑微博的主题搜索。  最后,本文对微博的主题搜索算法和字词提取算法分别作了有效性验证,实验结果证明了上述两个方法较以往的算法在微博数据上效果有显著提升。
其他文献
随着互联网和电子商务的迅速发展,如何将合适的产品和服务推荐给用户,成为了信息时代最具挑战性的问题之一。个性化推荐系统在这信息爆炸的时代应运而生,它能主动的预测到用户的
随着电力工业的发展,变电站的数字化、信息化的要求越发迫切,数字化变电站成为了变电站自动化系统的发展方向,在变电站在线监测系统中,数字化变电站网络通信也显得尤为重要。本文
自20世纪末以来,虚拟现实技术一直是信息领域研究、开发和应用的热点方向之一。它借助计算机构建出一个与现实环境十分逼真的虚拟环境,而且支持用户使用自然的技能亲身感受它
随着移动互联网、物联网等新兴领域的蓬勃发展,人类社会正逐步从大数据时代向移动大数据时代演进。据统计,全球移动手机占有率预计2020年达到28亿,随之产生的移动数据规模以
微博作为一个新兴的社交媒体服务,从各个方面渗透并影响着人们的生活,成为人们共享信息、交流情感的一个重要平台。其中大部分的个人微博内容记录其生活经历、专业兴趣以及热点
多目标跟踪是智能交通系统中最重要的模块,它是实现交通监控智能化和其他视觉领域实时应用的关键所在。传统跟踪方法通常限定在特定的场景设计,对于各种复杂环境的变化难以应
感知哈希算法是多媒体信息安全领域的一个新课题,已应用于多媒体检索、多媒体索引、数字水印、多媒体认证和拷贝检测等方面。从本质上而言,它是一种单向映射函数,可把任意的多媒
高光谱图像(HSI)的信息量巨大,导致数据的传输、存储及处理都有很大的困难,如何有效地减少数据量、降低数据维数是高光谱图像处理技术中的重要研究内容。本文采用波段选择的方
随着互联网所承载的信息量日益增大,如何在互联网上快速高效的找到用户所需要的数据是互联网发展的方向。结构化数据的存储为海量信息的查找提供了途径,因而出现了越来越多的
随着虚拟化技术大量应用于云计算与大数据领域,数据中心中的虚拟机数量急剧增加。虚拟机热迁移是减少服务器管理和维护花费、提高资源利用率、实现绿色计算的关键技术。本文围