微博用户偏好分析与建模

来源 :北京交通大学 | 被引量 : 3次 | 上传用户:acmilanno1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为近年来飞速发展的社交网络应用,微博已成为人们日常生活中进行交流和信息获取的重要途径之一。微博的内容包含了用户的兴趣偏好信息,这些隐含在微博当中的用户偏好信息对用户建模、内容推荐、热点事件走向预测、为用户提供个性化服务方面都有重要作用。但隐含在文本信息中的用户兴趣偏好难以直接获取并对其进行描述,如何准确地对这些信息进行挖掘和描述成为了急需解决的问题。  本论文以微博数据为对象,分析研究了微博用户偏好的描述和建模方法,并对所提出的方法进行了实验验证。论文的主要工作如下:  (1)针对微博用户兴趣偏好主体不明确,且传统基于用户手动添加兴趣标签等方法数据稀疏、更新不及时,无法准确描述用户偏好的问题,本文采用了文本分析的方法来获取用户兴趣偏好,进行用户偏好建模。本文所提出的方法首先结合了用户在微博的行为特点以及兴趣随时间转移的特点,改进了关键词权重的计算方法,然后将计算结果作为结点权重引入到图模型投票算法TextRank中,通过改进的TextRank对用户微博中的兴趣关键词进行了提取。实验结果表明,与传统方法相比,本文所提出的方法将用户兴趣关键词提取的准确率和召回率分别平均提升了2.97%和2.67%。  (2)针对当前用户兴趣偏好提取与建模方法主要从词频、语义、主题等角度进行分析,但忽略了用户对于不同兴趣的情感与偏好程度的问题,本文提出了用户对于某一兴趣的偏好程度与其对于该兴趣的情感强度相关的假设,并基于这个假设把情感分析结果作为衡量用户对于兴趣偏好程度的方式引入了用户偏好建模。在文本情感分析方面,本文结合微博文本特点,对情感词典进行了极性以及强度的调整,并提出了基于依存句法与语义依存的情感分析方法。相较于传统的方法,本文的情感分析方法将情感识别的准确率、召回率、F值与改进前的方法相比分别提升了2.03%,2.98%,2.53%。基于微博数据的用户偏好建模实验结果也表明提出的结合情感分析的用户偏好建模方法有较强的适用性。
其他文献
学位
圆柱形构件被广泛应用于航天航空、汽车制造、国防弹药等领域。由于在生产过程当中,容易造成气孔、夹杂等缺陷,影响着产品的最终使用性能。因此在产品生产或使用过程中需要对其
深度图像作为一种三维场景信息的表达方式在当今的计算机视觉系统中得到了广泛的应用,然而激光雷达、TOF相机、Kinect等各类深度传感设备所获得的深度图像往往并非完美,通常
目前国内3G技术已面向市场,它为广大消费者提供了更多集趣味性、娱乐性、业务性于一体的基于位置的服务。同时,蓬勃发展的物联网也为基于位置的服务提供了更广阔的应用空间,
无线传感器网络是一种由传感器节点构成的网络,可以使普通物体具有感知和通信的能力,在国防军事、环境监测、民用及工业等领域有着广阔的应用前景。但无线传感器电池目前存在
红外偏振与红外光强图像的融合作为热红外目标跟踪与识别的前端关键技术,在军用和民用领域都有着广泛应用。当前,两者的融合算法多为事先确定的,而实际应用中两者的差异特征是动
数字化的语音传送、控制和识别是信息社会的基本组成部分之一。但是语音信号在获取和传送途中,都会不可避免的受到各类噪声的干扰,不仅导致接收者听到的语音质量下降,还会影
物联网最近两年在我国迅猛发展,无线传感器网络被形象的比喻成物联网的神经末梢,作为物联网的主要技术之一也得到了迅猛发展,我国也把这项技术列入了长期科技发展规划中。能量问
随着汽车工业的发展,停车场建设的复杂化、规模化带了寻车难的问题,如何快速的找到汽车成为汽车用户和停车场管理人员关注的焦点。受到停车场环境特殊,多样化的影响,传统的室外定
图像配准技术是计算机视觉的一项基础任务,其应用领域包括医学图形处理,遥感图像处理,图像融合,图像搜索,机器视觉,虚拟现实,目标识别,环境监测,图像拼接,安全监控以及地理信