基于微博用户的行为分析与应用研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:dddddddddddddzzzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博在社交网络中占据重要地位,是人们快速获取各种最新资讯的平台,其随时性、时效性特点一直备受大众喜爱。一方面微博为大众提供娱乐休闲、生活服务的信息分享和交流;另一方面也实现消息的裂变传播。新浪微博作为国内最主流、最具人气的社交网站一直位于Alexa排名前列。对微博历史数据进行研究可以寻找微博热词,定位公众关心的焦点问题,同时根据用户评论,也可以间接了解公众的价值导向。目前国内对微博的三大用户行为:转发、评论和点赞进行综合研究的文献较少。因此,本文重点研究建立用户行为的整体预测模型。具体研究内容如下:第一,本文从博文内容、用户行为和时间分布这三方面来选取模型特征。首先,针对博文内容进行挖掘,选取文本特征关键词。其次,针对不同用户的转发次数分布的不均衡性,利用FCM(模糊C均值)算法对微博用户的转发数进行模糊聚类,通过各簇权重来刻画用户的历史记录。然后,针对用户发表微博的时间分布特点,计算出不同时刻微博用户的平均转发、评论和点赞数。显然,一条微博如果是在用户最大可能性登录微博平台的时间段内发布,则这条微博被阅读的可能性会得到极大提高。最后,本文综合以上特征构建了距离加权KNN模型和FCM加权KNN预测模型。第二,本文选用整体评分作为模型衡量指标,比较普通KNN算法模型,距离加权KNN模型和FCM加权KNN模型的预测效果。本文同时考虑了文本特征词个数对模型预测结果的影响,分别选出100、150、200、250、300个不等的文本特征词作为预测模型的输入,观察整体评分的波动情况。最后,通过对三种算法的比较,本文得出当文本特征词个数为100时,FCM加权KNN预测模型能实现26.62%的整体评分且高于普通KNN算法和距离加权KNN算法。说明在实验范围内FCM加权KNN模型能挖掘出更多微博信息,且具有普通KNN算法和距离加权KNN算法的共同优势。
其他文献
目的研究应用维生素D辅助熊去氧胆酸(UDCA)治疗原发性胆汁性肝硬化(PBC)患者的疗效及其对血清25-羟基维生素D3(25-(OH)2-D3)和外周血T淋巴细胞亚群的影响。方法2013年4月~201
针对差分式光学电流互感器抗外磁场干扰能力差的问题,提出一种提高其磁场抗扰度的新方法。建立差分式光学电流互感器的磁场抗扰度数学模型,研究不同布置方式下差分式光学电流
目的比较股骨近端防旋髓内钉(PFNA)与股骨近端锁定钢板治疗高龄股骨转子间不稳定骨折的临床疗效。方法回顾性分析我科2007年9月至2013年3月,102例股骨转子间骨折高龄患者(>75
本文以14所体育院校为研究对象,借助专利情报分析方法从专利申请数量、结构类型、研发机构、研究热点对我国体育院校冬季项目相关专利进行了分析,以期为各高校进行冬季项目相
本文介绍一种新型、高效、实用的六角车床专用辅具,用于加工差速器壳体内球面,很好地解决了内球面加工精度要求高和加工困难的矛盾。
从电影短片衍生出来的微电影一直是高校电影专业创作、学习和教育的重要形式。但大学生微电影存在类型单一、叙事稚嫩和市场接受度差的先天性缺陷,致使电影创作的教育效果大
<正>1 断裂原因我厂生产的农用三轮运输车曾一度出现半轴断裂较多的情况,严重地影响了我厂的声誉.
近日,在中国一欧盟社会保障合作项目“医疗保险研究班”上.欧盟医保专家冈特&#183;丹纳博士对27个成员国进行了认真分析,他将这些国家的医保模式分为4类,即”国家卫生服务制度、
针对太钢1 549mm热连轧厂4座板坯加热炉采用脉冲燃烧技术的特点,设计了基于模糊PID控制理论的数字化燃烧控制系统。通过控制每个烧嘴的开关时间,达到控制燃料和空气给进量从
出于对环境保护的重视,绿色施工技术在房屋建筑行业的应用越来越普遍。本文通过对绿色施工阐述,简要分析目前房屋建筑工程绿色施工的现状和方法,提出了一些解决建议。