社会媒体中基于主题模型的用户评分预测研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:duoduodehua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,人们越来越习惯于在互联网上表达自己的看法、观点及情感,也越来越习惯于从别人发布的信息中获取信息,形成了一个广大用户主导的互联网模式。社会媒体就是在这样一个环境下发展起来的。社会媒体,是指人们用来创作、分享、交流意见、观点及经验的虚拟社区或网络平台。人们越来越多地在各种社会媒体上发表自己的观点,这些观点通常代表着用户的情感倾向,可以被分为两类,一类是用户本身发表的文本信息,比如微博的博文、点评网站的评论等;另一类则是用户对物品、事件等的打分,比如对餐馆的评分等。用户评分预测研究正是对这些蕴含情感的信息的分析与研究。用户评分预测,即给定一个用户,预测其可能对一个物品的评分。因为用户对产品一些特定方面的质量有着个性化需求,所以现在有很多工作都在研究方面评分预测问题。它的目的是从在线评论中提取热点方面,然后为每一方面预测得分。因此,本文从方面评分的角度来研究社会媒体中的用户评分预测问题。然而,方面评分预测问题面对着两个挑战:(1)如何有效地整合评分信息与评论信息;(2)如何有效地融合对象的内容信息和网络结构信息。针对这两个挑战,本文设计了两个新颖的方面评分预测模型,分别是MaToAsp和HINToAsp。如何有效地整合评分与评论信息是方面评分预测问题的核心。矩阵分解是针对评分预测的最有效的手段之一,而主题模型广泛应用于评论处理,所以一个自然的想法就是结合矩阵分解和主题模型来进行方面评分预测。然而,这样的结合会遇到几个挑战:如何设计适当的共享因子,如何解决隐分子的规模不匹配问题以及如何建立评分与评论间的依赖关系。在本文中,我们提出了一个新颖的方面评分预测模型MaToAsp,有效地融合了矩阵分解与主题模型。在中、英文两个真实的数据集上的实验表明:相比于其他的对比方法,MaToAsp不仅获得了更合理的方面识别结果,也达到了最好的方面评分预测效果。最近,异质信息网络成为数据挖掘领域的研究热点,它包含了不同类型的节点与边,拥有更加复杂的结构信息,同时也可以表达更加丰富的语义。主题模型一直是文本分析领域中的重要方法,在文本挖掘、评分预测等方面应用广泛。但是,主题模型只考虑了对象的文字内容,没有考虑到文字外的信息。在本文中,我们将异质信息网络与主题模型结合起来,设计了一个统一模型HINToAsp来解决方面评分预测问题。HINToAsp利用主题模型来建模对象的内容信息,同时利用异质信息网络来建模对象的结构信息,通过随机游走框架使这两部分信息相互影响、相互加强,进而提升方面评分预测的准确性。在中、英文数据集上的实验验证了 HINToAsp的有效性。
其他文献
更旺(福建)鞋服有限公司是一家集开发﹑生产于一体的现代化大型鞋服企业,主要生产国内体育品牌安踏运动鞋系列产品,是安踏的长期合格的成品供应商。更旺(福建)鞋服有限公司现行
金属纳米材料除有一般的纳米材料所具有的优越性能外还有其独特的光学性质,使的金属纳米材料在超灵敏监测、新型功能材料、化学生物传感、信息储存等方面均有很重要的应用前
睑袋命名、分型与手术步骤的商榷作者单位:518102深圳市宝安区西乡人民医院整容科韩玉玺近年来关于睑袋的文章较多,但文章中所用诊断与手术名称极不统一,如:眼袋、下眼袋、下睑袋,而手术
目的了解泸溪县2012-2016年水痘疫情特征,为制定水痘防治措施提供依据。方法采用描述流行病学方法对2012-2016年泸溪县水痘报告病例进行分析。结果 2012-2016年泸溪县共报告
我国政治协商制度萌芽于新民主主义革命时期,正式确立于中国人民政治协商会议第一届全体会议时期,完善于改革开放后,在党的十八大召开后进一步扩展为社会主义协商民主制度,并
第二次世界大战中,旨在破坏对方军事经济潜力和保卫己方海上运输的战斗,是同盟国和轴心国遂行海上作战的主要作战样式。交战双方围绕着海上保交和破交,在各大海洋战区展开了长期
随着建筑业飞速发展,科技水平不断提高,工程对混凝土的各种性能要求越来越高,工程不仅要求混凝土工作性能好、强度指标高、耐久性好等,而且还要求混凝土结构有光洁如镜的外观,尤其
叙事的“当下”性,小说的“移步换景、随物赋形”,毕竟与诗、画存在一定差异。诗、画的视角,就是作者的视角,作者与对象之间的关系是直接的;而小说的书写对象与作者之间,则夹
报纸
期刊
加筋土挡土墙是利用加筋土技术修建的一种柔性支挡结构物。介绍了一种高效、快速的加筋土挡土墙施工方法。