论文部分内容阅读
随着互联网的高速发展,人们越来越习惯于在互联网上表达自己的看法、观点及情感,也越来越习惯于从别人发布的信息中获取信息,形成了一个广大用户主导的互联网模式。社会媒体就是在这样一个环境下发展起来的。社会媒体,是指人们用来创作、分享、交流意见、观点及经验的虚拟社区或网络平台。人们越来越多地在各种社会媒体上发表自己的观点,这些观点通常代表着用户的情感倾向,可以被分为两类,一类是用户本身发表的文本信息,比如微博的博文、点评网站的评论等;另一类则是用户对物品、事件等的打分,比如对餐馆的评分等。用户评分预测研究正是对这些蕴含情感的信息的分析与研究。用户评分预测,即给定一个用户,预测其可能对一个物品的评分。因为用户对产品一些特定方面的质量有着个性化需求,所以现在有很多工作都在研究方面评分预测问题。它的目的是从在线评论中提取热点方面,然后为每一方面预测得分。因此,本文从方面评分的角度来研究社会媒体中的用户评分预测问题。然而,方面评分预测问题面对着两个挑战:(1)如何有效地整合评分信息与评论信息;(2)如何有效地融合对象的内容信息和网络结构信息。针对这两个挑战,本文设计了两个新颖的方面评分预测模型,分别是MaToAsp和HINToAsp。如何有效地整合评分与评论信息是方面评分预测问题的核心。矩阵分解是针对评分预测的最有效的手段之一,而主题模型广泛应用于评论处理,所以一个自然的想法就是结合矩阵分解和主题模型来进行方面评分预测。然而,这样的结合会遇到几个挑战:如何设计适当的共享因子,如何解决隐分子的规模不匹配问题以及如何建立评分与评论间的依赖关系。在本文中,我们提出了一个新颖的方面评分预测模型MaToAsp,有效地融合了矩阵分解与主题模型。在中、英文两个真实的数据集上的实验表明:相比于其他的对比方法,MaToAsp不仅获得了更合理的方面识别结果,也达到了最好的方面评分预测效果。最近,异质信息网络成为数据挖掘领域的研究热点,它包含了不同类型的节点与边,拥有更加复杂的结构信息,同时也可以表达更加丰富的语义。主题模型一直是文本分析领域中的重要方法,在文本挖掘、评分预测等方面应用广泛。但是,主题模型只考虑了对象的文字内容,没有考虑到文字外的信息。在本文中,我们将异质信息网络与主题模型结合起来,设计了一个统一模型HINToAsp来解决方面评分预测问题。HINToAsp利用主题模型来建模对象的内容信息,同时利用异质信息网络来建模对象的结构信息,通过随机游走框架使这两部分信息相互影响、相互加强,进而提升方面评分预测的准确性。在中、英文数据集上的实验验证了 HINToAsp的有效性。