论文部分内容阅读
近年来,视频点播网站逐渐成为观众追剧的主要途径,电视剧在网络与卫视中同时首播的模式也变得常态化。以点播量作为主要收入指标的视频网站,越来越希望购买到热门的视频资源,视频越热,点播量越高,而不断提高的视频播出版权价格,导致视频网站之间的竞争非常激烈,能否提前预判电视剧的点播热度非常重要。随着社交网络的发展,在新浪微博中宣传的电视剧越来越多,用户只需关注电视剧公众账号或相关演员、导演,便能了解到电视剧的最新动态和其他观众的看法。搜索引擎则能直接给出电视剧的详细介绍和点播链接,这两类数据都是用户主动行为所产生的,体现了用户对电视剧关注的意愿。如果能通过这类网络数据对电视剧点播热度进行预测,那么播出版权购买决策上的成本可得到减少,同时还能为视频网站中的推荐和搜索服务带来更开阔的策略选择。本文首先对微博中电视剧的评论进行了情感倾向分析,提出了融合评论对象和电视剧评论模式的情感倾向分析算法TT-OM,该方法充分考虑了情感词作用在不同评价对象上的情感差异和电视剧领域中特有的评论模式。随后从以下几个方面对电视剧点播量进行了分析:微博流行度、搜索热度、主演和导演热度、电视剧评论情感倾向等,通过相关性分析,从潜在影响电视剧点播因子集中确定了多个与电视剧点播量显著相关的因素,并发现社交数据与搜索数据在不同时间段的预测效果差异。基于此,本文提出了融合社交与搜索数据的电视剧的点播量排名预测算法,在真实的优酷和爱奇艺电视剧数据中,本文的排名预测结果与真实点播排名之间的斯皮尔曼系数分别0.82**和0.89**。