论文部分内容阅读
随着互联网与信息技术的发展,电影产业的从业人员越来越多地借助信息化手段来对产业中的流程以及人员选用进行优化。普通的观影用户也希望能通过数据分析手段了解到电影的更多信息。然而,传统的数据分析手段有着较高的使用门槛,可视化是近年来兴起的一种新形式的数据分析手段。它通过利用人的视觉理解能力的优势,将人的推理与分析能力加入到传统的数据分析手段当中。通过给分析人员提供可视化的结果与交互手段,可视分析系统能使人们从数据中发现传统分析手段难以发现的新知识。 多模态可视化是将数据集中包含的实体细分为多个不同类别来进行可视化的方法,它可以以不同的方式对各个模态进行可视化,并且能够更清楚的展示不同模态节点间的关系。本文采用多模态的概念,以不同的可视化方式呈现电影数据中的电影、导演、演员等多个模态的数据,并设计了多种布局方式来展现模态内部与模态之间的关系。 论文的主要工作如下: (1)基于多模态影人合作网络的电影数据可视化:为了展现导演和演员等影人之间的合作关系,本文改进只能处理单一类型节点的传统力导引图布局算法,在算法中引入多模态节点的概念,为不同模态节点间的连接关系设计了不同的力函数,使得不同类型的节点之间相互作用力与节点本身模态和属性相关,从而有效地展示了不同模态影人之间的合作网络。为了能够对影人合作网络提供有效的上下文用于可视分析,本文进一步采用密度图可视化与影人相关的影片的评分与影响力等信息,并将其作为背景展示,从而使得用户可以基于背景的电影分布更好地理解影人间的合作关系。 (2)基于主题的多模态电影数据多视图可视化:为了帮助用户从影片主题出发,分析电影的相似程度,探索主题与影人合作模式之间的关系,本文提出了一种多视图联动的多模态可视分析方法。通过对电影简介信息的分词处理,获得了电影的主题词信息,并从电影的主题词出发获得了比传统的电影分类方法更精确的电影间相似关系。在此基础上,依据影片相似关系进行影片聚类可视布局,并对用户感兴趣的电影群显示主题词词云和相应的影人合作网络视图。通过电影聚类、电影主题词云和局部影人合作网络这三个视图的可视化让用户更好地从影片主题出发理解多模态电影数据之间的关系。 (3)面向多模态电影数据的可视化原型系统和用户实验:为了验证上述多模态电影数据可视分析方法的有效性,本文设计并实现了一个面向多模态电影数据的可视化原型系统,提供了从影人合作关系网络与影片聚类出发的多个可视分析界面。系统采用结点链接图、密度图、词云等不同的可视手段来展现和分析不同模态电影数据间的关系。本文进一步设计了可视化任务与用户实验,对系统的有效性进行测试和分析,实验结果验证了系统的有效性。