论文部分内容阅读
随着计算机性能的日益提高,以及数字化技术的飞速发展,越来越多的研究者,把关注的目光投向了多媒体文件的存储和应用。近年来,由于电影工业的飞速发展,每年都有数以千计的影视作品诞生,其中不乏优秀作品,但同样有不良内容的存在,这些不良内容对观影者,尤其是心理尚不成熟的青少年人群造成了较大的负面影响,而这些社会问题的出现,已经引起社会各界人士的广泛关注。
越来越多的心理学研究证实,影视节目中的暴力内容对青少年存在潜在的心理诱导作用。虚拟世界中暴力内容的存在,与现实世界中青少年犯罪存在着千丝万缕的联系。随着电影工业的飞速发展,包含暴力内容的影视节目日益增多,传统人工监测的方法耗时费力,已经不能满足现实需求,因此如何对影视暴力内容实行自动的检测和屏蔽,成为亟需解决的,具有现实意义的研究课题。本文研究的主要内容,即为影视节目中暴力内容的检测。
本文通过对大量含有暴力内容的影视节目的调研,以及对“电影语法”的研究,分析了影视节目中暴力内容在拍摄手法和制作手段上的共性,采用检测特定暴力事件的方法检测暴力镜头;采用弱监督学习的方法实现检测过程的自动化。本文的主要贡献如下。
(1)本文根据对影视节目中暴力内容的通用制作手法和表现手段,以及“电影语法”的分析,提出了“典型暴力事件”、“电影暴力类型”、“暴力事件”、“暴力对象”和“暴力区域”相结合的中层概念。实验证明,这些中层概念的提出,使对影视节目中暴力内容的检测通用框架的形式化过程更加便利和易于理解。
(2)由于传统的有监督学习方法需要对大量多媒体内容进行人工标注,耗时费力,本文中采用联合训练(Co-training)算法来实现影视节目中暴力内容的检测,这是联合训练算法在暴力检测领域的首次使用。联合训练算法通过在少量标注数据上训练生成若干分类器进行工作,之后用这些分类器来标注未标注数据。从新标注的数据中选取一部分可信度最高的标注数据加入到已标注数据集中。
(3)本文提出了一种在电影中检测暴力镜头的通用框架。检测过程分为两个相互独立的角度:音频角度和视频角度。音频角度运用基于概率潜在语义分析的学习方法来提高检测效果:视频角度运用结合典型暴力事件的分类器来检测暴力镜头。最终,音频分类器和视频分类器通过联合训练的方法进行融合。在若干部电影上的实验效果初步证明了本方法的有效性。
(4)本文在原有初步框架的基础上进行改进和扩展:音频角度引入时序信息,采用与隐马尔科夫模型(HMM)性能相似,但具有更宽松独立性条件的隐条件随机场模型(HCRFs)进行音频暴力的检测;视频部分将初步框架中的暴力事件加以扩展,形成对暴力区域的检测。