成人图像视频检测研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:aaavvv001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
成人图像视频检测(Adult Image/Video Detection)旨在快速准确地从互联网上的海量数据中识别含有色情内容的图像和视频,在信息过滤和视频监控等领域具有广阔的应用前景。   根据特征提取方法的不同,成人图像视频检测方法可以分为基于人体肤色的检测方法、基于视觉单词(Visual-Words)的检测方法和基于多模态特征的检测方法三种类型。目前大多采用基于人体肤色的检测方法,但是误检率偏高。基于视觉单词的检测方法是检测“色情部位或色情姿态”的有效手段,然而,现有方法在视觉单词提取过程中,量化损失较大、背景噪声较多。基于多模态特征的检测方法利用音频等模态信息检测“色情行为”,但是,现有方法中缺乏准确的音频语义表示方法,导致检测性能仍然偏低。   本文针对上述问题,在基于视觉单词软加权、视觉注意模型的成人图像检测和基于音视融合的成人视频检测等方面展开较为深入的研究,取得了如下研究成果:   1.基于视觉单词软加权的成人图像检测   为了提高成人图像的检测性能,提出基于视觉单词软加权的成人图像检测方法。该方法使用基于密度的聚类算法过滤噪声,运用区间逼近策略获取合适的词表尺寸(Vocabulary Size),采用软加权(Soft-Weighting)减少视觉单词提取过程的量化损失。实验结果表明,该方法提高了成人图像的检测性能,在误检率(False Positive Rate)为15%时,检出率(True Positive Rate)比基准方法(Baseline)提高约4%。   2.基于视觉注意模型VAMAI的成人图像检测   兴趣区域(Region of Interest,简称ROI)是指包含“色情部位或色情姿态”的区域,精确提取ROI至关重要。本文提出基于视觉注意模型VAMAI(Visual Attention Model forAdult Images)的成人图像检测方法。首先,提出基于多尺度和埘比的显著图模型,并与肤色分类模型和人脸检测模型相结合,构造了一种新的视觉注意模型VAMAI,用于较精确地提取ROI。然后,提出基于VAMAI的视觉单词提取算法,用于提高BoW(Bag-of-Words)模型的检测性能。最后,比较多种全局特征的性能,从中选择颜色矩,将它与BoW的支持向量机分类结果进行后融合。实验结果表明,该方法能够较精确地检测ROI,并显著提高了成人图像的检测性能。当误检率为15%时,检出率比基准方法提高约17%。   3.融合音频单词与视觉特征的成人视频检测   随着互联网上低质视频的快速增长,单纯依靠视觉特征难以满足成人视频的过滤需求。为了快速准确地过滤成人视频,提出融合音频单词与视觉特征的成人视频检测方法。首先,提出基于周期性的能晕包络单元(Units of Energy Envelope,简称EE)分割算法,将音频内容表尔为EE的序列。其次,提出基于EE和BoW的音频语义表示方法,将EE的特征表示为音频单词(Audio-Words)的出现概率。然后,采用复合加权的融合方法融合音频单词与视觉特征的检测结果。最后还提出基于剧期性的成人视频判别算法,用于提高判别性能。实验结果表明,与基于视觉特征的方法相比,该方法显著提高了成人视频的检测性能。当误检率为9.76%时,检出率可达94.44%。   总之,本文的研究工作在深入分析现有成人图像视频检测技术不足的基础上,通过对优化视觉单词提取、精确提取ROI和准确表示音频语义等几个关键问题的深入研究,提高了成人图像视频的检测性能,从而为图像视频信息的过滤与监控等应用提供了良好的解决方案,具有广泛的应用前景。
其他文献
优化的模型观察方法是图形学中重要的研究方向,广泛应用在基于图像的建模、场景漫游、镜头控制、体数据绘制和医学数据可视化等方面。近年来,随着三维模型扫描及建模技术的不断
随着图形显示技术日趋完善,非真实感绘制(NPR)近年来引起了人们的极大兴趣,成为计算机图形学中的一个重要分支。NPR风格画模拟是计算机技术和绘画艺术相结合的一个研究领域,主要
科学研究、经济领域和工程实践中的优化问题大多是多目标问题。多目标问题的最优解是一个集合,而多目标演化算法一次进化过程可以得到多个可行解,近年来演化算法逐渐成为求解
全方位视觉由于其视角较传统视觉大而在机器人、视觉监控、多媒体等领域得到广泛应用。反射折射式全方位视觉由于采用一次成像,水平视角较大,得到广泛而深入的研究。另一方面,由
由于大规模植被场景的复杂性和多细节的特征,传统的基于几何多边形的绘制方法面临两大问题。首先是绘制细节时产生严重的走样,导致视觉效果下降;其次是绘制效率会随着复杂度的
随着数据中心的普及与不断发展,更多的商业应用系统被开发和部署到各商业企业及公共服务部门,本文通称该类应用为数据中心应用。由于数据中心应用的负载具有不可预知的波动性
随着国民经济的迅速发展,私家车数量也越来越多,但同时汽车被盗己成为世界一大公害,给人们带来了巨大的经济损失。因此,利用车载GPS/DR(全球定位系统/航位推算)组合定位系统
随着Internet及其应用的快速发展与普及,越来越多的软件系统开始部署并且运行在网络环境上,计算机软件开发、部署、运行和维护的环境开始从静态、封闭和可控逐步走向动态、开放
无线传感器网络是一种功能集成、应用广泛、性价比高的网络系统,近年来已成为国内外研究热点。本文对无线传感器网络进行了深入学习,对传感器网络的历史、现状以及未来发展趋
在日常的生活和娱乐中运用三维效果,已成为当前信息社会的一个发展趋势,办公也不例外。然而,由于通常的三维模型格式都比较复杂,携带了大量的高精度的工程数据,使得三维文件的体积