论文部分内容阅读
敏感图像作为不良信息的一种,严重破坏了健康的网络环境。为此研究者们提出了多种敏感图像过滤技术,其中以基于内容分析的过滤方法最为流行。然而,基于内容的敏感图像过滤技术目前仍存在肤色建模不够准确、特征提取不够完备、分类器性能不佳等缺点。在研究了当前过滤技术的前提下,本文提出了改进的过滤方法和基于人体关键部位检测的过滤方法。并将过滤方法应用于博客系统实现了用户上传图像的过滤。
首先,本文介绍了本课题的研究背景和意义,对敏感图像过滤技术的研究现状进行了分析。分别研究了基于人体肢体组合和基于特征提取与机器学习的两种过滤方法,在对比分析两种方法的优缺点、适用场景的基础上做了总结,并给出了此研究课题的研究趋势。
其次,本文提出了改进的敏感图像过滤方法。此方法包含更加完备的特征提取,人体躯干定位以及三层过滤技术。特征提取首先利用自建的快速肤色模型进行肤色检测,进而提取肤色、轮廓、空间分布等特征。人体躯干定位方法主要有两种:一种是基于头肩检测,它使用离线训练模型检测头肩区域进而定位人体躯干,另一种是基于人脸检测或椭圆拟合粗定位人体躯干的简单定位。对于分类器,本文采用三层过滤技术,第一层利用肤色、纹理等特征过滤多数正常图像,第二层利用基于头肩检测的方法定位躯干,并用决策树分类器进行分类,第三层利用决策树、简单规则两种方法结合的分类器进行分类。实验表明三层过滤技术既保证了较快的速度,又一定程度上提高了分类的准确率。
然而,对于裸露较多但未露出关键部位的图像以及类肤色像素较多的图像,普通分类器会将其误检为敏感图像。通过研究人体关键部位的特征提取和分类器构建方法,本文提出了基于人体关键部位检测的过滤方法,通过实验证明了此方法在降低此类图像误检率方面的有效性,但性能方面仍待于提高。
最后,本文利用前面所提出的过滤方法实现了敏感图像过滤模块,用于过滤用户上传的图像,并在博客系统上搭建了实时过滤平台和离线审核平台。实时过滤平台可以实时检测用户上传的图像,必要时给用户警示信息。离线审核平台重在离线审核所有上传图像,大大减少了审核人员的工作量。实际应用环境测试表明两个平台运行稳定,过滤作用明显。