论文部分内容阅读
现代网络和多媒体技术给人们带来资源共享的同时,色情、暴力等不良信息极大危害青少年的健康成长。因此,如何快速有效的监测和过滤网络不良图像已经成为当前迫切需要解决的实际问题。传统的依靠屏蔽色情信息网站的检索和浏览的方法已不能有效地处理色情图像和视频等多媒体数据,因此,通过图像语义分析技术识别敏感图片已经成为网络信息安全领域富有挑战性课题。
针对现有算法存在比基尼图像和类肤色图像误检率过高、不能有效过滤带有淫秽动作的多人色情图像和现有色情图像语义算法存在的低层和高层语义缺失等问题,本文以图像语义分析相关理论为基础,对现有的不良图像过滤算法进行深入分析研究,提出了基于高层语义视觉词袋的不良图像过滤模型及关键算法。本文的主要工作包括:
(1)提出了基于高层语义视觉词袋的不良图像过滤模型,模型主要分为提取局部特征、构建高层语义视觉词典、行为语义识别和构建SVM分类器四个关键模块。其中,高层语义视觉词典由低层视觉词汇、中层视觉词组和高层语义对象三个层次语义词汇构成。
(2)改进了局部特征提取算法,融合了肤色和全局特征;改进了视觉基元分配算法,缩短构建视觉词汇的计算时间;视觉词典构建算法通过融合上下文语义和空间相关高层语义特征描述兴趣区域视觉词组;构建人体行为语义提取算法,检测容易误检为不良图像的运动类图像、比基尼图像、亲吻图像和拥抱图像中的行为语义。
(3)构建了改进算法和综合分类实验方案,其中,改进算法实验分析和比对了改进算法的计算时间和平均准确率,综合分类实验分析和比对了查全率、查准率和正确分类率、分类ROC曲线,平均处理时间等评价指标,并与本领域著名学者LiuYlZhi、AnaP.B.Lopes和WangYushi的算法实验结果进行比对。
本文提出的过滤模型通过提取图像包含的高层语义特征完成识别不良图像不仅符合人类视觉理论和人类认知理论,而且实验比对结果表明,本文模型可以有效过滤带有淫秽动作的多人不良图像,较同类算法识别率高,误检率低。因此该过滤模型具有一定的理论和实用价值。