论文部分内容阅读
随着互联网的高速发展,网络不良信息的传播越来越泛滥,对我国网民尤其是未成年网民的生活及学习产生十分不良的影响。国家对网络传播淫秽色情违法行为不遗余力地进行打击,相关的法律法规也在不断完善。同时,采用技术手段对网络不良信息进行过滤及封堵十分必要。网络不良图片因其规模巨大、传播广泛、危害甚大,是我们净化网络环境重点打击的对象之一。随着5G时代的到来,大带宽的移动互联网进一步加快了数字图片的传播,不良图片的规模也在快速增长,对不良图片的识别算法的性能要求也在不断提高。本文对现有的不良图片识别算法进行研究总结,主要对基于感兴趣区域的传统识别算法及基于深度学习的识别算法进行分析,归纳了二者主要使用的技术特点,比较了各自的优缺点及适用范围。由于不良图片具有海量规模、变化多样的特点,传统的图片识别过滤方法在先验特征上具有一定局限性,从而影响了算法的识别精度。而基于深度学习的不良图片识别算法不存在人工选择特征的局限,在大规模样本学习、特征提取上更具有拓展性,更能满足识别不良图片的目标要求。因此,本文通过对现有的图片过滤技术进行总结分析后,重点研究了基于深度学习的图片识别算法,提出了一种基于R-FCN和Res Net的不良图片识别算法框架,并在现有网络框架的基础上进行两方面算法改进,主要对感兴趣区域池化层及位置特征提取上进行改进。为了充分验证算法的有效性,本文采用了包含2万多张不良图片的大规模数据集进行学习训练,实验主要识别图片中的人体裸露敏感部位,图片一旦检测到有任何认定为裸露的人体敏感部位即标记为不良图片予以滤除。实验证明本文算法对不良图片的识别准确度达到96.2%,对正常图片的误判率仅为2.2%,优于传统方法。同时,为了验证网络架构的效果,本文进行同组对比实验,结果表明本文验证的深度学习神经网络架构和参数设定对不良图片识别准确度提升的效果明显。