论文部分内容阅读
随着计算机网络和Internet的迅猛发展,以数字图象为代表的多媒体信息被广泛使用。然而,Internet上的图象内容良莠不齐,大量的色情图象对青少年的健康成长造成了严重的危害,因此如何对计算机网络上图象内容进行监控和管理,防止青少年接触到不良图象,已经成了一个富有挑战意义的课题。正是在这种背景下,本文对基于内容的图象过滤(CBIF:Content-Based Image Filtering)技术开展了较为深入的研究。本文简单回顾了传统的网络信息过滤方法,指出了它们的不足,接着实现了一套基于内容的图象分类(CBIC:Content-Based Image Classification)系统,并在此基础上设计了一套基于图象内容的网络信息过滤系统。 本文先介绍了一些与课题相关的技术,主要有图象文件格式、肤色检测、纹理检测、轮廓检测和形状描述等技术。本文详细讨论基于内容的图象分类(CBIC)系统的设计和实现,该系统主要包括肤色检测器、纹理检测器、轮廓检测器、形状描述符提取、分类特征的提取和分类决策6个模块。先用肤色检测器、皮肤纹理检测器依次对图象进行检测,并根据它们的检测结果对图象进行分割,再用轮廓检测器提取目标轮廓,并提取目标的形状描述符;在此基础上,提取5类共11个特征,组成1个11维的特征向量,最后依此特征向量进行分类决策,得出结论。这其中,本文提出和改进了一些方法和算法:在借鉴其它结构的基础上,提出了基于内容的图象分类(CBIC)系统的体系结构;在皮肤纹理检测器中,没有直接采用灰度统计法,将其改造成色阶偏差法;将形状描述符作为分类特征;在分类特征的提取中,吸收“走迷四川人学才项卜学位论文宫”算法的思想,提出了“无通路迷宫数检测”算法。另外,本文分别实现两种分类方法—Bayes分类法和SVM分类法,并对它们的分类效果做了比较。该分类系统还集成了针对Bayes和SVM这两种分类法的训练算法。实验表明,分类系统效率较高,准确率达到了75%。 在实现的基于内容的图象分类(C BIC)系统基础上,本文设计了一套基于图象内容的网络信息过滤系统,该系统综合运用了基于内容的图象过滤(CBIF)技术和传统的过滤技术—关键词过滤(Keyword Filtering)、包过滤(paeket Filtering)和URL阻断(URL Bloeking)技术等多种过滤技术,能够对图象和文本等网络信息进行过滤。过滤系统主要包括数据采集模块、数据分析模块、数据处理模块和控制界面模块4部分,采用WinsockZ SPI技术,方便灵活地实现了网络数据的拦截和过滤。关键词:基于内容的图象过滤(CBIF)基于内容的图象分类(CBIC)数字图象处理Bayes分类器SvM分类器