论文部分内容阅读
互联网的高速发展已经使其成为世界上覆盖面最广、范围最大、内容最为丰富的资源库。人们在充分享受信息共享所带来的便利的同时,却也饱受着大量“垃圾信息”的困扰,特别是对于广大青少年学生,一些“有害信息”正在威胁着他们的身心健康。孩子的健康成长需要一个干净的网络,网页内容安全问题亟待解决。 这一问题已经引起全世界的广泛关注和重视,许多国家已经意识到了这一问题的严重性,开展了相关的讨论和研究,并且从技术和非技术两方面采取了一定的措施。非技术措施主要包括政策法规、正确的教育引导等,技术措施主要是采用各种网页内容过滤的方法和技术对不良内容进行“堵”。但是,目前各种技术防范手段还远远没有达到高效、准确、方便的要求,没有遵循一个全面、客观内容分类分级标准,也无法迅速方便地实现更新和升级。新技术的出现和新的技术标准的颁布为这些问题的解决带来了希望,本文试图在对网页内容过滤技术研究的基础上提出一个新的网页内容过滤技术解决方案。 围绕着实现一个新的网页内容分级过滤系统,本文主要进行了以下几方面的研究。首先,本文对网络信息过滤技术和各种实现方法进行深入的研究。其次,在总结这些方法优缺点的基础上,提出了一种新的技术解决方案,即遵循中国教育内容分级标准(CHERS),采用Web服务方式实现的网页内容分级过滤系统。基于CHERS标准的内容架构使得系统对于有害信息的分类更为全面、客观,基于Web服务的结构,使本系统架构具有突出的扩展升级功能,通过改进分类过滤算法、关键词库和Web服务的实现可以提高整个系统的性能,而这一过程在客户端不需要做任何变动。接着,本文对该方案进行设计和实现,并对其关键技术、相关算法和所采取的具体策略进行详细分析。最后,本文对所实现的系统进行试验和评价。