论文部分内容阅读
随着计算机和通讯技术的发展和进步,人类社会进入了信息社会。Web网页是网络信息传播的主要途径之一,随着网络技术的发展,web网页信息不断丰富,极大地提高了人们的生活质量,但是,web网页中也包含有不少不健康的内容;因此,有必要对web网页的内容进行监控和过滤。
在本文中,首先从包过滤和应用代理防火墙技术入手,结合主机型和边界型防火墙的特点,对过滤网上不良数据的实现方法进行了具体分析,总结不同方法的特点和不足,为基于防火墙的数据过滤技术的进一步研究打下基础。
然后在前面分析的基础之上,总结了目前各种文本过滤方法的优缺点,准备采用潜在语言索引模型LSI,结合应用代理技术,构建一个web过滤的试验系统。在文中,介绍了该系统的主要算法的原理,主要的组成部分,以及各个组成部分的功能,并且给出了部分试验数据,最后对进一步的研究工作做了一个展望。