基于Web内容安全的审计技术研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:tmac0000000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随 Web的飞速发展,其带来的问题也日益显现,Web内容中出现了各种各样的不良信息,已经开始侵入人们的生活,严重玷污了网络环境,有悖于和谐社会的理念。由于很多 Web没有传统媒体的监督审查和监管体系,因此防止和控制非法信息传播,对其进行内容过滤已经成为目前网络内容安全研究的重点问题,对Web内容的管理、监督、审计已成为信息安全技术的热点内容之一。  本文通过对Web内容审计领域相关技术的深入研究和分析,提出了自己的研究成果。首先介绍了Web内容审计的研究现状,分析了Web内容安全研究的发展方向。然后详细介绍了 Web内容审计中涉及到的相关技术,如:信息过滤技术的原理、网页去噪、特征提取和常用分类方法等。在认真分析网页噪音去除对基于 Web内容处理系统的重要性和网页去噪理论的基础上,阐述了一种利用数据库进行网页去噪的有效方法及其实现步骤,该方法在处理网页噪音时不用将内容全部放入内存中,完全根据数据库中网页内容进行消除噪音操作,达到净化网页的目的。基于网页的布局结构信息和当前网页开发过程中的模板意识,针对目前文本表示模型对向量空间模型的依赖性以及文档频率特征提取方法在二值分类方面的不足,提出了基于差异频度的类别空间模型的二值分类方法,该方法突破了向量空间模型的限制,采用改进DF的差异频度方法进行特征提取,实现二值分类功能。运用数据库原理、C#编程语言等技术设计了Web内容安全审计系统。给出了审计系统的处理、总体设计等,实现了对Web内容安全的审计。实验验证和分析结果表明基于本文理论分析设计的审计系统是可行的而且是有效的。  互联网和手机媒体大量传播的非法信息,既引发公众的愤慨,更引起公众的思考。对 Web内容进行审计已经成为人们越来越关注的重要问题之一,对于网络信息规范管理及和谐社会的建立具有十分重要的社会意义。
其他文献
基于句法的统计机器翻译近年来逐渐成为统计机器翻译的研究热点.基于句法的模型有助于解决基于短语的模型所面临的主要问题,如短语层次上的重排序,泛化能力弱,以及要求短语连
定位技术是无线传感器网络的关键技术之一。基于射频(Radio Frequency, RF)信号的定位技术由于其仅利用节点自身的RF信号就能实现定位、无需额外硬件支持等特点而被广泛使用
随着 Web应用软件用户数量的急剧增长和业务规模的不断扩大,如何保证 Web应用软件的稳定性与可靠性成为人们关注的重要问题。Web性能测试是保证Web应用软件稳定性与可靠性的
信息技术的发展,使企业的全球化竞争日趋激烈,销售系统设计的目的是帮助企业进行更好的客户产品的销售管理,使企业建立弹性化和灵活性的业务流程,提高工作效率,减少人工操作中
本文首先概要地介绍了汽车电子领域的焦点——CAN/LIN总线技术,并结合基于重型卡车的CAN/LIN总线整车仪表控制系统的研发工作,从其机理、总体结构的研究到软硬件的开发设计、
随着Lntcrnct技术的迅猛发展,对人机之间,尤其是机器与机器之间的交互需求越来越多。具有松耦合性,自我描述以及XML文档驱动等特征的Web服务技术作为一种新型的分布式计算模
学位
网格是继Internet后的新一代信息基础设施,是新一代软件基础支撑平台。网格环境开放、动态、多变,其用户多样,用户需求多样且不断变化。面对网格新形势,研究如何构造可随网格环境
广告检测与识别技术是指利用计算机对广播电视节目中出现的广告进行自动检测并识别。由于音频广告检测与识别和相应的视频处理相比,效率更高,因此本论文将重点关注音频广告检测
目前,中职学校学生就业难,这是众所周知的。在“双向选择”“自主择业”过程中,既有成功的喜悦,也有无可奈何的叹息。在这方面,无奈和叹息的多半是中职毕业生。对此问题,教育专家提
现代汉语介词(以下简称为介词)是现代汉语语法词类中的一个重要类别,没有实在的词汇意义,但是介词却是汉语语句中重要的语义信息标记,对汉语的词义消歧、语义分析等工作提供帮助