论文部分内容阅读
企业邮箱用户常常受到垃圾邮件的干扰,同时在竞争日益激烈的商业背景下,由于企业员工安全防范意识薄弱,利用邮件进行各种违反保密规定的操作,导致内部资料、商业机密被泄漏,给企业带来无法估量的损失。为了防止企业知识产权信息、内部资料的泄漏,同时营造良好的企业内部邮件网络,企业需要拥有一种手段,能够用来监控企业内部网络与外界网络的邮件通信情况,对各种业务往来邮件进行集中的备份和事后追查。因此,设计开发基于POP3的邮件监测系统是十分必要的。而研究基于POP3的邮件监测系统的关键技术,对POP3邮件监测系统的功能优化、性能提升是至关重要的。本文在分析课题关键技术的研究现状的基础上,重点研究解决在捕获海量的邮件数据后,如何高效的、并行化处理相关POP3邮件数据,提高POP3邮件监测系统的性能,同时研究如何高效实现邮件内容中的敏感关键词的匹配识别。通过对课题关键技术,进一步避免上层的内容分析过滤模块成为整个系统的瓶颈,提升POP3邮件监测系统的整体性能。本文的主要工作如下:1、本文提出了一种基于信息熵的线程池调度方法,针对实现并行化邮件原文解析线程,研究了信息熵的多属性决策模型,设计了邮件原文解析线程池,动态选择空闲度最高的邮件原文解析线程。通过对比基于线程轮询的线程池调度与基于信息熵的线程池调度的实验,说明所提出的的方法适合于实际的邮件监测环境,可进一步提升邮件原文解析线程池的并行化程度。2、本文将多模式匹配AC算法应用于邮件监测关键词匹配领域,提出了基于多模式匹配AC算法的邮件内容监测机制,高效进行文本敏感关键词的定位匹配。通过对AC算法的存储空间消耗和匹配耗时等实验,证明多模式匹配AC算法可以高效的完成POP3邮件监测系统中的敏感关键词的监测。3、研究了基于POP3的邮件监测系统的前后台各模块设计方案,前台包含了系统管理、规则配置、日志管理等功能模块,后台包含了主控模块、libnids捕包、POP3协议分析、邮件原文解析、敏感关键词检测等模块,详细阐述了系统各模块的具体实现及测试,并给出了典型的应用场景。本课题设计并实现了基于POP3的邮件监测系统,不仅从多线程负载均衡的角度来提高线程池资源的利用率,而且从优化线程中的敏感关键字匹配的效率的角度,提升系统总体性能。通过本课题能够对企业内部的邮件实施审计,能够在一定程度上为企业创造更安全的邮件环境,为企业更好的进行网络信息化建设奠定基础。