论文部分内容阅读
随着Internet的迅速发展、网络应用日益普及以及云计算技术的快速成熟,在全世界,pc、手机、pad上的各种app极大方便了人们的生活和旅游。各种O2O,各种app极大丰富了我们物质生活上的各类需求,带给人们极大的飞速体验。Internet飞速发展的同时,在移动端和pc端的业务需求和数据流量也不断增长。从早期占用少量带宽的浏览网页、发送接收电子邮件、QQ聊天到现阶段的占用大量带宽的迅雷视频、优酷影视、各种网络游戏等等。可以看出随着移动多媒体的发展,这种pc和移动端的app也来越丰富。但是也伴随着出现了垃圾网络信息的占用带宽,例如广告、垃圾视频等。此外网络内容安全也越来越严重。如何有效的检测和识别网络流量数据包,是大规模网络流量识别技术需要研究的问题。目前,已经有一些大规模集群化流量数据监控的方案。但是它们更多的是检测pc等client端,没有对现如今集群化的大规模server端进行流量数据包的统计和分析。如何设计一个能检测集群化服务器,提供server端应用层检测能力,能满足网络限制或截断,集群化server上的流量识别等功能是本文研究的主要课题。本论文主要研究了云环境下的流量识别技术和流量控制技术。详细设计集群化服务器的检测架构,由内层云的计算统计server和外层云的应用server组成,这样的设计方案可以运用内层云的大规模计算的能力,又可以检测和统计外层云应用server的数据流量。详细研究了linux环境下开源抓包工具NetHogs。在NetHogs的基础上设计流量层次化识别方案,也就是加入大规模流量识别算法。这样极大提高了外层云上检测数据包的高效性和正确性。并且详细设计和实现了本流量监控系统的模块,主要由流量控制模块、流量管理模块、数据库模块、流量检测client模块、流量检测server模块。同时最后对实现后的流量检测系统进行深入的测试和分析。本论文研究的意义在于在借助于云计算和并行计算的思想,提出了适用于监测集群化服务器的流量监控的架构。并对基于此架构对本流量进行了详细的设计和实现。同时将实现的流量检测系统部署到实验室中。在实际应用中检测本流量检测系统的准确性和高效性。并且将最后的测试结果进行详细的功能和性能的分析。详细总结分析得出的数据结果,得出本流量检测系统的不足之处和可以改进的方面。