移动应用流量识别关键技术研究

来源 :武汉邮电科学研究院 | 被引量 : 0次 | 上传用户:johndovl1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前移动应用流量已成为网络流量的主要组成部分。移动应用蓬勃发展,几乎涵盖了用户社交,购物,出行,医疗,娱乐等所有生活行为,这使得移动应用流量中包含丰富的用户信息。获取这些信息对网络侦控具有重要的意义。但是,获取这些信息的前提,是要实现准确的流量识别,即识别流量的应用来源。机器学习在分类领域表现优越,因此基于机器学习的流量识别方法潜力较大,相关研究、工作较多,但是它无法满足大规模应用的流量识别需求。鉴于此,本论文从移动应用与服务器的通信方式、基于深度包检测(Deep Packet Inspection,DPI)的流量识别方法出发,深入研究适合大规模应用场景的流量识别方法。文章主要论述了:(1)基于静态DNS库的流量识别算法:通过提取海量DNS报文中的IP-域名对来建立静态DNS库,提出基于爬虫技术以及字典树匹配的方法,建立域名-移动应用的对应关系,以此建立IP-域名-移动应用的映射关系,从而实现根据服务器IP有效识别应用流量的目标。(2)移动音视频应用流量识别算法:通过研究音视频应用访问CDN服务器的原理、音视频产生的流量中的占比情况,提出非加密流、加密流同步识别的音视频应用流量识别算法。通过从HTTP报文中的Host字段、User-Agent字段以及HTTPs协议中明文扩展区域的ServerName字段提取移动应用对应的特征字符串,用以同步识别非加密流、加密流。(3)基于应用指纹的流量识别算法:提出一种大规模自动化提取应用指纹的算法,从移动应用产生的报文中为每个应用提取出一到多个特征字符串,提出一种筛选特征字符串的评分模型,并制定特征精简策略,将筛选后的一到多个特征字符串组合成识别该移动应用流量的应用指纹,然后运用HyperScan算法有效提升字符串匹配效率,以满足大规模应用场景的流量识别需求。本文提出的方法在识别移动应产生用流量时,效果有较大提升,应用覆盖率达70%,流覆盖率最高达87%,字节覆盖率最高达98%。
其他文献
基于螺旋肋钢丝、CFRP筋材两种材料的特点,提出将预应力螺旋肋钢丝、CFRP筋材混合内嵌于混凝土梁中的加固方法,并通过对1根对比梁、6根内嵌不同加固筋材的试验梁进行静力加载
随着我国竞技健美操综合实力的不断增强,面临的挑战和压力也不断增加,因而提高我国竞技健美操的整体实力已刻不容缓。据相关研究表明,近年来竞技健美操集体项目中,我国最需要
随着新课改的不断深入,越来越多的人将注意力放在小学英语课堂中。对小学生来说,英语一直都是非常重要的科目,通过英语知识点的学习不仅可以提高学生的语言素养还可以让小学
为了让学生在校园养成"健步走"的体育习惯,在教学实践中引入了基于手机计步器APP的"健步走"。通过"健步走"在校园体育课内外一体化中的应用和实验数据分析,论证了基于手机计
[目的]观察中医"治未病"综合干预对女性更年期抑郁症的影响。[方法]将240例社区抑郁症更年期妇女随机分为观察组和对照组各120例,对照组居家进行自我调理,观察组则接受护士上
近年来,随着市场经济的不断发展,一些别有用心的当事人利用法律赋予的诉讼权利,寻找法律法规中存在的漏洞,利用欺骗、串通、隐瞒等手段骗取人民法院的生效判决、裁定和调解书
为了应对日趋复杂的外部市场环境和内部经济转型发展的需要,通过科技创新推动经济和社会发展已经成为全社会的共识。企业作为科技创新的主体,如何通过内部创新机制的培育和创
2015年,新一轮离职潮来了。一面是银行高管频频离职,截至4月初,就有超过10位银行高管离职;一面是跳槽的公务员比去年上涨34%,受到越来越多的关注。国有银行高管离职和限薪令
随着科学技术的飞速发展,知识和信息量的急剧增加,使得单个评价者很难给出准确的评价结果,因此,为使评价结果更加客观、合理且提高评价结果的质量和可信度,往往需要多个评价
项目型企业作为一种新兴的现代企业管理组织形态,本质上是为了应对现代社会的多专业跨领域生产发展遇到的复杂管理问题而存在的。项目型企业的组织管理结构是企业组织的全体