论文部分内容阅读
近年来,随着移动互联网通讯技术的迅猛发展,移动智能终端和移动应用程序的种类、数量、功能都呈现爆发式增长。其中,Android平台凭借开源便捷的开发流程、物美价廉的硬件产品,在全球市场上赢得了垄断性的市场份额,并且保持持续增长的态势。但是,Android平台的大热也吸引了大量的恶意攻击者将自己开发的各式各样的恶意应用发布到应用市场,从而诱导用户下载与安装。而应用市场对于新发布的应用的审查与验证机制并不完善,无法评估应用的功能描述的准确性与行为的正常性,导致不少恶意应用出现在用户视野中。鉴于目前Android市场混乱的现象,本文提出了应用的行为一致性理论,在此基础上进行面向Android应用行为一致性验证的LSTM(Long-Short Term Memory)模型研究,可实现对新发布应用程序的类别检测与行为一致性验证。该方法主要通过构建带有因果关系与时序关系的网络事件-行为时序序列,并设计带有特殊输入结构的LSTM分类模型对行为序列进行训练与学习,从而实现较好地应用分类效果。此外,采用生成对抗网络GAN生成更多的新数据,进一步提高了 LSTM模型的分类准确性。本论文的主要研究工作有如下几点:1、应用程序的动态网络行为特征提取与重构通过获取各大Android应用市场上较热门的8类应用程序,设计场景事件组合触发各类应用程序的网络行为。经过对网络流量数据包的解析、流量的清洗与整理后,提取了 4维的网络行为特征,构建成带有因果关系与时序关系的网络事件-行为时序序列。2、设计LSTM长短时记忆神经网络进行动态网络行为建模为了更好地刻画场景事件与所触发网络行为特征的因果关系与时序关系,设计了一个带有特殊输入结构的LSTM循环神经网络模型,综合学习上述的逻辑关系,实现对应用网络行为的准确分类。3、设计基于GRU的生成对抗网络生成新的网络行为数据为了增加实验的数据量,本文设计基于GRU(GatedRecurrentUnit)门控循环单元的生成对抗网络来学习捕获的真实网络事件-行为时序序列的特征,理解各类应用程序的网络行为,从而实现生成有效的新数据的目的。4、Android应用的行为一致性验证验证Android应用程序具有行为一致性理论,即自我一致性与同类一致性。自我一致性通过标准化的闵可夫斯基距离计算,同类一致性则通过LSTM分类模型进行验证。