安卓恶意代码检测技术的研究与实现

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:robert_xt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
安卓系统使用量的增长使得各种新型恶意代码不断出现,这些恶意代码通常在未经用户允许的情况下运行在用户终端的后台。编写人员利用这些恶意代码来窃取私人信息或投放广告,严重的侵犯了用户合法权益。越来越多的研究人员开始投身于基于安卓平台的恶意代码检测领域,并且把发现的恶意代码公布在互联网公共平台,起到了监督的作用。检测恶意代码的方法主要分为静态检测和动态检测。静态检测主要是分析源代码的结构和配置文件的信息等静态特征,然后再与公共平台上已经公布的恶意代码进行匹配,如果匹配度极高则判断为是恶意的。静态检测方法是非常准确的,这种方法不执行应用程序,能够达到快速的分类,但是不能检测到未知的的新型恶意代码;动态检测主要是在源代码中加入设计好的代码段,通常是放在接口的入口或出口,通过重新编译后再执行来跟踪应用的行为。根据程序是否输出信息来查看接口是否被调用,而且还可以利用程序的顺序执行来分析程序的调用序列,然后判断其逻辑,看是否有越权和调用一些与本身应用功能无关的接口等操作。但是也存在着缺点:首先,手动插入代码工作量较大,需要对源代码非常熟悉并且难以模拟恶意代码被激活的真实环境。其次,安卓系统更新较快,不同的版本需要插入代码段的时间和位置也就不一样,这样就增加了动态分析的复杂性。最近,分类算法被成功地用于检测恶意代码,其中提取特征的重要性决定了分类结果的好坏。本论文面向基于安卓平台的恶意代码检测,提出了一种基于安卓虚拟机(Dalvik)指令操作符(OpCode)特征的分类算法的检测模型。同时也改进了自然语言处理领域中的N元模型(N-Gram),使用N个OpCode组成一个词语来表示特征,并且利用国内开源的并行深度学习框架(Paddle)进行特征训练,加快了特征训练的速度,不但节省了时间,而且提高了准确率。本文主要工作内容具体如下:(1)通过编写脚本批量反编译安卓应用,汇总每个应用的Dalvik指令,提取其中的OpCode,然后对安卓应用的OpCode进行分类和描述,同时改进N-Gram模型,为了获得一个比较好的N值,分别设置N=1,2,3,4,5,6,通过实验对比来选择最合适的N值,从而为后面的实验做好铺垫。(2)用OpCode序列的词频(TF)和词频逆文档频率(TF-IDF)分别作为特征的值来进行实验,从而选择一种较好的特征表示方法。本论文通过实验证明两者表示效果差别很小,最终选择TF方法,因为随着训练集合的扩大TF-IDF会带来额外的运算。(3)分别选择决策树、随机森林和神经网络作为检测模型的分类器,并且在实现算法的过程中对其进行改进。决策树:用信息增益比作为决策树的特征选择方法,并且将已生成的树进行简化,防止出现过拟合现象;随机森林:实现多个决策树,通过多轮实验的对比设置决策树的个数以及随机森林中各个决策树的高度;神经网络:基于Paddle框架,实现自动编码器(AutoEncode)来对特征进行重构,用尽可能少的信息来表示OpCode特征,建立多层网络,加快了模型训练的速度。最后结合三种分类器对于测试集合的判定结果,选取一个训练较好的模型来作为预测未知恶意代码的最终模型。
其他文献
太极拳可谓是中国传统文化的缩影,也可谓是中国传统文化的完美体现。然而太极拳作为中华武术极具代表性的一个派别(体系)与最初的武术无论是形式上还是内涵上都有着很大的不
目的:观察平衡阴阳针法改善脑卒中肌痉挛患者的运动功能及日常生活能力及临床疗效,初步探讨平衡阴阳针法治疗脑卒中肌痉挛的机理。方法:选用随机对照的试验方式,将60例相符纳入
目的:观察解毒活血益气汤治疗脓毒症患者临床疗效,探讨其作用机制。方法:选择2013年6月至2013年12月于山东省千佛山医院重症医学科住院治疗并符合条件的病例26例,随机分为实验组
随着经济一体化和世界经济的发展,我国的市场也随之不断变化,为了保证企业能够在市场中稳定的发展,需要根据当前的情况进行分析,保证企业能够做好企业管理。整体价值评估是当
血脂代谢异常是指血浆中脂的质和量发生异常,实际上也可称为脂蛋白异常血症(dyslipidemia)。大多数患者可因遗传因素或饮食环境影响造成原发性血脂异常,少数或因全身性疾病如:肥胖
[目的]通过观察中药狼毒大戟提取液(Euphorbia Fischeriana Steud, LDE)对体内外培养的Lewis市癌细胞增殖、凋亡及bel-2、bax、caspase-9mRNA, PCNA、TSP-1蛋白表达变化与抗
核因子相关因子-2(Nrf2)是肝脏细胞防御氧化应激的重要调节因子,通过介导一系列抗氧化酶和2相解毒酶的表达,降低各种药物、毒素、化学致癌物等有害物质肝毒性。酒精是引起氧
为评估沥青路面就地热再生技术的节能减排效益,有必要量化就地热再生技术的能耗与碳排放。应用全生命周期分析法,根据沥青路面养护施工流程划分了能耗与碳排放的边界条件,提
我国公共部门人力资源管理过程中,“借调”其他单位公职人员帮助本单位开展工作的现象长期存在,且比较普遍。“借调”现象作为一种超常规的人才流动与公务协作方式,规范的“
目的探讨基于病情风险分层的出院干预对急性冠脉综合征患者预后及自我效能感的影响。方法将98例急性冠脉综合征患者按分层随机数字号分为对照组48例和干预组50例。对照组采用