基于机器学习的安卓恶意应用检测系统的设计与实现

来源 :北京大学 | 被引量 : 3次 | 上传用户:wk8954642
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着安卓系统市场占有率成为全球首位,安卓系统的应用安全问题也愈加严峻,恶意应用程序逐渐对安卓平台的安全性构成了诸多威胁,这些应用程序的数量和多样性不断增加,使得传统的防护手段逐渐失效,如何有效的检测安卓恶意应用成为了移动安全领域的一个重点研究课题。目前,安卓恶意应用检测包括基于静态分析技术的检测方法和基于动态分析技术的检测方法,同时两种检测方法又分别结合恶意样本规则库和机器学习技术进行具体实现。本文研究范畴为基于机器学习技术和静态分析技术的安卓恶意应用检测方法。为通过安卓应用的静态代码特征结合机器学习算法实现安卓恶意应用检测,本文提出了一种基于代码语义的多维特征提取方法、一种基于频繁模式的特征处理方法,并基于以上方法设计实现了一种基于机器学习的安卓恶意应用检测系统。本文主要研究内容如下:(1)研究安卓应用的静态代码特征提取方法。在应用机器学习算法对安卓应用进行检测的过程中,如果静态代码特征提取不够深入,会直接导致检测过程中的召回率低、准确性差等问题。本文为全面有效提取安卓应用的静态代码特征,提出了一种基于代码语义的多维特征提取方法。该方法对安卓APK文件进行解析,从逆向代码特征、程序语义特征、漏洞模式特征三个方面进行特征提取,解决了APK程序内部的用户自定义函数问题、代码混淆保护问题、死代码问题、数据流分析冗余问题,有效实现了对安卓应用程序的静态分析;(2)研究安卓应用静态代码特征处理方法。随着技术发展,安卓应用能够提取的静态代码特征维度已能够达到十万级单位,影响特征提取及检测效率。本文为对静态代码特征进行有效筛选,提出了一种基于频繁模式的特征处理方法。该方法对形成的多维语义特征进行基于支持度、区分度和相似度的特征过滤,并进行了频繁特征模式的挖掘,能够有效去除冗余特征,提高模型训练和恶意应用检测的效果和性能;(3)研究基于机器学习的安卓恶意应用检测方法。为通过安卓应用静态代码特征,基于机器学习算法完成安卓恶意应用检测,本文设计并实现了一种基于机器学习的安卓恶意应用检测系统。该系统结合基于代码语义的多维特征提取方法、基于频繁模式的特征处理方法,并基于机器学习技术实现了对安卓恶意应用的识别,最终检测准确度达到了96.5%。
其他文献
以中国现行的基本养老保险制度为依据,解释了基本养老保险个人账户未来超支的概念,设计了"新人"、"中人"个人账户基金收支变量和参数;运用利息理论,构建了"新人"、"中人"基本
目的探讨腔道泌尿外科手术患者术后体温过低的原因及护理措施。方法选取114例行腔道泌尿外科手术的患者作为研究对象,其中58例术后发生体温过低的患者作为观察组并采取保温措
随着物联网的发展,网络中的流量组成发生了很大变化.通常用Hurst参数大小来表示网络流量的自相似程度.为了研究物联网业务的流量特性,文章通过Matlab对几种典型物联网业务进
<正>陶渊明归隐所拒绝的并不是异代新朝,而是当时漫天"斯兴"的"大伪";与之相应,他归隐所承诺的也不是对业已灭亡的东晋王朝尽忠,而是对已经"告逝"的人世"真风"的呼唤(《感士
随着环境保护问题越来越受到人们的重视,涂料水性化发展成为涂料行业发展热点。水性双组分聚氨酯涂料作为环保无毒,对环境友好型涂料,还具备高耐磨性、柔韧性、耐水性和耐化
本研究旨在挖掘影响中国美利奴羊(新疆型)羊毛性状的关键候选基因及分子标记。本研究的实验动物为中国美利奴羊(新疆型),通过采用PCR-SSCP技术对GPR143基因外显子6核苷酸的多
股票市场多因素分析试图从纷繁复杂的证券市场走势中,发掘出影响证券收益共同趋势的基本内在力量。这无论是对资产定价还是投资管理的组合构建、投资组合风险管理、投资组合
我国政府在科学发展观的指导下,认识到当前企业存在的许多问题的严重性(如安全生产事故频频发生,忽视职工工作条件,缺乏环境意识,消费者的权益受到严重侵害等等)。所以越来越
目的总结川南地区43例人工耳蜗植入患者的基因突变类型,分析其人工耳蜗术后康复效果,了解两者的相关性。方法对43例耳聋患者行GJB2、SLC26A4、mtDNA 12S rRNA基因检测,有基因
目的观察白藜芦醇对体外培养的人外周血单个核细胞(PBMCs)分泌白细胞介素-1β(IL-1β)、白细胞介素-6(IL-6),单核细胞趋化蛋白-1(MCP-1)及对细胞因子信号抑制因子1和3(SOCS1/