基于重构API的Android恶意软件检测方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:yaqi007666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于Android系统的开放性,Android应用程序能够通过非官方渠道安装在Android设备上,这为智能系统带来了安全风险。因此,研究如何检测Android恶意软件是非常有必要的。目前,许多基于机器学习的Android恶意软件检测方法都以应用编程接口(API)为特征,具有检测效率高、准确率高等优点。然而,由于这些方法将API作为一个独立的整体特征,当API因Android系统的发展而发生变化时,这些方法检测准确率将大大降低。同时,这些方法大多只使用系统API,无法检测通过第三方API实现恶意行为的恶意应用。为了解决这些问题,本文提出了一种基于语义信息的API重构方法,并提出了一种基于重构API权重计算算法的特征选择方法。在此基础上,构建了一个基于重构API的Android恶意软件检测模型,对2015年至2019年的样本进行分析实验和对比实验。实验结果表明,本文的检测方法取得了很好的结果,在总共10000个恶意样本和10000个良性样本的混合样本集中取得了超过98%的准确率。并且当使用的训练集和测试集年份不一样时,本文方法明显优于两种典型的Android恶意软件方法。同时,为了进一步验证和说明恶意软件的恶意行为,本文将污点流分析的思想引入Android恶意软件的恶意软件行为检测。通过多种渠道收集Android的污点源和泄漏点API,使用基于重构API的方法对其进行重构。并根据来自20000个样本的语料库构建Word2Vec模型,利用余弦相似度来确定两个API的相似程度。将和重构污点源和泄漏点API相似的API作为扩展污点源和泄漏点。本文通过对Android程序的API调用图进行遍历,对扩展污点流分析得到该恶意软件的恶意行为。利用扩展污点流,本文为机器学习模型提供了可解释性,并且挖掘出了恶意软件的恶意行为,使得用户能够清楚的了解使用恶意软件可能存在的风险。通过在1000个恶意样本上的实验,本文方法能够在其中892个恶意软件中提取到有效的扩展污点流。
其他文献
近年来,随着社会信息化程度越来越高,互联网改变了人们的生活,成为了人们生产生活中不可缺少的一部分。但是,随着网络安全问题日益凸显,人们的隐私和数据安全不断受到威胁。数字身份作为互联网的基础设施,是网络安全中的重要一环。而传统的身份管理方式下存在用户隐私泄露、身份管理效率低、数据共享困难等问题。为了改进数字身份管理方式,保障网络数据安全和用户隐私安全,本文进行了以下研究:1)为了解决集中式数字身份管
学位
目标跟踪是计算机视觉领域一项基础性挑战任务,具有重要的学术价值与实用意义。在给定初始帧标注信息后,其任务不仅要在后续帧中对目标中心进行粗略定位,还需要进行精确的目标状态估计。近来,基于孪生架构的方法因其能在保持良好速度的同时取得较显著的性能,引起了目标跟踪领域的广泛关注。然而,孪生网络分支通常是独立的,缺乏信息交互,这限制了模型性能的进一步提升。为了增强孪生网络分支的协作能力,本文提出基于孪生架构
学位
安防监控系统不仅能给居民提供安全保障,而且也常用于协助案件侦破。行人重识别(Person Re-identification,Re ID)技术作为计算机视觉领域的热门研究方向,旨在实现跨摄像头下快速自动地行人身份识别及检索,可以显著提高警务人员对监控数据的利用效率。然而监控视频中存在背景干扰强、行人姿态差异大等问题,夜间环境下还会进行红外模式成像,这些因素都给行人重识别带来了挑战。目前,在单模态场
学位
随着互联网和智能终端的普及,网络文本信息量增长迅速。传统的文档级、句子级情感分析已经无法满足当前文本研究对细粒度情感倾向的需求。方面级情感分析可以对实体进行多方面、全方位的情感描述,但由于文本语言环境的复杂性,现有方法在泛化等性能上仍然存在不足,本文从方面目标情感分析和方面类别情感分析子任务入手,以深度学习为基础展开研究,主要工作和贡献如下:(1)针对于现有方面目标情感分析模型存在的参数量过大、局
学位
旅行商问题(Travelling salesman problem,TSP)是一种NP问题,在物流路线规划等领域有着广泛的应用。目前,研究人员提出了不同的算法来解决TSP,主要分为精确算法和启发式算法。由于精确算法设计复杂和求解时间长,启发式算法受到了广泛关注。在启发式算法中,蚁群算法是一种经典且有效的启发式算法,然而由于蚁群算法的参数不能灵活设置和局部启发信息不足等原因,算法容易陷入局部最优,因
学位
在中国,患者去医院就诊的第一步是选择科室进行挂号,科室选择的正确与否直接影响患者后续的就诊流程。然而,绝大多数患者缺少相关的医学专业知识判断自己应该选择哪一个科室进行挂号,而且随着我国人口老龄化的加剧,这一问题尤为凸显。调查研究发现,大多数医院通过设立导医综合服务台为患者提供科室选择指导,但由于看病人数远远多于导诊工作人员、导诊工作人员医学专业水平参差不齐等因素,导致服务台时常人山人海,患者没有得
学位
推荐系统旨在帮助用户寻找其感兴趣的事物(项目),正被应用到越来越多的互联网服务中。推荐任务通常可形式化为评分预测任务,即预测用户对候选项目的评分。基于协同过滤(Collaborative Filtering,CF)的推荐算法因其出色的性能成为推荐系统评分预测任务的研究热点,但目前仍存在以下问题:1)用户对项目的评分数据普遍偏少从而影响了推荐效果的数据稀疏性问题;2)根据用户最近的评分数据快速捕捉其
学位
国际疾病分类(International Classification of Diseases,ICD)是一种被广泛应用于疾病诊断编码工作的分类系统,其标准由世界卫生组织制定。在医疗实践中,人工ICD编码工作是易错且低效的,其中导致编码错误的最大原因之一就是合并编码情况没有被正确识别并处理。为了辅助编码人员进行编码工作,目前已经有不少关于ICD自动编码的研究涌现出来,但之前的研究都没有对合并编码给
学位
多旅行商问题(mTSP)是著名的旅行商问题(TSP)的延伸。多旅行商问题的目标是寻找一组哈密顿圈,其中每个旅行商都被派往一组城市而且保证每个城市只能访问一次。目前已经有一些致力于求解多旅行商问题的研究,但是大多数研究集中在如何最小化所有旅行商的旅行距离之和(即,minsum mTSP),只有很少的研究是专门针对以下两类复杂多旅行商问题:1.最小化所有旅行商的最大旅行距离(即,minmax mTSP
学位
膜计算是从活细胞的结构和功能中抽象出来的计算模型。该模型的进化规则执行具有不确定性和极大并行性。基于膜计算与进化计算相结合的膜进化算法将活细胞的生命活动抽象为进化算子,然后通过进化算子进化膜结构和膜内物质来求解优化问题。容量聚类问题(Capacitated clustering problem,简称CCP)是将无向图的顶点集划分为几个不相交的簇,使每个簇中的顶点权重之和满足容量限制,同时最大化同一
学位