基于主题和敏感数据流的Android恶意应用检测方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ilfang456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Android操作系统的开放性以及繁杂的第三方应用市场使得恶意应用数量爆炸性增长,这些恶意应用给用户带来了严重的经济损失和隐私泄露问题。因此,Android恶意应用检测方法的研究非常重要。传统的Android恶意应用检测方法主要通过研究分析利用静态或动态手段从应用程序中提取的语法特征来检测恶意应用,因为这些语法特征可以从一定程度上反映应用程序的行为。然而,应用程序的行为与其功能息息相关,相同的行为在某些应用中是恶意的,但在特定的功能的应用中却可能是正常的。因此,分析应用程序安全问题时应当将其功能和语法特征都纳入考量范围。本文正是以此为出发点,充分考虑应用程序功能和行为间的联系,提出了一种基于主题和敏感数据流的恶意应用检测方法。本文的具体工作如下:1、提出一种基于自然语言处理的Android应用程序功能分类方法。利用应用程序的描述信息,通过主题建模算法抽象出其中的主题。然后根据应用程序对各主题的相关度对应用进行聚类分析,实现对应用程序的功能分类,为后续的恶意应用检测提供前提条件。2、提出一种基于敏感数据流异常分析的特征抽象方法。通过静态分析的方法提取更能代表应用程序行为的敏感数据流信息。以此为基础,结合应用程序所申请的敏感权限,通过异常分析算法对同一主题类别中的应用程序进行敏感数据流异常分析,抽象出异常值特征向量。该特征向量反映了应用程序在各权限下敏感数据流的异常程度,可以指导研究人员发现潜在的安全问题或者告知用户可能存在潜在风险。此外,异常值特征向量也可以用来训练分类模型以检测恶意应用。3、综合考虑应用程序的功能用途和敏感数据流特征,提出并实现一个基于主题和敏感数据流的Android恶意应用程序检测系统。通过在1 145 1个应用程序样本上进行实验,选取了五种机器学习分类算法中最适合本文方法的算法——随机森林,并进行多组对比实验证明本文所提出的恶意应用检测方法的有效性。除此之外,本文还对几个主题类别内正常应用和恶意应用的敏感数据流进行宏观分析,进一步验证通过结合应用程序功能和敏感数据流来检测Android恶意应用程序方法的合理性。最终,根据本文方法所训练的检测模型取得了不错的效果:整体应用分类正确率到达了98.67%,恶意应用程序识别率达到了98.76%。
其他文献
无线通信系统中频谱资源有限,面对不断增长的数据速率的需求,如何提升频谱效率、增强传输可靠性成为新一代无线通信需要解决的关键问题。全双工技术同时同频发送和接收信号,理论上能使频谱效增加一倍。无线通信系统中以协作方式工作的中继技术,可以有效抵抗信道衰落,增强小区覆盖。全双工双向中继集成了全双工和中继技术的优势,但同时其带来的自干扰限制了性能的提升,因此,本文旨在研究全双工双向中继系统的中继策略。针对不
移动互联网和云计算的蓬勃发展,涌现出了大量基于移动云平台的应用服务。用户在使用移动云服务的过程中将大量用户数据信息存放在云端,因此在获得丰富的移动云服务的同时,也
伴随着现代生物领域相关技术的快速发展以及信息科技的进步,进行身份验证的技术已经慢慢的转到了基于生物特征层面的识别。其中,人脸作为生物特征识别领域最重要的研究方向,得到了越来越广泛的重视。和传统的身份鉴定方法不同的是,现今的识别技术主要依靠计算机与高科技手段,通过待识别个体独一无二的特性实现身份的判定,譬如DNA。而人脸作为人体的一种外在的根本属性,其优势不言而喻。但在实际应用中由于人脸在光照变化,
随着电子技术的发展,越来越多的可移动式设备出现在人们的生活中。为了方便可移动设备的联网,国际电气和电子工程师协会工作组制定了无线局域网的规范802.11协议。然而,原有
作为数字图像处理的重要组成部分,图像分割一直受到不少国内外学者们的关注。一方面,特定类的图像往往存在丰富的信息,通过相机等设备获得的图片可能受到污染,光线不均匀的影
氮化镓(GaN)材料广受科学界的重视,目前已是半导体研究的重要热点之一。如今,由于GaN材料具有宽的直接带隙、高临界场强和高发光效率等特性,使得它成为了光电领域中不可缺少的材料,GaN光电器件在诸多领域中的应用价值也都非常之大。本文用分子动力学模拟方法,并结合多种微观结构表征方法,例如径向分布函数(Pair Distribution Function,PDF)与可视化技术,模拟了多个冷速与多个压强
讲社源于城乡中集团参拜的组织,经过发展之后形成了经济互助、教育及行政等不同功能的讲社组织。讲社集团在战后其规模和数量都大幅缩水,然而直至今日仍然有不少讲社集团在发挥着自己的作用。本文基于笔者对福冈县太宰府天满宫飞梅讲社及崇敬会相关人士的采访调查和对太宰府天满宫社报《飞梅》的文献分析,并结合共同体的理论,从地域性、共同性与领域性、公共性的角度,解析处于地域共同体面临崩溃的大环境中的飞梅讲社与崇敬会的
近年来,新兴体域网技术在医疗康复监测、影视及游戏制作、专业动作分析等领域得到广泛关注和应用。当前相关研究大多采用稀疏表示分类算法解决体域网动作模式识别问题,但其中
影响路径覆盖测试消耗的因素很多,不仅包括所需覆盖的路径数目,也包括路径的覆盖难易程度,还包括测试数据的生成效率。目前,已有许多文献针对测试数据生成方法进行大量研究,但是很少看到针对目标路径选择方面的研究成果。本文基于路径覆盖测试对目标路径的选择方法进行研究,通过选择少量具有代表性的可达完整路径,达到降低路径覆盖测试消耗的目的。本文从串行程序和并行程序两个方面进行路径选择的方法研究。第一,针对串行程
目的:羊毛固醇合成酶抑制剂(RO 48–8071,RO)处理皮肤角质形成细胞(KCs),探讨RO对皮肤角质形成细胞增殖、分化和凋亡的影响,并初步探讨可能的分子机制,为阐明甲羟戊酸途径在皮肤生长发育及皮肤疾病中的作用奠定基础。方法:(1)取外科手术正常皮肤组织,培养人的原代皮肤角质形成细胞(KCs);(2)以不同浓度的RO(0,0.1,0.3,1.0,3.0,10.0,30.0,100.0μM)处理