基于多元化程序特征的相似代码分析技术

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:kary_yeah
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速提升,软件的发展达到空前的规模,相似代码分析在程序抄袭检测、知识产权保护、信息搜索、恶意代码监测等方面发挥着越来越重要的作用,受到了学术界的广泛关注。但传统相似代码分析技术中,基于属性计数度量的检测方法无法充分表示程序的语法和语义特征,准确率较低;基于结构度量的检测方法操作时较为复杂,时空效率不高;且现有相似代码分析工具只能进行固定粒度的检测,灵活度较低。针对上述问题,本文提出一种基于多元化程序特征的相似代码分析技术。此技术基于作者所在实验室的另一课题——面向相似代码分析的多元化特征提取技术对代码进行多角度的特征提取。本文首先通过对代码相似情况进行大量研究,对代码相似这一概念作出定义,将其划分为简单相似、结构相似、功能相似三种情况。然后从结构化语句块、函数、文件、程序四个级别对代码相似的三种情况作出详细分析,接着利用不同的代码特征制定分析策略。高级别的分析过程依赖于低级别的分析结果,这一方法不仅仅关注代码的宏观信息也注重代码的内部信息,在提升分析效率的同时具备更高的准确性。基于上述方法本文实现相似代码分析系统,并对4个开源工程进行实验。通过对结果进行分析,证明该方法显著提升了分析效率且可以保障结果的准确率,为代码相似分析技术提供了一种思路。
其他文献
<正>二次函数是中学数学的重头戏,初中就介绍了,到高中仍不断的出现,也是中学数学研究的重点,许多文章所研究的主要是三个二次(一元二次方程、一元二次不等式、一元二次函数)
<正>发展"学生核心素养"理念的提出,标志着课程教学正从"三维目标"的教学逐步转向以"素养为本"的教学,自主建构、合作探究、任务驱动等教学方式正深刻影响着我们的课堂.近日
在网络社交平台如此发达的今天,数量逐年激增的网络微型商家(微商)正大规模地潜入我们的日常生活,从微博、微信到各类社交平台,随处都能看到他们活动的身影。本文利用传播学
博弈效用中的参数是影响博弈均衡的主要诱导机制或激励机制。改变博弈效用参数、打破从众心理、加强行为互动是克服该困境的基本治理对策,且其在激励博弈群体作出符合社会价
病人服用免疫营养物质后对机体炎性反应的改变越来越受到人们重视。我们将综述胃肠肿瘤手术病人炎性反应的特点、免疫营养物质对其作用,以及不同免疫营养如谷氨酰胺类、精氨
P53是一种重要的抑癌基因,其突变、缺失、重排等现象的发生与人体多种肿瘤密切相关。P53基因在DNA的损伤、修复,细胞生长、分化,细胞凋亡等过程中发挥重要作用。目前,关于P53基因
众所周知,生命信息传递的物质基础是脱氧核糖核酸(DNA),DNA分子的破坏势必造成生命过程的障碍,甚至中断。因此对于DNA与其它分子作用及其相关研究是目前比较活跃的一个领域。特
蒙古文与属于孤立语系的汉语不同,它属于黏着语系,蒙古文词由词根、词干和词缀构成。通常把汉语的单词分割称为汉语分词,而蒙古文则需要做形态素分析,即不仅要做构词的形态素识别,还需要对形态素进行词性标注,即蒙古文形态素解析。蒙古文字大体可分为胡都木蒙文和拉丁蒙文两种,即老蒙文和新蒙文,由于彼此之间有不同的书写规则和语言特点,所以转换起来十分困难。蒙古文的词和词之间有天然的空格,因此不必像汉语一样进行分词
本文在阐述以数学基本活动经验积累为目标的探究活动设计思路和设计原则的基础上,以苏科版初中数学"二次函数y=ax~2的图像和性质"为例,略作分析.
背景及目的:HBV母婴传播有三种可能的传播方式:宫内传播,分娩时传播和产后传播。实施联合免疫后,大多数研究认为联合免疫失败的婴儿可能发生了宫内感染。一些学者用新生儿出生时HBV-M特征分析HBV母婴传播。有些研究认为脐带血安全,操作简单,家属易接受,所以用脐带血HBV-M分析母婴传播。也有研究认为脐带血容易受到母血的污染,故新生儿出生时外周血分析HBV母婴传播。我们的研究同时采集新生儿脐带血和外周