使用Windows API进行恶意软件检测的研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:rui1986911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来计算机技术不断发展,计算机软件和硬件水平也不断提高,越来越多的恶意软件涌现了出来。针对Windows主机的的入侵也越来越多,传统的网络安全措施难以适应Windows环境安全检测需求。为了解决Windows环境下的网络安全问题,研究者们提出了基于机器学习的Windows入侵检测技术。在机器学习算法中,随机森林、K-Means、SVM等算法被广泛应用于入侵检测,但是这些算法复杂度高,模型泛化能力弱,数据量较大时检测时间较长。使用集成学习Boosting的算法有LightGBM,使用集成学习Bagging思想的算法有随机森林,Bagging思想是非常简单的,就是每一个子数据集生成一个弱学习器,然后通过投票的方式决出一个强学习器,对于简单的数据集来说,随机森林简单且高效。LightGBM是基于直方图算法的决策树算法,能够将大量相对连续的数值进行离散化。本文通过对入侵检测以及集成算法的研究,最终选LightGBM算法作为入侵检测系统的算法,并对入侵检测结果使用准确率、精确率、召回率、F-1度量进行了评估。论文主要工作内容如下:(1)针对数据集的处理,本论文充分利用收集到的多个关于Windows API调用的公开数据集,针对这些数据集的不同,本文将这些数据集进行了合并,形成了两套数据集。通过对比这两套数据集,选用一套效果好的数据集加入到本文的入侵检测系统中。整理完数据集本文先对数据进行预处理,充分挖掘数据信息,找到296个重要的API调用,并考虑到不同恶意软件之间的差异,将数据集分为9部分,代表不同的九种恶意软件。(2)本论文设计了 Windows环境下的使用LightGBM入侵检测系统,利用Python的Sklearn库对数据集进行训练,通过调整LightGBM中学习率、树的最大深度、特征选取比例和每次迭代的数据比例参数确定了理想参数范围,并在测试集上取得了很高的分类准确率。(3)作为横向对比,采用相同数据集,在LightGBM检测基础上,分别使用回归树、决策树、随机森林、GBDT、XGBoost和LightGBM算法进行了异常检测。在训练时间以及准确率等方面,将结果与LightGBM算法进行对比,对模型进行评估及优化。LightGBM的准确率、精确率、F-1值和AUC值都高于其他机器学习模型,都在97%以上。
其他文献
习近平总书记在教育的重要论述中指出高等教育的根本任务是立德树人,要为党育人,为国育才.医学生是推动祖国医药卫生事业发展的重要人力资源,但是当前医学人才集中在市级综合三级医院,县乡级医院人才匮乏现象十分突出.该文认为通过挖掘应用课程思政元素,在医学生就业指导课中有效引导学生服务基层,在基层建功立业,进而促进医学生充分就业,才能达到多赢格局.
目的 分析病案分组讨论教学法在心电图带教中的应用效果.方法 研究样本选取2019年3月—2021年2月间于该院心电图科实习的82名学生.利用整群随机化分组法将其等分为探究组、参照组,其中参照组41例实施常规教学法,探究组41名开展病案分组讨论教学法.比较两组学习积极性、教学满意率、考核成绩.结果 探究组学生学习积极性(97.56%)相较于参照组明显更高,探究组学生综合素质、心电图操作、心电图知识、科室评分、学生互评得分等均高于参照组,参照组教学满意率相较于探究组(97.56%)明显更低,差异有统计学意义(
目的 研究以问题为导向的教学方法(problem based learning,PBL)在直肠癌护理带教中的应用.方法 选取2020年1—12月间在该院肿瘤科实习的51名护理专业实习生作为观察组,运用PBL教学方法;选取2019年1—12月间在该院肿瘤科实习的51名护理专业实习生作为对照组,运用基于授课学习方法(LBL),评价两组教学效果.结果 观察组理论知识平均为(28.10±0.40)分、操作技能平均为(27.56±0.42)分、临床思维成绩平均为(37.11±1.25)分;对照组理论知识平均为(24
目的 分析情景模拟教学在整形美容临床本科实习带教中的应用效果.方法 2020年7月—2021年7月选取于该院整形美容科进行临床实习的本科学生40名进行分析.按照随机抽签分组法将其分成两个小组.研究组实习生应用传统教学模式,研究组实习生应用情景模拟教学.分析两组带教效果.结果 带教后,参照组实习生的考核成绩较参照组高,差异有统计学意义(P<0.05);研究组实习生的临床工作能力较参照组好,差异有统计学意义(P<0.05);研究组实习生的带教满意度较参照组高,差异有统计学意义(P<0.05).结论 在对整形美
目的 探讨失效模式与效应分析(FMEA)对手术室护士职业暴露的预防效果研究.方法 选择2019年1月—2020年12月在该院手术室工作的48名护士作为研究对象,针对手术室护士容易出现的职业暴露问题组建FMEA小组,并采取FMEA分析方法对该院手术室护士在2019年全年出现的职业暴露相关因素实施汇总和回顾分析,采取风险指数值(RPN)降序排列的方法对高危因素失效模式予以确定,并制定相应的改进方法措施,同时制定与措施对应的方案,将改进方案于2020年全年实施.对改进方案实施前与实施后的职业暴露RPN值、职业暴
目的 分析精神专科医院门诊不合理处方情况,将不合理处方原因分类并及时反馈临床,提高临床药师的药学服务水平.方法 收集2018年1月—2019年12月点评的门诊处方8534例,应用帕累托图,找出造成该精神专科医院不合理处方的主要、次要原因及一般原因.结果 门诊不合理处方以“超说明书用量用药、联合用药不适宜、单剂量错误”为主要内容,以“用法用量不适宜”为次要内容;使用药物类别以“抗精神病药物、抗抑郁药物”为主要类别,以“情绪稳定剂”为次要类别.结论 通过分析总结处方点评情况,规范医师处方和药师调剂医疗行为,体
目的 对山东省血液中心2018—2021年上半年机采献血者招募工作进行分析,为今后招募方式和招募策略选择提供参考.方法 用启奥科技SHINOW9.5系统中统计功能模块分析,构成比的比较采用SPSS 20.0统计学软件行χ2检验.结果 2018—2020年机采献血者捐献人数和机采血小板捐献份数逐年上升,2021年上半年与2020年同期相比也均有升高.2018—2020年每年首次捐献的献血者人数逐年上升.2020年与2019年相比首次捐献比例显著升高,差异有统计学意义(P<0.05).2021年上半年与202
目的 了解南昌城市社区退休人群生活现况,探明其生活满意度及影响因素,提出针对性的改善建议.方法 于2019年6—7月在南昌城市社区中随机抽取退休人员944名作为研究对象,采用现场流行病学问卷调查.结果 调查对象中69.0%的人以养老金作为主要经济来源,超过七成的人月支配资金在2000元以上;后代与身体状况是他们较为困扰的问题,社区服务项目少、设施及场所有限的问题较为突出.有648人(68.6%)对退休生活感到满意.Logistic回归提示,高龄、有配偶、无慢性病、无孤独感、月支配资金高的退休老人对生活满意
近年来,人工智能技术突飞猛进,机器博弈也逐渐进入大众视线。随着诸如国际象棋、国际跳棋、围棋等完备信息博弈问题被机器博弈一一解决,人工智能学者也将目光转移到德州扑克、麻将等非完备信息博弈问题上。桥牌是一种非完备信息博弈游戏,游戏过程分为叫牌和打牌两个阶段。由于多种叫牌体系的存在,桥牌叫牌研究非常困难。本论文提出了一种以深度学习和强化学习为基础,将动作选择和局面评估相结合的方法,为桥牌叫牌研究中的多体
随着人工智能、大数据业务的兴起,云计算平台的底层支撑作用变得愈加重要。在云平台中,以Docker代表的容器技术,凭借其轻量化、便捷性等特点,得到广泛应用。资源的合理分配是保证容器服务质量和控制设施成本的关键,而在数据分析时代内存资源尤为重要。面对复杂多变的云业务需求,如何保证容器服务在拥有良好性能表现的同时,尽可能地节省内存计算资源,是值得关注和研究的问题。那么,根据容器服务当前的内存需求量进行资