代价敏感的多分类恶意网页识别系统研究与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:zdf657094142
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网的蓬勃发展为人们的日常生活创造了巨大的便利。但同时,便捷的网络服务也吸引了众多的攻击者们通过恶意软件、网络钓鱼、和垃圾邮件等方式进行非法牟利,这些网页被称为恶意网页。它们都在不知情用户进行访问时对客户端系统发起攻击,但这些不法活动的目的和手段各不相同,不同种网页的实际数量和误分类的代价也有很大差异。目前的研究主要是针对某一类恶意网页,实现恶意网页多分类的研究还相对较少,对于机器学习方法分类的研究中提取的特征也还有待完善。本文针对上述问题,提出了利用CSS特征和URL特征结合的有监督机器学习的分类方法,同时考虑数据不均衡和误分类代价不同的情况,提出了“误分类代价和”作为新的度量指标,对钓鱼网页、恶意软件下载网页和良性网页进行三分类研究。论文的主要成果有:首先提出了全新的CSS特征,并证明了这些特征在对恶意软件下载的恶意网页识别的有效性,通过组合和新增特征,本文对全部恶意软件下载网页识别准确率提升稳定至92%,对利用重定向的恶意软件下载网页的识别准确率最高可达到99%,时间性能也有所提高。其次推导出三分类误分类代价度量指标,考虑实际数据比例和误分类代价进行大量实验,证明新指标的合理性和本文分类方法的合理性。最后将本文理论分析和工程技术相结合,设计实现了一个针对钓鱼网页和恶意软件下载网页的多分类恶意网页识别系统,并测试了系统的准确性和稳定性。
其他文献
鲍温病是一种多发生于中老年人的表皮内鳞状细胞癌,有发生侵袭性鳞癌的可能性。鲍温病发病率的上升及人们对于美容要求的提高引起业内人士对治疗手段的不断改进和探索。鲍温
<正>回眸与发现研读2013年中考作文题,可以发现五个关注点。一、总体呈现:"接轨"说未曾"走红";标题作文命题继续"高企",追求精致;选题作文依旧受到青睐去年以来,对中考作文命
平衡能力作为人体的一项基本能力,不管是在运动中还是在日常生活中都起着非常重要的作用。而它又受着诸多因素的影响,年龄、视觉、前庭觉、本体感觉、肌力等,他们的下降都会
<正>2011年全国中考作文题在命题格局上稳中有变,命题内容上贴近生活,彰显人文意识,体现创新理念,其试题异彩纷呈。2012年的中考作文命题将会有更多新变化,但立足"课标",聚焦
电子商务在跨境贸易领域的发展为外贸企业重塑国际竞争优势创造了机遇的同时也制造了新的挑战,学习更合理和更高效地应用电子商务是国际贸易企业的必然选择。作为培育高等教
本文引入空间统计学的相关方法来分析我国旅游业发展的差异性问题.首先选取若干反映旅游业发展水平的指标,利用因子分析法来综合评价我国31个省、直辖市和自治区旅游业整体的
<正>我是一只见了书就废寝忘食的"小书虫",喜欢从书这只精神面包里吸收各种营养。我喜欢读各种滋味的书:许多味道交织在一起的《海底两万里》等世界名著,像是世界各地的"美食
维生素D及其受体在人体健康和疾病中具有重要作用。引起维生素D缺乏的主要原因是日照不足或通过膳食补充减少。维生素D缺乏对健康的损害不仅表现为佝偻病和骨软化症,还与内分
数学源于生活,数学之美体现在课堂,如何在课堂上展现数学美,使学生能够欣赏数学的美学价值,课堂教学中体现出数学简洁之美、思维之美、数形结合之美、和谐之美。
我国“海岛法”已列入十届全国人大常委会立法规则,其出台指日可待。本文认为,我国“海岛法”的基本制度包括海岛规划制度、海岛保护制度、海岛使用权证制度、海岛调查统计制