基于K-Means和SVM的流行中文钓鱼网站识别研究

来源 :软件导刊 | 被引量 : 0次 | 上传用户:parabird
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
K-Means是一种简单、高效的聚类方法,能快速将网页文本分类。SVM在解决小样本、非线性及高维模式识别中有许多独特优势,能够通过低样本获取全局最优解。因此,将K-Means和SVM结合,以达到自动识别流行中文钓鱼网站并对其进行分类的目的。验证了两种方法结合应用的有效性。
其他文献
军事装备的技术资料大多数仍采用传统纸制介质存储,传统纸制介质存在信息存储困难、维护效率低下等问题。在分析GJB6600标准下交互式电子技术手册(IETM)关于设计问题的基础上,
针对本科高年级教学特点和《人工智能》课程的学科特点,结合实际教学经验,探讨《人工智能》课程教学。注重激发学生对专业背景的探索,适时适度进行科研引导,并与实际应用相结
通过对数据库分层访问优化算法的设计,提高大型数据库的数据调度和信息索引能力。传统方法对分层数据库的访问算法采用语义指向索引技术,随着数据量的增大和干扰数据增多,对
MIS系统的查询模块一般与数据库和业务紧耦合、不通用,不能满足一些特定的应用场景。为解决该不足,基于数据字典和用户数据字典来设计查询,并且将查询权限融入设计。查询自定
采用本体概念映射方法,研究概念间相似度计算问题并提出本体图驱动的概念相似度算法。该算法将概念映射到本体结构图上,通过计算概念的语义、结构及属性相似度得到综合相似度。
虚拟机放置是云数据中心资源管理的一个重要问题。提出了基于多目标优化的蚁群算法,通过建立服务器CPU进程损耗和内存资源消耗模型,定义一个多目标优化的虚拟机放置问题。通
Oracle数据库具有可用性强、可扩展性好、安全稳定等特点,在各行各业得到了广泛应用。但其操作相对于其它数据库而言更为复杂,技术含量也较高。着重探讨了Oracle数据库的日常
为提高网络运维人员知识结构和工作效率,构建了基于B/S结构的知识训练考核系统。设计了数据层、服务层和应用层三层系统架构,详细分析了系统功能,从实现角度探讨了系统采用的
在《网络协议分析》课程中存在许多抽象和难以理解的概念,尤其是当涉及到某些具体协议的数据单元结构和通信双方的交互过程时。为了降低教学难度,提高教学效率,介绍了两种可
为提高学生c程序设计课程的学习效果,调动学习积极性,将彩色的、有高度组织性的思维导图应用到c程序设计课程教学中,提出了基于思维导图的学习方法与策略,让学生由被动学习转变到