基于主动探测的仿冒网站检测系统设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:dingjk3883085
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“钓鱼”在互联网概念中指通过在网页中携带欺骗信息,意图获取用户个人隐私数据的一种互联网诈骗方式。2013年钓鱼网站持续快速增长,每天有接近600万网民会访问各种不同类型的钓鱼网站,一旦用户在钓鱼网站中提交了重要信息,很有可能会对用户财产造成损失,及时准确地发现钓鱼网站对保护互联网用户财产安全具有积极意义。随着反钓鱼引擎的发展,钓鱼网站制作者越来越善于利用隐藏技术躲避检查,本文通过处理渲染后的实际页面,防止敏感数据隐藏。针对钓鱼网站中制作与正规官方网站相同或类似的页面,骗取用户信任的仿冒网站为研究点,采取预设白名单,使用包括URL自动生成、元搜索查询、邮件监测等多数据源主动探测方式,尝试主动发现新增的仿冒网站。为检测仿冒网站,本文提出了一种网页视觉块选择算法,将完整网页划分为不同种类的视觉区域,并提出了基于视觉区域匹配的网页相似度评价方法,按区域匹配度衡量整个页面的相似度,综合考虑了页面中的图片区域相似。为了实现页面中图片的快速相似比对,本文改进了一种图片感知哈希计算方法,通过将图片映射为一串32位的十六进制值实现图片相似比对。本文分别采用支持向量和朴素贝叶斯解决视觉块种类划分和仿冒网站判断方法,通过建立视觉块和页面索引实现仿冒网站快速判断。除考虑被保护网站外,本文建立仿冒网站模板特征索引作为黑特征库,通过建立仿冒网站黑特征库,可以有效地提高检测召回率,做到一次发现,永久杜绝,以此提高仿冒网站的制作成本。最后本文设计并实现了一套仿冒网站主动监测系统,输入被保护网站和仿冒网站,分别建立被保护网站特征库和仿冒网站模板特征库,通过样本数据获得训练模板,对多探测数据源发现的待检测网页进行仿冒判断。实验证明本文提出的系统可以有效发现仿冒程度大和已发现的黑模板仿冒网站。
其他文献
设计说明此系列鞋款,鞋面色调以亮丽、干净为主,加上帮面有趣的穿插分割;干脆利落的设计风格中仍不失活泼调皮的心理表现,让鞋子灵动起来,为穿着带来舒适、愉悦的体验!
<正>毋庸置疑,无论是汽车还是摩托车,"电动化"都已成为当下各个主机厂最关注的产品研发方向。前不久网上疯传的燃油机动车禁售时间表并非空穴来风,以电能为主的可再生新能源
目前我国已经是世界上黄金产量最大的国家,也是全球黄金消费最多的国家,为避免我国巨大的黄金财富因国际黄金价格的剧烈波动而蒙受损失,我国必须提高在国际黄金市场上的作用
The automotive industry is seeking new concepts for a continuously variable transmission (CVT) in the driveline. One possible solution for a CVT design is half
FAST-9检测子不具备尺度不变性,为此,提出一种基于多尺度FAST-9的图像快速匹配算法。对图像建立高斯尺度空间,在各图层上应用FAST-9检测子分别提取特征点,在其周围建立圆形区域并分配主方向,同时建立方形区域构造SURF描述子,利用基于最近邻匹配方法进行匹配。实验结果表明,与SURF、SIFT算法相比,该算法具有较高的匹配速度。
依据新实施的国家强制性标准GB 30585-2014《儿童鞋安全技术规范》,对20 1 6年国家质检总局及省级工商质监部门发布的儿童鞋质量抽检情况进行总结与分析.结果显示,除了传统的
金融业作为现代经济运行的核心产业,掌握着国民经济发展的血脉,在经济全球化发展大环境下,金融业的发展尤为重要。而在整个金融业的发展中,商业银行是核心因素。商业银行的发展在
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
面临非典给上海商业零售业带来的“冲击”,沪上一些商家苦练内功挑战市场,抓住商机,主动出击。
开展变电培训工作是一个持续的过程,它不只是做几道题、听几节技术讲课、开展几次考试,更多的是需要将学习到的东西如何应用在日常的工作中,对培训后,在实际工作起到的效果进