基于网络涉恐数据Logo识别技术的研究与实现

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:w5130293253
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着有害数据在互联网中大肆传播,如何有效地检测出这些有害数据,维护网络的健康安全是整个社会所需要研究的重要课题。经过对有害数据的研究分析,逐渐形成了以图像处理技术为核心的检测架构。本课题的研究依托于中国电子科技集团第30研究所成都三零凯天公司的“视图内容检测分析系统—GA”项目。项目要求通过将已掌握的图像、视频等抽取为视觉特征库,并利用特征库匹配及深度学习的视觉分类技术,对内容平台推送的图片、视频、文档内容进行匹配、识别及分析,快速甄别出海量信息中不良有害内容,为相关部门子系统提供有效线索,供其进行进一步的关联分析。本文重点研究如何利用现有的图像处理技术快速甄别有害数据中的涉恐徽标(Logo)。在Logo识别模块中,图像分类模型具有至关重要的作用,而支持向量机(Support Vector Machine,SVM)是图像分类应用中最广泛的一种分类器,因此本文首先对基于传统词袋模型(Bag-of-words model,BOW)的SVM图像分类模型进行研究,分析了传统词袋模型存在的两点缺陷:视觉词信息表征准确性不高和灵活性差。本文根据这两个缺陷结合可对比性词及汉明嵌入技术,对传统词袋模型进行了改良,提高了词袋模型的鉴别力,并将改良后的词袋模型结合到SVM图像分类模型中,给出了一种基于高鉴别力词袋模型的SVM图像分类模型,测试结果表明其在分类的准确性及稳定性上都有较大的提高。传统的模版匹配模型对涉恐Logo数据存在着误报率较高、识别速率慢等缺陷。本文将上述基于高鉴别力词袋模型的SVM图像分类模型与传统模版匹配模型相结合,给出了一种新的模版匹配模型方案,从而实现了Logo识别模块。最后对上述实现的Logo识别模块进行模块性能测试和系统测试,模块性能测试结果表明:(1)匹配速率基本不受模版库大小的影响,单次识别时间稳定在0.6s以内,从而较好的解决了模版匹配运行速率慢的问题;(2)模版匹配后的数据经过SVM决策机制拥有较好的分类效果,使得非涉恐数据的误报率维持在0.1%以内。由系统测试可知,本文给出的Logo识别模块可以稳定的实现系统各种需求。
其他文献
采用1年生薄壳山核桃实生苗为研究材料,以盆栽加盐的方式来人工模拟盐胁迫环境,设置0(对照,不加NaCl),0.1%,0.2%,0.3%,0.4%,0.5%,0.6%,0.7%和0.8%共9个盐梯度,研究在不同盐梯度下薄壳
分心驾驶行为的典型特征多发性行车过程中,驾驶人通常难以将注意力高度集中在驾驶任务上。据公安部交管局联合七家网络平台所进行的问卷调查显示:高达77%的驾驶员偶尔会出现分心
变电站的安全工作关乎城市电力系统的稳定性,同时继电保护是变电站安全的关键,在继电保护二次回路的运行当中,还存在着拒动、误动的情况,对变电站的安全性产生不利的影响,因此本文
教学、科研、资政是党校的三大职能,基层党校在保证履行教学、科研职能的基础础上,强化资政职能不仅是职责所在,也是提高自身地位的重要途径,资政服务,其基质是为领导的决策服务。
在分析微机械陀螺接口电路工作原理的基础上,采用中电集团第24研究所的3μm 10V P-well标准模拟CMOS工艺设计并制作了微机械陀螺ASIC接口电路.电路HSPICE仿真灵敏度为0.252mV/aF.
开展采用小冲杆微试样试验技术评定材料断裂性能的研究。针对2.25Cr-1Mo钢(脆化态和脱脆态)及1.25Cr-0.5Mo钢,将小冲杆试验测试结果与常规冲击韧度及断裂韧度试验结果相关联,得到小
<正>深圳市南山区珠光小学始建于1936年,现有35个教学班,可绿化面积覆盖率达到100%。学校一直秉承"以人为本,和谐发展"的办学理念,2013年在王春平校长亲自提议和指导下,珠光
传统观点认为税收规避能够节约企业税收支出,减少现金流出,是政府向企业转移财富的增值行为。但基于委托代理理论的研究却认为代理问题是影响现金持有的重要因素之一,税收规
继电器对供电系统的保护作用具有巨大的影响,特别是在当前经济和社会大发展大繁荣带动下的快速发展的电力系统的背景之下。作为电力系统的重要组成部分,二次回路和继电保护能
2016年4月18日,美国联邦最高法院不予受理美国作家协会诉谷歌公司案,这意味着谷歌数字图书馆长达十多年的版权纠纷尘埃落定,其构成合理使用而不侵犯版权。谷歌公司早在2004年