图片检索在网络敏感信息实时预警系统中的应用

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:xy255c
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的不断发展,信息交换和传播的方式也越来越多样化,对于企业来说,需要及时获知网络上与自身有关的敏感信息。“网络敏感信息实时预警系统”是针对企业需求开发的一种网络信息审查系统,可以对指定网站上的文本和图片信息进行获取和分析。本文的研究属于系统中的图片搜索模块,在系统的图片库中辨别出公文图片,并使用汉字识别技术识别出标题文本,以进行相应的敏感信息匹配和预警。本文对公文图片进行标题识别的方法分为图片过滤、提取标题字符和字符识别三个部分。图片过滤是为了在种类繁多的图片中过滤掉不具有公文特征的图片,公文图片的明显特征包括颜色分布特征和红色横杠特征,再加上图片的大小,以这三个特征作为公文图片的判断标准。提取标题字符是从图片中提取出需要识别的单个字符,这是特征提取和识别的先决条件,提取字符可分为:版面分析、字符切分、规范化和细化几个步骤。字符识别是对各个标题字符进行特征提取和识别,这个部分又分为特征提取和识别器的设计两个步骤,识别器包括粗分类和单字识别,采用最近距离分类法进行多级分类和计算,以得到最后的识别结果。将本文介绍的图片检索和识别方法应用到“网络敏感信息实时预警系统”中,使系统在检索文本信息的同时,还具有了对网站上的公文图片进行检索和预警的功能,实际应用中的状况表明,本文的方法能够较好地检索出公文图片并识别标题信息。
其他文献
数字内容的传播范围随着互联网的发展日趋扩大,科学合理的版权保护技术对于促进文化传播意义重大。本文通过对数字版权管理(DRM)体系标准化成果的分析,以自底向上方法完成了
本文的主要研究工作来源于河南省教育厅自然科学研究计划项目(No.20098520015)“区间值Fuzzy逻辑的代数结构”与河南省重点科技攻关项目(No.092102210149)“基于区间结构的柔
在计算机系统中,存储子系统的能耗占着相当大的比例。降低存储子系统能耗成为计算机系统节能的一条重要途径。利用组合盘(由固态盘和硬盘构成)进行节能是近年来的一个研究热点
闪存(Flash Memory)是嵌入式系统中一种常用的存储介质,具有体积小、容量大、成本低等一系列优点。它最早为人所知是通过U盘的普及。现在,随着手机、数码相机、PDA、便携式游
无线传感网是最近几年研究很热的一个领域,它被公认为是继互联网之后的第二大网络,而无线传感网的特点决定了它对防危性有很高的要求,即无线传感网的良好应用需要防危性的保
三维视频以其真实、自然以及广泛的应用前景,在三维电影、电视、视频会议以及军事、医疗等方面均有广泛的应用。但三维视频庞大的数据量,使其在存储、处理及传输方面对系统要
无线传感网络(Wireless sensor network, WSN)为人们提供了新的感知物理环境的手段,如何从其产生的数据流中识别出有意义的数据和事件并加以处理已经成为了当前研究的热点。复杂
随着科技的快速发展,人们社会活动趋于频繁,对稳定、快速、准确的个人身份验证和查询的需求变得越来越大;但目前人证同一性验证普遍存在验证效率低、精度差、信息使用不充分等问
乳腺癌作为中老年女性的致命肿瘤之一,早期检测、早期治疗是降低乳腺癌死亡率的关键。乳腺X线摄影是公认的诊断早期乳腺癌的方法,但医生阅读乳腺X射线片图像是一个耗时耗力的工
目前虚拟化技术的研究工作主要集中在各种主流硬件的虚拟化,虚拟机网络带宽分配方面的研究工作比较少。如果虚拟机的网络带宽无法根据应用的需求进行必要的控制,相互的带宽争用