互联网文本视频过滤技术研究与应用

被引量 : 0次 | 上传用户:chenpeixin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于网络信息发布缺少有效的监督机制,越来越多的不良信息出现在网络上。为了构建和谐健康的网络环境,自动的信息过滤技术具有重要研究价值。为了逃避现有的过滤系统,当前不良信息发布者越来越多地以图像的形式发布不良文本信息,这给不良信息过滤研究提出了新的挑战。本文针对网络上的文本图像信息进行不良信息过滤研究,其包括文本图像的字符识别和识别后文本过滤两个方面的研究内容。为了提高过滤的准确性,本文对文本图像过滤的一些关键技术提出了建设性的方法。通过文本定位和文本抽取研究提高复杂背景文本图像中的字符识别性能,同时通过文本主题识别和文本倾向性分析相结合的方法来提高文本过滤的准确率。本论文的主要工作如下:1、本文提出了基于连通分量的文本定位方法。该方法利用了字符几何形状特征和文本区域内字符整体特征,并将两类特征有效地融合到分类过程中。同时,本方法使用了级联弱分类器和支持向量机相结合的分类方法来确认字符。实验结果显示该方法具有较高的定位准确率。2、针对复杂背景图像的文本抽取问题,本文提出了一种基于HSL颜色空间的抽取方法,用于消除字符颜色不一致和复杂背景的影响。该方法将文本区域分为三种不同的颜色类型,对不同类型的文本区域,采用HSL颜色空间中相适应的颜色分量进行分割。该方法充分利用HSL各个分量的优势。实验结果表明了该方法的有效性。3、在文本过滤方面,本文采用主题来表示过滤模板,通过识别文本主题来确认是否需要过滤。本文提出了基于概念知识树的主题识别方法。该方法利用了概念知识树的层次关系和节点属性信息来确认文本主题的核心概念,并利用概念的语义关系构建一个复合概念来表示文本的主题。实验表明该主题识别方法具有较高的性能,并能有效地运用于文本过滤系统中。4、为能够准确识别具有相同主题的正面和反面文本,文本情感倾向性特性被用于文本过滤。本文提出了基于主题词上下文词汇的文本倾向性分析方法。该方法认为文本的倾向性与文本的主题相关,而且可以通过主题词的上下文词汇对主题词的相互作用来表示。基于主题词的倾向性分析能够有效的消除文本内容变化带来的困难。实验结果显示了该方法的有效性。
其他文献
通过模拟试验和实际提升过程中的精密测量控制,对超高层钢结构中大跨度、大截面钢桁架整体提升测量控制技术进行研究,实践表明:该技术的测量精度高,可保证安装质量;经模拟计
<正>2003年以来,首钢依据国家、北京市的有关政策,积极稳妥地推进主辅分离辅业改制工作。首钢列入市国资委改制计划的共有108家单位,到2008年底,首钢累计完成94家企业改制,涉
期刊
北京电视中心工程首次在工程中对巨型钢框架结构体系进行了研究与应用的工程,针对巨型框架结构体系超高层纯钢结构设计与施工方面的特点和难点,主要研究应用了巨型框架平面控
乡镇党政领导的执行力,事关农村社会的稳定和发展。山西省乡镇领导在转型跨越发展中,能把握大局,执行政策时处置恰当,使山西农村经济社会的发展呈现良好局面。但是,由于社会
家长助教具有补充幼儿园教育资源、协助教师完成教育任务、提高教学的有效性、促进幼儿发展、实现家园共育等优势。有效开展家长助教活动,要在调查、分类、整理家长资源的基
新生儿游泳有利于其生长发育。但存在安全隐患,如新生儿烫伤、溺水、感染等。加强新生儿游泳安全管理,对护士进行培训,提高安全意识及业务水平,同时制定、实施相关规章制度,
本论文以低碳经济的本质属性为理论基础,从微观层面上探讨特定经济体如何进行低碳经济发展模式选择以及怎样构建微观层面上的低碳经济运行机制问题,在理论层面上回答特定行为
随着海洋运输业的发展,越来越多的物品以集装箱的形式进行航运运输。伴随而来的集装箱落水事故也相对于以前有所增加。集装箱落水事故的发生,直接造成了人们巨大的经济利益损
在我国广大农村,土地是农民最基本的生产和生活资料,特别对处于弱势群体的广大农村妇女来讲,土地是其赖以生存和发展的基础。保障农村妇女的土地权利,即是男女平等原则的体现