一种不良信息过滤的文本预处理方法研究

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:tezon1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前互联网上含有不良内容的文本信息形式多变,本文主要针对不良内容的敏感信息出现的特征变化,提出一种基于文本内容的不良信息过滤的文本预处理方案,并着重探讨了其结构变化的敏感信息的识别及解决的方法。研究表明在文本的分词处理前,对不良信息形式的变化进行预处理,能够提高过滤的效率。
其他文献
本文介绍了利用红外热成像技术作为电路板故障信息检测,电路板故障分析采用故障树分析法与专家系统相结合的诊断方法,并描述了此专家系统的基本设计构想及实现方法。该诊断方式
根据人眼对图像内容边缘比较敏感的特点,针对宏块内水平方向或垂直方向边缘点的个数及边缘的总数选择宏块分割模式。对于边缘点的选择根据仿生学中人眼视觉对比敏感度,提出了新
紫外辐射(UV-B)对人类健康、水域和陆地生态系统都存在不同程度的影响。综合论述了近年来有关陆地植物对UV-B辐射响应的研究成果及进展,包括植被外部形态、光合作用和光合色素
本文以两分支电网为例,分析了零序直流选择性漏电保护原理及其保护判据特性。介绍了以单片机为核心的零序直流选择性漏电保护原理的实现。
随着因特网的发展与广泛应用,网络安全越来越重要。人们对网络安全也提出了更高的要求,而数字签名技术在保证数据的完整性、真实性和不可抵赖性方面起着重要的作用。本文分析了
在中国的三个传统的巨大的 forested 区域上的森林破碎的 Geospatial 模式(东北,西南;南部的中国) 比较地被分析;基于 250-m 分辨率陆地盖子数据集报导了。明确地,森林破碎的空间
本文提出了一种快速帧内编码算法,利用prewitt算子检测亮度信号的边界方向,并根据周围块的编码模式预测出可能的编码模式,将色度信号与亮度信号分开处理,然后利用拉格朗日代价函数计算出最优编码模式。实验数据表明,该算法可以极大地提高帧内编码速度,而对图像质量和码率大小变化影响极小。
基于MSP430系列单片机设计了体外临时心脏起搏器的起搏装置,给出了硬件设计电路和软件的系统结构。经实验研究,该装置比原有的以AT89c2051型单片机制造的体外临时心脏起搏器在
本文根据智能大厦OAS(办自动化系统)的设计目标,结合Web服务的优点,提出了基于Web服务的智能大厦OAS的逻辑架构,最后给出了智能大厦OAS中的车次查询服务的设计过程实例。
针对虹膜图像中复杂的层次结构使得虹膜卷缩轮难以提取问题,提出了一种基于Snake的虹膜卷缩轮提取方法。以轮廓采样点到相邻采样点的中点距离为内部能量函数,以每个采样点与相邻两采样点线段上所有点的梯度的平均值为外部能量函数,并且根据内、外部能量的比值动态调整权值参数。该方法将虹膜卷缩轮特征点的提取转化成求总能量函数的最小值问题。实验结果表明基于Snake的虹膜卷缩轮提取方法的可行性和有效性。