基于向量空间模型的过滤不良文本方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户：kfanffvga

【摘要】

：

就向量空间模型文本表示方法以及归一化技术对不良文本过滤性能的影响进行了研究，并基于平衡样本集和不平衡样本集分别进行了试验。试验和结果分析表明，Naive Bayes方法由于采

【作者】

：

李强李建华

【机构】

：

上海交通大学信息安全工程学院

【出处】

：

计算机工程

【发表日期】

：

2006年10期

【关键词】

：

文本表示文本归一化向量空间模型支持向量机 NAIVE Bayes模型 Text expressing Text normalization Vecto

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

就向量空间模型文本表示方法以及归一化技术对不良文本过滤性能的影响进行了研究，并基于平衡样本集和不平衡样本集分别进行了试验。试验和结果分析表明，Naive Bayes方法由于采用概率模型进行文本表示，在不平衡样本集上显示了较差的准确度，而基于向量空间模型进行文本表示的方法，如中心向最法（VSM）、支持向量机（SVM）等在平衡或非平衡样本上取得了较好的准确度，并用于过滤不良文本的文本内容安全监管中。

其他文献

娄底高铁南站枢纽一体化项目机电设备招投标存在的问题与体会

娄底高铁南站枢纽一体化项目机电设备招投标，耗时一年半，先后进行了三次招标、四次评标。本文通过对这一实例的分析，谈谈机电设备招投标中容易出现的问题和体会。

期刊

机电设备招投标评标专家

大地电磁仪的Windows CE驱动程序设计

为了实现超长周期大地电磁信号的智能化采集，设计数据采集板硬件，移植Windows CE5．0内核。开发Windows CE内核下独立型流接口的数据采集板驱动程序，通过访问驱动实现采集应用程序

期刊

WINDOWSCE内核驱动开发大地电磁Windows CE kernel driver development magnetotelluric

浅析建筑工程项目管理的现状与对策建议

随着我国经济建设的迅速发展，作为我国支柱产业之一的建筑业的发展规模与速度空前。建筑工程的项目管理日益成为我国建筑行业发展中备受人们关注的一个重要问题。建筑行业的飞

期刊

建筑工程项目管理现状对策

面向流应用的流寄存器文件

存储系统是通用处理器在处理流应用时的瓶颈。该文基于FT64流处理器体系结构，提出一种面向流应用的流寄存器文件结构设计方法和数据传输机制，分析它在FT64中的作用。通过采用大

期刊

流寄存器文件流处理器FT64处理器计算核心存储stream register file stream processor FT64 process

Ad Hoc网络环境中避免虫洞攻击的路由算法

根据Ad Hoc网络环境中虫洞攻击的特点，提出了一种基于移动Agent的路由算法。移动Agent在网络中根据一定的运行策略进行移动，并不断地和所经历的节点进行数据交换，由此了解网络中

期刊

虫洞移动AGENT路由算法ADHOC网络Wormhole Mobile Agent Routing algorithm Ad Hoc networ

基于向量空间模型的过滤不良文本方法

其他学术论文