基于向量空间模型的过滤不良文本方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:kfanffvga
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
就向量空间模型文本表示方法以及归一化技术对不良文本过滤性能的影响进行了研究,并基于平衡样本集和不平衡样本集分别进行了试验。试验和结果分析表明,Naive Bayes方法由于采用概率模型进行文本表示,在不平衡样本集上显示了较差的准确度,而基于向量空间模型进行文本表示的方法,如中心向最法(VSM)、支持向量机(SVM)等在平衡或非平衡样本上取得了较好的准确度,并用于过滤不良文本的文本内容安全监管中。
其他文献
娄底高铁南站枢纽一体化项目机电设备招投标,耗时一年半,先后进行了三次招标、四次评标。本文通过对这一实例的分析,谈谈机电设备招投标中容易出现的问题和体会。
为了实现超长周期大地电磁信号的智能化采集,设计数据采集板硬件,移植Windows CE5.0内核。开发Windows CE内核下独立型流接口的数据采集板驱动程序,通过访问驱动实现采集应用程序
随着我国经济建设的迅速发展,作为我国支柱产业之一的建筑业的发展规模与速度空前。建筑工程的项目管理日益成为我国建筑行业发展中备受人们关注的一个重要问题。建筑行业的飞
存储系统是通用处理器在处理流应用时的瓶颈。该文基于FT64流处理器体系结构,提出一种面向流应用的流寄存器文件结构设计方法和数据传输机制,分析它在FT64中的作用。通过采用大
根据Ad Hoc网络环境中虫洞攻击的特点,提出了一种基于移动Agent的路由算法。移动Agent在网络中根据一定的运行策略进行移动,并不断地和所经历的节点进行数据交换,由此了解网络中