基于文本过滤的贝叶斯分类算法的改进

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:dingzhiyoulan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统贝叶斯分类算法无法满足复杂网络文本过滤需求,提出一种多词-贝叶斯分类算法(Multi Word-Bayes,MWB)。该算法一方面引入了特征权重(Term Frequency-Inverse Document Frequency,TF-IDF)的计算思想,优化了传统贝叶斯分类算法只考虑词频不考虑文本间关系的问题;另一方面将词与词间的关系作为文本分类的重要参考项,克服了传统贝叶斯分类算法在分类器训练上对语义分析的忽视。实验结果表明,MWB在垃圾文本过滤上具有更好的分类性能。
其他文献
随着网络的不断发展,企业通过网络平台,不仅可以实现企业内部信息的交流和共享,而且还可以借助网络的力量,应用在生产当中,从而极大地提高了生产效率。但是,在不断拓展网络架构的时
传染性皮下及造血组织坏死病毒(IHHNV)是一种分布较广、危害较大的对虾病毒,已被世界动物卫生组织(OIE)列为须向其申报的甲壳类重要疫病病原。IHHNV在我国已形成了一定的流行趋势
目的 探讨在浅静脉输液中应用留置针时采用临床护理路径对减少并发症,减轻患者痛苦,改善护患关系的影响.方法 随机将116例静脉输液中应用留置针的患者分成实验组和对照组,实
为研究隧道施工条件下管线的变形,通过开发颗粒流程序及利用室内管线加载-挠度试验建立了管线宏细观参数之间的关系.基于PFC2D建立了隧道-土体-管线的数值模型,模拟砂土中隧
单井控制面积计算是油田开发中原始和剩余地质储量研究的基础。针对注采井网形成的平面变密度离散点集的边界搜索问题,本文提出以角度为判别标准,基于变搜索步长的滚边新算法
为消除光照变化对图像结构信息的影响,提出基于三维块匹配(BM3D)预处理的纹理光照不变特征提取算法。基于BM3D算法的良好降噪特性,该方法首先对图像各颜色通道采用BM3D降噪,利用小波变换得到各颜色通道对数域的低频和高频分量,然后对低、高频分量分别运用小波和Bayes-Shrink算法降噪,并构造光照不变量,最后采用主成分分析(PCA)降低特征维度,取得特征向量,并利用K-最近特征线分类器进行图像
【正】高先生近几年的绘画略显忧郁,2003城市心情主题系列更是明显。时隔四年的今天,我们用生活的视角去看待这位艺术创想家曾用画笔记下的心情
信息物理系统(Cyber—PhysicalSystem,CPS)是计算、通信、控制与物理过程高度集成的新一代智能控制系统,具有安全、可靠、实时、高效等特点,应用前景广泛。将CPS应用到果园植保机
<正>2012年安倍政府再度上台执政以来,高度重视开展对中东外交。截至2018年7月,安倍已先后6次访问中东地区,~①足见中东在安倍外交板块中的重要地位。2018年5月安倍政府最新
根据Gartner的预测,2005年底能够上网的手特设备将达到PC水平,而且“无线热区”也正快速地从机场、酒店向街区过渡。这意味着一种全新的互联刚接入模式以及出此产生的新的攻击