层次式文本分类的Nave Bayes改进方法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:shijingthink
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Naive Bayes方法在文本分类中的决策强烈依赖于主观选择的样本关于类别的分布。本文利用层次式分类的特点并引入概率条件改进Naive Bayes方法,使其在每个内部类别所属的子类局部数据中进行决策,缓解了全局数据分布对分类器的影响,部分克服了数据偏斜问题。实验表明,改进方法在层次式分类中的效果较Naive Bayes方法有显著提高。
其他文献
<正> 几年前,现代化阳图PS版生产工艺流水线,无论国内外都采用如下的模块式结构: 脱脂→电解糙化→阳极氧化→封孔→涂布→裁切 其中,前四部分习惯上合称为版基处理。众所周
本文介绍了一种适用于单输入多输出(SIMO)系统中的自适应盲均衡算法——典型相关分析的递归最小二乘自适应盲均衡(CCA-RLS),并在此基础上提出了一种改进算法——典型相关分析的可
在高校德育工作经历了两个不同的阶段后正向规范化稳定发展。但也遇到新的情况和问题;班主任在高校德育工作中既是教育者又是沟通者的重要角色,应充分发挥灵活多样的作用。本文
目前计算思维和计算思维能力的培养越来越受到重视,然而如何在教学实践中培养学员的计算思维,仍需深入探讨和研究。以计算思维的培养为视角,探索计算机硬件课程教学,总结其教学实
知识经济,这是实现中华民族伟大复兴的极好机遇,为迎接知识经济的到来,必须加强企业管理人员的培训和培训基地的建设。要把企业管理培训工作看作是企业改革与发展的一次战略
要保障中国股市健康、快速地稳定发展,必须加强股市运作的科学规范,解决多年来上市公司股权、股价扭曲和市场供求失衡问题。目前较好的政策选择是低价全额配售。这样能协调股市
现实中的资源使用往往同时存在"公共使用"和"私人使用"这两种属性,只要其中一种属性能够占据主导地位时该资源系统就表现为"公共资源"或"私有财产"。然而当这两种属性都很重
针对现有信息检索系统中存在的词不匹配问题,本文提出一种基于负关联规则挖掘与特征词抽取融合的局部反馈查询扩展算法。该算法首先从前列n篇初检局部文档中抽取特征词,建立特
本文介绍了一种大规模0/1线性方程组的特点,以及用标准粒子群算法求解时出现的不足。为此,提出了一种混合粒子群算法。该算法引入了遗传算法的变异机制,采用自适应惯性权重,动态调
本文着重论述名牌经济与城市形象之间的关系,指出名牌经济是塑造美好城市形象的强大动力和重要内容,实施名牌战略,发展名牌经济,可以为塑造美好城市形象作贡献。