二元正态分离的特征词提取算法的研究与改进

来源 :黑龙江科技信息 | 被引量 : 0次 | 上传用户:zhangduanhua0505
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
这篇文章研究的是文本分类中的特征词提取部分的算法中的二元正态分离法的改进。文章分析了原有算法未加入词频统计的概念和因此产生的不足,提出了分散度的概念,并设计了加入分散度概念的改进算法公式,通过具体的文本分类实验表明该算法的改进在中文文本分类应用中较原算法和其他特征词选择算法在分类效果上比较具有优势。
其他文献
4月12日,农业部在内蒙古锡林浩特市举办了2017年全国草原春季禁牧休牧与草原防火宣传活动。此次活动标志着我国主要草原地区陆续进入春季草原禁牧休牧期。农业部副部长于康震
近年来,我国畜牧经济得以飞速发展,但同时也出现了诸多问题。要想实现畜牧经济的可持续发展,需要依据现有的科学技术力量,对生产技能、管理制度进行不断完善,对生产养殖方式
陕西省商洛市丹凤县为了认真贯彻落实《中华人民共和国动物防疫法》,全面履行各级行政保密度、业务部门保质量的动物防疫工作职责,保障全县春季动物防疫秩序有序进行,不发生