一种基于增量学习型矢量量化的有效文本分类算法

来源 :计算机学报 | 被引量 : 0次 | 上传用户：bashi0000

【摘要】

：

KNN作为一种简单的分类方法在文本分类中有广泛的应用,但存在着计算量大和训练文档分布不均所造成的分类准确率下降等问题.针对这些问题,基于最小化学习误差的增量思想,该文

【作者】

：

王修君沈鸿

【机构】

：

中国科学技术大学计算机科学与技术系

【出处】

：

计算机学报

【发表日期】

：

2007年08期

【关键词】

：

学习型矢量量化(LVQ) 生长型神经气(GNG) 学习误差类间距离学习概率

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

KNN作为一种简单的分类方法在文本分类中有广泛的应用,但存在着计算量大和训练文档分布不均所造成的分类准确率下降等问题.针对这些问题,基于最小化学习误差的增量思想,该文将学习型矢量量化(LVQ)和生长型神经气(GNG)结合起来提出一种新的增量学习型矢量量化方法,并将其应用到文本分类中.文中提出的算法对所有的训练样本有选择性地进行一次训练就可以生成有效的代表样本集,具有较强的学习能力.实验结果表明:这种方法不仅可以降低KNN方法的测试时间,而且可以保持甚至提高分类的准确性.

其他文献

多物理数值模拟中一种有效的并行耦合方法

在实现多物理并行数值耦合模拟中,需要处理多个物理过程之间网格、并行区域分解的差异.针对该问题,该文基于三维流体力学与激光传播耦合的并行数值模拟,提出了一种实用的并行

期刊

并行计算多物理模拟并行数据重分配有向图parallel computingmultiphysics simulationparallel data

基于视觉感知片组的多描述视频编码

针对Internet视频通信中面临的随机丢包问题，提出了一种基于视觉感知片组的多描述视频编码方案（PSG-MDC）．方案依据H．264所采用的树型结构运动补偿，较大的宏块分割尺寸适用于平坦区，

期刊