一种基于增量学习型矢量量化的有效文本分类算法

来源 :计算机学报 | 被引量 : 0次 | 上传用户:bashi0000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
KNN作为一种简单的分类方法在文本分类中有广泛的应用,但存在着计算量大和训练文档分布不均所造成的分类准确率下降等问题.针对这些问题,基于最小化学习误差的增量思想,该文将学习型矢量量化(LVQ)和生长型神经气(GNG)结合起来提出一种新的增量学习型矢量量化方法,并将其应用到文本分类中.文中提出的算法对所有的训练样本有选择性地进行一次训练就可以生成有效的代表样本集,具有较强的学习能力.实验结果表明:这种方法不仅可以降低KNN方法的测试时间,而且可以保持甚至提高分类的准确性.
其他文献
在实现多物理并行数值耦合模拟中,需要处理多个物理过程之间网格、并行区域分解的差异.针对该问题,该文基于三维流体力学与激光传播耦合的并行数值模拟,提出了一种实用的并行
针对Internet视频通信中面临的随机丢包问题,提出了一种基于视觉感知片组的多描述视频编码方案(PSG-MDC).方案依据H.264所采用的树型结构运动补偿,较大的宏块分割尺寸适用于平坦区,
在太空环境中,软件系统经常受到各种辐射现象的影响.在此类环境下,寻找软件脆弱点主要是考虑环境扰动对该软件的影响.文中提出了一种由环境扰动引入的软件脆弱点的分析方法.首先在
由于MPEG-4AVC/H.264采用了可变块尺寸(variable block size)和率失真最优化(rate distortion optimization)两项技术,视频编码流程中复杂度最高的运动估计(motion estimation)模块
提出一种基于部分测试向量奇偶位切分的LFSR重新播种测试方法.针对确定测试集中各个测试向量包含确定位的位数有较大差异以及测试向量所含的确定位大多连续成块的特点,通过奇偶
拥有MD随身听的朋友越来越多,可是在索尼(SONY)的MZ—N1和夏普(SHARP)的IM—MT880之类的NETMD产品普及之前,实现纯正的数字录音就只能通过光纤接口或者同轴接口,而具有此类接口