一种用于文本分类的语义SVM及其在线学习算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:DFHGFD43
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文利用SVM在小训练样本集条件下仍有高泛化能力的特性,结舍文本分类问题中同类别文本的特征在特征空间中具有聚类性分布的特点,提出一种使用语义中心集代替原训练样本集作为训练样本和支持向量的SVM:语义SVM。文中给出语义中心集的生成步骤,进而给出语义SVM的在线学习(在线分类知识积累)算法框架,以及基于SMO算法的在线学习算法的实现。实验结果说明语义SVM及其在线学习算法具有巨大的应用潜力:不仅在线学习速度和分类速度相对于标准SVM及其简单增量算法有数量级提高,而且分类准确率方面具有一定优势。
其他文献
普通绵耳狨猴是体型较小的非人灵长类实验动物,具有饲养成本低,繁殖效率高,性成熟时间短等优势,非常适合开展辅助生殖技术及基因修饰模型研究。狨猴的人工辅助生殖技术(assis
11月29—30日,广西南宁市举办了“南宁2008香蕉嘉年华暨西乡塘坛洛第二届美食节”,由广西区水果总站、西乡塘区坛洛镇政府和南宁市西乡塘区经济贸易局主办。坛洛镇是南宁市香蕉
利用单播传输路径的重叠特性所构建的叠加组播树可以部分模拟IP层的有源组播,而单组会话中成员主机在网络中分布的不足可以通过多组会话中的主机来弥补。该文根据这一特点提出
近年来我国重大灾害事故频发,给人民生命财产造成了重大损失,已经严重影响到我国经济社会的平稳发展。在巨灾风险防范体系中政府承担了主要的损失补偿责任,尚缺乏市场化的应对机
番茄红素(lycopene)是类胡萝卜素的一种,它是由11个共扼及2个非共扼碳—碳双键组成的直链碳氢化合物,具有很强的抗氧化性,是一种很好的食品添加剂。本文介绍了几种常见的番茄红素
文章论述了人所具有的特性,这些特性哪些是有益于软件开发的,哪些特性是不利于软件开发的,探讨了怎样利用人的优点,避开人的缺点,在软件开发的过程中应怎样运用软件工程思想,怎样处
根据视频运动的空间和时间相关性,以当前帧相邻块和前一帧重建VOP对应位置块及其相邻块为基础,并且自适应地调整当前帧和前一帧各块对初始搜索点确定的权值,完成初始搜索点的准
文章介绍了一种提高任意双正交小波消失矩的方法。此法根据小波的消失矩与其对应FIR滤波器的Laurent多项式在x=1处零点阶数相等的关系,基于提升格式采用迭代法设计提升系数,便
目的利用超声心动图技术观察急性心肌梗死(acute myocardial infarction,AMI)食蟹猴的左心室心功能的变化,为食蟹猴AMI模型的应用提供参考。方法分别对食蟹猴AMI模型建模前、
提出一套针对误差分散类逆半调图象的质量评价方法。在分析了误差分散半调图象退化特性的基础上,将逆半调图象中的噪声表征为图象频率失真和附加噪声的联合作用,据此确定了该评价方法中的像素级差异测度,频谱距测度,边缘质量测度和附加噪声测度;通过对不同误差分散类逆半调图象序列的实验分析了这些测度的性能.实验证明在评价逆半调图象时,该套评价方法较目前广泛使用的峰值信噪比(PSNR)测度更为全面。