基于分组聚类的SVM训练算法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:for1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
考虑到对噪声样本敏感是SVM的固有特性,为了加快算法的训练速度,同时不降低学习机的推广能力,该文提出了一种基于分组聚类的训练算法.其主要想法是:首先把原训练样本随机分成多个互不相交的子集;然后在每个子集中进行k-均值聚类,得到多个类中心;最后把得到的类中心作为新的训练样本进行SVM训练.由于这些类中心很好地表示了原训练样本的特征,可以说该方法不会降低学习机的推广能力.从理论上,该文分析了算法的复杂度,保证了所提出的算法比不聚类的算法快.在多个公开的标准测试数据集上的计算结果表明;所提处法在保持推广能力的同时比不聚类的SVM训练算法快至少一倍以上.
其他文献
经过几个月的日夜奋战,开封空分集团出口阿联酋4000m~3/h空分设备的厂内制作全部完工,三月中旬发往阿联酋。这是该公司自营出口到阿联酋的首套空分设备。这套4000m~3/h空分合
半色调是一种将连续色调的图像用二值或多值图像表示出来的技术。它是图像输出设备的一项重要技术,也是多年以来图像处理研究的热点和难点。半色调技术有多种实现方法,其中误差
对亏指数(1,1)的下半有界闭对称算子的von Neumann问题,作者利用实参数形式的Krein公式和自伴正算子的秩1扰动理论给出了一个仅依赖于Friedrichs延拓的显式解答,并且证明了对
自然环境和资源是人类社会存在和发展的必要基础,为了保证社会的可持续发展就必须协调好人类发展和自然环境之间的矛盾.由于人类的过度开发,许多物种的种群数量过低,已经威胁
现代通信技术的发展,提出了大量存贮、记录和传输各种静态图像的问题。对图像压缩的研究也成了人们日益重视的热点问题。 本文首先对图像压缩的历史、现状以及压缩标准、判
数学家Hadamard针对数学物理问题中的定解问题提出了适定性的概念。如果这个定解问题的解满足三个条件:存在、唯一、稳定,则称这个定解问题是适定的。这就是现在我们称之为Hada
由于无线传感器网络具有大规模密集部署的特点,距离教近的节点收集到的数据信息通常具有非常大的相似性,产生许多冗余数据,从而导致网络能量的严重浪费。根据网络特点与应用环境
神经网络在实际应用中,由于引入信号传输延迟,所以在研究网络稳定性过程中,就需要在原有的数学模型中加入延迟。从而更准确地刻画了实际应用的神经网络。有延迟和没有延迟的网络
盲信号分离(BSS)是在源信号不能被直接观测和传输信道未知的情况下,仅利用观测信号和源信号的统计独立性假设提取或恢复源信号的一种信号处理方法。作为计算智能学习的重要研究
本文用鞅方法对可转换债券(Convertible Bond)进行研究和分析。随着中国金融市场改革和开放,利率管制逐步放开,无风险利率开始市场化;同时,作为一种利率衍生证券,可转换债券的存续期