大规模数据集下支持向量机训练样本的缩减策略

来源 :计算机科学 | 被引量 : 0次 | 上传用户:gaolch002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大量数据下支持向量机的训练算法是SVM研究的一个重要方向和焦点。该文从分析SVM训练问题的实质和难点出发,提出一种在训练前先求出类别质心,去除非支持向量对应的样本,从而达到缩小样本集的方法。该方法在不损失分类正确率的情况下具有更快的收敛速度,并从空间几何上解释了支持向量机的原理。仿真实验证明了该方法的可行性和有效性。
其他文献
随着我国移动通信事业的快速发展,运营商越来越重视无线网络规划与优化工作,侍播模型是移动通信网中小区规划的基础,根据给出的传播模型经验公式,提出了具体的解决方案,设计了相应
在分析不一致不完备信息系统规则提取的基础上,提出了先将不完备信息系统分为一致的和不一致的信息系统后再求其最优选择的方法。然后利用改进的分辨矩阵对所求得的不一致最优
业务模型的复杂度决定企业信息系统的复杂度,也对信息系统的重构性能具有很大程度的影响。目前研究多侧重于代码级软件的复杂度度量,而对业务模型的复杂度则关注较少。本文首先
本文分析了基于EDI和XML技术的电子商务系统应用集成问题,描述了一个EDI-XML通用数据转换构件系统的设计原则和软件架构,论述了该架构方案中EDI-XMI。数据模式的定义机制,提出了
诠释(annotation)是JavaSE5引入的一种新的编程语言成分,目前得到广泛关注。但从可视化建模来看,已有的Java元模型和UML2元模型并不支持诠释规范,这导致诠释的语义特征在高层抽象
随着网络上光盘资源的增长,光盘服务器成为光盘网络共享的重要技术.针对传统光盘服务器的缺点,设计并实现了一个基于iSCSI协议的高性能集群光盘服务器CCS(Cluster CD Server).CCS
现代企业日益强化企业信息系统的开放性、可重用性和可伸缩性。本文针对当前企业信息系统研发中的一些问题,在将企业信息系统可被抽象表示为“用户在安全控制下对受控实体的一
本文提出一种基于动态哈希树的流量跟踪算法DHT(Dynamic Hash Tree)。该算法利用网络会话的长时稳定性,动态搭建一个由多哈希表组成的树,以提高实际网络环境中会话识别和流量跟踪
电子邮件是互联网的最重要应用之一,尽管给人们日常工作和生活带来很大便利,但也带来了一种令人讨厌的副产品一一垃圾邮件。对邮件进行分类已成为当前的一个研究热点,而如何进行
多径传输有两种模式:一种是主/备模式,只有在主路径失效之后,其它路径才可以传输数据;另一种是复制模式,数据同时从所有的路径传输。在传感器网络中,这两种模式都没有很好地结合能量