【摘 要】
:
支持向量机结构简洁、泛化性能优越而广泛应用于模式识别、信号处理、图像处理等智能化信息处理领域。该算法等价于求解二次规划,所以在不均衡样本集、大样本集上存在着泛化
论文部分内容阅读
支持向量机结构简洁、泛化性能优越而广泛应用于模式识别、信号处理、图像处理等智能化信息处理领域。该算法等价于求解二次规划,所以在不均衡样本集、大样本集上存在着泛化能力和性能瓶颈的问题。对于不均衡样本集,预处理算法的引入剔除了冗余样本点,减少了支持向量机的训练耗费,但预处理算法没有考虑不同类样本集间规模的差异,这导致了预处理算法效率低下。对于大样本集,分解算法使用工作集策略大大降低了支持向量机训练的复杂度,但现有的工作集选择算法没有充分利用目标函数的信息导致收敛速度不高。本文在现有的学习算法和预处理算法研究的基础上,提出了解决上述问题的相应方法:(1)分析了对于不均衡样本集泛化性能低的原因和和预处理算法参数选取的困难。(2)把样本集的分布信息用于样本集预处理算法中,改进了参数选取方法,剔除了部分冗余样本点,减少了对于不均衡样本集的训练耗费。(3)比较了两种分解算法的工作集选择方案,说明了SVM-LIGHT在工作集选取上的不足之处。(4)把LIBSVM和SVM-LIGHT中的工作集选择方法结合,提出了一种新的基于二次信息的工作集选择方法,并把该方法应用于公共数据集,验证了算法的有效性。最后,作者对所做的工作进行了总结,并对以后的研究工作进行了展望。
其他文献
随着Internet的发展,互联网上的数据和信息呈现海量特征,文本分类作为处理和组织大量文本信息的关键方法,可以方便人们准确地找到自己所需要的知识。信息的爆炸式增长,使人们
计算机网络在各行业中获得广泛应用的时候,网络安全也成为机构和企业越来越关注的问题。虽然防火墙、防病毒系统、IDS、漏洞扫描等安全产品被部署于网络中,但多种安全设备缺
基于人工免疫的入侵检测技术是近年来入侵检测研究领域的热点,它的突出特点是利用生物免疫系统特征、规则与机制实现对入侵行为的检测和反应。入侵检测系统与免疫系统具有本
无线传感器网络是近年来信息技术领域的一个研究热点,它融合了传感器、计算机科学、信号与信息处理、通信等多个领域的技术,集成了信息采集、数据传输、数据处理、数据管理等
体绘制技术是科学计算可视化领域一个重要的研究方向,近年来,由于计算机图形处理器(Graphic Processing Unit,简称GPU)的高速发展,使得基于GPU的实时绘制成了当前计算机图形
随着无线传感器网络研究的不断深入,应用化已经逐渐成为人们关注的焦点。各种在特定应用背景下的研究层出不穷,如环境监测、目标跟踪、安全监控等。如何对这些应用研究成果进
随着科技的进步,科技创新越来越受重视,但目前科技项目评审缺乏科技创新参考指标,因此需要对以往科技项目创新性指标进行分类,提高科技项目评审的质量。采用传统的基于向量空
当下网络基础设施和相关硬件技术的飞速发展,给予了流媒体技术相当的发展空间。然而,由于现行的Internet网络基础带宽仍然无法匹配日益庞大的流媒体用户数和数据大小,传统的C
伴随着互联网的快速发展,大型搜索引擎面临着越来越严峻的性能挑战。一方面,它们每秒钟都要响应成百上千的查询请求,而这些请求需要从上百亿张网页中检索出与之最相关的网页集合