面向大数据的支持向量机改进与扩充

来源 :中国计量大学 | 被引量 : 0次 | 上传用户:xfh99620
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,人工智能和数据挖掘成为了新的研究热点和商业热点。在众多的数据挖掘算法中,支持向量机因为其具有理论完备、过拟合较少等优势,被人们应用到了各个领域。根据专家学者们不断深入的研究,发现支持向量机存在着的很多优化和改进的空间。本文主要对支持向量机现存的两个缺点进行深入研究,其一是针对支持向量机的参数优化方面;其二是对大规模数据集训练时间过长的问题,在Cascade SVM的基础上进行改进。本文主要内容如下:(1)从SVM参数优化的角度,在标准遗传算法优化SVM参数(GA-SVM)的基础上,提出了基于多种群遗传算法对SVM的参数优化(MPGA-SVM),突破了简单遗传算法的演化框架,引入多个种群进行优化搜索的同时还保证了算法全局搜索能力和局部搜索能力的平衡。实验证明与GA-SVM相比,MPGA-SVM具有较好的收敛效果和分类精度。(2)本文还提出了一种数学优化算法和遗传算法结合的鲍威尔遗传算法(PowellGA-SVM),将以往的乱序的参数优化变得有方向性。使其既能够继承遗传算法在全局搜索上的优势,也同时具备鲍威尔算法较强的局部搜索能力。实验证明,与GA-SVM相比,Powell-GA-SVM也具有较好的收敛效果和分类精度,而且分类的精度和收敛的效果是这三个参数优化算法中最好的。(3)从联级支持向量机(Cascade SVM)的角度,我们在支持向量机面对大样本数据下训练时间的问题上进行了研究。针对Cascade SVM后面层级对筛选支持向量贡献度不高的问题,提出了一种与集成学习结合的算法(Vote Cascade SVM),本文还对Cascade SVM相关改进算法进行复现,然后在大量实验中进行对比。通过和5个基准算法对比,发现Vote Cascade SVM在分类精度和训练时间方面拥有较大的优势,而且这样的优势是随着数据规模越大越明显。
其他文献
当前市场经济竞争日益加剧,企业危机感加强,除了在技术等层面增强竞争力之外,企业在员工培训方面也开始逐步增加投入,希望可以让员工在综合素养以及专业技能方面得到提高,从
自工业革命以来,煤炭、石油等不可再生化石资源的过度消耗给现代社会的可持续发展带来了严重的危机。随着经济和社会文明的发展,人们对世界能源危机和环境污染的日益关注,极大地推动了电化学储能装置的发展。设计和制造高能量和功率密度、长循环寿命的电化学储能系统具有重要意义。超级电容器由于其环境友好、使用寿命长、功率密度大等优点,被认为是储能系统中最有前途的候选者之一。另外随着柔性电子设备的发展,对柔性储能设备
学位
随着经济全球化与国际分工局势的发展,我国作为生产要素丰裕的国家,凭借低成本的劳动力优势成功嵌入全球价值链中的加工制造环节。然而,由于全球经济放缓和资源环境问题日益
生物产业作为21世纪的新兴产业,已跃然成为我国一个重要的战略产业,国家相关部门也发布了一系列的政策文件,以促进生物产业的不断发展,推动生物产业成为我国经济高质量增长的
γ-TiAl基合金具有密度低、比强度高、抗燃性能、抗蠕变性能好等优点,作为一种轻质高温结构材料在航空航天领域具有重大应用前景。其中,beta-gamma系TiAl合金通过引入无序β
随着经济全球化程度的提高,创新能力在企业竞争力中扮演着越来越重要的角色。在学术界,“双元创新”的理念被提出和成功测量后,逐渐成为了热门研究话题。如何维持探索型创新
氧枪喷头是转炉炼钢生产中的关键零部件之一,其在工作过程中受到钢液的高温热辐射,以及飞溅的钢渣、钢液的冲刷和侵蚀,内部又受到循环水流的冷却,导致喷头内部存在较大的温度
技术创新可以促进一个国家或地区的产业发展和经济增长,提升技术创新能力是我国当前经济建设持续有效发展的重中之重。高新技术企业是我国技术创新的主体,各地政府和金融体系
我国中央政府连续十个中央一号文件着力关注“三农”问题,十六大报告中指出农村土地制度改革起着促进农村地区发展的关键作用。农地流转成为相关红头文件的关键词,逐步上升为
高氮奥氏体不锈钢具有高强度和高韧性等良好的力学性能,同时还具有优异的耐蚀性、无磁性和生物相容性等特点,在化工生产、海洋工程及石油开采等领域具有广阔应用前景。本文以中频感应熔炼的Cr20Mn18Ni2Mo2高氮钢为研究对象,通过光学显微镜、EBSD测试以及电化学实验等手段,研究了电渣重熔、锻造、冷变形和GBE处理对Cr20Mn18Ni2Mo2高氮钢组织及性能的影响,重点研究了晶界特征分布对其耐蚀性的
学位