大规模数据样本下的稀疏最小二乘支持向量机研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:ajdujun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最小二乘支持向量机算法是由经典的支持向量机算法改良而来,引入误差平方项,使得经典支持向量机算法中的不等式约束问题变为等式约束问题,但同时因为改良,使得在求解过程当中,最小二乘支持向量机模型中所有的数据样本点都作为模型的拉格朗日乘子对模型的建立起到决策作用,这使得最小二乘支持向量机模型很难应用在较大规模数据样本集的处理中。但是在实际的应用中,数据样本集往往包含着大量的数据,而且不同数据样本集的数据具有不同的特征,因此,如何使最小二乘支持向量机能够应用在复杂多样的大规模数据样本中是本课题的主要研究内容,围绕此问题,本文的主要工作如下:(1)分析研究最小二乘支持向量机算法过程,发现并不是所有的数据样本点都对模型的建立起到关键的决策作用,最小二乘支持向量机算法中对模型建立起到关键决策作用的是距离分类决策面非常近和非常远的数据样本点。(2)引入聚类算法,在复杂多样的大规模数据样本中选取对最小二乘支持向量机模型的建立起到关键决策的数据样本点,对K-means聚类算法特性以及均值平移聚类算法的算法特性进行对比研究,最终选用均值平移聚类算法选取对最小二乘支持向量机模型的建立起到关键决策作用的数据样本点,使用新的数据样本子集进行模型训练,并在真实数据集上进行测试从而实现对模型的优化和改进。(3)为了验证本文的模型的有效性,将使用均值平移聚类算法约减后的最小二乘支持向量机模型应用在实际的工业项目中。针对直拉硅单晶体生长过程中引晶阶段的温度无法自动控制的问题,本文提出了一种基于光圈图像的引晶阶段温度自动检测并调整的方法。采集光圈原始图像,进行图像处理,采用均值平移聚类算法约减后的最小二乘支持向量机对光圈图像进行分类,模型输出为光圈图像所属的温度模式,由此实现引晶温度的自动检测和辨识。晶体生长的实验表明,本文所提出的使用均值平移聚类算法约减后的最小二乘支持向量机模型的分类方法实现了对引晶流程生长温度的自动分类,控制系统依据分类结果对温度进行调节后,可满足细颈生长对温度精度的要求,成功实现了直拉晶体生长全流程的自动化操作,提升了此类主流晶体生长设备的控制性能与自动化水平,验证了本文所提的均值平移聚类算法约减后的最小二乘支持向量机模型的实用性。
其他文献
影响免疫组化染色结果的因素较多,从组织离体到取材前对组织进行预处理能大大改善免疫组化结果。作者在这方面进行了摸索,现将有关体会介绍如下。
世界杯开赛在即,对于冠军的猜想真是热火朝天。大部分人只是凭直觉在猜,其实可以用数学让猜想变得更有依据一些。统计方法玩预测统计就是对已经有的数据进行收集、 World Cu
【正】 人体的健康与身体的免疫能力是不可分的。美国佛罗里达大学的免疫学家贝里·达比教授为首的科研小组,对睡眠、催眠与人体免疫力的关系作了一系列的详细研究。专家
回顾3月,国际油价环比有所上涨。美国原油产量不断攀升依旧压制油价,但美伊、沙伊关系紧张,委内瑞拉产量下行风险突出等因素对油价构成重要支撑,临近月末油价大幅上涨,布伦特
为了考察掺纤维对混凝土阻裂、止裂能力的影响规律,分别研究了掺钢纤维和掺聚丙烯纤维水工大体积混凝土的初裂强度、等效抗折强度、弹性模量和弯曲韧性。结果表明:掺聚丙烯纤
为解决单纯的太阳能热发电成本较高、能量利用率较低的问题,提出了一种基于太阳能辅助的燃气-蒸汽联合循环的冷热电联产系统。为了提高系统热电调节灵活性,将燃气轮机的烟气
为了深入研究和应用自然通风技术中的热压通风模式,文章详述了常规热压作用下的自然通风原理,指出了单层建筑利用常规热压作用自然通风模式的优势,同时分析了多层建筑利用该
煤系高岭石是一种夹杂在浮选尾煤中含量高、粒度小的粘土类矿物,具有一定的利用价值。为了研究浮选尾煤中高岭石等矿物质的分布规律,本文以大同长焰煤、王家岭气煤和马兰焦煤
研究京津冀城市群产业协同创新的关键驱动要素,对于实现京津冀地区产业转型升级和协同创新发展的国家战略具有重要意义.本文在文献研究和机理分析的基础上,探索出京津冀城市