基于随机扰动的正则化路径奇异问题研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:loveandlove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
正则化路径(regularization path)方法是统计机器学习中一种有效的参数选择方法,该方法可以得出正则化参数所有的可能取值以及对应优化问题的解,在l1范数最小化(l1-norm minimization)和支持向量机(Support Vector Machine,SVM)的参数选择中发挥着重要作用。正则化路径方法主要利用了活动集(active set)方法追踪KKT(Karush-Kuhn-Tucker)最优条件,当数据集中包含重复、近似或线性相关的数据时,在追踪过程中可能会遇到奇异问题。现阶段,国内外针对正则化路径方法的奇异问题提出了很多解决方案,其中,随机扰动加载方法最为简单,不需要其他额外操作,但该方法仍然存在以下问题:1)该方法通过修改每个样本数据来保证每次迭代中只有一个索引被移入或移出活动集,而在实际问题中,样本数据的值是不断变化的,因此选择合适的扰动值具有一定的难度;2)对于高维的数据集,需要添加扰动项的数量往往十分庞大,这使得随机扰动对整个解路径的影响较大。针对上述问题,本文围绕l1范数最小化和支持向量机的参数选择,提出一种新型的基于随机扰动的正则化路径奇异问题处理方法,主要研究内容如下:在l1范数最小化的参数选择方面,提出了一种新型的基于随机扰动的l1范数最小化正则化路径算法。该算法在优化问题中引入一个小的随机扰动向量来避免奇异问题,无需修改观测矩阵的值,克服了难以选择合适扰动值的缺陷,显著减小了添加的随机扰动对整个解路径的影响。实验结果表明,所提算法能够有效解决l1范数最小化正则化路径中的奇异问题,在求解带约束的l1范数最小化问题时,该算法与原始正则化路径算法相比在训练时间上有很大优势。在SVM的参数选择方面,提出了一种新型的基于随机扰动的支持向量机正则化路径算法。该算法在SVM原始问题中添加一些随机扰动标量来避免出现奇点,而不是直接修改每个数据点的特征向量,实现更为简单,克服了难以选择合适扰动值的缺陷,可以显著减小添加的扰动项对解路径的影响。实验结果表明,所提算法可以有效避免支持向量机正则化路径的奇异问题,能够正确拟合出SVM的整个解路径,同时其算法性能优于现有算法。
其他文献
排序是一种优化问题的方法,通过调整工件的顺序以达到某种目的。排序的质量直接影响费用的大小。机器要加工的工件和工件的加工顺序所处的位置有关,也与工件所分配得到的资源
本文主要研究AA堆叠双层石墨烯(AA-BLG)模型在零温度和有限温度两种情形下能隙解的适定性问题.针对零温度无掺杂的AA-BLG模型,应用上下解方法,得出能隙解的存在唯一性;针对有
目的:根据我科编制饲鸽者肺筛查问卷,找出可能引起饲鸽者肺发生的危素因素,预防饲鸽者肺发生。方法:将2013年12月-2017年5月在新疆维吾尔自治区人民医院及喀什医院呼吸科确诊
核电产业高速成长,为国民带来改善经济水平的机遇、降低环境污染的可能,并被作为保障国家安全稳定的手段。然而在获利的同时,也蕴藏许多风险。其中部分风险的发生会造成难以
学生的数学问题提出能力对其问题解决能力、数学理解、数学情感以及创造力等方面的发展有着重要意义,因此,目前包括我国在内的一些国家均在教育纲领性文件中明确指出培养学生
水源地水污染治理不仅涉及到技术管理等问题,从本质上说,水源地的最基础的一种本质就是自然本质,而在自然本质中又具有整体性,同时又具有独立性质。但是在现实生活中,由于不
通过图中每个顶点一次且仅一次的回路称为哈密尔顿圈。存在哈密尔顿圈的图就是哈密尔顿图。哈密尔顿图是图论中的一个重要问题。截至目前,对哈密尔顿图的研究,已经有了丰富的
二维中子输运方程应用广泛,在众多学科中都有涉及,所以如何对它高效准确的求解就成为研究的重点。在二维中子输运的众多求解方法中,由于特征线方法可以求解任意几何形状的问
消费级数码相机大都使用单个表面覆盖彩色滤波阵列的CCD芯片来获得彩色图像。原始图像在每个像素点处都只有红色、绿色、蓝色三基色中的一种颜色像素值。为得到完整的彩色图
当检察机关作为民事公益诉讼的起诉人时,其在民事公益诉讼中应享有处分权。虽然在《民事诉讼法》、《关于检察公益诉讼案件适用法律若干问题的解释》、《最高人民法院关于审