【摘 要】
:
稀疏学习由于其简约特性和计算优势而获得了越来越多的关注。稀疏学习问题等价于最优子集选择问题,这是一个NP完全问题。已有的稀疏学习方法大多基于启发式的规则或正则项近似,但这些方法缺乏相应的理论保证,并且难以有效地在精度和稀疏度之间进行权衡。松弛和取舍技术是一种广泛应用的算法设计技术,已被验证了在NP难问题的近似算法设计上极为有效。本文将松弛和取舍技术扩展到稀疏学习问题,提出并设计了一个新的稀疏学习的
论文部分内容阅读
稀疏学习由于其简约特性和计算优势而获得了越来越多的关注。稀疏学习问题等价于最优子集选择问题,这是一个NP完全问题。已有的稀疏学习方法大多基于启发式的规则或正则项近似,但这些方法缺乏相应的理论保证,并且难以有效地在精度和稀疏度之间进行权衡。松弛和取舍技术是一种广泛应用的算法设计技术,已被验证了在NP难问题的近似算法设计上极为有效。本文将松弛和取舍技术扩展到稀疏学习问题,提出并设计了一个新的稀疏学习的一般框架。本文的主要贡献如下:1.重写稀疏学习问题。首先将稀疏学习问题写为l0惩罚的子集选择问题,然后通过引入布尔变量将其等价地重写为l1约束的混合整数规划。2.提出了新的基于松弛和取舍的l0的近似算法,并具体研究了支持向量机和深度神经网络两个典型案例。3.给出所提出新的l0范数近似方法的理论分析,包括近似误差接和时间复杂性分析。本文提出的方法在学习的同时可以获得稀疏的解的结构。与已有方法相比,所提出的方法具有可证明的近似保证,可以有效地在稀疏度和精度之间进行权衡,并且具有很强的可扩展性。
其他文献
光纤法珀传感技术以其解调精度高、动态解调范围大、抗电磁干扰等优点广泛应用于航空航天、深海探测和石油勘探等领域,随着应用的不断深入,对多个光纤法珀传感器进行同步解调的需求逐渐突显,然而传统多通道复用技术由于使用线阵CCD,在对多个通道的光纤法珀传感器进行同步解调时,为了区分各个通道的干涉信号,需要对系统光源的中心波长或者法珀传感器的腔长控制提出很高的要求,进而限制了其应用范围。本文针对上述问题,提出
制造业的蓬勃发展使得现阶段对数控机床加工精度提出了更高的要求。然而机床使用时间的增加和各零部件的老化、磨损等情况均会导致其加工精度的降低。为了维持和提高数控机床加工精度,亟需一种高效率、低成本的误差建模、检测与辨识方案。本文基于微小角度传感器和L型组合靶标阵列,提出一种三轴机床几何误差的新型辨识方案,完成的主要工作有:1、通过对比现阶段数控机床几何误差的数学建模与误差辨识方法,基于多体系统理论建立
随着机械制造业的快速发展,数控机床在模具制造、电子工程、汽车和航空航天等领域有着广泛的应用。由于具有通用性强、精度高、加工范围大等优点,数控机床已成为一种非常必要的设备。精度在数控机床中起着关键作用,目前也成为了加工自动化领域的一个热点问题。为了提高数控机床直行运动的精度,本文设计一种基于复合特征面阵列的测量系统,并基于该系统辨识机床直行运动过程中的几何误差,主要完成以下工作:1.分析了平面镜和旋
锈蚀是钢结构中一种普遍存在的缺陷。如果不及时采取锈蚀处理措施,可能会引发严重的安全事故并造成经济损失。人工视觉检查是目前最常用的结构锈蚀检测方法。该方法虽然操作简便,但是效率低、主观性强。基于计算机视觉的方法能够自动进行损伤检测,可以显著提高检测效率并给出客观地检测结果。传统的计算机视觉方法需要依赖先验知识设计特征,而深度学习算法能够自动从图像中提取出合适的特征。现有研究主要识别结构是否发生锈蚀,
目前建筑的运行能耗约为全社会商品用能的三分之一,是节能潜力最大的用能领域,也是节能工作的重点,北方城镇冬季集中供热占建筑能耗的21%,且目前管理粗放,难以满足按需供热的要求,集中供热工程势必将向着精细化的方向发展,这也对短期负荷预测的精度提出更高的要求。本文在对热负荷的影响因素及特点进行分析的基础上,结合各影响因素的重要性和可获得性确定了负荷预测模型的输入变量及预处理方法。以承德市某供热系统作为案
当前,我国冬季供暖能耗在社会总能耗中占比较大,供热节能势在必行。对供暖负荷的准确预测可以帮助运维人员提前掌握建筑的用能需求,进行精准调控,从而避免不必要的能源浪费。随着计量装置的普及以及人工智能技术的发展,机器学习技术在建筑物能耗预测方面得到了快速发展。本文以寒冷地区某住宅建筑为例,使用树模型与神经网络模型对供暖负荷进行短期预测与超短期预测,研究了两类在供暖负荷预测中的应用效果。本文首先利用相关性
"十四五"是国家电网公司迈向战略目标的关键五年。而供电所既是公司供电服务的最前沿,又是政策落地的最末端。落实"一体四翼"发展布局,提高供电所基础管理是必然要求。为解决供电所一线人员对上级政策理解不全面、业务流程不熟悉、服务要求落实不精准等一系列问题,国网山东省电力公司东营供电公司(以下简称"东营供电公司")创新搭建市、县、所贯通协同的"五点云讲堂"培训平台,以"上级政策一贯到底,基层需求及时
当前,基于卷积神经网络的深度学习技术在计算机视觉等多个领域取得极大成功,也是最具代表性、最有效的方法。但是深度学习技术严重依赖于标签准确且类别间数据平衡的大规模数据集。然而,大规模的标签准确的数据是极难获取的,同时真实世界的数据集大多存在类别间样本不平衡的问题。针对计算机视觉领域中的图像分类和人脸识别任务,如何有效利用标签噪声的数据或类别间不平衡的数据训练出理想的深度学习模型是一个亟待解决的难题。
机器学习和数据挖掘中多数数据类标签的缺失,使得聚类任务成为学习过程中的关键任务。聚类的最终目的是揭示数据的隐藏特性,因此对于聚类任务,得到合理的样本关系对的表示至关重要。而对于维度较高的数据的聚类任务,由于其数据密度低,较难从中得到有用的信息。目前常用的解决方法是无监督特征选择和子空间聚类。无监督学习任务中由于数据无类标签,无法直观得到样本关系,此时可通过构建图模型来表示,以挖掘数据信息,构建学习
真实世界中事物是复杂多样的,单一语义无法描述事物蕴含的丰富信息。为了描述事物丰富的语义信息,多标记学习应运而生并广泛应用在多种领域,例如文本分类、场景分析等。多标记分类学习的任务是学习一个模型,该模型为未知实例预测出一组相关标记。标记之间存在某种联系使得多标记学习难度高于多分类学习。为了使模型具有更高准确性和泛化能力,本文从标记独立和标记关联增强两方面对多标记分类展开研究,主要研究工作如下:(1)