【摘 要】
:
逻辑回归是一类非线性回归模型,作为一种重要有效的分类工具,在机器学习、数据挖掘、模式识别、医学和统计等领域都有着广泛的应用.近些年来,由于实际问题产生的数据规模不断扩大,但仅有部分特征起到作用,这导致大规模稀疏逻辑回归问题的产生.同时数据规模大、数据的不确定性、约束复杂等原因给计算带来了不小的挑战,因此发展设计快速有效的算法来解决稀疏逻辑回归问题是非常有必要的.本文基于最近几年对统计学中的变量选择
【基金项目】
:
国家自然科学基金(11571033,11671029); 北京市自然科学基金(Z190002):“监督学习的降维理论与优化方法”,2020.1-2023.12;
论文部分内容阅读
逻辑回归是一类非线性回归模型,作为一种重要有效的分类工具,在机器学习、数据挖掘、模式识别、医学和统计等领域都有着广泛的应用.近些年来,由于实际问题产生的数据规模不断扩大,但仅有部分特征起到作用,这导致大规模稀疏逻辑回归问题的产生.同时数据规模大、数据的不确定性、约束复杂等原因给计算带来了不小的挑战,因此发展设计快速有效的算法来解决稀疏逻辑回归问题是非常有必要的.本文基于最近几年对统计学中的变量选择理论和稀疏优化方法的研究,建立了稀疏逻辑回归问题的各种优化模型,并设计求解这些模型的二阶优化算法,使之具有全局收敛性、稳定性、快速性.首先,针对稀疏逻辑回归问题,本文在理论方面(见第2.1,3.1节)分别对模型中目标函数和稀疏约束进行了分析,进而建立了最优性条件,借助于在稀疏集上的投影,切锥和法锥定义了四种稳定点,并详细分析了这些稳定点与局部以及全局最优解之间的关系,同时对模型解的存在性和唯一性给出了分析.其次,针对稀疏逻辑回归问题,本文在算法方面(见第2.2,3.2节)提出了两个牛顿类型的算法.第一个是贪婪投影梯度牛顿算法,该算法是投影梯度方法和牛顿方法的结合.第二个方法是完全通过牛顿法有效求解一个稳定点方程组.本文也分析了这两种方法的收敛性(见第2.3,3.3节),均具有最优支撑集的有限识别性和局部二次收敛性.大量数值实验结果显示(见第2.4,3.4节),这两种方法与众多先进的求解器相比,具有更高的精度和更快的计算速度.最后,针对组稀疏多元逻辑回归问题,本文(见第4章)不仅在理论上通过定义的稳定点与局部以及全局最优解的关系建立了其最优性条件,而且在算法方面提出了子空间信赖域算法来求解该模型.该算法具有出色的收敛性,包括全局收敛性和局部二次收敛性.数值实验结果清楚地证明了该算法在逻辑损失值、稀疏性恢复和计算时间方面的优越性能,尤其对一些维数较大的图片数据能够快速有效分类.
其他文献
近年来,微波光子学在光通信、光纤传感等领域发挥了重要作用。微波光子技术融合了微波技术和光子技术的优点,为实现高质量的光通信和快响应、高分辨率的传感提供了新的可能。与传统的电子技术相比,微波光子技术具有抗电磁干扰,带宽大,功能灵活等众多优势。本文针对微波光子技术近年来的研究热点和需求,结合光电振荡器(OEO)和光载无线(RoF)技术等相关内容,对信号生成和处理,光纤传感等问题进行了理论和实验研究。取
二维过渡金属硫族化合物(2D TMDs)因自身具有较大的吸收系数、带隙可随厚度变化、激子束缚能高达数百毫电子伏特等优异特性成为新一代半导体材料中的重点研究对象。在研究设计2D TMDs光电器件过程中,绝缘材料作为栅绝缘层与2D TMDs相结合形成范德瓦尔斯异质结构,半导体材料与2D TMDs形成不同能带排布的异质结构,可以调控光电器件中2D TMDs的光电特性,异质结构中光生载流子动力学性质对2D
轮对-轴箱系统作为城轨列车关键走行部机构,其健康服役状态对于列车安全高效运营具备重要意义。在轮对-轴箱系统产生故障后,轻则检修维护费用增加,重则引起行车安全事故,而复杂机械耦合结构使得故障特征非线性强,很难直接通过振动信号进行故障表征,在系统故障耦合严重的条件下,故障特征混淆难以提取。因此,对轮对-轴箱系统进行有效地监测表征与解耦诊断研究,是维护城轨列车安全服役状态的重要环节,也是城轨列车避免经济
海量用户接入互联网的场景使得转发设备面临安全威胁。一方面,攻击者可发起恶意的数据包洪泛,致使转发设备难以正常运转。另一方面,攻击者可截获转发设备的数据包,致使其携带的用户隐私泄露。传统互联网体系难以安全转发数据包。近年来,信息中心网络、智融标识网络等新体系的发展,为安全转发数据包提供机遇。因此,本文围绕智融标识网络数据包安全转发机理及关键技术进行研究。具体而言,本文明晰智融标识网络的数据包转发机理
钢板剪力墙作为一种具有良好延性性能和较强耗能能力的抗侧力构件,可在地震作用下为结构提供稳定的抗侧刚度并消耗地震输入能量。然而,钢板剪力墙通过钢材屈服耗能,累积塑性变形会在震后产生明显的残余变形,给结构的震后修复带来困难,同时,墙板产生的拉力带会对边缘柱产生不利影响。因此,本文提出了一种兼具高耗能与自复位性能的自复位支撑钢板剪力墙(Steel plate shear wall with self-c
交通运输行业是国家经济发展的支柱行业之一,公路运输又是其中重要的组成部分并承担了大部分的运输需求。公路运输在服务人员出行和经济发展的同时,也带来了交通安全、交通拥堵和环境污染等日益严重的负面影响。在此背景下,以蜂窝车联网(Cellular Vehicle-to-Everything,C-V2X)为代表的智能交通技术逐渐成为研究的热点领域。C-V2X技术可以实现交通参与者之间全方位和高效率的信息传输
企业作为市场经济的主体,对市场经济发挥着重要的作用,由于其间有着复杂的“行为”,导致这些复杂“行为”造成的结果千差万别。即便仅仅发生在经营活动中的一个环节,也可能引发舆情,进而影响企业正常的经营活动。目前对于企业网络舆情信息的研究和应用,主要将企业网络舆情的数据作为企业信用评价的一个维度,对于舆情本身的研究主要集中在舆情传播、舆情的情感识别等方面,还缺乏对于舆情内容的深入分析和挖掘。对于很多非上市
驾驶人的风险认知能力是决定驾驶人能否安全驾驶的关键因素。风险认知能力越强的驾驶人,碰撞事故发生的可能性越小。因此,分析驾驶人的风险认知能力对于降低事故发生率,提高道路安全水平具有重要意义。驾驶人的风险认知能力是其对外部存在危险事物的一种认知能力。分析驾驶人的风险认知能力,需要先理解驾驶人的认知反应特性,进而研究在高风险场景下,认知反应特性与交通事故之间的关系。首先,本文采用E-prime软件,融合
物流业是支撑国民经济发展的基础性、战略性、先导性产业,也是建设现代经济体系、推动经济高质量发展的重要支撑。同城配送作为物流行业“最后一公里”的解决方案,在整个物流系统中具有十分重要的作用,既是影响配送整体效率的关键环节,也是客户评价物流服务的重要指标之一。对同城配送方案进行优化是提高物流企业核心竞争力以及促进现代物流服务体系建设的关键。而现有的相关研究多是针对单个场景(例如一天)的配送方案进行优化
城市轨道交通具有安全高效、快捷准点、绿色环保等特点,是现代化公共交通发展的重要方向,近年来得到了快速的发展。随着路网规模的逐渐扩大和乘客出行需求的迅猛增长,城市轨道交通的运营环境日益复杂,运营控制难度日趋增大。列车运行过程中会不可避免地出现由设备、环境、人为等因素导致的随机干扰而产生延误,如果不采取有效措施及时地进行列车运行调整,会导致线路甚至路网运营秩序紊乱、站台乘客滞留等危害。目前轨道交通系统