【摘 要】
:
近年来,如何从理论上分析算法的泛化性能是机器学习主要研究问题。在机器学习中,泛化误差用来衡量一个学习机应用到未知数据的学习能力。我们希望找到一个泛化误差的上界,利
论文部分内容阅读
近年来,如何从理论上分析算法的泛化性能是机器学习主要研究问题。在机器学习中,泛化误差用来衡量一个学习机应用到未知数据的学习能力。我们希望找到一个泛化误差的上界,利用该上界来指导我们进行模型选择,从而得到一个具有更好泛化能力的学习机。鉴于此,本文主要对泛化误差上界进行研究讨论,且将学习场景限定在域自适应学习与在线学习中。域自适应学习可用来解决训练样本和测试样本概率分布不一致的机器学习问题。在线学习是机器学习的重要分支,是一种实时交互式动态学习的机器学习方法。首先概述了泛化误差界的基本学习理论,并对我们研究的两种学习场景:域自适应回归学习和在线学习进行了综述,分别介绍了其学习理论和当下的热门研究方法。总结了两种学习场景下对泛化误差上界有待进一步讨论的问题。通过将域自适应分类场景中的学习思路应用到回归场景中,我们对域自适应回归场景中的误差上界进行重新求解,最终利用源域的误差和源域和目标域的对比离差距离给出目标域的误差上界。针对在线学习场景,我们提出了一种新的学习算法,其可应用于回归学习。自适应控制理论为我们提供了一个新的思路,李雅普诺夫稳定性定理为我们提供了完备的理论基础。我们构建与梯度下降算法类似的目标函数,通过利用李雅普诺夫函数的稳定性定理,得到一个新的权值更新规则,且同时得到了误差损失上界和累积损失上界。最终在人工生成数据集和UCI真实数据集上的实验也证明了该算法在在线学习中的有效性。当要学习的真实模型是随时间改变的时变模型时,我们需要考虑学习算法对不断改变的模型如何保证依然具有较好的学习效果,以及如何设置学习率来提高学习效果,因此我们对迁移专家场景中的在线学习算法进行了研究。最终我们给出了迁移专家场景下的学习率的具体调整方法,且通过实验验证了该方法的有效性。最后总结全文,提出域自适应回归学习和在线学习中泛化误差上界的未来研究方向。
其他文献
随着信息时代的到来,IT技术逐渐深入到了国民各个领域的业务活动中,也促进IT企业能提供更好的服务和产品。随着IT工程项目的增加,项目进度延迟的案例也越来越多。如何对IT项
胖树形网络是一种多级互连网络,具有较好的可扩展性、高对分带宽、无死锁和路由算法简单等优点,广泛应用于多级交换数据网、片上网络、高性能计算和数据中心等领域。各种不同
2010年中国数据中心市场总规模已达到92亿美元,近年来仍保持着两位数的增长率。随着数据中心规模的快速扩大,数据中心对软件和硬件资源的需求也在不断增加。操作系统方面,以L
三维重建中的运动恢复结构,是从一个或若干图像中恢复出目标物的三维信息,其中包括摄像机的运动参数和三维场景的结构信息,这是计算机视觉领域的重要问题。矩阵恢复作为本领
由于心脏病发病率高和供体器官短缺,人工心脏的开发一直是近年来的研究热点。当前,人工心脏的能源供给方式主要是通过经皮电缆进行能量传递,但该能量传递方式由于有导线穿过皮肤,容易造成术后感染和人体排异现象。无线能量传输方式没有导线或导管连接,能很好的避免经皮导线感染等问题,因此,血泵的无线能量传输方式越来越受相关研究人员的关注。随着磁力驱动技术的发展,采用磁力耦合方式对人工心脏血泵进行非接触式无线驱动是
智能手机的问世不仅带动了通信行业的迅速崛起,更加快了通信技术的革新步伐。小蜂窝技术的出现缓解了传统宏蜂窝的覆盖压力,并有效地对宏蜂窝边缘地区进行补盲。认知无线电作
Takagi-Sugeno(T-S)模糊模型是指采用局部线性化方法,基于模糊隶属度函数将各个线性子模型光滑连接起来的一个全局模型,它能够以任意精度逼近非线性系统,因而受到了广泛关注
近年来,随着我国经济迅猛发展,交通业越来越发达,不断增加的汽车保有量为人们的通行提供了诸多便利。根据国家统计局公布的信息显示,截至2019年6月,全国汽车保有量达2.5亿辆,
伴随着工业生产、科学领域及各行各业向智能化、数字化的发展,控制系统的受控对象越来越复杂,不仅包含了连续的、确定的动态过程,还包含大量的离散变量和随机因素。这就使得
案件指纹是揭露犯罪和认定犯罪的重要物证。加强案件指纹信息的管理和使用,对于提高刑事案件破案率具有重要作用。案件指纹主要分散于各地公安机关的刑侦部门,指纹查询比对工