基于多源信息融合的预测及决策方法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:wyp154
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多源信息在现实世界中广泛存在,并且蕴含更丰富的内容。如何利用多源信息改善模型性能以及提升模型鲁棒性,已成为机器学习研究的热点问题。在各种机器学习算法中,分别从模型特征输入和环境反馈信息来看,存在两种广受关注的多源信息:多模态表示和多辅助奖赏。其中,多模态表示丰富了模型的输入信息,多辅助奖赏丰富了强化学习的指导信息。本文针对如何利用两种形式的多源信息进行了研究,并取得了相应进展:1.复杂多模对象的预测问题研究。复杂对象通常可以用多种模态来表示,例如,复杂文章包含文本段落和图片。以往的方法假设多模态的示例之间存在一致性,然而在实际应用中该假设往往得不到满足,例如,文章中文本段落和图片数量不定且不存在对应关系。多模态多示例多标记学习在处理此类复杂对象预测问题上表现出色,但是多模态多示例多标记学习面临两个挑战:1)如何有效利用标记相关性;2)如何充分利用未标记数据。为了解决这些问题,本文提出了一种新颖的多模态多示例多标记深度神经网络模型,该模型基于模态包级别的一致性端到端地训练深度神经网络。在该模型的基础上,我们使用基于最优传输的损失函数,并自动学习标记代价度量矩阵,从而利用标记相关性。此外,我们在该模型的半监督扩展中引入了未标记数据训练每个模态示例级的自动编码器和包级别最优传输。因此,本文所提的方法可以更好地预测标记并利用标记相关性和未标记数据。在基准数据集进行的实验验证了所提方法的有效性。2.多源辅助奖赏的决策问题研究。环境反馈信息是强化学习关键的组成部分,在很大程度上影响了强化学习算法的效率。稀疏奖赏和延迟奖赏会增加任务难度,造成现有的方法难以有效地探索,阻碍了强化学习的应用。通过引入领域知识构造辅助奖赏,多源辅助奖赏强化学习获得了优越的性能,然而仍然面临着两个问题:1)如何安全地引入领域知识构造辅助奖赏;2)如何自动组合奖赏函数。为此,本文提出了自动连续强化学习方法,该方法基于奖赏塑形在强化学习环境中引入领域知识,缓解稀疏奖赏带来的问题。为了在学习的不同阶段使用合适的奖赏函数,该方法自动选择最优的奖赏组合方式。仿真实验表明,本文所提出的方法在经典控制环境和视频游戏中均取得了优越的性能。此外,本文所提方法在现实世界均成功得到了应用。复杂多模对象的预测方法被应用于王者荣耀论坛的复杂文章分类中,提升了复杂文章分类的准确率。多源辅助奖赏的决策方法被应用于家居自动布局领域,降低了家居布局的经济成本和人类劳动。
其他文献
厄尔尼诺-南方涛动(El Ni?o-Southern Oscillation,简称ENSO)现象是热带太平洋地区年际气候变化中的最强信号,其发生发展机理和预测一直是研究关注的重难点之一。同时在全球
机床部件因热产生变形而导致的热误差,是影响高端数控机床精度稳定性的重要因素之一。误差补偿法具有实施成本低、适用范围广等优势,是抑制机床热误差最常用的一种方法。而建
在人工智能技术飞速发展的当下,电网智能化也成为了一个热点问题,构建一个智能的调度机器人系统对于现在结构复杂、安全稳定性要求极高的电网至关重要。而由于电网数据繁杂,
本研究通过田间试验对东北红豆杉宽甸、本溪、和龙、汪清和穆棱5个产地幼苗的保存率、地上和地下性状等15个生长特征进行了测定,试验分别在山东、北京、辽宁3个地点观测4年生苗,利用表型性状和原产地生态因子相关性研究,揭示了东北红豆杉地理变异规律,并采用系统聚类的方法将5个产地分为三类。主要研究结果如下:1、在山东和辽宁试验点,汪清产地幼苗表现最好,宽甸产地幼苗表现最差。在北京试验点汪清产地表现最好,和龙
尖晶石型氧化物ZnAl_2O_4具有良好物理化学性质,并且具有良好的力学性能、较宽的活性温度范围,在透光导电材料、陶瓷、催化剂、催化剂载体、材料等领域应用广泛。目前过渡金属离子负载的铝酸锌(ZnAl_2O_4)作为一种良好的非均相催化剂,广泛应用于光催化有机合成以及碳氢化合物选择还原脱除氮氧化物(NO_x)。本文综述了尖晶石型氧化物选择催化还原脱除氮氧化物(NO_x)的研究背景,并概括了小分子在尖
水分解制氢技术不仅可以缓解化石燃料消耗引发的环境问题,而且还能满足日益增长的能源需要。无偏压水分解器件的制备逐渐受到国内外科研工作者的关注。目前,半导体与太阳电池
白蚁分飞的持续时间短,分飞过后脱翅并配对建巢,是白蚁种群扩大和繁衍的重要活动,在白蚁生活史中占有重要地位。目前对白蚁分飞行为的研究中,主要集中在白蚁分飞行为的生物学
融资错配现象的长期存在极大地影响了我国企业的投融资行为,亟须进行制度创新加以解决。引入优先股这种新式融资工具,无疑有助于我国建立多层次的资本市场,而对优先股这一新政的深入研究,不仅能剖析该制度对我国资本市场各相关利益主体带来的影响,还可以为我国融资理论的研究提供素材,当然需要交代的是,本文所研究的融资错配,指的是企业间融资资源的错配。本文利用2007—2017年中国沪深A股的上市公司的财务面板数据
《论共产党员的修养》是刘少奇在思想政治教育领域的代表作,集中地体现了刘少奇进行思想政治教育的独特方法。首先,恰当运用说服教育法充分论证做到以理服人;其次,创造性地从
醛类物质是很多化工和医药产品的重要中间体。2019年,全世界醛类物质的产量超过1500万吨。醛类物质用途十分广泛,例如,国际上采用正戊醛生产无毒、环保型大分子增塑剂邻苯二