面向物联网的迁移学习算法应用与优化

被引量 : 0次 | 上传用户:wangkaidi58
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人工智能算法的技术加持下,物联网(Internetof Things,IOT)边缘已经从数据源头逐渐转变为智能应用入口,以实时感知、动态决策为代表的大量智能应用在网络边缘不断涌现,而单纯基于云的人工智能存在通信压力大、应用反应迟缓、数据隐私差等难以克服的缺点,因此将人工智能推向网络边缘势在必行。然而,目前边缘人工智能的实现仍然面临着数据异质、计算存储资源不足以及算法收敛时间长等挑战。迁移学习通过知识重用,不仅可以减少对数据、计算等资源的依赖,而且能够提高算法性能,因而成为一种有效的解决方案。本文利用迁移学习解决深度学习模型在物联网边缘训练困难和多智能体场景下智能体交互效率低的问题,分别从构建迁移算法性能与通信资源联合优化框架,以及利用知识迁移提高智能体交互效率两个方面展开研究,主要工作内容如下:(1)针对IOT边缘通信计算等资源不足导致迁移效率低下、模型训练困难的问题,提出适用于无线网络的多点对多点迁移学习算法。借助于IOT边缘异构设备的数据多样性,设计多源多目标的迁移学习算法。考虑多源多目标的分组特性,构建基于正交频分复用(Orthogonal Frequency Division Multiplex,OFDM)的无线组播通信模型,并以此建立源设备选择与无线网络资源分配的联合优化问题。考虑到优化问题中优化变量相互耦合的特点,提出基于源设备数据相似度和通信资源利用率的源设备选择方案,在得到源设备选择方案后进行通信资源分配。最终的仿真结果显示,相对于随机选择数据迁移,提出的算法在资源受限的情况下能够达到较高精确度,并且在时延、可扩展性等方面也有很大提升。(2)针对传统多智能体算法在解决物联网下的多设备联合决策、预测等任务时存在的交互效率低、收敛时间长等缺点,提出基于在线知识迁移的多智能体强化学习算法。考虑多智能体场景下的环境非平稳性和部分可观测性,利用soft target机制生成具有全局信息的软目标,并利用在线知识迁移方法重行设计critic网络损失函数,将软目标作为智能体critic网络优化目标之一。为进一步提高智能体间的交互效率,提出了基于奖励、线性组合、MinLogit以及相似度聚类四种soft target生成方案。最终在经典游戏环境grounded communication environment上的实验结果显示,提出的算法能够帮助智能体快速收敛并获得更高的奖励。
其他文献
近年来,随着互联网数字经济的发展,数据要素的价值越发凸显,数据资产的会计确认也成为亟待解决的理论和实践问题。本文通过对数据概念进行辨析,并进一步构建了数据资产的形成机制,进而对数据资产的会计确认和计量问题进行探讨,在此基础上提出数据资产的良好发展需要依赖市场交易机制的建立。
期刊
随着中国基础设施的不断完善,城镇化进程的不断加快。中国的建筑企业也迎来了发展的良好机遇。但是从目前的情况来看,建筑行业的市场竞争也日益激烈。很多建筑企业在市场上存在着很强的风险,包括日常经营的风险和财务风险。其中财务风险是影响企业生存能力的重要风险因素,但是很多企业却没有从思想上重视对财务风险的管理和防控。文章对风险管理的相关概念进行了阐述,并且总结了建筑企业存在的财务风险类型,进而提出了针对性的
期刊
随着公共交通智能监管的逐步推进,以及物联网和轻量级目标检测领域的快速发展,人们的生产和生活受影响越来越明显。然而,受场景限制和专业技术等原因,很多中小企业和个人研究人员很难深入实践。此外,考虑到公交分布位置广泛,采集的数据传输到云端处理会产生时延等问题,针对目标检测应用场景,本文设计了一个基于物联网的轻量级目标检测平台,将部分检测计算赋能于嵌入式设备,并实现了公交辅助驾驶、客流统计、数据可视化、智
学位
研究目的:地铁车辆段具有道岔和轨道接头多、曲线半径小、列车行车速度低等特点,其轨道结构的减振设计一般参照地铁正线,实际减振特性尚不明确。为掌握双层非线性扣件在车辆段内轨道道岔运用效果,对车辆段内减振道岔进行试验研究。研究结论:(1)双层非线性减振扣件能够减小钢轨传至扣件减振层以下的道床和盖板地面处振动,但扣件减振层以上的钢轨处振动显著增大;车速20 km/h时,辙叉处道床和盖板地面分别衰减6.6
期刊
作为一项重要的政策内容,住房公积金政策因为和居民生活中的住房环节相联系的原因在社会经济发展中受到了高度的重视。但是随着社会发展水品的变化以及社会实践的变化,住房公积金贷款的政策受到了多方面的影响而产生了许多的漏洞,这些漏洞导致的住房公积金贷款的风险成为了影响国计民生的重要问题。分析住房公积金贷款的风险并提出可行的防范措施是本文的主题。
期刊
大数据技术带来的巨大影响正在社会中各个领域凸显。在新闻业,大数据与新闻碰撞出了数据新闻这一新的新闻报道形式,它通过对海量数据的挖掘、分析和可视化为新闻提供了新的生产方式、新颖的思考方向以及精美的呈现形式,给传统新闻业带来了新的活力。在日常生活中,大数据技术改变生活的方方面面,智能手机催生出的移动社交、短视频APP等,正在将人们的阅读习惯变得碎片化、轻量化。顺应潮流,数据新闻也在随需求而改变。与国外
学位
目的 探究中西医结合呼吸康复训练对慢性阻塞性肺疾病(COPD)患者运动能力的影响。方法 选取2018年11月—2020年2月南昌市第一医院收治的80例COPD患者作为研究对象,采用随机数表法将患者分为对照组和观察组,每组40例。对照组采用中西医联合疗法,观察组在对照组基础上结合呼吸康复训练治疗。对比2组患者治疗1个月、2个月后的6 min步行测试(6MWT)距离和治疗前后肺功能指标1 s用力呼气容
期刊
参照蝠鲼等鱼类游动方式所研制的水下仿生扑翼机器人具有效率高、机动性强、负载能力大等多方面优势。由于其广阔的应用前景,水下仿生扑翼机器人已逐步成为水下航行器领域的研究热点。本文系统地将蝠鲼的生物学特性、机器人的结构设计、动力学模型、单体运动控制、集群运动控制以及实验研究等方面的国内外研究进展进行了总结和梳理。已有的研究表明:水下仿生扑翼机器人正在朝着软体化、集群化、高机动等方向发展,新兴的水下仿生扑
期刊
自金融危机以来,如何防范化解系统性金融风险始终是当下社会重大课题。与此同时,全球范围内的央行普遍强化了对金融稳定职能的沟通,提高了金融稳定透明度,因而研究央行金融稳定透明度与系统性风险相关关系对于我国防范化解系统性风险以及更好地实施宏观审慎政策具有重大参考意义。本文基于Roman Horváth et al.(2016)央行金融稳定透明度指数构建方法对我国央行金融稳定透明度进行测度研究;采用下半方
期刊
目的:研究云南地区前庭导水管扩大耳聋患儿SLC26A4基因突变位点频率,报道SLC26A4基因新发突变位点,进一步明确SLC26A4基因突变谱,探讨SLC26A4基因的双等位、单等位基因突变与内耳CT表型的关联,为耳聋的临床和基因诊断提供依据。方法:回顾2016年8月至2021年9月昆明市儿童医院耳鼻喉科390例人工耳蜗术后患儿颞骨CT检查结果,对59例发现前庭导水管扩大的患儿进行对SLC26A4
期刊