基于Bandit反馈的分布式在线对偶平均算法

来源 :四川轻化工大学学报:自然科学版 | 被引量 : 0次 | 上传用户:hulala
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决梯度信息难以获取的分布式在线优化问题,提出了一种基于Bandit反馈的分布式在线对偶平均(DODA-B)算法。首先,该算法对原始梯度信息反馈进行了改进,提出了一种新的梯度估计,即Bandit反馈,利用函数值信息去近似原损失函数的梯度信息,克服了求解复杂函数梯度存在的计算量大等问题。然后,给出了该算法的收敛性分析,结果表明,Regret界的收敛速度为O(Tmax{k,1-k}),其中T是最大迭代次数。最后,利用传感器网络的一个特例进行了数值模拟计算,计算结果表明,所提算法的收敛速度与现有的分布式在线对
其他文献
题1已知AD为△ABC中∠4的平分线,△ABC的内切圆⊙I在边BC上的切点为E,点A1在△ABC的外接圆上,
针对预测数据噪声过大或超参数调整不当,导致随机森林回归(RFR)模型预测光伏发电功率精度不高的问题,提出一种基于变分模态分解(VMD)结合改进的粒子群(IPSO)优化随机森林回归
现在大家都在说中国梦。中国梦是中国人的梦。13亿中国人正在为实现中华民族伟大复兴的中国梦努力奋斗。
北京市百姓宣讲团首都国企宣讲分团举办了"我的梦·中国梦"的报告会,受到热烈的欢迎。
酷暑之下,人体需要大量饮水。但为了保障身体健康,伏天喝水需注意“六要”和“六不要”:要慢喝,不要猛饮;要喝温开水,不要喝冰水;要定时饮水,不要等口渴时再喝;要喝烧开过的水,不要喝生
报纸
<正> 三甲基醋酸是叔碳酸系列中第一成员。它是一种重要的有机合成原料,主要用于生产烯烃聚合物的引发剂、农药、医药、感光材料、化妆品、润滑油、传动液等。60年代国外就有
目的:观察不同浓度组罗哌卡因腹横肌平面阻滞(Transversus Abdominis Plane Block,TAPB)对全麻腹腔镜妇科手术术中阿片类药物及对术后镇痛药用量的影响。为术中麻醉方式及术
【正】宏观政策陈至立:探索农业科技产业化新模式国家级农业高新技术产业示范区——杨凌示范区近日举行庆祝成立十周年大会,国务委员陈至立出席大会并讲话。陈至立指出,杨凌
期刊
本次研究主要做了以下四件事情:一是设计了中国共产党党内治理“工具箱”。分析和明确了党内治理工具的概念和内涵,并从个体行为、组织领导、政治系统三个维度对党内治理工具
张焕国,我国知名密码学专家,武汉大学计算机学院教授、博士生导师,作为学科带头人创建了武汉大学的信息安全本科专业、硕士点、博士点和博士后产业基地,形成了信息安全人才培