【摘 要】
:
强化学习是一个与环境交互的学习过程,在实验场景中,训练环境部署的可扩展性和算法验证的便捷性常受限于物理引擎和渲染模块的高耦合性。为对物理引擎和渲染模块进行解耦,构
【机 构】
:
中国科学院计算机网络信息中心,中国科学院大学计算机科学与技术学院
【基金项目】
:
国家重点研发计划“大规模并行计算的工具库和领域相关基础软件包”(2017YFB0202202),“中国科技云”建设工程(二期)项目“超算资源池建设”(XXH13503),国家电网有限公司总部科技项目“电力人工智能实验及公共服务平台技术”(SGGR0000JSJS1800569)。
论文部分内容阅读
强化学习是一个与环境交互的学习过程,在实验场景中,训练环境部署的可扩展性和算法验证的便捷性常受限于物理引擎和渲染模块的高耦合性。为对物理引擎和渲染模块进行解耦,构建一种面向物理引擎和渲染模块的云端交互式模型,其中包括操作字典、元素字典和对应的算法接口,并基于该模型实现模拟器。通过集成模拟器、可视化工具和知识管理等组件,搭建支持云端可视化交互的强化学习平台,并以MuJoCo物理引擎为例,验证Web模拟器接入自定义物理引擎的便捷性。实验和分析结果验证了该模型的有效性,其可方便接入平台,实现云端渲染并提高所属集
其他文献
采用烃类油蒸发制造油气,将油气通入浮选柱气泡发生器的吸气口,生成油泡。对低阶煤煤泥进行油泡柱浮选试验,试验结果表明:油泡对低阶煤煤泥具有强捕收能力与高选择性,分选指
目前选煤厂的浮选智能化水平普遍较低,一些现代化的选煤厂也仅实现了浮选加药自动化,且运行效果一般。文章阐述了浮选智能化的目标,对其研究进展进行了综述,并以选煤厂浮选智
现有载波索引差分混沌移位键控(DCSK)通信系统较传统DCSK系统能耗更低且数据传输速率更高,但其无法应用于多用户通信环境。提出一种多用户载波索引差分混沌移位键控系统,为系
为探索煤炭精细分级分选,优化生产系统,淮北选煤厂对煤泥重介质旋流器及粗煤泥振动弧形筛进行了优化,通过采用大直径煤泥重介质旋流器,改变弧形筛工艺参数,增加筛面喷水,稳定
针对传统Census算法对噪声敏感且在弱纹理区域匹配精度低的不足,提出一种基于自适应权重的改进算法。在代价计算阶段,通过空间相似度加权计算得到参考像素值,设定阈值限定参考值与中心点像素的差异,使算法能够判断中心点是否发生突变并自适应选择中心参考像素值。在代价聚合阶段,引入多尺度聚合策略,将引导滤波作为代价聚合核函数,加入正则化约束保持代价聚合时尺度间的一致性。在视差计算阶段,通过胜者通吃法得到初始
目前主流的边缘存储策略通过协同或非协同的方式来提高存储资源的请求命中率,从而降低请求延迟以满足时间敏感型业务的需求,然而这些策略并未考虑存储节点的副本数量过多所带
为确定效果最优的纳米石英浮选工艺条件,采用浮选法对微硅粉分离提纯,考察了捕收剂用量、不同金属阳离子活化剂种类、矿浆pH值、搅拌强度、引入纳米气泡等条件对纳米石英提纯
为解决制约煤泥减量化生产的难点,山东能源临沂矿业集团各选煤厂精准定位各自工艺流程、装备水平及现场管理存在的问题及主要挖潜点,在粗煤泥分选回收、煤泥浮选、尾煤泥截粗
为运用肌电信号分析髋脱位儿童和正常儿童的差异,提出一种基于统计的聚类方法,识别步态中下肢肌电信号的周期起始时刻。使用非参数贝叶斯模型将肌电信号序列聚类为状态序列,
为提高直线特征匹配的可靠性,提出一种基于卷积神经网络(CNN)学习的直线特征描述方法。构建用于网络学习的大规模直线数据集,该数据集包含约20.8万对匹配直线对,每条直线用其周围的局部图像块表征。将图像块输入CNN,利用HardNet网络结构提取特征,使用三元组损失函数进行训练,输出强鲁棒性的直线特征描述子。实验结果表明,与手工设计的描述子MSLD和IOCD相比,该描述子在视角、模糊、尺度和旋转变化