基于动作约束深度强化学习的安全自动驾驶方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:ysabby2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的发展,自动驾驶领域的研究也日益壮大。深度强化学习(Deep Reinforcement Learning,DRL)方法是该领域的主要研究方法之一。其中,安全探索问题是该领域的一个研究热点。然而,大部分DRL算法为了提高样本的覆盖率并没有对探索方法进行安全限制,使无人车探索时会陷入某些危险状态,从而导致学习失败。针对该问题,提出了一种基于动作约束的软行动者-评论家算法(Constrained Soft Actor-critic,CSAC),该方法首先对环境奖赏进行了合理限制。无人车动作转角过大
其他文献
人工智能(Artificial Intelligence,AI)治理是解决AI挑战的主要手段。AI治理的主要目的是充分发挥人工智能带来的优势和有效降低人工智能导致的风险,并通过整合技术、法律、政策、标准、伦理、道德、安全、经济、社会等多个方面的影响因素,最终建设负责任的人工智能(Responsible Artificial Intelligence,RAI)。AI治理可以从智能个体治理、智能群体治理以及人机合作与共生系统的治理等3个方面,分技术层、伦理层、社会及法律层等3个层面进行。AI治理的主要关键技术
随着安防需求的日益增长,人群异常行为检测已经成为计算机视觉的研究热点。人群异常行为检测旨在对监控视频中行人的行为进行建模和分析,区分出人群中的正常行为和异常行为,及时发现灾难和意外事件。文中对基于深度学习的人群异常行为检测算法进行了梳理总结。首先,针对人群异常行为检测任务及其现状进行介绍;其次,重点探讨卷积神经网络、自编码网络和生成对抗网络在人群异常行为检测任务中的研究进展;然后,列举该领域常用的
【摘要】 当前,随着微课逐渐被引入到课堂教学中,信息技术与学科教学融合的紧密程度得以不断增强,微课在初中信息技术教学中也得到广泛应用。实践表明,微课在初中信息技术教学中能够有效激发学生学习兴趣、提升学生自主学习能力。进一步地讲,在农村初中信息技术教学中应用微课,可以缩小城乡信息技术教育差距、提高信息技术教育资源配置效率、有效改善教学方式并提升教学效果。然而,微课在农村初中信息技术课程的应用中也面
内陆湖泊水华现象的频繁爆发,严重影响着地表水环境安全,严重阻碍了我国的生态文明建设。充分发挥合成孔径雷达(Synthetic Aperture Radar,SAR)遥感技术全天时、全天候的优势,可实现大尺度、周期性的水华识别与监测工作,对于地表水生态环境的保护与监管具有重大的现实意义。立足于SAR遥感目标识别技术的研究与应用,文中提出了一种基于特征优化的水华识别方法。该方法基于对水华SAR图像特征的深入分析与提取,应用ReliefF特征优化算法对全部的22个水华特征进行筛选与优化,得到包含10个特征的最优
文中提出一种融合深度典型相关分析和对抗学习的跨模态检索方法(DCCA-ACMR),该方法提高了无标签样本的利用率,能够学习到更有力的特征投影模型,进而提升了跨模态检索准确率。具体而言,在DCGAN框架下:1)在图像与文本两个单模态的表示层间增加深度典型相关分析约束,构建图文特征投影模型,充分挖掘样本对的语义关联性;2)以图文特征投影模型作为生成器,以模态特征分类模型作为判别器共同构成图文跨模态检索模型;3)利用有标签样本和无标签样本,在生成器和判别器的相互对抗中学习到样本的公共子空间表示。在Wikiped
随着移动互联技术的不断发展,社交媒体成为了公众分享观点和抒发情感的主要平台,在重大社会事件下对社交媒体文本进行情感分析能够有效监控舆情。针对现有中文社交媒体情感分析算法的准确性能和运行效率较低的问题,提出了一种基于Spark分布式系统的集成情感大数据分析方法(Spark Feature Weighted Stacking,S-FWS)。该方法首先基于Jieba库预分词和PMI关联度完成新词发现;然后考虑词语重要度混合提取文本特征,并使用Lasso进行特征选择;最后改进传统Stacking框架忽略特征重要度
传统的大数据工具一般为专业数据分析人员打造,具有难以上手、操作交互性差以及不够智能化等特点。而智能交互向导系统是针对大数据交互式分析系统目前存在的问题而研制的一套大数据分析辅助工具。系统既研发了用户意图理解、数据抽样及列推荐、可视化推荐、分析方法推荐等核心关键技术,也拥有良好的图形化界面与人性化的智能交互体验。在满足用户多种交互式分析需求的同时,还具有极高的响应速度。不仅可以随时回溯到分析流程任意一步重新选择方法的执行流程,还可以通过接口与各种分析应用快速集成以部署应用于不同场景。经过实验测试,系统的平均
基于光谱重建约束的非负矩阵分解,提出了一种高光谱与全色图像的有效解混方法。首先在高光谱图像的非负矩阵分解中引入光谱重建误差最小化的正则项,通过多目标寻优寻找最佳的正则项参数,以鼓励分解的光谱特征矩阵包含更真实的光谱特征;然后对全色图像进行非负矩阵分解,以获得描述图像细节的丰度矩阵;最后利用光谱特征矩阵和丰度矩阵重建得到融合结果。实验仿真结果表明,所提方法的融合结果能在较好地保留全色图像细节的同时,
异质信息网络(Heterogeneous Information Network,HIN)嵌入将复杂的异质信息映射到低维稠密的向量空间,有利于网络数据的计算和存储。现有的基于多视图的HIN嵌入方法考虑了节点之间的多种语义关系,但忽略了视图的不完整性。大多数视图存在数据缺失,直接融合多个不完整的视图会导致嵌入效果不佳。为此,文中提出了一种融合不完整多视图的HIN嵌入方法(Incomplete Multi-view Fusion Based HIN Embedding,IMHE)。IMHE的关键思想是聚合其他
行人重识别旨在跨摄像头条件下,从目标数据库中检索出特定的行人目标,其在视频监控领域有重要的应用价值。目前其研究难点为样本图像类内差异大、类间差异小,因此如何设计并训练深度神经网络对行人图片提取一个判别力更强的特征成为了其关键。针对以往研究只单独进行全局特征或局部特征学习的不足,提出了一种联合全局特征和局部特征学习的网络结构,该结构能够同时提取全局特征和具有较强区分力的局部细节特征;针对每部分局部特