蒙特卡洛树搜索网络在无人车自动驾驶中的研究与应用

来源 :东北大学 | 被引量 : 0次 | 上传用户:yellowfly1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动驾驶问题是一个复杂行为的序贯决策问题,无人车的感知,决策,控制都能影响在交通道路中的轨迹以及自动驾驶的表现。在自动驾驶发展的早期,通常将自动驾驶问题分解成多个子问题,利用分而治之的思想,在每个子问题中分别求解最优。近年来,AlphaGo在围棋领域中战胜人类职业玩家可以证明,蒙特卡洛树搜索网络在序贯问题中可以求解出局部最优,甚至全局最优。本文对自动驾驶问题进行建模,从而利用蒙特卡洛树搜索以及卷积神经网络,对自动驾驶问题模型进行求解。本文设计并实现了一个端到端的训练以及决策的蒙特卡洛树搜索网络算法,通过车载摄像头捕获试试数据,输出方向盘的转角,实现车辆的自动驾驶。该算法主要分为三个部分,蒙特卡洛树搜索,策略网络以及评估网络,并以蒙特卡洛树搜索为基础,将蒙特卡洛树搜索的选择,扩展,模拟以及更新中的部分过程进行网络化,以此减少搜索树的广度和深度,提高搜索效率,极大地提升了该算法在无人车自动驾驶中决策的智能化水平。同时,针对无人车搭载的计算单元,设计了一个仅由7层卷积和4层全连接的卷积神经网络,从而有效处理实时数据,避免决策的滞后性。策略和评估网络的输入均为第一视角下的无人车路况信息,策略网络的输出为方向盘转角的选择概率,评估网络的输出为当前无人车所处状态的危险度。为了验证算法的有效性,本文利用开源的无人车仿真平台,实现自动驾驶训练数据的采集以及处理。对策略和评估网络进行数小时的训练,该算法在仿真平台中能够有效避开障碍物并达到指定目的地。最后,本文设计并实现了一个低成本的微缩智能车硬件测试平台,并在实验室环境下完成了数据采集,网络训练,算法测试等流程。最终实验结果表明,该算法在转弯,避障以及路径规划等方面都能够学习到人类的知识,能够在特地场景下拥有不错的自动驾驶表现。
其他文献
动机是影响二语学习成功率的关键因素之一,这已被教师和研究者广泛接受。在二语动机的研究领域中,二语动机系统已成为其中占重要地位的理论框架。在此之前,许多实证研究已证实它的有效性。但是,多数研究选择大学生作为研究对象,只有一部分研究聚焦高中生的二语动机自我系统,其中以学优生和学困生为研究对象的更是少数。为了解高中英语学优生和学困生二语动机自我系统并帮助英语教师调动英语学困生的积极性,本研究提出两个研究
学位
<正> 赵××,女,62岁。1985年10月22日诊。患者24年前食陈猪肉后发生腹泻,继则时发时止,曾多方求医,服药不效。83年5月经川医附院作病理鉴定诊断为慢性肠炎,给喉头菌片等药物治疗二月余,病情反而加重。刻诊:患者形丰体胖,头眩嗜卧,食欲不振,胸脘痞闷,烦躁易怒,语声洪亮,大便一日十余次,泻前腹痛加剧,随即泻出大量粘液,尿少,双下肢浮肿,舌质淡红,苔白厚腻,
期刊
关联方交易普遍存在于企业的日常经营活动中,相较于其他交易手段具有提高交易效率、节约交易成本、降低违约风险等优点。与此同时,关联方交易也由于其易操作性和隐蔽性,已然成为上市公司大股东实施利益输送的常用手段。大股东为了谋取私利,通常会利用自己的股权地位或者对高管层的控制,实现对公司重大决策的主导和掌控,对上市公司的利益进行侵占。在信息不对称情况下,大股东倾向于采取不合法或不公允的关联方交易手段,来实现
学位
从光子晶体光纤(Photonic Crystal Fiber,PCF)在1995年被提出至今,其价值已经被无数科学家证实,凭借着独特的结构和性能优势,在光学领域得到了越来越广泛的关注。由于光子晶体光纤具有灵活的材料选择及结构设计,它具有传统光纤所不具备的一些特有的光学性质,如强非线性效应、稀奇的色散特性、高双折射特性以及低弯曲损耗特性等。本文设计了 一种利用其偏振特性的基于表面等离子体共振(sur
学位
<正> 全蝎蜈蚣均有毒,息风止痉,用于惊风抽搐、中风口眼斜、破伤风等。如止痉散,解毒散结,用于瘰疬疮疡肿毒等证;通络止痛,用于顽固性头痛、风湿痹痛。二药皆平息肝风以解痉挛,祛风通络以止疼痛,解毒散结以疗疮肿,辛散力强。全蝎较蜈蚣性缓而平和,息风止痉,宜于手足震颤、头部摇动、频频抽动者;蜈蚣较全蝎性猛而刚燥,息风止痉,宜于手足麻木、角弓反张、痉挛强直者。
期刊
<正>戏剧活动是指在教师的引导下学生展开即兴演出、角色扮演、模仿朗读、游戏等创作性活动,在情境中学习英语知识,发展英语听说、表演、创造等方面的能力并获得美感经验、陶冶情操的学习实践活动。Dodson(2000)指出,戏剧活动有助于让学生建立起对新单词和新语法结构的良好认知,发展学生运用语言的能力。除了为学生提供整体习得语言的机会,
期刊
综合能源系统是实现能源阶梯利用、提高能源综合利用效率以及促进整合可再生能源的有效形式。但多能源载体间的耦合与相互作用使得研究变得复杂,尤其当高比例可再生能源注入时,系统的运行模式和控制策略灵活多样,能量流分布也不同于传统。此外,气网、热网作为电网的源或负荷,一定会影响原有的能流分布和安全程度。因此本文研究综合能源系统的能量流计算,并进一步研究稳定性评估,研究结果对掌握综合能源系统状态、规划设计、优
学位
随着社会的发展与进步,我国的城市化进程不断推进,这使得越来越多的人选择进入城市中工作、学习和生活。可以预见,久坐将会成为一种日常生活中的常态。而医学研究表明,长时间保持不良的坐姿会损害身体健康。例如,我国青少年近视率不断升高,职业人群肩颈问题日益突出,其根源很大程度上在于长时间的不良坐姿,所以在日常学习、工作中保持正确坐姿对保持健康、预防疾病有着重要作用。但是人们在专注的学习工作中,很难时时刻刻注
学位
<正> 患者樊某,男,38岁。1984年3月30日以腹泻2年余收住院。主诉2年前曾因吃凉橘子罐头后引起,以致每日腹泻3~4次,为稀糊状带粘液便,且黎明前必泻下2次。在某医院以“肠炎”治疗,屡服中西药而效差。入院后根据上述诸证及脉弦细,舌质淡红、苔薄白腻等诊为脾肾阳虚之泄泻,服理中汤合四神丸加味3剂无效。即改用升阳益胃汤:党参、白芍、黄芪各15克,白术、半夏、陈皮、茯苓各10克,柴胡、羌活、独活、防
期刊
系统与控制研究中的许多问题,最终都可以化归为某种形式的带约束优化问题来求解。自状态空间方法被引入系统与控制研究后,许多线性系统控制问题被建模成带有线性矩阵不等式(Linear Matrix Inequation,LMI)约束的优化问题。随着一些高效易用的LMI自动化求解软件被开发出,LMI方法在系统与控制领域表现出了重要价值。本文的研究即以LMI方法为起点,探索其在现今的系统与控制领域内的可能应用
学位