基于正强化学习和正交分解的干扰策略选择算法

来源 :系统工程与电子技术 | 被引量 : 0次 | 上传用户:zhuxianwei00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习作为自学习和在线学习方法,以试错的方式与动态环境进行持续交互,进而学习到最优策略,成为机器学习领域一个重要的分支。针对当前无线通信干扰策略研究依赖先验信息以及学习速度过慢的缺点,提出了基于正强化学习-正交分解的干扰策略选择算法。该算法利用正强化的思想提高了最优动作被选中的概率,进而加快了系统的学习速度。特别地,当通信信号星座图因诸多因素而产生畸变时,利用提出的正交分解算法能够学习到最佳干扰信号的同相分量和正交分量,即通过学习获得最佳干扰样式。仿真结果表明,利用正强化学习-正交分解算法能够更加快速地学习到最优干扰参数和最佳干扰样式,相同任务中,仅需更少的交互次数且干扰效果更好,较现有干扰策略选择算法更优。
其他文献
报道了中国兰科一新记录种,白花异型兰Chiloschista exuperei(Guillaumin)Garay。该种由于其花的颜色为白色、唇瓣中裂片基部具球状、密被毛的胼胝体而明显不同于该属内其它
后设监管主要是指政府对企业自我监管的监管,这是一种兴起于西方国家,强调建立政府与非政府机构协同监管的新模式。这种后设监管模式在我国实践中已经实际存在,但学术界缺乏
稻米品质差异的形成主要涉及到C、N和P的代谢差异。C代谢将来自于叶片的光合产物合成淀粉并储存在胚乳组织的淀粉粒中;N代谢和P代谢的产物主要是蛋白质和植酸。成熟的水稻种
今年1月16日,习近平总书记出席中央政法工作会议并发表重要讲话,总书记站在新时代党和国家事业发展全局高度,科学回答了事关政法事业发展方向性、根本性、长远性的一系列重大问
报纸
小麦是世界最重要的粮食作物之一,但利用现代生物技术进行改良小麦品种则相对滞后,其瓶颈在于小麦组培技术尚不成熟。目前小麦转化中常用的受体是幼胚,但幼胚的获得受到季节
深化改革开放是党中央确立的基本国策,广东在改革开放以来,取得了经济快速发展,走出了一条成功的发展之路。有许多好的做法和经验,在全国各地进一步深化改革开放过程中,仍然
PPP模式被认为是一种能够缓解政府财政压力、提高投资和管理效率的采购方式,但采用PPP模式建设海绵城市是否比政府传统采购方式更有效尚不明确,因此需要进行物有所值(VfM)研
盐碱化土壤是导致我国环境危机的重要因素之一,利用基因工程培育抗旱,耐盐品种已经成为解决我国土壤盐碱化日益严重问题的一条重要途径。本文对克隆获得水稻类金属硫蛋白(rgMT
本文通过以FPGA为核心的高速数据集采集系统的设计制作,并通过verilogHDL语言进行编程,最后实现了一个具有高性能的数据采集系统。