深度学习在无线通信中的应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:liu6541
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在无线通信中,频谱资源的稀缺性已经引起了业界的广泛关注。频谱资源的短缺并不意味着其已被耗尽,而是由于对已有频谱资源的利用率普遍较低,导致大量已分配好的频谱资源得不到良好的使用。因此基于认知无线电的动态智能化频谱感知和频谱共享成为了热门的研究课题。本文考虑包含一个主用户和一个次用户的认知无线电通信系统中的频谱共享问题,希望通过合理的设计使得次用户在不对主用户造成有害干扰的情况下,与主用户共享频谱资源,提高频谱资源利用率。假设主用户和次用户以非合作式的方式共同工作,且主用户基于预先设定好的功率控制策略更新其发送功率。主用户与次用户网络之间没有任何通信,因此次用户无法得知主用户的发送功率和功率控制策略。次用户的目标是学习一个高效的功率控制策略,使得在若干轮的调整后,主用户和次用户都能成功的传输各自的数据,这里的成功定义为接收端所接收的信号可以达到指定的服务质量要求。为了与主用户互动,次用户需要间接的获取主用户的信息。本文考虑在无线环境中布置多个传感器,分别放在不同位置上,测量接收信号强度。传感器所测量得到的接收信号强度可以表征系统的状态信息。当不考虑环境的干扰时,可以证明次用户的功率控制过程是一个马尔科夫决策过程,因此本文提出基于Q-学习的方法进行求解。实验结果表明无论主用户采用何种功率控制策略(本文以两种不同的功率控制策略为例),次用户都可以使用基于Q-学习的功率控制算法使系统在较短时间内从任意初始状态到达最终状态(定义为主用户和次用户均可以成功传输数据的状态)并一直停留在最终状态,实现频谱资源高效合理的利用。然而在实际的通信场景中,传感器接收到信号的强度会受到环境的干扰,次用户可能得到的状态集合由有限离散集变为无限连续集,而基于Q-学习的方法不能处理无穷多个状态的情况。因此本文进一步提出了基于深度强化学习的方法,将Q-学习方法生成的动作-值函数表(Q表)替换为深度神经网络,由于神经网络的输入可以是任意值,因此不再有状态离散有限化的要求。实验结果表明基于深度强化学习的方法在不同的系统参数设定下均有较好的表现。最后将本文提出的方法与DCPC优化方法进行了对比实验,进一步说明了基于深度强化学习方法的优势。
其他文献
金融资产管理公司是国家为了处置国有商业银行不良资产、促进国有银行和国有企业改革而设立的。通过金融资产管理公司的运作,银行资产质量显著改善,使得国有商业银行可以轻装
目的了解骨科住院病人对健康教育的需求情况,以便采用更合理的教育方式满足病人需求。方法采用描述性研究方法,对骨科住院病人进行调查。结果骨科病人出院前的健康教育需求程
本文针对现有大型政策性担保机构"五位一体"的运行模式,全面分析其运行机制与效果,客观阐述其利弊;并结合担保行业的发展规律,探讨并提出了不同时期与不同阶段,担保公司如何
服务业的发展对于一国提高国民生产总值和转变经济结构具有重要的战略意义。如何加快服务业发展成为当前中国经济学界关注的重点。改革开放以来,特别是进入20世纪90年代中后
恐怖主义作为一种古老的政治或社会现象由来已久;20世纪60年代末,恐怖主义成为了全球的一大公害。当代恐怖主义的活动范围不仅局限于中东、西欧、拉美等热点地区,还在其他地区不
实施素质教育,减轻学生过重的课业负担,提高课堂教学质量,要从教育教学的各个环节入手。数学作业是数学教学的重要一环。在现阶段,重新认识与分析数学作业教学,克服传统教学的弊端
在信息化和知识经济时代背景下,随着中国加入WTO,国与国之间的竞争也越来越激烈,人才的竞争成为国与国之间竞争的焦点之一。作为高等教育重要组成部分的留学教育,与教育的国际化
在当今的传媒格局中,新闻摄影已经占有一席之地。尤其随着“读图时代”的来临,新闻摄影在新闻报道中的作用日益彰显,对读者和社会的影响力也越来越大,新闻摄影已经成为了一种现实
目的分析长时间机械通气的患者发生气管食管瘘的原因及保守治疗的方法。方法结合4例长时间机械通气导致呼吸衰竭患者的临床资料及相关文献复习,系统分析气管食管瘘的形成原因
中国为应对全球金融危机采取扩大内需的政策,不断加大对铁路建设的投资规模,为铁路监理企业带来良好的发展机遇。本文试图通过对铁路监理特点、发展现状、存在问题和发展策略等