论文部分内容阅读
随着海洋资源开发和国防安全建设的发展,人们对海洋信息的需求不断增加,这对水声传感器网络传输信息的高效性提出了更加严格的要求。水声传感器网络中,各类节点间采用协作通信的方式传输感知到的信息,能够有效对抗频带受限、时延增加及多径衰落的影响。因此,水声协作通信策略优化是改善水声通信质量和提高水下信息传输效率的有效手段。然而,与电磁波通信不同,水声协作通信网络的中继资源优化和自适应通信策略仍面临诸多挑战,包括信道状态的时变未知、拓扑结构的动态不确定以及噪声干扰等。本文针对复杂的水声协作通信网络,在不同通信场景及不同通信约束下为用户设计了多种高效、低成本、可适用性强的中继选择算法并提出了基于多参数调节的自适应通信方案,以实现高水平的水下信息传输速率。首先,针对水声协作通信网络中信道状态信息未知时变的静态源节点中继选择问题,提出了专家增强的对抗性多臂老虎机(Multi-Armed bandit,MAB)学习算法。为避免非理想信道状态信息的影响,设计对抗性MAB在线决策模型,在交互回值观测序列的基础上基于EXP3(Exponential-weight algorithm for Exploration and Exploitation)算法自适应调整中继决策。另外,考虑到用户对中继选择策略响应的快速性要求,提出专家学习机制启发式地学习最优中继选择概率分布函数以丰富学习信息并指导用户决策,从本质上提高了EXP3算法的学习能力,进而实现了较高的系统容量。其次,同时考虑水下噪声干扰和信道状态信息时变,提出了基于自适应扩展卡尔曼滤波的双层对抗性MAB中继学习算法。考虑到水下噪声干扰极易引发中继链路回值观测的不准确性,在回值估计层首先基于期望值最大算法在线估计噪声协方差,然后基于扩展卡尔曼滤波算法抑制噪声干扰,提高中继回值估计精度。在决策层,用户利用降噪后的回值评价中继质量并基于改进的EXP3算法选择最优中继。该学习算法更能适应复杂的水声通信环境,对噪声干扰、非完全信息获取都有一定的容忍能力。再次,针对网络拓扑动态不确定的移动源节点中继选择问题,提出了具有协同意识的上下文MAB学习算法。考虑到候选中继集受移动源节点的影响表现出强时空变化特性,首先将中继周围的环境信息量化为上下文特征向量并基于岭回归算法学习中继回值预测函数,有效捕捉水下环境对中继回值的影响。然后,提出基于簇集的协同学习机制,根据上下文特征向量将中继分簇并共享学习信息,从而提高新增中继的学习效率,对抗中继集合的空间不确定性。该算法具有较强的自组织和自适应能力,能够在时空变化的中继集合中高效的选择最优中继。继而,针对多源节点多中继选择问题,提出了公平约束的上下文组合MAB学习算法。首先考虑多源节点联合决策带来的多中继分配策略空间复杂的难题,为多源节点设计组合MAB在线学习模型,独立观测每个用户-中继对的回值信息,降低算法计算成本。然后,考虑水下环境的动态时变、多源节点的竞争性干扰,基于Kernel自回归算法学习上下文环境与用户-中继策略回值的非线性关系。另外,提出基于虚拟队列的公平约束决策准则,为每个自回归学习模型提供充足的训练数据,进而提高多源节点最优中继决策效率,保证高系统容量。最后,针对水声协作通信网络中快变环境下的自适应OFDM(Orthogonal Frequency Division Multiplexing)通信问题,提出了基于多参数联合调节的自适应OFDM通信方案。首先,利用对抗性MAB学习理论建立OFDM系统多参数配置决策模型。然后,针对联合多参数优化策略带来的决策空间复杂的问题,为用户设计正交学习算法加强对初始指数级多参数组合策略的学习,使其可在筛选过的小空间中对多参数配置策略进行学习决策。该通信方案实现了低复杂度、高效的OFDM多参数联合优化,进而提高了数据传输的可靠性。