《电子技术应用》
您所在的位置:首页 > 通信与网络 > 设计应用 > 一种基于PPO算法的低空基站优化模型
一种基于PPO算法的低空基站优化模型
电子技术应用
薄云鹏1,2,亢抗3,潘桂新3,汪敏1
1.中国科学院云南天文台;2.中国科学院大学;3.中国联合网络通信有限公司广东省分公司
摘要: 通过优化现有地面网络基站来实现低空网络服务具有成本低、建设快等优点,面对低空基站优化过程中存在的无线环境复杂、配置参数多样、优化目标互相影响等问题,提出了一种基于近端策略优化算法的多维低空网络基站优化模型:通过射线追踪技术计算不同类型、不同角度基站的低空覆盖能力,并构建支持多目标优化和多参数配置的低空网络基站优化模型,利用PPO算法得到基站配置策略。在仿真环境中进行训练与结果验证,证明该模型可有效生成基站优化方案,且相较于基于A2C方法的模型具有更快的收敛速度和更好的基站优化效果。
中图分类号:TN929.5 文献标志码:A DOI: 10.16157/j.issn.0258-7998.256278
中文引用格式: 薄云鹏,亢抗,潘桂新,等. 一种基于PPO算法的低空基站优化模型[J]. 电子技术应用,2025,51(7):60-64.
英文引用格式: Bo Yunpeng,Kang Kang,Pan Guixin,et al. A low-altitude base station optimization model based on PPO algorithm[J]. Application of Electronic Technique,2025,51(7):60-64.
A low-altitude base station optimization model based on PPO algorithm
Bo Yunpeng1,2,Kang Kang3,Pan Guixin3,Wang Min1
1.Yunnan Observatories, Chinese Academy of Sciences;2.University of Chinese Academy of Sciences;3.China United Network Communications Co., Ltd., Guangdong Branch
Abstract: Optimizing existing terrestrial network base stations to provide low-altitude network services offers advantages such as cost-effectiveness and rapid deployment. Facing challenges in the optimization process of low-altitude base stations, including complex wireless environments, diverse configuration parameters, and interrelated optimization objectives, this paper proposes a multidimensional low-altitude network base station optimization model based on the Proximal Policy Optimization (PPO) algorithm. By employing ray tracing technology, the model calculates the low-altitude coverage capability of base stations with different types and angles. It constructs an optimization model that supports multiple objectives and parameter configurations for low-altitude network base stations. The PPO algorithm is utilized to derive base station configuration strategies, which are then trained and validated in a simulated environment. This demonstrates that the model can effectively generate optimization schemes for base stations and exhibits faster convergence speed and better optimization results compared to models based on the Actor-Critic (A2C) method.
Key words : low-altitude base station;low-altitude communication;PPO;reinforcement learning

引言

近年来,随着低空经济的发展,无人机的数量和应用急剧增加,无人机的通信需求也随之快速扩张[1]。而传统的基于地面站的无人机通信方式受地面站性能和所用的非授权频段的限制,存在易受干扰、通信范围受限、安全性差等问题,难以满足新应用场景的需求,因此,人们认为利用蓬勃发展的5G及以上蜂窝网络支持无人机通信是最有前途和成本效益的方法[2-6]。

然而,现有的蜂窝网络以服务地面用户为主[7],据此开展的网络规划和优化也主要面向地面目标,并且由于天线自身存在零位、旁瓣等问题,低空场景中信号覆盖不全、邻区关系杂乱、切换频繁、信号干扰严重等现象极为突出,使得目前的蜂窝网络难以满足无人机低空通信的需要[2, 5, 8]。因此,亟需通过建立专门的低空网络来开展对低空无人机应用场景的通信服务。

当前的低空通信组网方案主要有同站空地同频组网、同站空地异频组网、异站空地同频组网、异站空地异频组网等[2, 9],其中,同站组网方案通过在地面蜂窝网络站址上对现有设备进行调整优化或新增少量AAU设备等方式实现低空网络的建立,具有成本低、建设方便等优点。对于具体的低空网络建设方案,已有很多关于低空基站的选址[10]以及对天线的仰角[11-12]的调整方面的研究,然而上述研究往往只聚焦于站址或仰角等单一配置的调整,对于实际应用中通过优化已有地面基站建立低空网络过程中的对合适基站进行选择以及对高度、天线角度、设备选型等多方面配置策略的联合设计而言,其实用价值有限,需要设计一种多要素联合的低空基站优化方法,实现低成本、高效率的低空网络建设。

传统的蜂窝网络的基站规划方法往往根据经验模型估计信号的传播,而已有研究证实,城市环境内的复杂建筑物的遮挡和反射会极大地改变空对地信道特性[13-15],因此统计性信道模型往往难以准确描述信道特征。而射线追踪技术可通过计算无线电波与场景之间的电磁相互作用,模拟真实的信号传播过程,具有更高的灵活性[15]。然而射线追踪作为一种确定性传播工具,其所需计算量往往远大于统计性模型,因而在应用时需采取实时计算等措施降低计算量,提升效率。

强化学习是一种通过智能体与环境的交互来积累信息、改进策略的机器学习方法,该方法通过环境对智能体动作的反馈来进行智能体的训练与学习,具有无需提前获取先验信息的优点。对低空基站优化问题而言,使用强化学习方法可免于提前进行各基站不同优化方案的覆盖效果的繁杂计算,提升优化速度,降低计算量与时间成本。


本文详细内容请下载:

https://www.chinaaet.com/resource/share/2000006596


作者信息:

薄云鹏1,2,亢抗3,潘桂新3,汪敏1

(1.中国科学院云南天文台,云南 昆明 650200;

2.中国科学院大学,北京 100049;

3.中国联合网络通信有限公司广东省分公司,广东 广州 510700)


Magazine.Subscription.jpg

此内容为AET网站原创,未经授权禁止转载。