에너지 효율 증대를 위한 강화학습 기반 태양광 패널 장착형 이동 기지국 경로 최적화Reinforcement Learning-Based Trajectory Optimization of Solar Panel-Equipped UAV BS for Energy Efficiency
- Other Titles
- Reinforcement Learning-Based Trajectory Optimization of Solar Panel-Equipped UAV BS for Energy Efficiency
- Authors
- 김동욱; 홍충선; 박성배; 최종원
- Issue Date
- Oct-2023
- Publisher
- 한국정보과학회
- Keywords
- UAV base station; wireless communication; reinforcement learning; energy harvesting; UAV 기지국; 무선통신; 강화학습; 에너지 수확
- Citation
- 정보과학회논문지, v.50, no.10, pp 899 - 905
- Pages
- 7
- Journal Title
- 정보과학회논문지
- Volume
- 50
- Number
- 10
- Start Page
- 899
- End Page
- 905
- URI
- https://scholarworks.sookmyung.ac.kr/handle/2020.sw.sookmyung/159420
- DOI
- 10.5626/JOK.2023.50.10.899
- ISSN
- 2383-630X
2383-6296
- Abstract
- 5G와 B5G 무선 통신 시스템에서는 사용자의 요구사항을 만족하기 위해 mm-Wave와 같은 높은 주파수를 갖는 대역을 사용한다. 이는 기존의 주파수 대역보다 낮은 회절과 투과율 그리고 강한 직진성으로 인한 제약들이 존재한다. 이 제약을 해결하기 위해 Unmanned Aerial Vehicle(UAV)의 지원을 받는 셀룰러 통신 패러다임은 기존 지상 기지국 보다 통신 서비스를 보다 유연하게 해준다. 하지만 UAV는 제한된 배터리 용량을 가지고 있어서 통신 서비스의 수명에 영향을 준다. 이를 해결하기 위해 본 논문에서는 태양광 패널이 장착된 UAV를 고려한다. UAV의 태양광으로 인한 에너지 생성과 유저 평균 Data rate를 최대화를 위한 UAV의 움직임은 많은 에너지를 소모한다. 에너지 생성 및 유저 평균 Data rate 최대화와 에너지 소모는 트레이드오프 관계를 갖는다. 이에 본 연구에서는 강화 학습 알고리즘 ‘Proximal Policy Optimization(PPO)’을 사용하여 학습한 에이전트를 이용하여 위 트레이드오프 관계를 최적화하는 UAV의 경로를 찾는 시스템을 제안하고 에너지 소모를 고려하지 않은 것과 본 논문에서 제안한 시스템을 비교하였고 에너지 소모까지 고려한 시스템이 더 UAV의 에너지 제약에서 뛰어난 성능을 보이는 것을 확인되었다.
- Files in This Item
-
Go to Link
- Appears in
Collections - 공과대학 > 소프트웨어학부 > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.