동적 해양 환경에서 자율 수중 차량 임무 수행을 위한 강화학습 기반 경로 최적화 기법동적 해양 환경에서 자율 수중 차량 임무 수행을 위한 강화학습 기반 경로 최적화 기법
A Reinforcement Learning-Based Path Optimization for Autonomous Underwater Vehicle Mission Execution in Dynamic Marine Environments
  • 안효준
  • 안신천
  • 노지민
  • 송일석
  • 권주은
  • ... 박수현
  • 외 3명
Citations

WEB OF SCIENCE

0
Citations

SCOPUS

0

초록

This paper proposes an AOPF (Autonomous Underwater Vehicle Optimal Path Finder) algorithm for AUV mission execution and path optimization in dynamic marine environments. The proposed algorithm utilizes a PPO (Proximal Policy Optimization)-based reinforcement learning method in combination with a 3-degree-of-freedom (DOF) model, enabling a balanced approach between obstacle avoidance and effective target approach. This method is designed to achieve faster convergence and higher mission performance compared to the DDPG (Deep Deterministic Policy Gradient) algorithm. Experimental results demonstrated that the algorithm enabled stable learning and generated efficient paths. Furthermore, the proposed approach shows strong potential for real-world deployment in complex marine environments. It offers scalability to multi-AUV cooperative control scenarios.

키워드

reinforcement learningpath optimizationdynamic marine environmentAUV control강화학습경로 최적화동적 해양 환경자율 수중 차량 제어
제목
동적 해양 환경에서 자율 수중 차량 임무 수행을 위한 강화학습 기반 경로 최적화 기법동적 해양 환경에서 자율 수중 차량 임무 수행을 위한 강화학습 기반 경로 최적화 기법
제목 (타언어)
A Reinforcement Learning-Based Path Optimization for Autonomous Underwater Vehicle Mission Execution in Dynamic Marine Environments
저자
안효준안신천노지민송일석권주은권세이김영대박수현김중헌
DOI
10.5626/JOK.2025.52.6.519
발행일
2025-06
저널명
정보과학회논문지
52
6
페이지
519 ~ 528