Otimização de rotas de drones usando reinforcement learning
Este trabalho apresenta uma metodologia para a otimização de rotas de entrega de drones utilizando técnicas de aprendizado por reforço (RL). Motivado por desastres naturais recentes no Brasil, como as inundações no Rio Grande do Sul, o estudo visa desenvolver soluções que permitam a entrega rápida e eficiente de suprimentos em áreas inacessíveis por meios de transporte convencionais. A pesquisa explora algoritmo de Proximal Policy Optimization (PPO) para resolver problemas de roteamento e de otimização. A aplicação dessa técnica visa reduzir o tempo de entrega e aumentar a eficiência dos drones, melhorando a capacidade de resposta em situações de emergência e contribuindo para a gestão global de desastres.