今日AI-深度强化学习-2024年10月15日

发现全网最新的AI内容

开源!最全面的强化学习框架

文章概要:

1. OpenDILab一个开源的决策智能平台,上海人工智能实验室(Shanghai AI Laboratory)旗下的OpenXLab推出。
2. OpenDILab一套完备的决策训练与部署框架,自顶而下了应用生态层、算法抽象层、异步分布式管理层和最底层的分布式执行层。4. OpenDILab团队会定期维护和升级项目,确保跟上最新技术标准。
阅读原文

MATLAB|无人机路径规划|基于深度强化学习的多无人机辅助边缘计算网络路径规划

文章概要:

1. 本文研究了无人机辅助边缘计算网络的路径规划问题,采用高斯马尔可夫随机移动模型设备的移动性,制定了旨在最大化设备卸载的数据比特量同时最小化无人机能量消耗的路径问题,应用深度强化学习(DRL)方法了一种在线路径规划算法
2. 本文联合优化了无人机的轨迹和比特分配,考虑了无人机动态飞行和执行任务消耗的能量
3. 本文通过使用深度神经网络(DNN)进行函数逼近,证明深度强化(DRL在逼近Q值方面是有效的
4. 本文研究了基于深度强化学习的物联网设备计算卸载
阅读原文

文末附代码:一种新的强化学习基准测试环境(实验工具)

文章概要:

1. 文章介绍了一种新的强化学习基准测试环境,该环境是为水生导航提出的,旨在应对不可预测和非固定的环境对现代DRL方法构成的重大挑战
2. 文章详细介绍了该环境的设计、特点、训练和验证DRL代理的管道,以及在世界数据创建的洞穴导航场景中的测试结果
3. 文章提供了对模拟环境和训练算法的开放访问,以促进该领域的进一步研究和合作
阅读原文

MATLAB|无人机路径规划|基于深度强化学习的多无人机辅助边缘计算网络路径规划

文章概要:

1. 本文研究了无人机辅助边缘计算网络的路径规划问题,一架无人机部署了服务器,用于执行从多个设备卸载的计算任务。考虑设备的移动性,采用高斯马尔可夫随机移动模型,制定了旨在最大化设备卸载的数据比特量同时最小无人机能量消耗的路径规划问题。了处理复杂环境的动态,应用强化学习(DRL),双深度Q学习网络(DDQN)开发了一种在线路径规划算法。的仿真结果验证了所提出的基于DRL的路径规划算法在收敛速度和系统奖励方面的有效性
2. 本文还介绍了移动边缘计算(MEC)的,以及如何利用无人机为大量物联网设备边缘计算服务。
3. 本文介绍了一种基于深度强化学习的在线路径规划算法,并通过仿真验证了该算法的有效性。
阅读原文