今日AI-深度强化学习-2024年11月27日

发现全网最新的AI内容

强化学习联合注意力机制!双热点在手,发文我不愁!

文章概要:

1. 强化学习与注意力机制结合热度暴涨,ICML、NeurIPS等顶会篇论文,效果拔群。
2. 在强化学习引入注意力机制,能帮助模型更好利用环境信息,在状态表示、动作选择、奖励预测阶段发挥重要作用突出关键信息抑制无关信息,使模型在决策更加准确迅速。
3 强化学习与注意力机制在游戏AI、自动驾驶、金融、LP、图像处理等有应用,相比其他领域,还不算“红海空间很大。
4. 为让大家能够把准领域的脉络,早点发出自己的文章,作者准备了12前沿创新思路,以及开源代码
阅读原文

MATLAB|用于无人机控制的深度强化学习|使用深度确定性策略梯度通过连续状态空间中的过渡来控制倾转旋翼无人机

文章概要:

1. 本项目的目的是通过垂直和水平之间的过渡来控制倾转旋翼无人机使用现代人工智能(AI)技术的水平飞行
2. 传统控制器是专家需要设计人员对控制器进行编程以在每种可能的情况下工作的系统
3. 学习系统从第一原则中学习解决方案,无需任何先验知识
4. 该项目使用强化学习作为工具来控制有翼的倾转旋翼机
5. 考虑了许多不同的动态规划方法来控制飞机。最终发现强化学习算法是最适合该问题的候选算法
6. 深度确定性策略(DDPG)是一种在连续状态和动作空间中都工作的强化学习算法,这是关键该飞机的要求
7. 初步测试强调了飞机模拟中稳定性的性
8.DDPG算法的测试突显了实现它的困难程度由MATLAB处理,但需要大量的工作来获得适用于培训
9. 最终,这位代理人是训练以多旋翼模式在两点之间飞行,不如调校良好的PID成功控制器
10. 过渡是飞行中最复杂的部分:为了简化它从以下状态开始性能最好的多旋翼智能体,以及控制电机和飞行倾斜角的能力增加了控制器权重
11. 该项目取得了良好的效果,但并没有在经过良好调优的传统控制器上进步
12. 强化学习智能体在没有先验的情况下成功地学习了良好的策略,并且“智能”行为的示例,如前瞻性规划
阅读原文