今日AI-深度强化学习-2024年11月28日

发现全网最新的AI内容

强化学习之父Sutton万字采访:炮轰深度学习只是瞬时学习,持续学习才是智能突破的关键

文章概要:

1. Rich Sutton是加拿大计算机科学家认为是现代计算强化学习的创始人之一,对该领域做出了多项重大贡献。他在2019年发表了一篇著名文章《Bitter Lesson》,强调一个重要的教训:简单、通用的方法最终会比人类设计的复杂、领域特定的方法更成功。
2. Rich Sutton认为,AI研究需要重新关注“持续学习”能力,而不是仅仅追求在固定数据集上的性能。他认为,深度学习过于关注“瞬时学习”,在厂里学成后就固定下来了,这种方法虽然在非线性映射方面取得了成功,但牺牲了持续学习的能力。
3. Rich Sutton认为,真正的突破应该来自于对学习目标的重新思考,而不是简单地改进现有的优化。他相信奖励假说,即所有的目标追求都可以被理解为最大化一个单一的、外部接收到的标量信号。
4. Rich Sutton认为,为了实现这个“总体目标”,我们为自己设置许多子问题,比如我有个子问题是如何拿起茶杯并成功送到嘴边而不洒出来,所有这些都是对解决总体目标有用的子问题。
5. Rich Sutton认为,复杂的高层次目标,如获得博士学位、建立家庭等都是为了优化这个基础的目标奖励。
6. Rich Sutton认为,如果你能规划,能通过试错学习,这就是他认为的“心智”。br>7. Rich Sutton认为,要保持日常写作习惯,记录并发展自己的想法;要中立对待流行趋势,选择真正重要且有潜力的问题;研究者专注于未解决的问题,而不是已经成功的领域。
阅读原文

【控制】基于深度强化学习网络DDPG实现SMC抖振抑制附Matlab代码

文章概要:

1 DDPG简介
2.MC抖振抑制问题
.事项> 5.
. 参考文献
阅读原文