深度强化学习-2024年11月28日最新技术资讯

强化学习之父Sutton万字采访：炮轰深度学习只是瞬时学习，持续学习才是智能突破的关键

文章概要：

1. Rich Sutton是加拿大计算机科学家认为是现代计算强化学习的创始人之一，对该领域做出了多项重大贡献。他在2019年发表了一篇著名文章《Bitter Lesson》，强调一个重要的教训：简单、通用的方法最终会比人类设计的复杂、领域特定的方法更成功。
2. Rich Sutton认为，AI研究需要重新关注“持续学习”能力，而不是仅仅追求在固定数据集上的性能。他认为，深度学习过于关注“瞬时学习”，在厂里学成后就固定下来了，这种方法虽然在非线性映射方面取得了成功，但牺牲了持续学习的能力。
3. Rich Sutton认为，真正的突破应该来自于对学习目标的重新思考，而不是简单地改进现有的优化。他相信奖励假说，即所有的目标追求都可以被理解为最大化一个单一的、外部接收到的标量信号。
4. Rich Sutton认为，为了实现这个“总体目标”，我们为自己设置许多子问题，比如我有个子问题是如何拿起茶杯并成功送到嘴边而不洒出来，所有这些都是对解决总体目标有用的子问题。
5. Rich Sutton认为，复杂的高层次目标，如获得博士学位、建立家庭等都是为了优化这个基础的目标奖励。
6. Rich Sutton认为，如果你能规划，能通过试错学习，这就是他认为的“心智”。br>7. Rich Sutton认为，要保持日常写作习惯，记录并发展自己的想法；要中立对待流行趋势，选择真正重要且有潜力的问题；研究者专注于未解决的问题，而不是已经成功的领域。

阅读原文

【控制】基于深度强化学习网络DDPG实现SMC抖振抑制附Matlab代码

文章概要：

1 DDPG简介
2.MC抖振抑制问题
.事项> 5.
. 参考文献

阅读原文