今日AI-深度强化学习-2024年10月23日

发现全网最新的AI内容

Eagle:基于端到端深度强化学习的自主控制PTZ 摄像机

文章概要:

1. 文章介绍了使用深度强化学习RL)来解决PTZ摄像机自主控制问题的新方法命名为Eagle1
2. 现有PTZ摄像机自主控制存在3个涉及多个阶段,其中对象检测和是需要标签,并且由于阶段信息流中的误差传播存在性能瓶颈;对象在受限的设备上实时变得不可行
3 Eagle1是一个端到端的强化,训练一个神经网络策略,该策略直接以作为输入来控制PTZ摄像机
4. 作者引入了一个逼真的仿真框架,用于Z摄像机控制策略
5. Eagle1高分辨率接近捕获图像的中心,实现了卓越的摄像机控制性能
6.域随机化,在仿真器中训练的Eagle1策略可以转移到现实世界场景中
阅读原文

【牛津大学博士论文】改进单智能体和多智能体深度强化学习方法

文章概要:

1. 强化学习(RL)是一种框架,代理通过与环境数据的,利用奖惩机制学习如何。
2. 深度强化学习( RL将深度学习与强化学习相结合,利用深度神经网络的强大功能的高。
3. 论文的部分智能RL环境问题,了一种新的方法实现语义,在稀疏奖励任务中样本效率和性能。
.第二部分聚焦于的多智能体强化L,了的方法如通用价值探索和可扩展的角色的学习。<> 最后,了合作型MARL策略方法,展示了方法流行的多体基准测试表现优于最先进学习方法
阅读原文

论文推送 | 大规模实时城市物流配送规划问题的分层深度强化学习求解方法

文章概要:

1. 本文提出了一种利用改进Transformer模型的分层深度强化学习方法(HDRLITF),解决了大规模客户和实时交通状况下的城市路线规划问题。
2. 实验结果表明,HDRLITF方法在性能上优于现有的深度强化学习方法,展示了在解决复杂的城市物流配送优化问题中的潜力。
3. HDRLITF方法在平均行驶时间方面显著优于其它深度强化学习方法,在稳定性和可靠性方面也优于其它深度强化学习方法。
阅读原文