标签:Reinforcement Learning
DeepMind|用深度强化学习让双足机器人学习敏捷足球技能
研究用深度强化学习让低成本人形机器人具备复杂的和安全的移动技能,在模拟器中使用深度强化学习训练一个20个活动关节的人形机器人玩简化版足球游戏:使用高...
通过强化学习出现类似信念的表征
动物必须学会预测未来的奖励或价值。动物被认为使用强化学习来学习奖励预测,真实环境中动物还必须学会仅使用不完整的状态信息来估计价值,动物通过首先形成...
田纳西大学|随机旅行时间的无人机与卡车联合运输问题:一种强化学习方法
//www.sciencedirect.com/sdfe/reader/pii/S1366554522002034/pdf【推荐理由】作为一种新颖的城市配送方式,卡车-无人机协同作业越来越受欢迎,研究将此问题...
北京邮电大学|用于成本和延迟敏感的虚拟网络功能放置和路由的多智能体深度强化学习
用于解决联合虚拟网络功能 (VNF) 布局和路由 (P&其中同时包含具有不同需求的多个服务请求。服务请求的差异化需求反映在它们的延迟和成本敏感因素上,R 问...
UC Berkeley | 通过潜在意图从被动数据中进行强化学习
【推荐理由】本文通过潜在意图从被动数据中进行强化学习,这种方案可以学习适用于下游任务的价值预测特征,并且实验表明可以从多种形式的被动数据中学习,【...