标签:强化学习

Insight Time预告|决策大模型:一种通过无标签视频预训练的方法

其研究方向为计算机视觉和强化学习,了解决策AI大模型训练的基本原理:掌握大模型训练的监督、自监督学习技术应用于序列决策任务的创新思路,了解大型通用模型...

清华大学车辆学院李升波|强化学习,让自动驾驶汽车自我进化,越开越好

清华大学车辆与运载学院李升波教授分享了题为《混合型强化学习及其高级别自动驾驶应用》的主题报告。该报告主要探讨了如何将强化学习应用于自动驾驶汽车的问...

Yann LeCun新论文:构建自动智能体之路

Yann LeCun发布了他的最新论文:这篇论文提炼了我过去5年或10年对人工智能前景前景的大部分思考。这基本上是我计划做的事情,机器如何学会推理和计划?机器如...

卡内基梅隆大学|AnyMorph:通过推断智能体形态来学习可转移策略

【推荐理由】强化学习的典型方法包括针对每一种新形态从零开始为特定智能体量身定制的训练策略。最近的工作旨在通过研究在具有类似任务目标的多个智能体上训...

通过强化学习出现类似信念的表征

动物必须学会预测未来的奖励或价值。动物被认为使用强化学习来学习奖励预测,真实环境中动物还必须学会仅使用不完整的状态信息来估计价值,动物通过首先形成...

田纳西大学|随机旅行时间的无人机与卡车联合运输问题:一种强化学习方法

//www.sciencedirect.com/sdfe/reader/pii/S1366554522002034/pdf【推荐理由】作为一种新颖的城市配送方式,卡车-无人机协同作业越来越受欢迎,研究将此问题...

北京邮电大学|用于成本和延迟敏感的虚拟网络功能放置和路由的多智能体深度强化学习

用于解决联合虚拟网络功能 (VNF) 布局和路由 (P&其中同时包含具有不同需求的多个服务请求。服务请求的差异化需求反映在它们的延迟和成本敏感因素上,R 问...

UC Berkeley | 通过潜在意图从被动数据中进行强化学习

【推荐理由】本文通过潜在意图从被动数据中进行强化学习,这种方案可以学习适用于下游任务的价值预测特征,并且实验表明可以从多种形式的被动数据中学习,【...

GNN与RL如何结合?KSU大学最新《基于图神经网络的强化学习》综述,阐述RL+GNN算法与应用

图神经网络和强化学习都是机器学习中研究的主流模型,最近来自美国堪萨斯州立大学发布了《基于图神经网络的强化学习》综述,阐述相关算法与应用。深度强化学...
1 6 7 8