智源社区

《强化学习周刊》第52期：Depth-CUPRL、DistSPECTRL & Double Deep Q-Network

本期周刊整理了强化学习领域相关的最新论文推荐及研究综述，可以扫描文末的二维码加入强化学习社区群。您已经完成《强化学习周刊》订阅啦;以后智源社区会自动...

强化学习

2年前 (2023)

清华大学车辆学院李升波|强化学习，让自动驾驶汽车自我进化，越开越好

清华大学车辆与运载学院李升波教授分享了题为《混合型强化学习及其高级别自动驾驶应用》的主题报告。该报告主要探讨了如何将强化学习应用于自动驾驶汽车的问...

强化学习

2年前 (2023)

Yann LeCun新论文：构建自动智能体之路

Yann LeCun发布了他的最新论文：这篇论文提炼了我过去5年或10年对人工智能前景前景的大部分思考。这基本上是我计划做的事情，机器如何学会推理和计划？机器如...

强化学习

2年前 (2023)

卡内基梅隆大学|AnyMorph：通过推断智能体形态来学习可转移策略

【推荐理由】强化学习的典型方法包括针对每一种新形态从零开始为特定智能体量身定制的训练策略。最近的工作旨在通过研究在具有类似任务目标的多个智能体上训...

强化学习

2年前 (2023)

通过强化学习出现类似信念的表征

动物必须学会预测未来的奖励或价值。动物被认为使用强化学习来学习奖励预测，真实环境中动物还必须学会仅使用不完整的状态信息来估计价值，动物通过首先形成...

强化学习

2年前 (2023)

田纳西大学|随机旅行时间的无人机与卡车联合运输问题：一种强化学习方法

//www.sciencedirect.com/sdfe/reader/pii/S1366554522002034/pdf【推荐理由】作为一种新颖的城市配送方式，卡车-无人机协同作业越来越受欢迎，研究将此问题...

强化学习

2年前 (2023)

北京邮电大学|用于成本和延迟敏感的虚拟网络功能放置和路由的多智能体深度强化学习

用于解决联合虚拟网络功能 (VNF) 布局和路由 (P&其中同时包含具有不同需求的多个服务请求。服务请求的差异化需求反映在它们的延迟和成本敏感因素上，R 问...

强化学习

2年前 (2023)

UC Berkeley | 通过潜在意图从被动数据中进行强化学习

【推荐理由】本文通过潜在意图从被动数据中进行强化学习，这种方案可以学习适用于下游任务的价值预测特征，并且实验表明可以从多种形式的被动数据中学习，【...

强化学习

2年前 (2023)

KDD2022 | 什么特征进行交互才是有效的？

本文主要针对推荐系统中的特征交互而提出的相关方法。如果将所有可能的特征都进行交互，本文提出HIRS用于直接生成有益特征交互。生成的特征交互的数量可以指...

智源社区

2年前 (2023)

自适应非欧表征广告检索系统AMCAD

近年来的研究发现欧氏空间在建模特定图结构如层次、环状结构时天然存在误差，我们将介绍如何利用非欧图表征提高复杂异构图建模精度同时在阿里妈妈搜索广告场...

智源社区

2年前 (2023)

《强化学习周刊》第52期：Depth-CUPRL、DistSPECTRL & Double Deep Q-Network

清华大学车辆学院李升波|强化学习，让自动驾驶汽车自我进化，越开越好

Yann LeCun新论文：构建自动智能体之路

卡内基梅隆大学|AnyMorph：通过推断智能体形态来学习可转移策略

通过强化学习出现类似信念的表征

田纳西大学|随机旅行时间的无人机与卡车联合运输问题：一种强化学习方法

北京邮电大学|用于成本和延迟敏感的虚拟网络功能放置和路由的多智能体深度强化学习

UC Berkeley | 通过潜在意图从被动数据中进行强化学习

KDD2022 | 什么特征进行交互才是有效的？

自适应非欧表征广告检索系统AMCAD

站点公告

最新文章

随机网址

热门标签