智源社区

电子科技大学|强化学习中有效利用的聚类经验回放

【推荐理由】强化学习通过利用不同决策产生的转换经验来训练智能体做出决策。大多数强化学习方法通​​过统一采样重放探索过的转换。很容易忽略最后探索的转换...

强化学习之父Richard Sutton论文:追寻智能决策者的通用模型

本文的想法是通过提出关于决策者的观点来加强和深化这一前提,这种观点在心理学、人工智能、经济学、控制理论和神经科学中具有实质性和广泛的应用,我称之为...

香港理工大学|数据高效的强化学习和网络流量动态的自适应最优周界控制

//www.sciencedirect.com/sdfe/reader/pii/S0968090X22001929/pdf【推荐理由】现有的数据驱动和反馈流量控制策略没有考虑实时数据测量的异构性。传统的交通控...

清华大学|稀疏奖励目标条件强化学习的阶段性自我模仿减少

【推荐理由】将监督学习 (SL) 的能力用于更有效的强化学习 (RL) 方法是最近的趋势,本文提出了一种新颖的阶段性方法,通过交替在线监督学习和离线强化学习来...

奥斯陆大学:Li Meng | 基于Swin-Transformer的深度强化学习

【论文链接】https”【推荐理由】Transformers是利用多层自注意力头的神经网络模型”Transformers近年来在自然语言处理任务上表现出了优异的性能。决策转换器已...

伯克利|Humans in 4D:基于Transformer的视频人体重建和跟踪

基于Transformer的视频人体重建和跟踪。提出了一种基于Transformer的网络架构HMR 2.0和综合的视频跟踪系统4DHumans:实现了高质量的人体重建和跟踪,并在动作...

伯克利&微软|用GPT-4进行可控的文本-图像生成

目前的文本到图像生成模型往往难以遵循文本指令,在生成代码片断以图形方式勾勒出文本输入方面表现出显著的精确性,用GPT-4生成的程序性草图来指导基于扩散的...

Transformers多模态学习综述

Transformers多模态学习综述,本文旨在对面向多模态数据的Transformer技术进行全面调研和综述。对多模态机器学习进行综述。包括Vanilla Transformer、Vision ...

CVPR 2023 Award Candidate | 自动驾驶通用算法框架UniAD

上海人工智实验室提出了自动驾驶通用算法框架——Unified Autonomous Driving(UniAD)。包括传感器技术、机器学习、路径规划等方面,大部分自动驾驶相关的工作...

NeRF原班人马打造Zip-NeRF,错误率降低 8%-76%,训练速度提高 22 倍

它可以利用几张静态图像生成多视角的逼真 3D 图像。一个神经网络被训练来模拟一个三维场景的体积表示,反复投射与训练图像中的像素对应的光线,并最小化(通...
1 42 43 44 45 46 60