Insight Time预告｜决策大模型:一种通过无标签视频预训练的方法

强化学习2年前 (2023)发布智源社区

570 0 0

Hi朋友们，第3期Insight Time前沿技术交流分享会马上又要和大家见面了！

本期邀请的嘉宾是来自悉尼大学的在读博士生Yae同学，其研究方向为计算机视觉和强化学习，目前专注于离线强化学习及多智能体强化学习。

7月6日（周三）20:00-20:30记得锁定OpenDILab B站直播间哦！

Insight Time预告｜决策大模型:一种通过无标签视频预训练的方法

您将获得

了解决策AI大模型训练的基本原理
掌握大模型训练的监督、自监督学习技术应用于序列决策任务的创新思路
了解大型通用模型训练的更多应用性

本期Insight Time活动议程

2022年7月6日（周三）

20:00-20:30

Insight Time预告｜决策大模型:一种通过无标签视频预训练的方法

分享嘉宾

Insight Time预告｜决策大模型:一种通过无标签视频预训练的方法

分享主题

近年来，自然语言和计算机视觉的工作证明了模数据集上预训练大型的通用基础模型对于下游任务的有效性。然而对于序列决策任务，由于需要交互和大量无标签数据的特点，难以利用常用于的大模型训练的监督、自监督学习技术。

我们寻求通过利用可免费获得的互联网规模未标记视频数据集和简单的半监督模仿学习方法，将训练大型通用模型的范式扩展到序列决策领域。

往期回顾

错过的朋友们可以看下方第1期Insight Time分析会文字+视频实录哦！

第1期主题：

机器人技能模仿学习：高效示教下的机器人观测模仿学习方法

One more thing

我们在直播中专门设置了问答环节，您可以添加DI小助手微信，向小助手发送您想要和嘉宾交流的问题，我们会在直播中解答您的问题哦。

Insight Time预告｜决策大模型:一种通过无标签视频预训练的方法

向小助手发送信息：Insight Time

小助手可拉您进入OpenDILab交流大群哦～

Insight Time预告｜决策大模型:一种通过无标签视频预训练的方法

# 强化学习 # 智源社区 # 大模型 # 强化学习 # 数据集 # 视频 # 资讯

文章版权归作者所有，未经允许请勿转载。

Meta AI 开源1750亿参数大模型- OPT，FlagAI一键调用！

智源社区

1,048

谷歌DeepMind ｜Block-State Transformer

智源社区

734

结束与开始：为什么 NLP 中间层一定会消亡？

智源社区

541

马斯克机器人大进化！全新技能解锁，启用端到端神经网络

智源社区

510

谷歌｜面向弱监督学习的局部增强

智源社区

693

卡内基梅隆大学|AnyMorph：通过推断智能体形态来学习可转移策略

智源社区

522

暂无评论

暂无评论...

Insight Time预告｜决策大模型:一种通过无标签视频预训练的方法

您将获得

本期Insight Time活动议程

分享嘉宾

分享主题

往期回顾

One more thing

《强化学习周刊》第52期：Depth-CUPRL、DistSPECTRL & Double Deep Q-Network

在使用函数逼近的高效在线强化学习中，普适覆盖条件的可证明益处

相关文章

暂无评论

相关文章

热门标签

热门网址