Loading...

Insight Time预告|决策大模型:一种通过无标签视频预训练的方法

强化学习2年前 (2023)发布 智源社区
489 0 0

Insight Time预告|决策大模型:一种通过无标签视频预训练的方法

Hi朋友们,第3期Insight Time前沿技术交流分享会马上又要和大家见面了!

本期邀请的嘉宾是来自悉尼大学的在读博士生Yae同学,其研究方向为计算机视觉和强化学习,目前专注于离线强化学习及多智能体强化学习。

7月6日(周三)20:00-20:30记得锁定OpenDILab B站直播间哦!

Insight Time预告|决策大模型:一种通过无标签视频预训练的方法

您将获得

  • 了解决策AI大模型训练的基本原理

  • 掌握大模型训练的监督、自监督学习技术应用于序列决策任务的创新思路

  • 了解大型通用模型训练的更多应用性

本期Insight Time活动议程

2022年7月6日(周三)

20:00-20:30

Insight Time预告|决策大模型:一种通过无标签视频预训练的方法

分享嘉宾

Insight Time预告|决策大模型:一种通过无标签视频预训练的方法

分享主题

近年来,自然语言和计算机视觉的工作证明了模数据集上预训练大型的通用基础模型对于下游任务的有效性。然而对于序列决策任务,由于需要交互和大量无标签数据的特点,难以利用常用于的大模型训练的监督、自监督学习技术。

我们寻求通过利用可免费获得的互联网规模未标记视频数据集和简单的半监督模仿学习方法,将训练大型通用模型的范式扩展到序列决策领域。

往期回顾

错过的朋友们可以看下方第1期Insight Time分析会文字+视频实录哦!

第1期主题:

机器人技能模仿学习:高效示教下的机器人观测模仿学习方法

One more thing

我们在直播中专门设置了问答环节,您可以添加DI小助手微信,向小助手发送您想要和嘉宾交流的问题,我们会在直播中解答您的问题哦。

Insight Time预告|决策大模型:一种通过无标签视频预训练的方法

向小助手发送信息:Insight Time

小助手可拉您进入OpenDILab交流大群哦~

Insight Time预告|决策大模型:一种通过无标签视频预训练的方法

© 版权声明

相关文章

暂无评论

暂无评论...