视觉 | 第 2 页

北大、斯坦福、Pika新研究：“文生图”好过DALL·E 3和SDXL

北大、斯坦福、Pika最新研究表明，“文生图”比DALL·E 3和SDXL更好玩的AI。该研究使用了官方媒体和网络新闻的10个素材来源，发表于2024年1月26日。

智源社区

1年前 (2024)

解密炒虾机器人远程控制技术：动捕手套/隔空取物/VR远程，都能训练机器人

斯坦福大学的炒菜机器人和ALOHA炒虾机器人在网络上引起了轰动，但机器人的自主能力仍有限，需要人工干预。Jim Fan分享了三个未来的技术方向，以提高机器人的...

智源社区

1年前 (2024)

大模型的商业价值来自AI原生应用体验的质变｜百度@MEET2024

百度AI技术生态总经理马艳军在MEET2024智能未来大会上介绍了知识增强大语言模型和围绕大模型建设的生态以及未来发展趋势。他认为大模型给应用体验带来了质的...

智源社区

1年前 (2024)

AI在操作系统里复制自己，这一天还是来了

AI在操作系统中启动自己的副本，通过多模态大模型判断屏幕上正在发生什么，生成下一步操作计划，并调用系统接口执行任务。这是AI复制自己的雏形。

智源社区

1年前 (2024)

新加坡国立大学提出Fus-MAE | 解决跨模态问题

文中，介绍了自监督表示学习框架在遥感和传感器社区中的应用，探讨了其减轻制作大型卫星图像数据集的高昂标签成本的潜力。同时，提出了基于Mask图像建模的预...

智源社区

1年前 (2024)

AI机器人席卷CES！OpenAI暗自解除ChatGPT军事应用限制，天网来了？

在CES 2024上，各种机器人展示了它们的技能，包括制作咖啡和按摩等。然而，OpenAI悄悄删除了ChatGPT用于军事和战争的限制，引起了网友的惊讶。这表明机器人技...

智源社区

1年前 (2024)

澜舟科技创始人&CEO周明当选 “2023年度 ACL Fellow”

澜舟科技创始人&CEO周明博士成为2023年度ACL Fellow名单中唯一入选的华人，该奖项旨在表彰对NLP领域做出杰出贡献的ACL成员。周明博士因为在机器翻译、语言学...

智源社区

1年前 (2024)

Nat. Mach. Intell. | 化学反应预训练和条件分子生成之间的联系

本，但现有方法难以捕捉和利用化学反应规律。Bo Huang和Zhenming Liu团队提出了一个全新的计算框架，能够学习和理解化学反应，并基于此生成新的分子结构，对...

智源社区

1年前 (2024)

使用新的ONNX导出器简化模型导出

摘要：ONNX是一种通用的机器学习模型表示和交换格式，可以在不同的框架和设备之间转换模型。新的ONNX Exporter解决了旧Exporter的限制，例如不能处理动态图和...

智源社区

1年前 (2024)

Sam Altman抛出2023年终总结，17大箴言引全网共振！

2023年即将结束，2024年展望。Sam Altman分享了17个建议。ChatGPT横空出世后掀起全球AI热潮，大模型层出不穷，颠覆生活。Altman表示感激OpenAI团队向世界推出...

智源社区

1年前 (2024)

标签：视觉

北大、斯坦福、Pika新研究：“文生图”好过DALL·E 3和SDXL

解密炒虾机器人远程控制技术：动捕手套/隔空取物/VR远程，都能训练机器人

大模型的商业价值来自AI原生应用体验的质变｜百度@MEET2024

AI在操作系统里复制自己，这一天还是来了

新加坡国立大学提出Fus-MAE | 解决跨模态问题

AI机器人席卷CES！OpenAI暗自解除ChatGPT军事应用限制，天网来了？

澜舟科技创始人&CEO周明当选 “2023年度 ACL Fellow”

Nat. Mach. Intell. | 化学反应预训练和条件分子生成之间的联系

使用新的ONNX导出器简化模型导出

Sam Altman抛出2023年终总结，17大箴言引全网共振！

站点公告

最新文章

随机网址

热门标签