智源社区

一键生成山川、河流,风格多样,从2D图像中学习生成无限3D场景

3D 内容创作的最终目标将是从海量的互联网二维图像中学习三维生成模型,最近关于三维感知生成模型的工作在一定程度上解决了这个问题。专注于从海量无标注自然...

追踪一切:基于Segment Anything的视频目标追踪和分割,已1.1k stars

这篇论文旨在解决Segment Anything Model (SAM)在视频中表现不佳的问题:该论文的关键思路是通过交互式设计实现视频对象跟踪和分割。该模型的交互设计在视频...

从39个Kaggle竞赛中总结出来的图像分割的Tips和Tricks

使用0.5的阈值对3D分割进行聚类,使用DoG(Difference of Gaussian)方法进行blob检测。使用基于patch的输入进行训练,使用cudf加载数据。使用对比度限制;使...

IEEE Spcetrum | 在寻找人类智能AI的道路上,Meta将宝押向了自监督学习

我们希望构建出能像动物和人类一样进行学习的智能机器“内容涉及到一种用于AI系统的自监督学习(SSL)。人工智能系统从标记的数据集中进行学习(标签就像教师...

从1小时到3.5分钟,Meta新算法一部手机搞定3D人脸数据采集,可用于VR的那种

就足以生成高保真、可驱动的真实3D人脸头像。是要用大型多视角人脸数据集训练一个超网络,这个超网络可以通过神经网络解码器产生专属于个人的头像参数。数据...

北大博士王逸之:面向文字的图形图像生成方法及其应用

王逸之,2022年6月毕业于北京大学王选计算机研究所,获得博士学位,导师连宙辉副教授。

SSSUP|人工智能体冲突抑制决策任务中的脑启发元强化学习认知控制

//www.sciencedirect.com/science/article/pii/S0893608022002350【推荐理由】人类实际情景中的冲突和意想不到的变化可能不利于人工智能体执行任务,应用于强...

ECCV 2022 | PEBAL:用于城市自动驾驶系统的异常分割模型

本文研究如何有效利用abstain learning来有效检测城市自动驾驶系统中经常遭遇的异常物体,其提出PEBAL:一个融合像素级别弃权学习abstention learning 和能量...

麦吉尔大学| ICML 2022: 顺序决策的效用理论

决策被简化为最大化某些效用函数的期望,本文将这些公理扩展到越来越结构化的顺序决策设置。并确定相应效用函数的结构,无记忆偏好会以每次转换奖励和未来回...

MAE入局多模态分析,CMU联合微软发布仅需文本监督的视觉语言新模型VLC

视觉语言Transformer(Vision-Language Transformers)一直是多模态领域中的重要研究话题。但是现有的关于视觉语言Transformer的工作仍然需要先在ImageNet上...
1 48 49 50 51 52 60