标签:论文
微软|PICL预训练上下文能力,比大型语言模型表现更好
该论文旨在通过提出一种新的框架PICL来增强语言模型的上下文学习能力。该论文的关键思路是通过在通用纯文本语料库上使用简单的语言建模目标来对模型进行预训...
大型语言-视觉模型的视觉提示工程
大型语言-视觉模型的视觉提示工程,研究如何让计算机视觉模型更好地理解图像,通过在图像上标记(比如画圈)的方式来引导模型更好地理解图像。从而在一些任务上...
OpenAI发布文字生成3D模型Shap.E
这使得生成的3D模型可以通过多种方式渲染或导入其他3D应用程序:为了提高3D生成模型的效率和多样性:直接生成可渲染为纹理网格和神经辐射场的参数:他们在编...
一键生成山川、河流,风格多样,从2D图像中学习生成无限3D场景
3D 内容创作的最终目标将是从海量的互联网二维图像中学习三维生成模型,最近关于三维感知生成模型的工作在一定程度上解决了这个问题。专注于从海量无标注自然...
追踪一切:基于Segment Anything的视频目标追踪和分割,已1.1k stars
这篇论文旨在解决Segment Anything Model (SAM)在视频中表现不佳的问题:该论文的关键思路是通过交互式设计实现视频对象跟踪和分割。该模型的交互设计在视频...
从1小时到3.5分钟,Meta新算法一部手机搞定3D人脸数据采集,可用于VR的那种
就足以生成高保真、可驱动的真实3D人脸头像。是要用大型多视角人脸数据集训练一个超网络,这个超网络可以通过神经网络解码器产生专属于个人的头像参数。数据...
SSSUP|人工智能体冲突抑制决策任务中的脑启发元强化学习认知控制
//www.sciencedirect.com/science/article/pii/S0893608022002350【推荐理由】人类实际情景中的冲突和意想不到的变化可能不利于人工智能体执行任务,应用于强...
ECCV 2022 | PEBAL:用于城市自动驾驶系统的异常分割模型
本文研究如何有效利用abstain learning来有效检测城市自动驾驶系统中经常遭遇的异常物体,其提出PEBAL:一个融合像素级别弃权学习abstention learning 和能量...
麦吉尔大学| ICML 2022: 顺序决策的效用理论
决策被简化为最大化某些效用函数的期望,本文将这些公理扩展到越来越结构化的顺序决策设置。并确定相应效用函数的结构,无记忆偏好会以每次转换奖励和未来回...
MAE入局多模态分析,CMU联合微软发布仅需文本监督的视觉语言新模型VLC
视觉语言Transformer(Vision-Language Transformers)一直是多模态领域中的重要研究话题。但是现有的关于视觉语言Transformer的工作仍然需要先在ImageNet上...