视觉

是机器学习的范式和方法论之一,是智能体与环境不断交互,从而不断强化自己的决策能力的过程

SIGGRAPH | 6个惯性传感器和1个手机实现人体动作捕捉、定位与环境重建

人体运动和环境的组合感知对于人类与环境互动的场景非常重要,人体和环境同时感知可以实现更高级别的人机交互,清华大学徐枫团队提出了仅使用6个惯性传感器(...

Stable Diffusion「文生动画」Stable Animation SDK发布

Stability AI也有比肩Gen-2的视频生成工具了!美术师可以使用所有Stable Difusion模型来生成动画。Stable Animation目前仅能通过SDK和付费API使用,而是仅提...

Relightify: 基于扩散模型从单幅图像建模可重打光3D人脸

介绍了一种通过扩散模型实现从单幅图像中重建可打光的3D人脸模型的方法。取得了在纹理补全和反射率重建方面的优越性能,基于扩散模型从单幅图像建模可重打光3D...

DreamFace:只需文本即可生成「超写实3D数字人」

随着大型语言模型(LLM)、扩散(Diffusion)等技术的发展,Google、NVIDIA和微软相继推出了自己的3D生成工作,即使通过传统方案将其转换为Mesh表达的几何和...

借力计算机视觉及深度学习,纽卡斯尔大学开发实时、自动化奶牛跛行检测系统

纽卡斯尔大学联合费拉科学有限公司联合开发了一个针对多头奶牛的自动化、实时跛行检测系统。该系统能够按照跛行评分系统将奶牛进行分类,来自纽卡斯尔大学的 ...

MinD-Video|读取大脑重建高清视频,Stable Diffusion

但以往的研究都主要聚焦在重建静态图像,而以高清视频形式来展现的工作还是较为有限。而fMRI这项技术的本质是测量血氧水平依赖(BOLD)信号,这项任务的难点...

微软等|基于可组合扩散的Any-to-An的生成

CoDi是一种创新的多模态生成模型:能自由生成任意组合的输出模态。并在生成质量方面超越或与单模态合成的最先进方法持平,开发一种能生成任意组合输出形式(如...

DragGAN模型|运动监督和点跟踪,点鼠标交互即可实现P图

本篇论文旨在解决生成对抗网络(GAN)中控制生成图像的问题”实现用户交互式精确控制生成图像的姿态、形状、表情和布局。DragGAN在图像操纵和点跟踪任务中优于...

拖动你的GAN:基于交互式点的操作生成图像流形

本篇论文旨在解决生成对抗网络(GAN)中控制生成图像的问题“实现用户交互式精确控制生成图像的姿态、形状、表情和布局:利用辨别式生成器特征来不断定位手柄...

AutoRecon:全自动化框架,3D目标发现与重建的自动化

用于从多视角图像中发现和重建无背景的物体模型:3D目标发现与重建的自动化。在数字内容创作中,全自动目标重建流程至关重要。尽管3D重建领域取得了深远的发...
1 8 9 10 11 12