CV的未来是图神经网络？中科院软件所发布全新CV模型ViG，性能超越ViT

871 0 0

论文标题：Vision GNN: An Image is Worth Graph of Nodes

论文链接：https://arxiv.org/pdf/2206.00272.pdf

首先需要将图像分割成若干个patch作为图中的节点，并通过连接最近的邻居patch构建一个graph，然后使用ViG模型对整个图中所有节点的信息进行变换（transform）和交换（exchange）。

ViG 由两个基本模块组成，Grapher模块用graph卷积来聚合和更新图形信息，FFN模块用两个线性层来变换节点特征。

在图像识别和物体检测任务上进行的实验也证明了ViG架构的优越性，GNN在一般视觉任务上的开创性研究将为未来的研究提供有益的启发和经验。

CV的未来是图神经网络？中科院软件所发布全新CV模型ViG，性能超越ViT

文章版权归作者所有，未经允许请勿转载。

智源社区

1,023

智源社区

771

智源社区

1,126

智源社区

840

智源社区

912

智源社区

930

暂无评论

暂无评论...