Loading...

CV的未来是图神经网络?中科院软件所发布全新CV模型ViG,性能超越ViT

图神经网络1年前 (2023)发布 智源社区
515 0 0

论文标题:Vision GNN: An Image is Worth Graph of Nodes

论文链接:https://arxiv.org/pdf/2206.00272.pdf

首先需要将图像分割成若干个patch作为图中的节点,并通过连接最近的邻居patch构建一个graph,然后使用ViG模型对整个图中所有节点的信息进行变换(transform)和交换(exchange)。

ViG 由两个基本模块组成,Grapher模块用graph卷积来聚合和更新图形信息,FFN模块用两个线性层来变换节点特征。

在图像识别和物体检测任务上进行的实验也证明了ViG架构的优越性,GNN在一般视觉任务上的开创性研究将为未来的研究提供有益的启发和经验。

CV的未来是图神经网络?中科院软件所发布全新CV模型ViG,性能超越ViT

CV的未来是图神经网络?中科院软件所发布全新CV模型ViG,性能超越ViT

© 版权声明

相关文章

暂无评论

暂无评论...