智源社区
CLIP再创辉煌!西南交大&MSRA提出CLIP4Clip,进行端到端的视频文本检索!
视频文本检索在多模态研究中起着至关重要的作用,CLIP(对比语言图像预训练)是一种图像语言预训练模型,它展示了从网络收集的图像文本数据集中学习视觉概念...
神经网络模型相似性:功能和表征相似性度量方法综述
提供了对神经网络模型的功能和表征相似性度量方法的全面概述。并讨论了其属性、应用和开放研究问题,功能和表征相似性度量方法综述,测量神经网络的相似性已成...
KDD 2022 | 图“预训练、提示、微调”范式下的图神经网络泛化框架
解决由传统 GNN 预训练中 Pretext 任务与下游任务之间内在训练目标差距导致的难以引出预训练的图知识、负迁移的问题。图神经网络 (GNNs) 已经成为许多现实世...
ICML2022 | 可扩展深度高斯马尔可夫随机场
图上的机器学习方法在许多应用中已经被证明是有用的。因为它们能够处理一般结构化数据,高斯马尔可夫随机场(GMRFs)框架提供了一种原则性的方法。利用图的稀疏...
MMCU@中文通用大语言模型测试集预发布
但却一直没有出现可应用于评测大模型能力的测试。甲骨易AI研究院提出一种衡量中文大模型处理多任务准确度的测试,并在此基础上制作了一套适配测试中文大模型...
填补国产空白!首个联网支持中文问答开源模型WebCPM
面壁智能联合来自清华、人大、腾讯的研究人员共同发布了 中文领域首个基于交互式网页搜索的问答开源模型框架WebCPM,能够像人类一样与搜索引擎交互从而收集回...
悟透Transformer–AI是如何学习扑克牌排序的(一)
人工智能的各个领域(自然语言处理、计算机视觉等)是兄弟爬山,每个领域都有自己的模型框架。作为一种具有更高普适性的AI模型架构,但绝大部分是从谷歌的原...
大模型自学使用工具(Toolformer)|OpenBMB论文速读第 7 期
本期论文速读带大家了解如何驱动语言模型去使用简单的模型来调用外部的工具——Toolformer:驱动语言模型去使用简单的模型来调用外部的工具,Toolformer 通过语...
评估大型视觉语言模型中的物体幻觉
该论文旨在研究大规模视觉语言模型(LVLM)中的对象幻觉问题。发现它们大多数存在严重的对象幻觉问题,该论文的主要新意在于针对LVLM中的对象幻觉问题提出了...
LaWGPT:基于中文法律知识的大语言模型
构造法律领域对话问答数据集、中国司法考试数据集进行指令精调,该项目基于中文裁判文书网公开法律文书数据、司法考试数据等数据集开展实验:1)中国法律智能...