智源社区
SIGKDD22|图“预训练、提示、微调”范式下的图神经网络泛化框架
解决由传统GNN预训练中Pretext任务与下游任务之间内在训练目标差距导致的难以引出预训练的图知识、负迁移的问题,图神经网络(GNNs)已经成为许多现实世界系统...
【ICML2022】利用虚拟节点促进图结构学习
随着图核和图表示学习的发展,人们提出了许多更好的方法来处理图结构学习中的可伸缩性和过平滑问题。我们使用一个特定的虚拟节点连接到所有现有的顶点,而不...
OpenBMB 对齐技术 UltraLM 登顶斯坦福 Alpaca-Eval 开源模型榜单
最近,UltraLM-13B 在斯坦福大学 Alpaca-Eval 榜单中位列 开源模型榜首,是 唯一一个得分在 80 以上的开源模型。 ChatGPT 之后,开源社区内复现追赶 ChatGPT ...
能「说」会「画」, VisCPM:SOTA 开源中文多模态大模型
最近,清华大学 NLP实验室、面壁智能、知乎联合在OpenBMB开源多模态大模型系列VisCPM ,评测显示, VisCPM 在中文多模态开源模型中达到最佳水平。 VisCPM 是...
CPM-Bee 开源满月|已飞入数十家企业,欢迎更多商用申请
我们同时开放了商业使用的授权申请通道。超过40家企业已被授权对CPM-Bee 10B开源大模型进行合法有效的商业使用。商用申请方包括同方知网数字出版技术股份有限...
一家380亿美元的数据巨头,要掀起企业「AI 化」革命
如何用更快的速度让大模型和现有产品整合,也可以直接使用自然语言查询和分析数据,企业将大模型部署到云端数据库将越来越容易。直接使用成品大模型工具分析...
马里兰大学等|指令微调的可利用性研究
研究了如何通过在训练数据中注入特定的指令遵循示例,来利用指令微调技术改变大型语言模型(LLM)的行为。攻击者可以通过注入提及目标内容的训练示例,提出一个...
高清还原你大脑中的画面
尤其是文本到图像生成方面取得了重大突破:这种「思维到图像」的生成方式有着广阔的应用前景。利用预训练的文本到图像模型(比如 Stable Diffusion)强大的生...
Statler:面向具身推理的状态维持语言模型
面向具身推理的状态维持语言模型,大型语言模型(LLM)为机器人执行复杂的推理任务提供了有希望的工具,现代LLM的有限上下文窗口使得在长时间范围内进行推理变...
北大法律大模型ChatLaw
致力于提供普惠的法律服务。无法运用法律武器保护自己。大语言模型最近的崛起正好为普通人以对话方式咨询法律相关问题提供了一个绝佳契机。逻辑复杂的法律问...