智源社区

大模型的最大bug!回答正确率几乎为零,GPT到Llama无一幸免

近乎为零,甚至还会给出完全错误的答案。这个现象被称为逆转诅咒,是指当模型在训练过程中接收到的数据具有一定的规律性时,模型会过度依赖这些规律性,从而...

澜舟科技与潞晨科技签署战略合作协议,联手打造更高效的企业级大模型解决方案

北京澜舟科技与北京潞晨科技达成战略合作协议,旨在共同推动人工智能在行业垂直领域的应用,为行业头部及标杆企业打造专属的垂直人工智能大模型产品和服务。...

Writer模型开源,可商用,共8个模型

Writer在huggingface上开源了大语言模型Palmyra,有8个型号可商用,支持数据微调。Palmyra的技术亮点包括参数小功能强,接受过商业写作、营销数据训练,主要...

大模型的本质及其在游戏行为分析中的应用

本期「中国游戏企业出海周周谈」分享游戏领域内的数据治理、游戏自动化开发、基于LLMs的行为分析新思路等干货内容,分享嘉宾来自完美世界、37手游、亚马逊云...

耶鲁大学|教大型自然语言模型掌握生物学语言Cell2Sentence

Cell2Sentence is a method for representing single-cell gene expression data as text sequences, called 'cell sentences,' that can be applied to tran...

LongLoRA:长上下文大语言模型的高效微调

本文提出了一种名为LongLoRA的高效微调方法,可以扩展预训练大语言模型的上下文长度,同时降低计算成本。LongLoRA使用移位短注意力来逼近完整的注意力,并通...

数学能力超过ChatGPT!上海交大计算大模型登开源榜首

上海交大GAIR实验室开发的Abel大模型已经成为国产数学大模型中的佼佼者,准确率高达83.6%,在开源模型中排名第一。该模型以挪威数学家尼尔斯·阿贝尔的名字命...

澜舟科技作为首批成员加入中国信通院可信开源大模型产业推进方阵

2023年9月21日,中国信通院和中国通信标准化协会联合主办的“2023 OSCAR开源产业大会”在北京举行。会议上,近十家企业、高校和科研机构展示了他们在开源产业领...

58标签体系建设实践

本文介绍了58标签体系建设实践,包括痛点及标签建设方案、标签体系和标签管理平台三个模块。文章探讨了业务在何时需要建立标签体系,并分享了相关的建设方案...

多模态大模型最全综述来了!7位微软研究员大力合作,5大主题,成文119页

AI助手总结出的摘要如下:微软华人研究员撰写的综述总结了多模态大模型的研究方向,包括视觉理解、视觉生成、统一视觉模型LLM加持的多模态大模型、多模态agen...
1 11 12 13 14 15 60