标签:大模型

澜舟科技与潞晨科技签署战略合作协议,联手打造更高效的企业级大模型解决方案

北京澜舟科技与北京潞晨科技达成战略合作协议,旨在共同推动人工智能在行业垂直领域的应用,为行业头部及标杆企业打造专属的垂直人工智能大模型产品和服务。...

Writer模型开源,可商用,共8个模型

Writer在huggingface上开源了大语言模型Palmyra,有8个型号可商用,支持数据微调。Palmyra的技术亮点包括参数小功能强,接受过商业写作、营销数据训练,主要...

大模型的本质及其在游戏行为分析中的应用

本期「中国游戏企业出海周周谈」分享游戏领域内的数据治理、游戏自动化开发、基于LLMs的行为分析新思路等干货内容,分享嘉宾来自完美世界、37手游、亚马逊云...

耶鲁大学|教大型自然语言模型掌握生物学语言Cell2Sentence

Cell2Sentence is a method for representing single-cell gene expression data as text sequences, called 'cell sentences,' that can be applied to tran...

LongLoRA:长上下文大语言模型的高效微调

本文提出了一种名为LongLoRA的高效微调方法,可以扩展预训练大语言模型的上下文长度,同时降低计算成本。LongLoRA使用移位短注意力来逼近完整的注意力,并通...

数学能力超过ChatGPT!上海交大计算大模型登开源榜首

上海交大GAIR实验室开发的Abel大模型已经成为国产数学大模型中的佼佼者,准确率高达83.6%,在开源模型中排名第一。该模型以挪威数学家尼尔斯·阿贝尔的名字命...

澜舟科技作为首批成员加入中国信通院可信开源大模型产业推进方阵

2023年9月21日,中国信通院和中国通信标准化协会联合主办的“2023 OSCAR开源产业大会”在北京举行。会议上,近十家企业、高校和科研机构展示了他们在开源产业领...

中文LLaMA-2刷榜,开源可商用!千元预算,训练半天,效果媲美主流大模型

LLaMA-2是一种中文汉化模型,经过15小时的训练和数千元的算力,其性能超过同级别的模型。相较于LLaMA-1,LLaMA-2引入更多高质量的语料,实现了显著的性能提升...

清华系大模型公司聆心智能发布 CharacterGLM:玩转 AI 角色扮演,6B 模型已开源

聆心智能团队开发了CharacterGLM,用于实现千人千面的社交对象的可定制化。该模型以ChatGLM模型为底座,具有不同参数量。团队将对社会开放12B和66B模型的API...

再看多语种大模型预训数据如何清洗:兼论文档结构信息对大模型问答的重要性及实现思路

本文讨论了在RAG行业文档问答中利用文档结构的方法。传统大模型在文档问题解答方面存在问题,因为文档无法在较小上下文长度内完成。现有工作侧重于从文档中检...
1 2 3 4 5 23