大模型

参数数量非常庞大的深度神经网络或其他机器学习模型。

开源开放 | 开源知识图谱抽取工具发布大模型版DeepKE-LLM

该版本基于大模型对数据进行智能解析以实现知识抽取,DeepKE-LLM目前支持多个大模型如Llama系列模型(Alpaca、Linly等)、ChatGLM等(MOSS、CPM-Bee、Falcon...

谷歌DeepMind |Block-State Transformer

解决在处理长序列时,Transformer模型的计算效率和质量问题,尽管Transformer模型在语言建模任务上取得了显著的成果。但其运行时间与输入序列长度呈二次关系...

MetaAI发布第一个生成的人工智能语音模型Voicebox

这是第一个可以推广到语音生成任务的模型,以及执行降噪、内容编辑、样式转换和多样化的样本生成。生成语音人工智能需要使用精心准备的训练数据对每项任务进...

离散扩散模型的引导方法:基于引导离散扩散的蛋白质设计

传统的蛋白质设计方法在优化离散序列方面存在困难,而现有的基于结构的方法也有数据稀缺和逆向设计的挑战。本文旨在提出一种离散扩散模型的引导方法:直接在...

大模型微调究竟需要多少数据

大型语言模型的训练分为从原始文本中进行无监督的预训练,只需要有限的指导微调数据就可以教会模型产生高质量的输出,在之前的文章《也谈大模型研发中的微调...

斯坦福提出FrugalGPT|性能媲美GPT4,成本降低98%

成本和准确性之间的平衡是决策制定的关键因素。从而实现成本和环境上的权衡,最近的一项研究尝试提出解决这一成本问题的方法,该研究概述并讨论了用户可以利...

人机视频对话|Video-LLaMA多模态框架,使大型语言模型具备了理解视频内容的能力

面向视频理解的指令微调音频-视觉语言模型。为了赋予大型语言模型(LLM)理解视频中的视觉和听觉内容的能力:与之前关注静态图像理解的视觉-LLM不同:Video-LLa...

机器学习张量库,目前3.2k星

官网地址:http://ggml.ai:Github地址:https,//github.com/ggerganov/ggml。ggml.ai是一家由Georgi Gerganov创立的公司。旨在支持ggml的开发Nat Friedman和...

Meta AI研究者推出MUSICGEN

这是一种简单、可控的音乐生成模型,能在给定文本描述的情况下生成高质量的音乐。Meta的MusicGen可以根据文本提示生成简短的新音乐。就像语言模型预测句子中...

官方教程|CPM-Bee在基础任务上的高效微调

我们可以任意设计字典中的键值对来表达我们希望模型做的事情;同时预留一个<,用于存储模型给出的答案;{'some_key';尽管输入数据的格式是任意的:{'input';'...
1 6 7 8 9 10 15