标签:大模型
ChatGPT中文语料库
它能够生成类似于人类写作的文本。您只需要给出提示或提出问题,它就可以生成你想要的东西。在此页面中,您将找到可与 ChatGPT 一起使用的各种提示。只需按照...
a16Z:大模型应用程序的新兴架构
?智源社区日报关注订阅? 本文来自a16z分析,原文链接: https://a16z.com/2023/06/20/emerging-architectures-for-llm-applications/ 在这篇文章中,我们分享...
AssistGPT:可规划、执行、检查和学习的通用多模态助理
可规划、执行、检查和学习的通用多模态助理,解决复杂的视觉任务在多模态场景下的挑战,包括难以准确分解查询、灵活的输入和中间结果,提出一个多模态AI助手...
开源开放 | 开源知识图谱抽取工具发布大模型版DeepKE-LLM
该版本基于大模型对数据进行智能解析以实现知识抽取,DeepKE-LLM目前支持多个大模型如Llama系列模型(Alpaca、Linly等)、ChatGLM等(MOSS、CPM-Bee、Falcon...
谷歌DeepMind |Block-State Transformer
解决在处理长序列时,Transformer模型的计算效率和质量问题,尽管Transformer模型在语言建模任务上取得了显著的成果。但其运行时间与输入序列长度呈二次关系...
MetaAI发布第一个生成的人工智能语音模型Voicebox
这是第一个可以推广到语音生成任务的模型,以及执行降噪、内容编辑、样式转换和多样化的样本生成。生成语音人工智能需要使用精心准备的训练数据对每项任务进...
Jim Fan等|Nvidia创建Minecraft机器人,使用GPT-4来解决游戏中的问题
语言模型生成帮助代理探索游戏的目标:以及随着时间的推移提高机器人游戏技能的代码https。Voyager将尝试使用错误消息、游戏反馈和GPT-4生成的代码描述来完善...
MetaVL: 将上下文学习能力从语言模型迁移到视觉-语言模型
将上下文学习能力从语言模型迁移到视觉-语言模型,研究如何在视觉-语言领域实现上下文学习:将单模态的元学习知识转移到多模态中,以提高大规模预训练视觉-语...
离散扩散模型的引导方法:基于引导离散扩散的蛋白质设计
传统的蛋白质设计方法在优化离散序列方面存在困难,而现有的基于结构的方法也有数据稀缺和逆向设计的挑战。本文旨在提出一种离散扩散模型的引导方法:直接在...
大模型微调究竟需要多少数据
大型语言模型的训练分为从原始文本中进行无监督的预训练,只需要有限的指导微调数据就可以教会模型产生高质量的输出,在之前的文章《也谈大模型研发中的微调...