标签:开源
复杂推理:大语言模型的北极星能力
这意味着复杂任务很可能是大型和小型语言模型的关键差异因素”复杂推理为基于语言模型构建大量应用程序提供了机会,我们将仔细分析讨论如何让大语言模型拥有强...
小羊驼Vicuna团队新作:Chatbot Arena——实际场景用Elo rating对 LLM 进行基准测试
采用匿名、随机的方式进行对抗评测,评测方式基于国际象棋等竞技游戏中广泛使用的 Elo rating system。平台采用 FastChat 多模型服务系统,在多个语言下提供...
AutoML-GPT:基于GPT的自动机器学习
这篇论文试图解决的问题是如何自动化机器学习的训练过程。论文还试图验证利用大型语言模型(LLMs)自动化训练的可行性:解决人工挑选模型架构、优化算法和超...
爱可可AI前沿推介(7.5)
以前所未有的规模实现Transformer模型的高效推断、基于扩散模型的语义图像合成、面向导航的视觉预训练、Epinet对分布漂移的鲁棒性、对记忆训练样本遗忘情况的...
Meta AI 开源1750亿参数大模型- OPT,FlagAI一键调用!
OPT系列模型包括了多组不同参数规模的模型权重:FlagAI对OPT不同版本的模型进行了兼容,并给出使用FlagAI快速加载OPT模型示例代码!OPT与GPT系列模型均采用了...
微软|MLCopilot:释放大型语言模型在解决机器学习任务中的能力
利用最先进的语言模型(即LLMs为新型机器学习任务开发机器学习解决方案,该研究展示了LLM扩展到理解结构化输入和执行彻底推理的可能性,本篇论文旨在解决机器...
PMC-LLaMA: 用医学论文微调LLaMA
本文提出一种基于生物医学文献的预训练语言模型PMC-LLaMA,大型语言模型(LLMs)由于缺乏领域特定知识而表现不佳的问题,作者通过在4.8百万篇生物医学论文上...
KnowledgeGPT:从各种信息源中提取知识并使用GPT-3生成答案
用于从各种信息源中提取知识并使用OpenAI的GPT-3模型生成答案的工具。支持从互联网、本地数据、YouTube字幕和音频等各种信息源中提取文本。OpenAI的GPT-3模型...
AudioGPT:理解和生成语音、音乐、声音和说话人头像
以处理复杂的音频信息和支持口头对话:在多轮对话中展现出强大的音频理解和生成能力。这篇论文的目标是解决当前大型语言模型(LLMs)无法处理复杂音频信息或...
复旦大学 MOSS 大模型今日开源:超 100 万条对话训练数据
成为国内首个插件增强的开源对话语言模型。打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径,基座模型在约110万多轮对话数据上微调得到:基...