大模型

The Shaped Transformer：无限深度和宽度限制下的注意力模型

无限深度和宽度限制下的注意力模型。随着Transformer模型的成功：本文研究了一个修改过的基于Softmax的注意力模型在无限深度和宽度比例限制下的协方差矩阵，...

大模型

2年前 (2023)

ChatGPT机器人应用：设计原则和模型能力

对OpenAI的ChatGPT在机器人应用中的使用进行实验研究。概述了一种结合提示工程设计原则和创建高级函数库的策略：使ChatGPT能够适应不同的机器人任务、模拟器...

大模型

2年前 (2023)

Statler: 面向具身推理的状态维持语言模型

面向具身推理的状态维持语言模型，大型语言模型(LLM)为机器人执行复杂的推理任务提供了有希望的工具，现代LLM的有限上下文窗口使得在长时间范围内进行推理变...

大模型

2年前 (2023)

谷歌｜大语言模型是有效的成对排序提示文本排序器

大语言模型是有效的成对排序提示文本排序器，尽管大型语言模型(LLM)在许多自然语言任务中表现出了令人印象深刻的性能。但是在重要的文本排名问题上，以改善LL...

大模型

2年前 (2023)

语言大模型的进化轨迹

ChatGPT的发布是语言大模型（LLM）发展史的转折点，该企业创建由LLM提供支持的自定义NLP模型，并领导了自动学习工具、用户友好的深度学习框架以及各种机器学...

大模型

2年前 (2023)

苹果AI领导者Ali Farhadi加入艾伦人工智能研究所，任首席执行官

他将重新加入总部位于西雅图的艾伦人工智能研究所（AI2）。后者在近十年前被已故微软联合创始人Paul Allen选中推出了AI2。并表示他将继续担任AI2孵化器的董事...

大模型

2年前 (2023)

GPT-Engineer｜提需求即可生成整个代码库，已20K星

创建一个软件项目就像和好友聊天一样简单，生成的技术非常规范；用户可以添加推理步骤，用户可以使用高级提示，GPT-Engineer 会询问一些用户输入的比较模糊的...

大模型

2年前 (2023)

吴恩达来信：AI的民主化

?智源社区日报关注订阅? Dear friends, AI risks are in the air — from speculation that AI, decades or centuries from now, could bring about human ext...

大模型

2年前 (2023)

斯坦福发布最新大模型排行榜AlpacaEval，微软WizardLM登顶开源模型第一

?智源社区日报关注订阅? 来自斯坦福的团队，发布了一款LLM自动评测系统——AlpacaEval，以及对应的AlpacaEval Leaderboard。这个全新的大语言模型排行榜 Alpac...

大模型

2年前 (2023)

伯克利开源LLM推理与服务库：GPU减半、吞吐数十倍猛增

?智源社区日报关注订阅? 加州大学伯克利分校的研究者开源了一个项目 vLLM，该项目主要用于快速 LLM 推理和服务。vLLM 的核心是 PagedAttention，这是一种新颖...

大模型

2年前 (2023)

The Shaped Transformer：无限深度和宽度限制下的注意力模型

ChatGPT机器人应用：设计原则和模型能力

Statler: 面向具身推理的状态维持语言模型

谷歌｜大语言模型是有效的成对排序提示文本排序器

语言大模型的进化轨迹

苹果AI领导者Ali Farhadi加入艾伦人工智能研究所，任首席执行官

GPT-Engineer｜提需求即可生成整个代码库，已20K星

吴恩达来信：AI的民主化

斯坦福发布最新大模型排行榜AlpacaEval，微软WizardLM登顶开源模型第一

伯克利开源LLM推理与服务库：GPU减半、吞吐数十倍猛增

站点公告

最新文章

随机网址

热门标签