大模型 | 第 21 页

使用自然语言学习编程

提出了一种使用自然语言作为编程语言的方法。让人类和大型语言模型都能轻松理解任务过程，提出了编程学习的方法来教导语言模型生成自然语言程序，论文的关键...

大模型

2年前 (2023)

使用自控记忆系统为大规模语言模型释放无限长度输入容量

论文旨在解决大型语言模型无法处理长文本输入的问题，提出了一种名为自控记忆系统（SCM）的解决方案。论文的关键思路是通过SCM系统解决大型语言模型无法处理...

大模型

2年前 (2023)

评估ChatGPT的信息提取能力：性能、可解释性、校准和忠实度的评估

本文聚焦于ChatGPT在各种信息抽取任务上的系统性评测，针对于7个细粒度信息抽取任务和14个数据集，从模型性能、可解释性、校准度和忠实度这四个角度，给出非...

大模型

2年前 (2023)

谷歌，手机上在12秒内呈现稳定的扩散图像

Stable Diffusion 在图像生成领域的知名度不亚于对话大模型中的 ChatGPT。并且由于设备上的计算和内存资源有限，在设备上运行这些模型可能会导致延迟增加，这...

大模型

2年前 (2023)

基于大型语言模型的语义压缩

本论文旨在探索利用大型语言模型（LLMs）进行近似压缩的可行性。并提出了两个新的度量标准来量化文本压缩和解压缩的语义准确性：论文还试图解决LLMs在处理大...

大模型

2年前 (2023)

符尧：我想为 MOSS 正名

是先前《拆解追溯 GPT-3.5 各项能力的起源》这篇文章的作者，是把模型训练得符合人类的期望：大部分已有的英文社区的开源模型并没有做中文 continue training...

大模型

2年前 (2023)

华盛顿大学&谷歌｜用更少数据和更小模型超越更大的语言模型

这篇论文旨在解决使用大型语言模型（LLMs）进行实际应用所面临的内存效率和计算效率问题，旨在通过利用更少的训练数据来训练比LLMs更小的模型。它在多任务训...

大模型

2年前 (2023)

AI Daily 深度见解｜05.04（大脑袋怎么说二期）

大脑袋怎么说：看他们怎么说，也看看他们怎么做 ? AI Daily 是一份由 AI 自动抓取、筛选、归纳的AI行业动态简报，每日定时推送，支持邮件、社群等渠道订阅。...

资讯

2年前 (2023)

AI Daily 深度见解｜05.03（开源大模型）

开源大模型：从一个大模型赢者通吃，到开源模型百花齐放还有很多机会，共识的切换，只需要一个月 ChatGPT引爆「向量数据库」赛道！两家公司共获10亿元融资文...

资讯

2年前 (2023)

AI Daily 深度见解｜05.01（大脑袋怎么说）

大脑袋怎么说张亚勤对话朱民：颠覆认知的AI时代及产业机遇研究院设立背景：张亚勤表示离开百度后一直想建立一个研究院，这个研究院应该从事基础研究，...

资讯

2年前 (2023)

标签：大模型

使用自然语言学习编程

使用自控记忆系统为大规模语言模型释放无限长度输入容量

评估ChatGPT的信息提取能力：性能、可解释性、校准和忠实度的评估

谷歌，手机上在12秒内呈现稳定的扩散图像

基于大型语言模型的语义压缩

符尧：我想为 MOSS 正名

华盛顿大学&谷歌｜用更少数据和更小模型超越更大的语言模型

AI Daily 深度见解｜05.04（大脑袋怎么说二期）

AI Daily 深度见解｜05.03（开源大模型）

AI Daily 深度见解｜05.01（大脑袋怎么说）

站点公告

最新文章

随机网址

热门标签