智源社区

谷歌，手机上在12秒内呈现稳定的扩散图像

Stable Diffusion 在图像生成领域的知名度不亚于对话大模型中的 ChatGPT。并且由于设备上的计算和内存资源有限，在设备上运行这些模型可能会导致延迟增加，这...

大模型

2年前 (2023)

本论文旨在探索利用大型语言模型（LLMs）进行近似压缩的可行性。并提出了两个新的度量标准来量化文本压缩和解压缩的语义准确性：论文还试图解决LLMs在处理大...

大模型

2年前 (2023)

是先前《拆解追溯 GPT-3.5 各项能力的起源》这篇文章的作者，是把模型训练得符合人类的期望：大部分已有的英文社区的开源模型并没有做中文 continue training...

大模型

2年前 (2023)

这篇论文旨在解决使用大型语言模型（LLMs）进行实际应用所面临的内存效率和计算效率问题，旨在通过利用更少的训练数据来训练比LLMs更小的模型。它在多任务训...

大模型

2年前 (2023)

1 … 58 59 60

这是一个专注于人工智能产品的导航站。