关于大型语言模型的争论和局限
以色列巴伊兰大学教授Yoav Goldberg分享了他对大型语言模型的能力和局限性的看法,围绕完美语言建模可以达到人类智能程度这一主题:玩这个游戏意味着要解决AI...
谷歌|SLiC-HF方法反馈矫正有效信息
基于人工反馈的序列似然校准:通过利用人工反馈数据进行序列似然校准:SLiC-HF方法提供了一种简单高效的方式来提升语言模型性能,通过学习人工反馈来对齐语言...
谷歌&斯坦福|DoReMi方法优化预训练数据领域的混合比例,加速大模型语言训练
这篇论文旨在解决语言模型预训练中数据混合比例对性能的影响问题,利用分组分布式鲁棒优化(Group DRO)训练小型代理模型来生成领域权重(混合比例)。该方法...
Stability AI发布DreamStudio的开源版本
Stability AI正在发布DreamStudio的开源版本,这是该公司AI图像生成器模型Stable Diffusion的商业接口。制作DreamStudio的开源版本对稳定性人工智能有好处”它...
70 款 ChatGPT 插件评测(含样例分析)
开发者仅使用自然语言就可以开发ChatGPT插件。
CodeT5+:非常灵活的、面向代码理解和生成的开放大型代码语言模型
面向代码理解和生成的开放大型代码语言模型,现有的代码大型语言模型在架构和预训练任务方面存在限制:无法灵活适应不同的下游代码任务“并在某些任务上达到最...
StructGPT:基于迭代的阅读-推理框架(IRR)让LLMs在结构化数据上推理
本文旨在研究如何在大型语言模型中统一提高其在结构化数据上的零-shot推理能力,使用迭代阅读-推理(IRR)的方式来解决基于结构化数据的问答任务:StructGPT...
微软|PICL预训练上下文能力,比大型语言模型表现更好
该论文旨在通过提出一种新的框架PICL来增强语言模型的上下文学习能力。该论文的关键思路是通过在通用纯文本语料库上使用简单的语言建模目标来对模型进行预训...
ChatGPT ios版来了
OpenAI 刚刚发布了 iOS 版本的 ChatGPT,目前还仅能在 US 地区商店下载到。 url:https://openai.com/blog/introducing-the-chatgpt-app-for-ios 截图如...
OpenAI首批70个ChatGPT Plugin最全梳理
以下是ChatGPT 70个插件的具体功能和提示方法: KeyMate.AI Search 功能:使用由AI驱动的自定义搜索引擎查找网页。 基本提示: “搜索关于可再生能源的最新...