标签:大模型

Stability AI发布DreamStudio的开源版本

Stability AI正在发布DreamStudio的开源版本,这是该公司AI图像生成器模型Stable Diffusion的商业接口。制作DreamStudio的开源版本对稳定性人工智能有好处”它...

70 款 ChatGPT 插件评测(含样例分析)

开发者仅使用自然语言就可以开发ChatGPT插件。

CodeT5+:非常灵活的、面向代码理解和生成的开放大型代码语言模型

面向代码理解和生成的开放大型代码语言模型,现有的代码大型语言模型在架构和预训练任务方面存在限制:无法灵活适应不同的下游代码任务“并在某些任务上达到最...

StructGPT:基于迭代的阅读-推理框架(IRR)让LLMs在结构化数据上推理

本文旨在研究如何在大型语言模型中统一提高其在结构化数据上的零-shot推理能力,使用迭代阅读-推理(IRR)的方式来解决基于结构化数据的问答任务:StructGPT...

微软|PICL预训练上下文能力,比大型语言模型表现更好

该论文旨在通过提出一种新的框架PICL来增强语言模型的上下文学习能力。该论文的关键思路是通过在通用纯文本语料库上使用简单的语言建模目标来对模型进行预训...

通过奖励建模实现可扩展的智能体对齐

将强化学习算法应用于现实场景的障碍之一是缺乏合适的奖励函数,一定程度上是因为无法明确表述用户对任务目标的理解,从而能够以符合用户意图的方式解决复杂...

悉尼科技大学 | 通过交互式提示进行高效的多模式融合

【推荐理由】文章提出了一种高效灵活的多模态融合方法,可以实现与其他几种多模态大模型微调方法相当的性能。【摘要】大规模预训练技术已经将计算机视觉和自...

Insight Time预告|决策大模型:一种通过无标签视频预训练的方法

其研究方向为计算机视觉和强化学习,了解决策AI大模型训练的基本原理:掌握大模型训练的监督、自监督学习技术应用于序列决策任务的创新思路,了解大型通用模型...

加速经典算法效率,突破现实技术瓶颈:图神经网络与组合优化读书会启动

基于图神经网络的复杂系统优化与控制将会是大模型热潮之后新的未来方向,为了探讨图神经网络在算法神经化求解的发展与现实应用,包括神经算法推理、组合优化...

复杂推理:大语言模型的北极星能力

这意味着复杂任务很可能是大型和小型语言模型的关键差异因素”复杂推理为基于语言模型构建大量应用程序提供了机会,我们将仔细分析讨论如何让大语言模型拥有强...
1 15 16 17 18 19 23