大模型

符尧等｜思想链中心：持续努力衡量大型语言模型的推理性能

随着大型语言模型（LLM）的不断发展，这是一个关于大型语言模型多步推理能力的开源评估套件，我们观察到复杂的推理可能是较弱和更强的LLM之间的关键区别，（2...

大模型

2年前 (2023)

评估大型视觉语言模型中的物体幻觉

该论文旨在研究大规模视觉语言模型（LVLM）中的对象幻觉问题。发现它们大多数存在严重的对象幻觉问题，该论文的主要新意在于针对LVLM中的对象幻觉问题提出了...

大模型

2年前 (2023)

LaWGPT：基于中文法律知识的大语言模型

构造法律领域对话问答数据集、中国司法考试数据集进行指令精调，该项目基于中文裁判文书网公开法律文书数据、司法考试数据等数据集开展实验:1）中国法律智能...

大模型

2年前 (2023)

Cohere的大型语言模型课程

课程从基础开始，涵盖了建立和使用文本表示和文本生成模型的所有内容。理论部分以类比和实例而不是公式进行解释，实践部分包含大量有用的代码示例，帮你巩固...

大模型

2年前 (2023)

文生图开源模型比较库

可根据输入文字同时用stable-diffusion 1.5、stable-diffusion 2.1、DALL-E、kandinsky-2等模型生成图像。用于测试生成比较：Github地址:https?//zoo.replica...

大模型

2年前 (2023)

OpenBMB × A.I HUB ｜大模型开发者沙龙，咖啡馆等你！

开源精神以自由和合作为信条，通过开放透明的方式促进技术和知识的创新共享。OpenBMB作为AI大模型领域的开源社区，积极倡导大模型领域成果的开源分享与交流，...

大模型

2年前 (2023)

PaLM 2技术报告

文章通过在英语和多语言以及推理任务上的广泛评估，证明了PaLM 2在不同模型大小的下游任务中具有显著的改进质量，PaLM 2的关键思路在于提高多语言和推理能力...

大模型

2年前 (2023)

用世界模型增强语言模型: 用具身体验增强语言模型

用世界模型增强语言模型：大型语言模型在许多任务上显示出卓越的能力。但在物理环境中进行简单的推理和规划(如理解物体的持久性或规划居家活动)方面常常存在...

大模型

2年前 (2023)

MIT｜用程序代码训练的语言模型中意义的证据

用程序代码训练的语言模型中意义的证据，尽管语言模型只被训练用于在文本中进行下一个Token预测，以评估语言模型中是否存在语义的存在或缺失，首先在编程语料...

大模型

2年前 (2023)

CCKS2023-PromptCBLUE中文医疗大模型评测比赛开放报名啦！

将16种不同的医疗场景NLP任务全部转化为基于提示的语言生成任务。形成首个中文医疗场景的LLM评测基准，type是原任务类型(不作为模型输入)。只有分类、术语标...

大模型

2年前 (2023)

符尧等｜思想链中心：持续努力衡量大型语言模型的推理性能

评估大型视觉语言模型中的物体幻觉

LaWGPT：基于中文法律知识的大语言模型

Cohere的大型语言模型课程

文生图开源模型比较库

OpenBMB × A.I HUB ｜大模型开发者沙龙，咖啡馆等你！

PaLM 2技术报告

用世界模型增强语言模型: 用具身体验增强语言模型

MIT｜用程序代码训练的语言模型中意义的证据

CCKS2023-PromptCBLUE中文医疗大模型评测比赛开放报名啦！

站点公告

最新文章

随机网址

热门标签