大模型
参数数量非常庞大的深度神经网络或其他机器学习模型。
符尧等|思想链中心:持续努力衡量大型语言模型的推理性能
随着大型语言模型(LLM)的不断发展,这是一个关于大型语言模型多步推理能力的开源评估套件,我们观察到复杂的推理可能是较弱和更强的LLM之间的关键区别,(2...
评估大型视觉语言模型中的物体幻觉
该论文旨在研究大规模视觉语言模型(LVLM)中的对象幻觉问题。发现它们大多数存在严重的对象幻觉问题,该论文的主要新意在于针对LVLM中的对象幻觉问题提出了...
LaWGPT:基于中文法律知识的大语言模型
构造法律领域对话问答数据集、中国司法考试数据集进行指令精调,该项目基于中文裁判文书网公开法律文书数据、司法考试数据等数据集开展实验:1)中国法律智能...
Cohere的大型语言模型课程
课程从基础开始,涵盖了建立和使用文本表示和文本生成模型的所有内容。理论部分以类比和实例而不是公式进行解释,实践部分包含大量有用的代码示例,帮你巩固...
文生图开源模型比较库
可根据输入文字同时用stable-diffusion 1.5、stable-diffusion 2.1、DALL-E、kandinsky-2等模型生成图像。用于测试生成比较:Github地址:https?//zoo.replica...
OpenBMB × A.I HUB |大模型开发者沙龙,咖啡馆等你!
开源精神以自由和合作为信条,通过开放透明的方式促进技术和知识的创新共享。OpenBMB作为AI大模型领域的开源社区,积极倡导大模型领域成果的开源分享与交流,...
PaLM 2技术报告
文章通过在英语和多语言以及推理任务上的广泛评估,证明了PaLM 2在不同模型大小的下游任务中具有显著的改进质量,PaLM 2的关键思路在于提高多语言和推理能力...
用世界模型增强语言模型: 用具身体验增强语言模型
用世界模型增强语言模型:大型语言模型在许多任务上显示出卓越的能力。但在物理环境中进行简单的推理和规划(如理解物体的持久性或规划居家活动)方面常常存在...
MIT|用程序代码训练的语言模型中意义的证据
用程序代码训练的语言模型中意义的证据,尽管语言模型只被训练用于在文本中进行下一个Token预测,以评估语言模型中是否存在语义的存在或缺失,首先在编程语料...
CCKS2023-PromptCBLUE中文医疗大模型评测比赛开放报名啦!
将16种不同的医疗场景NLP任务全部转化为基于提示的语言生成任务。形成首个中文医疗场景的LLM评测基准,type是原任务类型(不作为模型输入)。只有分类、术语标...