标签:大模型
终于 !中文基座模型CPM-Bee开源了
开发模型全流程加速系统以高效支持大模型的预训练、微调、应用和推理,并发起百亿大模型训练直播项目CPM-Live。在基础能力和性能表现上都在 CPM-Ant 的基础上...
国内首个大模型评测数据集(MMCU)问世,加速完善国产AI产业图谱
大语言模型将为各行各业带来颠覆性的效率革命和体验升级,如何更好地提升大语言模型对中文的理解能力,甲骨易AI研究院首创性地推出了高质量中文评测数据集——...
微软等|基于可组合扩散的Any-to-An的生成
CoDi是一种创新的多模态生成模型:能自由生成任意组合的输出模态。并在生成质量方面超越或与单模态合成的最先进方法持平,开发一种能生成任意组合输出形式(如...
精准推断用户习惯的迁移学习架构PeterRec
推导迁移学习对计算机视觉和NLP领域产生了重大影响,但尚未在推荐系统广泛使用。虽然大量的研究根据建模的用户-物品交互序列生成推荐,但很少有研究尝试表征...
MMCU@中文通用大语言模型测试集预发布
但却一直没有出现可应用于评测大模型能力的测试。甲骨易AI研究院提出一种衡量中文大模型处理多任务准确度的测试,并在此基础上制作了一套适配测试中文大模型...
填补国产空白!首个联网支持中文问答开源模型WebCPM
面壁智能联合来自清华、人大、腾讯的研究人员共同发布了 中文领域首个基于交互式网页搜索的问答开源模型框架WebCPM,能够像人类一样与搜索引擎交互从而收集回...
大模型自学使用工具(Toolformer)|OpenBMB论文速读第 7 期
本期论文速读带大家了解如何驱动语言模型去使用简单的模型来调用外部的工具——Toolformer:驱动语言模型去使用简单的模型来调用外部的工具,Toolformer 通过语...
评估大型视觉语言模型中的物体幻觉
该论文旨在研究大规模视觉语言模型(LVLM)中的对象幻觉问题。发现它们大多数存在严重的对象幻觉问题,该论文的主要新意在于针对LVLM中的对象幻觉问题提出了...
LaWGPT:基于中文法律知识的大语言模型
构造法律领域对话问答数据集、中国司法考试数据集进行指令精调,该项目基于中文裁判文书网公开法律文书数据、司法考试数据等数据集开展实验:1)中国法律智能...
Cohere的大型语言模型课程
课程从基础开始,涵盖了建立和使用文本表示和文本生成模型的所有内容。理论部分以类比和实例而不是公式进行解释,实践部分包含大量有用的代码示例,帮你巩固...