标签:自然语言处理
国内首个大模型评测数据集(MMCU)问世,加速完善国产AI产业图谱
大语言模型将为各行各业带来颠覆性的效率革命和体验升级,如何更好地提升大语言模型对中文的理解能力,甲骨易AI研究院首创性地推出了高质量中文评测数据集——...
UC Berkeley:Charlie Snell | 基于内隐语言Q学习的自然语言生成离线RL
【推荐理由】大型语言模型从文本语料库中提取广泛的知识,这个问题可以通过在管理的数据集上进行监督学习或通过强化学习对此类模型进行微调来解决。本文提出...
MMCU@中文通用大语言模型测试集预发布
但却一直没有出现可应用于评测大模型能力的测试。甲骨易AI研究院提出一种衡量中文大模型处理多任务准确度的测试,并在此基础上制作了一套适配测试中文大模型...
填补国产空白!首个联网支持中文问答开源模型WebCPM
面壁智能联合来自清华、人大、腾讯的研究人员共同发布了 中文领域首个基于交互式网页搜索的问答开源模型框架WebCPM,能够像人类一样与搜索引擎交互从而收集回...
悟透Transformer–AI是如何学习扑克牌排序的(一)
人工智能的各个领域(自然语言处理、计算机视觉等)是兄弟爬山,每个领域都有自己的模型框架。作为一种具有更高普适性的AI模型架构,但绝大部分是从谷歌的原...
大模型自学使用工具(Toolformer)|OpenBMB论文速读第 7 期
本期论文速读带大家了解如何驱动语言模型去使用简单的模型来调用外部的工具——Toolformer:驱动语言模型去使用简单的模型来调用外部的工具,Toolformer 通过语...
CCKS2023-PromptCBLUE中文医疗大模型评测比赛开放报名啦!
将16种不同的医疗场景NLP任务全部转化为基于提示的语言生成任务。形成首个中文医疗场景的LLM评测基准,type是原任务类型(不作为模型输入)。只有分类、术语标...
爱可可AI前沿推介(7.3)
用数据修剪战胜神经网络幂律扩展率、生成式神经人体辐射场、逆向问题中深度学习方法的理论分析、贝叶斯因果推断的批判性综述、可复现高效协作型优化基准、基...
悉尼科技大学 | 通过交互式提示进行高效的多模式融合
【推荐理由】文章提出了一种高效灵活的多模态融合方法,可以实现与其他几种多模态大模型微调方法相当的性能。【摘要】大规模预训练技术已经将计算机视觉和自...
《强化学习周刊》第52期:Depth-CUPRL、DistSPECTRL & Double Deep Q-Network
本期周刊整理了强化学习领域相关的最新论文推荐及研究综述,可以扫描文末的二维码加入强化学习社区群。您已经完成《强化学习周刊》订阅啦;以后智源社区会自动...