自然语言处理
针对开放条件下基于深度学习的自然语言处理健壮性不高、推理能力弱以及可解释性差等核心挑战,探索从数据驱动到知识驱动的范式跃迁
国内首个大模型评测数据集(MMCU)问世,加速完善国产AI产业图谱
大语言模型将为各行各业带来颠覆性的效率革命和体验升级,如何更好地提升大语言模型对中文的理解能力,甲骨易AI研究院首创性地推出了高质量中文评测数据集——...
MMCU@中文通用大语言模型测试集预发布
但却一直没有出现可应用于评测大模型能力的测试。甲骨易AI研究院提出一种衡量中文大模型处理多任务准确度的测试,并在此基础上制作了一套适配测试中文大模型...
填补国产空白!首个联网支持中文问答开源模型WebCPM
面壁智能联合来自清华、人大、腾讯的研究人员共同发布了 中文领域首个基于交互式网页搜索的问答开源模型框架WebCPM,能够像人类一样与搜索引擎交互从而收集回...
悟透Transformer–AI是如何学习扑克牌排序的(一)
人工智能的各个领域(自然语言处理、计算机视觉等)是兄弟爬山,每个领域都有自己的模型框架。作为一种具有更高普适性的AI模型架构,但绝大部分是从谷歌的原...
大模型自学使用工具(Toolformer)|OpenBMB论文速读第 7 期
本期论文速读带大家了解如何驱动语言模型去使用简单的模型来调用外部的工具——Toolformer:驱动语言模型去使用简单的模型来调用外部的工具,Toolformer 通过语...
中科大&美团提出VIRT,从交互模型中蒸馏知识,在文本匹配上实现性能和效率的平衡!
基于孪生Transformer编码器的表示模型已成为高效文本匹配的主流技术,通过注意力图提取将交互知识从基于交互的模型转移到孪生编码器,对话代理需要通过预测用...
《强化学习周刊》第52期:Depth-CUPRL、DistSPECTRL & Double Deep Q-Network
本期周刊整理了强化学习领域相关的最新论文推荐及研究综述,可以扫描文末的二维码加入强化学习社区群。您已经完成《强化学习周刊》订阅啦;以后智源社区会自动...
ICML 2022 | 探索语言模型的最佳架构和训练方法
两篇论文都是很实践性的分析论文。和常见的论文在模型做创新不一样:两篇论文都是针对现有 NLP 语言模型的架构和训练方法、探索其在不同场景下的优劣并总结出...
爱可可AI前沿推介(7.5)
以前所未有的规模实现Transformer模型的高效推断、基于扩散模型的语义图像合成、面向导航的视觉预训练、Epinet对分布漂移的鲁棒性、对记忆训练样本遗忘情况的...
Meta AI 开源1750亿参数大模型- OPT,FlagAI一键调用!
OPT系列模型包括了多组不同参数规模的模型权重:FlagAI对OPT不同版本的模型进行了兼容,并给出使用FlagAI快速加载OPT模型示例代码!OPT与GPT系列模型均采用了...