代码大模型综述:中科院和MSRA调研27个LLMs,并给出5个有趣挑战
它主要目的就是将自然语言转换成可执行代码来提高开发人员的工作效率。他们调研了 NL2Code 领域中的「27 个大型语言模型以及相关评价指标」。分析了「LLMs 的...
终于 !中文基座模型CPM-Bee开源了
开发模型全流程加速系统以高效支持大模型的预训练、微调、应用和推理,并发起百亿大模型训练直播项目CPM-Live。在基础能力和性能表现上都在 CPM-Ant 的基础上...
国内首个大模型评测数据集(MMCU)问世,加速完善国产AI产业图谱
大语言模型将为各行各业带来颠覆性的效率革命和体验升级,如何更好地提升大语言模型对中文的理解能力,甲骨易AI研究院首创性地推出了高质量中文评测数据集——...
图神经网络也能用作CV骨干模型,华为诺亚ViG架构媲美CNN、Transformer
华为诺亚实验室的研究员发现图神经网络(GNN)也能做视觉骨干网络。将图像表示为图结构,通过简洁高效的适配,提出一种新型视觉网络架构 ViG,表现优于传统的...
University of Colorado Boulder : Mateo Perez | 循环强化学习
【论文链接】https“【推荐理由】循环是有限描述潜在无限对象的基本范式。由于最先进的强化学习(RL)算法无法直接对循环进行推理;它们必须依靠实践者的创造...
CV的未来是图神经网络?中科院软件所发布全新CV模型ViG,性能超越ViT
论文链接:https,首先需要将图像分割成若干个patch作为图中的节点。并通过连接最近的邻居patch构建一个graph,然后使用ViG模型对整个图中所有节点的信息进行...
OpenHGNN发布0.3版本
更新异质图相关模型、提供API调用方式、简化定制数据集和模型流程、提供异质图统计信息可视化工具等。OpenHGNN第三版本修改和新增了一些异质图模型:新增节点...
大厂的广告系统升级,怎能少了大模型的身影
本文从腾讯广告混元AI大模型及广告大模型出发,介绍腾讯广告系统背后的技术,以及如何带来广告系统的硬指标——商品交易总额(GMV)的提升。目录:大模型:广告...
UC Berkeley:Charlie Snell | 基于内隐语言Q学习的自然语言生成离线RL
【推荐理由】大型语言模型从文本语料库中提取广泛的知识,这个问题可以通过在管理的数据集上进行监督学习或通过强化学习对此类模型进行微调来解决。本文提出...
FURG : Junior C. de Jesus | Depth-CUPRL:无人机Mapless导航强化学习中的深度图像对比无监督优先表示
【推荐理由】强化学习通过原始像素成像和连续控制任务在视频游戏中表现出了令人印象深刻的性能。RL在高维观察(如原始像素图像)中表现不佳。基于物理状态的R...