标签:自然语言处理
Nat. Mach. Intell. 速递:复杂预测的拓扑结构
该论文介绍了一种使用拓扑数据分析和图学习的方法来理解复杂预测模型的拓扑结构。作者将这种方法应用于深度神经网络和图卷积网络,并发现了这些模型中的拓扑...
MSLTNet开源 | 4K分辨率+125FPS+8K的参数量,怎养才可以拒绝这样的模型呢?
)的速度下对高分辨率照片进行校正。该网络的性能与其他更复杂的方法相媲美,同时具有更快的速度和更少的参数数量。
Nat. Mach. Intell.速递:在人工智能中结合神经启发的适应性进行持续学习
本文发表在Nature Machine Intelligence期刊上,题目为“Incorporating neuro-inspired adaptability for continual learning in artificial intelligence”,...
社区供稿 | 图解RoPE旋转位置编码及其特性
RoPE是一种广泛使用的位置编码,但由于计算资源限制,大模型训练时往往只能在较小的上下文长度中进行。为了让大模型在预训练长度之外取得更好的性能,涌现出...
EMNLP2023论文:基于机器翻译模型采用约束束搜索算法生成优化的机器翻译质量评估伪数据
本文介绍了机器翻译质量评估(Quality Estimation, QE)任务,该任务是在没有参考译文的情况下,仅依靠源语句评估机器翻译句子的质量。该任务包括词级别和句...
数学能力超过ChatGPT!上海交大计算大模型登开源榜首
上海交大GAIR实验室开发的Abel大模型已经成为国产数学大模型中的佼佼者,准确率高达83.6%,在开源模型中排名第一。该模型以挪威数学家尼尔斯·阿贝尔的名字命...
58标签体系建设实践
本文介绍了58标签体系建设实践,包括痛点及标签建设方案、标签体系和标签管理平台三个模块。文章探讨了业务在何时需要建立标签体系,并分享了相关的建设方案...
多模态大模型最全综述来了!7位微软研究员大力合作,5大主题,成文119页
AI助手总结出的摘要如下:微软华人研究员撰写的综述总结了多模态大模型的研究方向,包括视觉理解、视觉生成、统一视觉模型LLM加持的多模态大模型、多模态agen...
Nat. Mach. Intell. 速递:测试用于预测人类语言判断的自然语言模型的极限
本文介绍了一种新的方法来测试神经网络自然语言模型的性能,以预测人类语言判断的准确性。通过使用生成模型来评估模型的性能,研究人员发现,即使是最先进的...
中文LLaMA-2刷榜,开源可商用!千元预算,训练半天,效果媲美主流大模型
LLaMA-2是一种中文汉化模型,经过15小时的训练和数千元的算力,其性能超过同级别的模型。相较于LLaMA-1,LLaMA-2引入更多高质量的语料,实现了显著的性能提升...