机器学习 | 第 8 页

ICCV2023 基准测试：MS-COCO数据集的可靠吗？

ICCV2023会议上的一篇论文“Benchmarking a Benchmark: How Reliable is MS-COCO?”对用于算法比较的MS-COCO数据集的可靠性进行了探讨。数据集在各种任务中都起...

智源社区

1年前 (2023)

社区供稿 | 图解RoPE旋转位置编码及其特性

RoPE是一种广泛使用的位置编码，但由于计算资源限制，大模型训练时往往只能在较小的上下文长度中进行。为了让大模型在预训练长度之外取得更好的性能，涌现出...

智源社区

1年前 (2023)

书 |《人工智能基础数学：高效和成功人工智能系统数学》605页 | 2023年Hala Nelson编写

本指南介绍人工智能领域所需的基本数学知识，如回归、神经网络、优化、反向传播、卷积、马尔可夫链等。它专注于现实世界的应用，适合工程师、数据科学家和学...

大模型

2年前 (2023)

ACC-UNet | 致敬ConvNeXt，全卷积结构UNet设计，超越SWin-UNet！

前研究工作旨在将传统的卷积神经网络与Transformer相结合，提出了一种新的网络架构Convolutional Transformer Network（CTN）。该架构在医学影像分割任务上进...

大模型

2年前 (2023)

215篇【大模型医疗】论文合集(附PDF)

ChatGPT是一种生成式大模型技术，引发了医疗领域的热潮。通过大规模的数据和模型训练，医疗大模型可以预测、诊断和治疗各种问题。215篇医疗和大模型的论文供...

大模型

2年前 (2023)

长文本信息准确率超过ChatGPT，Meta提出降低大模型幻觉新方法

Meta AI实验室提出了一种名为“验证链”的解决方案，用于解决大模型幻觉问题。该方案使得Llama-65B输出的信息准确率提升了一倍，超过了ChatGPT。大模型幻觉是指...

大模型

2年前 (2023)

DualToken-ViT | 超越LightViT和MobileNet v2，实现更强更快更轻量化的Backbone

自注意力视觉Transformer（ViTs）已成为计算机视觉领域的有竞争力架构。与卷积神经网络（CNNs）不同，ViTs能进行全局信息共享。但其二次复杂性使ViTs计算密集...

大模型

2年前 (2023)

刷榜13个暗光增强基准！清华大学联合ETH等开源Retinexformer：亮、暗都有细节｜ ICCV 2023

Retinexformer架构可以端到端、单阶段解决过曝、伪影、低光等图像增强问题，超越了目前的暗光增强sota模型。该架构基于Retinex理论，但考虑了隐藏在黑暗中或...

大模型

2年前 (2023)

大模型的最大bug！回答正确率几乎为零，GPT到Llama无一幸免

近乎为零，甚至还会给出完全错误的答案。这个现象被称为逆转诅咒，是指当模型在训练过程中接收到的数据具有一定的规律性时，模型会过度依赖这些规律性，从而...

大模型

2年前 (2023)

澜舟科技与潞晨科技签署战略合作协议，联手打造更高效的企业级大模型解决方案

北京澜舟科技与北京潞晨科技达成战略合作协议，旨在共同推动人工智能在行业垂直领域的应用，为行业头部及标杆企业打造专属的垂直人工智能大模型产品和服务。...

大模型

2年前 (2023)

标签：机器学习

ICCV2023 基准测试：MS-COCO数据集的可靠吗？

社区供稿 | 图解RoPE旋转位置编码及其特性

书 |《人工智能基础数学：高效和成功人工智能系统数学》605页 | 2023年Hala Nelson编写

ACC-UNet | 致敬ConvNeXt，全卷积结构UNet设计，超越SWin-UNet！

215篇【大模型医疗】论文合集(附PDF)

长文本信息准确率超过ChatGPT，Meta提出降低大模型幻觉新方法

DualToken-ViT | 超越LightViT和MobileNet v2，实现更强更快更轻量化的Backbone

刷榜13个暗光增强基准！清华大学联合ETH等开源Retinexformer：亮、暗都有细节｜ ICCV 2023

大模型的最大bug！回答正确率几乎为零，GPT到Llama无一幸免

澜舟科技与潞晨科技签署战略合作协议，联手打造更高效的企业级大模型解决方案

站点公告

最新文章

随机网址

热门标签