强化学习 | 第 5 页

多项SOTA！SVDFormer-自增强自结构双生点云补全算法-ICCV2023论文详解

摘要：本方案提出了一种自视图融合网络(Self-view Fusion Network)，旨在解决点云补全任务中的两个挑战：生成真实的全局形状和高精度的局部结构。该网络利用...

强化学习

2年前 (2023)

无需标注海量数据，目标检测新范式OVD让多模态AGI又前进一步

本文介绍了计算机视觉中的目标检测任务，与图像分类/识别任务不同，目标检测需要模型给出目标的位置和大小信息。目标检测在CV三大任务中处于关键地位。

强化学习

2年前 (2023)

优化 | 面向协作多智能体强化学习的完全去中心化算法框架

协作多智能体强化学习（MARL）是实现群体智能的重要手段，已成为人工智能重要研究方向。MARL在交互式、复杂的合作多智能体环境中表现出了显著的性能，例如多...

强化学习

2年前 (2023)

CVPR 2023 冠军解决方案，零样本异常分割新突破！

CVPR2023冠军解决方案已经实现了零样本异常分割的新突破。本文介绍了Pytorch训练营，以及CV各大方向专栏和各个部署框架的最全教程。此外，还有CV全栈指导班、...

强化学习

2年前 (2023)

CVPR 2023 中的领域适应：用于切片方向连续的无监督跨模态医学图像分割

CVPR 2023的一篇论文介绍了无监督跨模态医学图像分割的领域适应方法。该论文提出了一种体积型的UDA框架，包括具体实现、Unpaired图像转换、体积自训练和伪标...

强化学习

2年前 (2023)

找到时序方向idea的方法

本课程介绍了时间序列预测的重要性和应用领域，包含前沿科研和比赛实战，总时长15小时，0.01元即可全部解锁。此外，还提供14个方向88篇时序顶会论文的免费领...

强化学习

2年前 (2023)

社区供稿 | 基于 LoRA 的 RLHF: 记一次不太成功但有趣的百川大模型调教经历

RLHF (基于人类反馈的强化学习) 分为三步：SFT (有监督的微调)、RM (基于奖励的建模)、IL (交互学习)。SFT使用正常的指令或对话样本来训练模型的基础对话、听...

强化学习

2年前 (2023)

无模型强化学习与微网格控制的融合：综述与启示

【论文链接】https。【推荐理由】由于新兴的大规模分布式能源（DER）和先进的控制技术，本文综述了微电网控制及其与无模型强化学习（MFRL）的融合，从六个不...

强化学习

2年前 (2023)

华为&伦敦大学学院| ICML 2022: 短时可塑性神经元学习和遗忘

【论文链接】https。【推荐理由】短期可塑性 (STP) 是一种在大脑皮层突触中存储衰减记忆的机制。本文提出了一种新型的循环神经单元，其关键机制是突触具有状...

强化学习

2年前 (2023)

【路径规划】基于A星算法实现机器人栅格地图全路径规划附Matlab代码

本文介绍了作者的个人主页“Matlab科研工作室”，并列举了其在Matlab仿真方面的专业领域，包括智能优化算法、神经网络预测、雷达通信、无线传感器、电力系统信...

智源社区

2年前 (2023)

标签：强化学习

多项SOTA！SVDFormer-自增强自结构双生点云补全算法-ICCV2023论文详解

无需标注海量数据，目标检测新范式OVD让多模态AGI又前进一步

优化 | 面向协作多智能体强化学习的完全去中心化算法框架

CVPR 2023 冠军解决方案，零样本异常分割新突破！

CVPR 2023 中的领域适应：用于切片方向连续的无监督跨模态医学图像分割

找到时序方向idea的方法

社区供稿 | 基于 LoRA 的 RLHF: 记一次不太成功但有趣的百川大模型调教经历

无模型强化学习与微网格控制的融合：综述与启示

华为&伦敦大学学院| ICML 2022: 短时可塑性神经元学习和遗忘

【路径规划】基于A星算法实现机器人栅格地图全路径规划附Matlab代码

站点公告

最新文章

随机网址

热门标签