标签:强化学习

多项SOTA!SVDFormer-自增强自结构双生点云补全算法-ICCV2023论文详解

摘要:本方案提出了一种自视图融合网络(Self-view Fusion Network),旨在解决点云补全任务中的两个挑战:生成真实的全局形状和高精度的局部结构。该网络利用...

无需标注海量数据,目标检测新范式OVD让多模态AGI又前进一步

本文介绍了计算机视觉中的目标检测任务,与图像分类/识别任务不同,目标检测需要模型给出目标的位置和大小信息。目标检测在CV三大任务中处于关键地位。

优化 | 面向协作多智能体强化学习的完全去中心化算法框架

协作多智能体强化学习(MARL)是实现群体智能的重要手段,已成为人工智能重要研究方向。MARL在交互式、复杂的合作多智能体环境中表现出了显著的性能,例如多...

CVPR 2023 冠军解决方案,零样本异常分割新突破!

CVPR2023冠军解决方案已经实现了零样本异常分割的新突破。本文介绍了Pytorch训练营,以及CV各大方向专栏和各个部署框架的最全教程。此外,还有CV全栈指导班、...

CVPR 2023 中的领域适应:用于切片方向连续的无监督跨模态医学图像分割

CVPR 2023的一篇论文介绍了无监督跨模态医学图像分割的领域适应方法。该论文提出了一种体积型的UDA框架,包括具体实现、Unpaired图像转换、体积自训练和伪标...

找到时序方向idea的方法

本课程介绍了时间序列预测的重要性和应用领域,包含前沿科研和比赛实战,总时长15小时,0.01元即可全部解锁。此外,还提供14个方向88篇时序顶会论文的免费领...

社区供稿 | 基于 LoRA 的 RLHF: 记一次不太成功但有趣的百川大模型调教经历

RLHF (基于人类反馈的强化学习) 分为三步:SFT (有监督的微调)、RM (基于奖励的建模)、IL (交互学习)。SFT使用正常的指令或对话样本来训练模型的基础对话、听...

无模型强化学习与微网格控制的融合:综述与启示

【论文链接】https。【推荐理由】由于新兴的大规模分布式能源(DER)和先进的控制技术,本文综述了微电网控制及其与无模型强化学习(MFRL)的融合,从六个不...

华为&伦敦大学学院| ICML 2022: 短时可塑性神经元学习和遗忘

【论文链接】https。【推荐理由】短期可塑性 (STP) 是一种在大脑皮层突触中存储衰减记忆的机制。本文提出了一种新型的循环神经单元,其关键机制是突触具有状...

【路径规划】基于A星算法实现机器人栅格地图全路径规划附Matlab代码

本文介绍了作者的个人主页“Matlab科研工作室”,并列举了其在Matlab仿真方面的专业领域,包括智能优化算法、神经网络预测、雷达通信、无线传感器、电力系统信...
1 3 4 5 6 7 8