智源社区

University of Washington :Hao Yin | 深度强化学习辅助下一代Wi-Fi网络的多接入点协调

【推荐理由】企业中的Wi-Fi（以重叠Wi-Fi单元为特征）构成了下一代网络的设计挑战，最近启动的IEEE 802.11be（Wi-Fi 7）工作组的标准化工作重点关注媒体访问...

强化学习

2年前 (2023)

CVPR再起争议：IBM中稿论文被指照搬自己承办竞赛第二名的idea

CVPR 2022又被曝出关于「论文抄袭」的争议！作者已经将相关举证信息发给了CVPR的Program Chairs。在计算机视觉领域搞研究已经十多年了。我写这篇博客是为了揭...

智源社区

2年前 (2023)

University of Toronto:Anthony Coache | 深度强化学习的条件可诱导动态风险度量

【推荐理由】本文提出了一种新的框架来解决风险敏感强化学习（RL）问题。其中智能体优化了时间一致的动态频谱风险度量：该方法构造了（严格一致的）评分函数...

强化学习

2年前 (2023)

爱可可AI前沿推介(7.3)

用数据修剪战胜神经网络幂律扩展率、生成式神经人体辐射场、逆向问题中深度学习方法的理论分析、贝叶斯因果推断的批判性综述、可复现高效协作型优化基准、基...

智源社区

2年前 (2023)

通过奖励建模实现可扩展的智能体对齐

将强化学习算法应用于现实场景的障碍之一是缺乏合适的奖励函数，一定程度上是因为无法明确表述用户对任务目标的理解，从而能够以符合用户意图的方式解决复杂...

强化学习

2年前 (2023)

悉尼科技大学 | 通过交互式提示进行高效的多模式融合

【推荐理由】文章提出了一种高效灵活的多模态融合方法，可以实现与其他几种多模态大模型微调方法相当的性能。【摘要】大规模预训练技术已经将计算机视觉和自...

智源社区

2年前 (2023)

强化学习如何用于医学影像？埃默里大学最新《强化学习医学影像分析》综述，阐述最新RL医学影像分析概念、应用、挑战与未来方向

医学影像分析的任务是协助医生对病变或解剖结构进行定性和定量分析，许多机器学习方法被用于加速和自动化图像分析过程。在医学图像分析中使用强化学习的尝试...

强化学习

2年前 (2023)

DeepMind｜用深度强化学习让双足机器人学习敏捷足球技能

研究用深度强化学习让低成本人形机器人具备复杂的和安全的移动技能，在模拟器中使用深度强化学习训练一个20个活动关节的人形机器人玩简化版足球游戏：使用高...

强化学习

2年前 (2023)

在使用函数逼近的高效在线强化学习中，普适覆盖条件的可证明益处

本篇论文旨在探讨使用覆盖条件在在线强化学习中的潜力和效用。本文的关键思路是探索更多可能的覆盖条件。本文提出的$L^p$浓度性、密度比实现性和部分/全覆盖...

强化学习

2年前 (2023)

Insight Time预告｜决策大模型:一种通过无标签视频预训练的方法

其研究方向为计算机视觉和强化学习，了解决策AI大模型训练的基本原理:掌握大模型训练的监督、自监督学习技术应用于序列决策任务的创新思路，了解大型通用模型...

强化学习

2年前 (2023)

University of Washington :Hao Yin | 深度强化学习辅助下一代Wi-Fi网络的多接入点协调

CVPR再起争议：IBM中稿论文被指照搬自己承办竞赛第二名的idea

University of Toronto:Anthony Coache | 深度强化学习的条件可诱导动态风险度量

爱可可AI前沿推介(7.3)

通过奖励建模实现可扩展的智能体对齐

悉尼科技大学 | 通过交互式提示进行高效的多模式融合

强化学习如何用于医学影像？埃默里大学最新《强化学习医学影像分析》综述，阐述最新RL医学影像分析概念、应用、挑战与未来方向

DeepMind｜用深度强化学习让双足机器人学习敏捷足球技能

在使用函数逼近的高效在线强化学习中，普适覆盖条件的可证明益处

Insight Time预告｜决策大模型:一种通过无标签视频预训练的方法

站点公告

最新文章

随机网址

热门标签