强化学习

Coggle 9月竞赛学习：时序回归预测

本文介绍了时序预测在能源消耗预测中的应用。对于能源供应商来说，准确预测客户未来的能源需求至关重要。本文将深入探讨时序预测的基本原理、方法以及其在能...

强化学习

2年前 (2023)

服务运营 | MS文章精读：基于强化学习和可穿戴设备的帕金森治疗方案

本文介绍了一种基于强化学习的帕金森药物治疗方案，通过患者的可穿戴传感器收集数据，是可穿戴治疗设备在慢性疾病管理中的应用研究的第一篇文章。该研究发表...

强化学习

2年前 (2023)

结束与开始：为什么 NLP 中间层一定会消亡？

本文摘要：Dan Klein在Simons Institute的LLM研讨会上发表演讲，解答了“中间层消亡史”并探讨了LLMs是否是NLP的开始或终结。通过宏观角度解释，文章得出结论。

强化学习

2年前 (2023)

直播预告 [周日上午10点]｜哥大彭天翼：当A/B实验平台遇上强化学习「TechTalk 41」

本次『运筹OR帷幄』TechTalk NO. 41的主题是'A/B实验平台遇上强化学习'，嘉宾为哥伦比亚大学商学院的彭天翼助教教授。本次分享将重点讲解A/B测试、实验干扰、...

强化学习

2年前 (2023)

蒸馏Alpha：因子的可交『弈』性

量化投资与机器学习是一家主流自媒体，专注于量化投资、对冲基金、Fintech、人工智能和大数据等领域。该公众号有30万+关注者，来自公募、私募、券商、期货、...

强化学习

2年前 (2023)

深度强化学习讲座第8期–离线强化学习主题

清华智能产业研究院助理研究员/助理教授詹仙园将于2023年8月21日举办深度强化学习讲座，主题为“Offline RL and Beyond: Towards Generalizable Data-Driven R...

强化学习

2年前 (2023)

Kaggle LLM Science 赛题高分思路

Kaggle举办了一个自然语言处理和大模型竞赛，名为LLM Science Exam，参赛者需要使用LLM回答一些困难的问题。随着大型语言模型能力范围的扩大，越来越多的研究...

强化学习

2年前 (2023)

Google DeepMind｜强化自训练(ReST)语言建模

Reinforced Self-Training (ReST)是一种新算法，用于改进大规模语言模型的输出质量，使其更符合人类偏好，从而提高翻译质量并减少潜在的不安全内容。该算法使...

强化学习

2年前 (2023)

优化 | 带有未知评估成本和预算约束的多步贝叶斯优化

本文介绍了一种新的基于贝叶斯优化的方法，用于处理异质评估成本和带有约束的优化问题。该方法通过引入一个新的代价模型来对异质性进行建模，并使用一种基于...

强化学习

2年前 (2023)

多项SOTA！SVDFormer-自增强自结构双生点云补全算法-ICCV2023论文详解

摘要：本方案提出了一种自视图融合网络(Self-view Fusion Network)，旨在解决点云补全任务中的两个挑战：生成真实的全局形状和高精度的局部结构。该网络利用...

强化学习

2年前 (2023)

Coggle 9月竞赛学习：时序回归预测

服务运营 | MS文章精读：基于强化学习和可穿戴设备的帕金森治疗方案

结束与开始：为什么 NLP 中间层一定会消亡？

直播预告 [周日上午10点]｜哥大彭天翼：当A/B实验平台遇上强化学习「TechTalk 41」

蒸馏Alpha：因子的可交『弈』性

深度强化学习讲座第8期–离线强化学习主题

Kaggle LLM Science 赛题高分思路

Google DeepMind｜强化自训练(ReST)语言建模

优化 | 带有未知评估成本和预算约束的多步贝叶斯优化

多项SOTA！SVDFormer-自增强自结构双生点云补全算法-ICCV2023论文详解

站点公告

最新文章

随机网址

热门标签