强化学习
是机器学习的范式和方法论之一,是智能体与环境不断交互,从而不断强化自己的决策能力的过程
Coggle 9月竞赛学习:时序回归预测
本文介绍了时序预测在能源消耗预测中的应用。对于能源供应商来说,准确预测客户未来的能源需求至关重要。本文将深入探讨时序预测的基本原理、方法以及其在能...
服务运营 | MS文章精读:基于强化学习和可穿戴设备的帕金森治疗方案
本文介绍了一种基于强化学习的帕金森药物治疗方案,通过患者的可穿戴传感器收集数据,是可穿戴治疗设备在慢性疾病管理中的应用研究的第一篇文章。该研究发表...
结束与开始:为什么 NLP 中间层一定会消亡?
本文摘要:Dan Klein在Simons Institute的LLM研讨会上发表演讲,解答了“中间层消亡史”并探讨了LLMs是否是NLP的开始或终结。通过宏观角度解释,文章得出结论。
直播预告 [周日上午10点]|哥大 彭天翼:当A/B实验平台遇上强化学习 「TechTalk 41」
本次『运筹OR帷幄』TechTalk NO. 41的主题是'A/B实验平台遇上强化学习',嘉宾为哥伦比亚大学商学院的彭天翼助教教授。本次分享将重点讲解A/B测试、实验干扰、...
蒸馏Alpha:因子的可交『弈』性
量化投资与机器学习是一家主流自媒体,专注于量化投资、对冲基金、Fintech、人工智能和大数据等领域。该公众号有30万+关注者,来自公募、私募、券商、期货、...
深度强化学习讲座第8期–离线强化学习主题
清华智能产业研究院助理研究员/助理教授詹仙园将于2023年8月21日举办深度强化学习讲座,主题为“Offline RL and Beyond: Towards Generalizable Data-Driven R...
Kaggle LLM Science 赛题高分思路
Kaggle举办了一个自然语言处理和大模型竞赛,名为LLM Science Exam,参赛者需要使用LLM回答一些困难的问题。随着大型语言模型能力范围的扩大,越来越多的研究...
Google DeepMind|强化自训练(ReST)语言建模
Reinforced Self-Training (ReST)是一种新算法,用于改进大规模语言模型的输出质量,使其更符合人类偏好,从而提高翻译质量并减少潜在的不安全内容。该算法使...
优化 | 带有未知评估成本和预算约束的多步贝叶斯优化
本文介绍了一种新的基于贝叶斯优化的方法,用于处理异质评估成本和带有约束的优化问题。该方法通过引入一个新的代价模型来对异质性进行建模,并使用一种基于...
多项SOTA!SVDFormer-自增强自结构双生点云补全算法-ICCV2023论文详解
摘要:本方案提出了一种自视图融合网络(Self-view Fusion Network),旨在解决点云补全任务中的两个挑战:生成真实的全局形状和高精度的局部结构。该网络利用...