标签:机器学习
Yann LeCun新论文:构建自动智能体之路
Yann LeCun发布了他的最新论文:这篇论文提炼了我过去5年或10年对人工智能前景前景的大部分思考。这基本上是我计划做的事情,机器如何学会推理和计划?机器如...
通过强化学习出现类似信念的表征
动物必须学会预测未来的奖励或价值。动物被认为使用强化学习来学习奖励预测,真实环境中动物还必须学会仅使用不完整的状态信息来估计价值,动物通过首先形成...
《因果科学周刊》第4期:因果赋能推荐系统
为了帮助大家更好地了解因果科学的最新科研进展和资讯,推送近期因果科学值得关注的论文和资讯信息。同时我们也将向大家介绍社区正在推进的活动——因果科学与C...
《强化学习周刊》第51期:PAC、ILQL、RRL&无模型强化学习集成于微电网络格控制:综述与启示
本期周刊整理了强化学习领域相关的最新论文推荐及研究综述,可以扫描文末的二维码加入强化学习社区群。您已经完成《强化学习周刊》订阅啦;
GNN与RL如何结合?KSU大学最新《基于图神经网络的强化学习》综述,阐述RL+GNN算法与应用
图神经网络和强化学习都是机器学习中研究的主流模型,最近来自美国堪萨斯州立大学发布了《基于图神经网络的强化学习》综述,阐述相关算法与应用。深度强化学...
智源LIVE第40期丨ICLR 2023杰出论文奖一作张博航:从图双连通性的角度重新思考图神经网络的表达能力
他曾获得ICLR 2023的论文获得杰出论文奖 (Outstanding Paper Award),目前在北京智源人工智能研究院实习。
《强化学习周刊》第52期:Depth-CUPRL、DistSPECTRL & Double Deep Q-Network
本期周刊整理了强化学习领域相关的最新论文推荐及研究综述,可以扫描文末的二维码加入强化学习社区群。您已经完成《强化学习周刊》订阅啦;以后智源社区会自动...
爱可可AI前沿推介(7.5)
以前所未有的规模实现Transformer模型的高效推断、基于扩散模型的语义图像合成、面向导航的视觉预训练、Epinet对分布漂移的鲁棒性、对记忆训练样本遗忘情况的...
Meta AI 开源1750亿参数大模型- OPT,FlagAI一键调用!
OPT系列模型包括了多组不同参数规模的模型权重:FlagAI对OPT不同版本的模型进行了兼容,并给出使用FlagAI快速加载OPT模型示例代码!OPT与GPT系列模型均采用了...
爱可可AI前沿推介(7.6)
神经网络分布漂移性能预测、语言模型的理由增强集成、具有无分布可靠性保证的推荐系统、延时摄影序列随机与循环效应的解缠、基于隐式差分的迭代细化算法训练...