标签:工程实践

悟透Transformer–AI是如何学习扑克牌排序的(一)

人工智能的各个领域(自然语言处理、计算机视觉等)是兄弟爬山,每个领域都有自己的模型框架。作为一种具有更高普适性的AI模型架构,但绝大部分是从谷歌的原...

University of Washington :Hao Yin | 深度强化学习辅助下一代Wi-Fi网络的多接入点协调

【推荐理由】企业中的Wi-Fi(以重叠Wi-Fi单元为特征)构成了下一代网络的设计挑战,最近启动的IEEE 802.11be(Wi-Fi 7)工作组的标准化工作重点关注媒体访问...

University of Toronto:Anthony Coache | 深度强化学习的条件可诱导动态风险度量

【推荐理由】本文提出了一种新的框架来解决风险敏感强化学习(RL)问题。其中智能体优化了时间一致的动态频谱风险度量:该方法构造了(严格一致的)评分函数...

《强化学习周刊》第51期:PAC、ILQL、RRL&无模型强化学习集成于微电网络格控制:综述与启示

本期周刊整理了强化学习领域相关的最新论文推荐及研究综述,可以扫描文末的二维码加入强化学习社区群。您已经完成《强化学习周刊》订阅啦;

FlagAI飞智:AI基础模型开源项目,支持一键调用OPT等模型

GPT-3、OPT系列、悟道等预训练模型在NLP领域取得了非常瞩目的效果,为了快速加载、训练、推理不同大模型,使用最新最快的模型并行技术以及提高用户训练和使用...
1 3 4 5