标签:强化学习
马斯克机器人大进化!全新技能解锁,启用端到端神经网络
驭世界,这个按钮肯定很重要”。马斯克表示这是紧急停止按钮,机器人出现任何问题时按下即可停止。马斯克的机器人展示了人工智能技术的不断进步和应用,受到了...
大模型如何实现与人类的价值观共舞?探索MOSS-RLHF模型背后的训练逻辑|《追AI的人》第29期直播回放
本生导师分享了《大模型有何安全伦理风险问题?看MOSS-RLHF如何实现人类与AI的价值观对齐》的主题,探讨了大模型的安全伦理风险问题以及实现人类与AI的价值观...
【AIIG观察第205期】布鲁金斯学会:美国需采取一个全面、分布式的人工智能监管方法
布鲁金斯学会的研究员Alex Engler发表评论文章《全面、分布式的人工智能监管方法》,指出美国需要采取一个全面、分布式的人工智能监管方法。该方法应该包括多...
WWW 2023 | 药物组合推荐新方法—MoleRec
机器学习的预测模型在临床决策中具有巨大潜力,能够提高决策的准确性和安全性。这类模型通过分析大量的个人医疗数据,为医疗专家提供更准确的疾病诊断和治疗...
Transformer+强化学习|谷歌DeepMind让大模型成为机器人感知世界的大脑
Google DeepMind提出了Q-Transformer,旨在将基于多样化真实世界数据集的大规模机器人学习与基于强大Transformer的现代策略架构结合起来。他们使用离线强化学...
Nat. Mach. Intell. | 自博弈的强化学习指导蛋白质工程
深圳华大智造的杨梦团队提出了一种基于AlphaZero算法的机器学习指导的蛋白质定向进化(MLDE)方法,可以高效采样蛋白质序列空间、加快优化周期、减少实验投入...
上传聊天记录「克隆」自己,这家初创公司让《黑镜》第一集走进现实
《黑镜》第一集“马上回来”中描述了一款能够通过收集一个人生前信息模拟出他的对话功能的软件,女主角通过分析已故男友的社交媒体和短信内容成功克隆了他的人...
CVPR 2023 冠军方案,零样本异常分割新突破!(附论文及源码)
本文介绍了CVPR2023冠军解决方案,在零样本异常分割领域中,通过引入多模态提示来规范化现代基础模型,实现了在零样本情况下分割任何异常的目标,并在多个基...
AIGC在游戏行业中的应用和趋势
摘要:AIGC已经开始应用在游戏领域的各个环节,包括游戏前的美术设计、内容设计和测试,及游戏中的体验优化、运营优化,还有可以应用在游戏竞技领域。AI也被...
RLHF再也不需要人类了!谷歌团队研究证明,AI标注已达人类水平
谷歌最新研究提出,AI反馈强化学习(RLAIF)可以取代人类进行偏好标注,不用人类标注,AI标注偏好后,也能取得与RLHF一样的效果。论文地址:https://arxiv.or...