强化学习
是机器学习的范式和方法论之一,是智能体与环境不断交互,从而不断强化自己的决策能力的过程
OpenAI 505员工联名逼宫请奥特曼回归,Ilya痛悔赶走CEO!威胁董事会立即解散,否则集体跳槽微软
OpenAI公司的宫斗事件仍在继续,公司首席科学家兼董事会成员Ilya发文呼唤Altman回归,参与了联名信。这场事件已经持续了三天,当地时间凌晨似乎已经落幕,但...
160w+ 未标注图像、3 个维度全方位评估,周玉坤等人开发 RETFound 模型,用视网膜图像预测多种系统性疾病
为现代医疗技术的一部分,人工智能和机器人技术正在改变医疗保健的方式。医生们现在可以使用AI来帮助诊断和治疗疾病,机器人手臂可以进行微创手术,3D打印技...
人类对「AI灭绝论」的担忧,这一方法能解决吗?|深度长文
著名AI学者吴恩达表示,他最担心的是AI风险被夸大并导致开源和创新受到限制,某些人传播人工智能灭绝人类的恐惧只是为了牟利。这一争论正变得愈发激烈。
全新Inner-IoU | YOLO上使用SIoU/CIoU等损失是尽头吗?你的IoU Loss该升级换代了
随着检测器的发展,边界框回归(BBR)损失函数不断更新和优化。现有的IoU基于BBR仍然集中在通过添加新损失项来加速收敛,忽略了IoU损失项本身的局限性。尽管I...
Nat. Comput. Sci. 前沿:基于深度强化学习的城市社区空间规划方法
清华大学电子系城市科学与计算研究中心与建筑学院合作,提出了强化学习的城市社区空间规划模型与方法,实现了人类规划师与人工智能算法协作的城市规划流程,...
RLHF何以成LLM训练关键?AI大牛盘点五款平替方案,详解Llama 2反馈机制升级
AI领域对RLHF技术的使用逐渐过时,但新的技术路线尚不明朗:是采用无需人工反馈的方法,还是继续改进RLHF机制。RLHF技术提升了语言模型的性能,注入了人类社...
AI Bot背后的强化学习技术与应用
本期「中国游戏企业出海周周谈」分享游戏领域内的数据治理、游戏自动化开发、基于LLMs的行为分析新思路等干货内容,分享嘉宾来自完美世界、37手游、亚马逊云...
立法能打败AI“魔法”吗?“人机对齐”能防住技术失控吗?
“AI换脸”技术的普及化引起了公众对其法律风险的关注。人脸和声音等生物信息一旦泄露可能影响社会秩序稳定。监管应该保持战略定力和自信,让技术先行,同时在...
从「思想实验」中学习,自监督 AI 模型向科学家看齐
ChatGPT因其背后的“血汗工厂”而引起争议,这表明为AI模型准备大规模、预先标注的训练数据是一项极其耗费精力的工作。在计算成像和显微成像方面的现有应用中,...
马斯克机器人大进化!全新技能解锁,启用端到端神经网络
驭世界,这个按钮肯定很重要”。马斯克表示这是紧急停止按钮,机器人出现任何问题时按下即可停止。马斯克的机器人展示了人工智能技术的不断进步和应用,受到了...