标签:强化学习
OpenAI 505员工联名逼宫请奥特曼回归,Ilya痛悔赶走CEO!威胁董事会立即解散,否则集体跳槽微软
OpenAI公司的宫斗事件仍在继续,公司首席科学家兼董事会成员Ilya发文呼唤Altman回归,参与了联名信。这场事件已经持续了三天,当地时间凌晨似乎已经落幕,但...
160w+ 未标注图像、3 个维度全方位评估,周玉坤等人开发 RETFound 模型,用视网膜图像预测多种系统性疾病
为现代医疗技术的一部分,人工智能和机器人技术正在改变医疗保健的方式。医生们现在可以使用AI来帮助诊断和治疗疾病,机器人手臂可以进行微创手术,3D打印技...
人类对「AI灭绝论」的担忧,这一方法能解决吗?|深度长文
著名AI学者吴恩达表示,他最担心的是AI风险被夸大并导致开源和创新受到限制,某些人传播人工智能灭绝人类的恐惧只是为了牟利。这一争论正变得愈发激烈。
全新Inner-IoU | YOLO上使用SIoU/CIoU等损失是尽头吗?你的IoU Loss该升级换代了
随着检测器的发展,边界框回归(BBR)损失函数不断更新和优化。现有的IoU基于BBR仍然集中在通过添加新损失项来加速收敛,忽略了IoU损失项本身的局限性。尽管I...
EMNLP2023论文:基于机器翻译模型采用约束束搜索算法生成优化的机器翻译质量评估伪数据
本文介绍了机器翻译质量评估(Quality Estimation, QE)任务,该任务是在没有参考译文的情况下,仅依靠源语句评估机器翻译句子的质量。该任务包括词级别和句...
Nat. Comput. Sci. 前沿:基于深度强化学习的城市社区空间规划方法
清华大学电子系城市科学与计算研究中心与建筑学院合作,提出了强化学习的城市社区空间规划模型与方法,实现了人类规划师与人工智能算法协作的城市规划流程,...
RLHF何以成LLM训练关键?AI大牛盘点五款平替方案,详解Llama 2反馈机制升级
AI领域对RLHF技术的使用逐渐过时,但新的技术路线尚不明朗:是采用无需人工反馈的方法,还是继续改进RLHF机制。RLHF技术提升了语言模型的性能,注入了人类社...
AI Bot背后的强化学习技术与应用
本期「中国游戏企业出海周周谈」分享游戏领域内的数据治理、游戏自动化开发、基于LLMs的行为分析新思路等干货内容,分享嘉宾来自完美世界、37手游、亚马逊云...
立法能打败AI“魔法”吗?“人机对齐”能防住技术失控吗?
“AI换脸”技术的普及化引起了公众对其法律风险的关注。人脸和声音等生物信息一旦泄露可能影响社会秩序稳定。监管应该保持战略定力和自信,让技术先行,同时在...
从「思想实验」中学习,自监督 AI 模型向科学家看齐
ChatGPT因其背后的“血汗工厂”而引起争议,这表明为AI模型准备大规模、预先标注的训练数据是一项极其耗费精力的工作。在计算成像和显微成像方面的现有应用中,...