标签:机器学习
University of Colorado Boulder : Mateo Perez | 循环强化学习
【论文链接】https“【推荐理由】循环是有限描述潜在无限对象的基本范式。由于最先进的强化学习(RL)算法无法直接对循环进行推理;它们必须依靠实践者的创造...
UC Berkeley:Charlie Snell | 基于内隐语言Q学习的自然语言生成离线RL
【推荐理由】大型语言模型从文本语料库中提取广泛的知识,这个问题可以通过在管理的数据集上进行监督学习或通过强化学习对此类模型进行微调来解决。本文提出...
FURG : Junior C. de Jesus | Depth-CUPRL:无人机Mapless导航强化学习中的深度图像对比无监督优先表示
【推荐理由】强化学习通过原始像素成像和连续控制任务在视频游戏中表现出了令人印象深刻的性能。RL在高维观察(如原始像素图像)中表现不佳。基于物理状态的R...
奥斯陆大学:Li Meng | 基于Swin-Transformer的深度强化学习
【论文链接】https”【推荐理由】Transformers是利用多层自注意力头的神经网络模型”Transformers近年来在自然语言处理任务上表现出了优异的性能。决策转换器已...
CVPR 2023 Award Candidate | 自动驾驶通用算法框架UniAD
上海人工智实验室提出了自动驾驶通用算法框架——Unified Autonomous Driving(UniAD)。包括传感器技术、机器学习、路径规划等方面,大部分自动驾驶相关的工作...
SIGGRAPH | 6个惯性传感器和1个手机实现人体动作捕捉、定位与环境重建
人体运动和环境的组合感知对于人类与环境互动的场景非常重要,人体和环境同时感知可以实现更高级别的人机交互,清华大学徐枫团队提出了仅使用6个惯性传感器(...
借力计算机视觉及深度学习,纽卡斯尔大学开发实时、自动化奶牛跛行检测系统
纽卡斯尔大学联合费拉科学有限公司联合开发了一个针对多头奶牛的自动化、实时跛行检测系统。该系统能够按照跛行评分系统将奶牛进行分类,来自纽卡斯尔大学的 ...
谷歌Pinpoint,一种AI记者工具
Pinpoint 是Reporter Studio(Google推出的一系列记者工具)的重要成员,更高效、更具创造性的安全的工作”Pinpoint 的基本功能是超级文档搜索工具。通过使用...
MMCU@中文通用大语言模型测试集预发布
但却一直没有出现可应用于评测大模型能力的测试。甲骨易AI研究院提出一种衡量中文大模型处理多任务准确度的测试,并在此基础上制作了一套适配测试中文大模型...
填补国产空白!首个联网支持中文问答开源模型WebCPM
面壁智能联合来自清华、人大、腾讯的研究人员共同发布了 中文领域首个基于交互式网页搜索的问答开源模型框架WebCPM,能够像人类一样与搜索引擎交互从而收集回...