标签:论文

卡内基梅隆大学|AnyMorph:通过推断智能体形态来学习可转移策略

【推荐理由】强化学习的典型方法包括针对每一种新形态从零开始为特定智能体量身定制的训练策略。最近的工作旨在通过研究在具有类似任务目标的多个智能体上训...

通过强化学习出现类似信念的表征

动物必须学会预测未来的奖励或价值。动物被认为使用强化学习来学习奖励预测,真实环境中动物还必须学会仅使用不完整的状态信息来估计价值,动物通过首先形成...

田纳西大学|随机旅行时间的无人机与卡车联合运输问题:一种强化学习方法

//www.sciencedirect.com/sdfe/reader/pii/S1366554522002034/pdf【推荐理由】作为一种新颖的城市配送方式,卡车-无人机协同作业越来越受欢迎,研究将此问题...

北京邮电大学|用于成本和延迟敏感的虚拟网络功能放置和路由的多智能体深度强化学习

用于解决联合虚拟网络功能 (VNF) 布局和路由 (P&其中同时包含具有不同需求的多个服务请求。服务请求的差异化需求反映在它们的延迟和成本敏感因素上,R 问...

UC Berkeley | 通过潜在意图从被动数据中进行强化学习

【推荐理由】本文通过潜在意图从被动数据中进行强化学习,这种方案可以学习适用于下游任务的价值预测特征,并且实验表明可以从多种形式的被动数据中学习,【...

KDD2022 | 什么特征进行交互才是有效的?

本文主要针对推荐系统中的特征交互而提出的相关方法。如果将所有可能的特征都进行交互,本文提出HIRS用于直接生成有益特征交互。生成的特征交互的数量可以指...

自适应非欧表征广告检索系统AMCAD

近年来的研究发现欧氏空间在建模特定图结构如层次、环状结构时天然存在误差,我们将介绍如何利用非欧图表征提高复杂异构图建模精度同时在阿里妈妈搜索广告场...

KDD 2022 | 协同过滤中考虑表征对齐和均匀性

本文主要针对协同过滤方法中的数据表征展开研究,现有的研究主要集中在设计更强大的编码器(例如。图神经网络)以学习更好的表征。而缺乏对 CF 中表征的期望...

8个扩展子包!RecBole推出2.0!

易用又强大的推荐算法框架伯乐(RecBole)又双叒叕发布新版本啦!覆盖从数据到模型多个推荐系统最新的主题和方向!为推荐系统多个领域的研究提供易用又强大的工...

SIGIR2021 | 基于特征交互学习的门控增强多任务神经网络用于CTR预测

深度神经网络(DNN)模型已被广泛应用于在线广告点击率(CTR)预测。CTR训练框架通常由嵌入层和多层感知机(MLP)组成。在百度搜索广告系统中(又名凤巢,新一代的CT...
1 6 7 8 9 10 14