标签:资源
通过奖励建模实现可扩展的智能体对齐
将强化学习算法应用于现实场景的障碍之一是缺乏合适的奖励函数,一定程度上是因为无法明确表述用户对任务目标的理解,从而能够以符合用户意图的方式解决复杂...
北京邮电大学|用于成本和延迟敏感的虚拟网络功能放置和路由的多智能体深度强化学习
用于解决联合虚拟网络功能 (VNF) 布局和路由 (P&其中同时包含具有不同需求的多个服务请求。服务请求的差异化需求反映在它们的延迟和成本敏感因素上,R 问...
8个扩展子包!RecBole推出2.0!
易用又强大的推荐算法框架伯乐(RecBole)又双叒叕发布新版本啦!覆盖从数据到模型多个推荐系统最新的主题和方向!为推荐系统多个领域的研究提供易用又强大的工...
AI TIME丨回顾与展望神经网络的后门攻击与防御
宾夕法尼亚州州立大学电子工程系博士生向臻、清华大学博士生李一鸣、弗吉尼亚理工计算机工程博士生曾祎、普渡大学计算机科学博士生沈广宇。
加速经典算法效率,突破现实技术瓶颈:图神经网络与组合优化读书会启动
基于图神经网络的复杂系统优化与控制将会是大模型热潮之后新的未来方向,为了探讨图神经网络在算法神经化求解的发展与现实应用,包括神经算法推理、组合优化...
AI Open2022|基于异质信息网络的推荐系统综述:概念,方法,应用与资源
推荐系统旨在为用户过滤掉不相关的信息。越来越多的工作提出在推荐系统中引入辅助信息来缓解数据稀疏和冷启动问题,基于异质信息网络(HIN)的推荐系统提供了一...
KnowledgeGPT:从各种信息源中提取知识并使用GPT-3生成答案
用于从各种信息源中提取知识并使用OpenAI的GPT-3模型生成答案的工具。支持从互联网、本地数据、YouTube字幕和音频等各种信息源中提取文本。OpenAI的GPT-3模型...
大模型工具学习权威综述,BMTools 背后的论文!
近期,来自清华大学、中国人民大学、北京邮电大学、UIUC、NYU、CMU等高校的研究人员联合 OpenBMB开源社区、知乎、面壁智能公司探索了基础模型调用外部工具的...
OpenAI &吴恩达|开发人员ChatGPT提示工程限时免费入门课
开发人员的ChatGPT提示工程对初学者友好。但它也适用于希望接近快速工程的前沿并使用LLM的高级机器学习工程师,旨在帮助开发人员有效利用LLM。反映了对使用最...
高效训练多模态大模型(BLIP-2)|OpenBMB论文速读第 6 期
【论文速读】是OpenBMB发起的大模型论文学习栏目,我们邀请来自清华大学自然语言处理实验室以及各大高校、科研机构的学术达人 作为主讲人分享大模型领域的论...