复杂推理:大语言模型的北极星能力
这意味着复杂任务很可能是大型和小型语言模型的关键差异因素”复杂推理为基于语言模型构建大量应用程序提供了机会,我们将仔细分析讨论如何让大语言模型拥有强...
小羊驼Vicuna团队新作:Chatbot Arena——实际场景用Elo rating对 LLM 进行基准测试
采用匿名、随机的方式进行对抗评测,评测方式基于国际象棋等竞技游戏中广泛使用的 Elo rating system。平台采用 FastChat 多模型服务系统,在多个语言下提供...
Open LLMs:可供商业使用的开放大型语言模型(LLM)列表
//github.com/eugeneyan/open-llms
AutoML-GPT:基于GPT的自动机器学习
这篇论文试图解决的问题是如何自动化机器学习的训练过程。论文还试图验证利用大型语言模型(LLMs)自动化训练的可行性:解决人工挑选模型架构、优化算法和超...
中科大&美团提出VIRT,从交互模型中蒸馏知识,在文本匹配上实现性能和效率的平衡!
基于孪生Transformer编码器的表示模型已成为高效文本匹配的主流技术,通过注意力图提取将交互知识从基于交互的模型转移到孪生编码器,对话代理需要通过预测用...
AI Daily 深度见解|05.07(千行百业Ⅳ)
千行百业Ⅳ 讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT 本文链接:https://www.ainavpro.com/2757.html 讯飞星火认知大模型发布及...
GPT-4 时代的新闻推荐算法:只读最重要的新闻
本文链接:https://www.ainavpro.com/2754.html GPT-4 时代的新闻推荐算法:只读最重要的新闻https://www.ainavpro.com/sites/2752.html这个极简新闻网站,...
10 个人工智能扩展将把你变成一个生产力的野兽
本文地址:https://www.ainavpro.com/2730.html Fireflies 你在浏览器中的人工智能实习生: - 记录和誊写会议内容 - 总结电子邮件和文件 - 总结 Youtube ...
AI Daily 深度见解|05.06(大厂出招)
大厂出招:除了钉钉飞书,其它大厂的其它BU也都开始活络起来 WPS AI 来了,比 ChatGPT 更适合办公,还更懂中文 文章来源:APPSO 产品体验:WPS AI在在线...
《强化学习周刊》第52期:Depth-CUPRL、DistSPECTRL & Double Deep Q-Network
本期周刊整理了强化学习领域相关的最新论文推荐及研究综述,可以扫描文末的二维码加入强化学习社区群。您已经完成《强化学习周刊》订阅啦;以后智源社区会自动...