大模型
参数数量非常庞大的深度神经网络或其他机器学习模型。
小羊驼Vicuna团队新作:Chatbot Arena——实际场景用Elo rating对 LLM 进行基准测试
采用匿名、随机的方式进行对抗评测,评测方式基于国际象棋等竞技游戏中广泛使用的 Elo rating system。平台采用 FastChat 多模型服务系统,在多个语言下提供...
Open LLMs:可供商业使用的开放大型语言模型(LLM)列表
//github.com/eugeneyan/open-llms
AutoML-GPT:基于GPT的自动机器学习
这篇论文试图解决的问题是如何自动化机器学习的训练过程。论文还试图验证利用大型语言模型(LLMs)自动化训练的可行性:解决人工挑选模型架构、优化算法和超...
CMU & Meta|逼真生成式3D人脸模型研究
提出一种3D可控生成人脸模型的方法。结合了2D人脸生成模型和语义人脸处理,能编辑具有细节的3D渲染人脸,Meta],2D人脸模型难以准确分离面部属性:限制了其编辑...
微软|MLCopilot:释放大型语言模型在解决机器学习任务中的能力
利用最先进的语言模型(即LLMs为新型机器学习任务开发机器学习解决方案,该研究展示了LLM扩展到理解结构化输入和执行彻底推理的可能性,本篇论文旨在解决机器...
PMC-LLaMA: 用医学论文微调LLaMA
本文提出一种基于生物医学文献的预训练语言模型PMC-LLaMA,大型语言模型(LLMs)由于缺乏领域特定知识而表现不佳的问题,作者通过在4.8百万篇生物医学论文上...
Nature|语言模型用于疾病抗体疗法
类似于ChatGPT背后的语言模型已被用于改进针对新冠肺炎、埃博拉和其他病毒的抗体疗法。并帮助为抵制传统设计方法的目标解锁抗体药物:Hie、Kim和他们的同事使...
KnowledgeGPT:从各种信息源中提取知识并使用GPT-3生成答案
用于从各种信息源中提取知识并使用OpenAI的GPT-3模型生成答案的工具。支持从互联网、本地数据、YouTube字幕和音频等各种信息源中提取文本。OpenAI的GPT-3模型...
CMU & Meta|逼真生成式3D人脸模型研究
提出一种3D可控生成人脸模型的方法。结合了2D人脸生成模型和语义人脸处理,能编辑具有细节的3D渲染人脸,Meta],2D人脸模型难以准确分离面部属性:限制了其编辑...
OpenAI &吴恩达|开发人员ChatGPT提示工程限时免费入门课
开发人员的ChatGPT提示工程对初学者友好。但它也适用于希望接近快速工程的前沿并使用LLM的高级机器学习工程师,旨在帮助开发人员有效利用LLM。反映了对使用最...