▾ 栏目简介
✍? 编者按
—
? 原文中译
大模型的机遇与陷阱
—
大模型业务领域充斥着 API,缺少价值更高、开发难度更大的应用程序。
亲爱的朋友们,
大语言模型(LLMs)的竞争格局正在迅速打开。最终的胜者尚未确定,但当前的形势已经令人兴奋。让我分享一些观察结果,重点关注直接面向消费者的聊天接口以及大模基础设施和应用层。
首先,ChatGPT 是一个新产品类别。它不仅仅是一个更好的搜索引擎、自动补全器或者其他我们已经知道的东西。虽然它与其他产品类别有所重叠,但人们也将其用于完全不同的目的,比如写作和头脑风暴。像谷歌和微软这样将大模型集成到现有产品中的公司可能会发现,转变不仅涉及技术,而且涉及产品类别,这就带来了独特的挑战。
OpenAI 显然在提供这个新产品类别方面处于领先地位,ChatGPT 是一个极具吸引力的直接面向消费者的产品。虽然竞争对手正在不断涌现,但最近 ChatGPT 开始支持第三方插件,一旦广泛采用,那么 OpenAI 的业务可能会变得更具防御性——就像 iOS 和 Android 的应用商店帮助这些平台更具防御性一样。
其次,大模型的基础设施层使开发人员能够通过 API 与大模型交互,这看起来很有竞争力。OpenAI/微软在这个领域领先,谷歌和亚马逊也宣布推出了自己的产品,而 Hugging Face、Meta、Stability AI 等公司和许多学术机构也正在忙于训练和发布开源模型。有多少应用程序需要用到像 GPT-4 这样的最大模型,而不是云提供商提供的更小(更便宜)的模型,甚至是在本地托管的模型(如gpt4all)——这还有待观察。
最后是大模型应用层。开发团队是在大模型基础上构建的,这个领域看起来竞争不那么激烈,且充满创造力。虽然许多团队正在挤入“显而易见”的想法 ——比如在在线内容基础上构建问答机器人或摘要生成器 。但 大模型驱动应用程序的潜在多样性还未被充分探索,包括专业指导(specialized coaching)和机器人过程自动化(robotic process automation)等垂直领域。我所领导的风投公司 AI Fund 正在与企业家合作开发构建这样的应用程序。当你能够识别确定出一个有意义的用例并深入解决它时,竞争的感觉就会减弱。
大模型是一种通用技术,它使许多新应用成为可能。从早期技术时代汲取教训,在 iPhone 推出后我花了 1.99美元购买了一个能把我的手机变成手电筒的应用程序。这是一个好主意,但这个业务并没有持续下去:其他人很容易复制并以更低的价格销售这个应用程序,最终苹果将手电筒整合到了 iOS 系统中。相比之下,其他企业家则构建了价值更高和开发难度更大的应用,例如 AirBnB、Snapchat、Tinder 和 Uber,这些应用程序至今仍然与我们在一起。我们可能已经在生成式AI中看到了这种现象:Lensa 在去年 12月使用量迅速增长,但其营收似乎已经崩溃。
今天,在一个周末的黑客马拉松中,您就可以通过利用厉害的 API 构建一个浅层的应用程序,来实现惊人的结果。但从长远来看,让我兴奋的是 大模型能为解决难题提供有价值的解决方案。谁将打造生成式 AI 的持久成功?也许就是你!
一个挑战是,构建大模型产品的专业技术仍在不断发展。虽然学术研究很重要,但当前研究对如何使用大模型只提供了有限的视野。正如 InstructGPT 论文所说,“公共 NLP 数据集不反映我们如何使用语言模型……它们旨在捕捉使用自动指标进行评估的任务。”
鉴于此,社区的作用比以往任何时候都更加重要。与从事大模型产品开发工作的朋友交谈,经常教会我一些直觉以外的技巧来改进我对这些产品的使用。我将继续尽我所能去帮助别人。
请不断学习吧!
吴恩达
原文?:https://www.deeplearning.ai/the-batch/opportunities-and-pitfalls-for-large-language-models/
*声明:原文来自 DeepLearning.AI 官网,如有侵权,可提议撤稿
欢迎大家添加 【OpenBMB】 微信号,即可进入大模型社群交流文章,也可分享推荐更多AI领域的好文!文章时效不限,既可以是讨论密集的的热点时文,也可以是历久弥香的经典前文~
长期开放招聘|含实习
算法岗 | 开发岗 | 产品岗