AlphaCode2-Google公布的基于Gemini的AI编程助手

AI工具2年前 (2024)发布 Ai导航

608 0 0

谷歌日前发布了AlphaCode2，这是一款由Gemini模型驱动的AI编程工具，是对前代AlphaCode的改进版本。与Gemini模型同时亮相，AlphaCode2在编程竞赛中表现出色，尤其在动态规划等复杂问题上具备更强大的能力。

研究人员通过在CodeForces竞赛网站上收集的约15000个问题和3000万份人类编写的代码的数据集上对Gemini Pro系统进行精细调整，为AlphaCode2的问题解决能力提供了强大支持。

根据谷歌在Codeforces平台上的数据，AlphaCode2在涵盖Python、Java、C++和Go等多语言的编程竞赛中，平均胜过了约85%的竞争对手，相较于前代，这是一次显著的提升。在技术白皮书中指出，在12场最近的竞赛中，AlphaCode2解决了77个问题中的43%，而前代仅在25%的问题上获得成功。

动态规划是编程竞赛中常见的复杂问题之一，而AlphaCode2展现出其在这方面的卓越表现。DeepMind研究科学家Rmi Leblond在一段预录视频中解释说，AlphaCode2不仅知道何时正确实施动态规划策略，还知道在何处使用它。这对于原始AlphaCode在处理需要动态规划的编程问题时曾经遇到的困难而言，是一项显著的进步。

AlphaCode2的工作原理涉及一系列“策略模型”，这些模型为每个问题生成多个代码样本。不符合问题描述的代码样本被过滤掉，然后通过聚类算法将“语义相似的代码样本”分组，以避免冗余。最终，AlphaCode2内的评分模型确定每个最大代码样本“簇”中的最佳候选答案。

尽管AlphaCode2在编程竞赛中表现出色，但白皮书指出其存在一些缺陷。例如，AlphaCode2需要大量的试错，运营成本较高，且过于依赖于过滤明显错误的代码样本。据猜测，迁移到更强大的Gemini版本，如Gemini Ultra，可能会缓解这些问题。

Google DeepMind相信，通过使用Gemini Ultra，一个比Gemini Pro更大更强大的大型语言模型，他们可以构建一个更出色的代码编写模型，并表示正在努力将其能力提供给开发者。团队希望将AlphaCode2的独特能力引入基础Gemini模型，使这种新的编程范式成为所有人的首选。

关于AlphaCode2是否会成为产品的问题，DeepMind的产品副总裁Eli Collins在一次简报中暗示了这一可能性。

他表示:“关于最新结果最让我兴奋的事情之一是，当程序员与[由Gemini提供动力的] AlphaCode2合作时，通过定义代码应遵循的某些属性，[模型]的性能会变得更好。”

他进一步指出:“在未来，我们预见程序员将利用高度 capable 的AI模型作为协作工具，从问题推理到辅助实施，助力整个软件开发过程。”