太多模型了!
多少个 AI 模型才算太多?这需要看你的角度。但每周 10 个可能有点过头了。在过去几天里,我们大概就看到了这么多新模型的推出,要说这些模型彼此之间有何对比,甚至一开始就能比较,都变得越来越难。那么这到底有什么意义呢?
我们正处于 AI 发展的一个奇怪时期,尽管整个过程一直都很奇怪。我们看到从小型开发者到大型资金雄厚的公司,各种大小模型层出不穷。
不如我们来简单列举一下这周推出的几个模型,看看各自的特点。
- LLaMa-3: Meta 最新推出的”开放”旗舰大型语言模型,受到广泛关注。
- Mistral 8×22: 一个来自法国的”专家组合”大型模型,曾经宣称开放,但如今有所收缩。
- Stable Diffusion 3 Turbo: Stability 公司的 SD3 模型升级版,搭配了新的 API,借鉴了 OpenAI 模型命名中的”Turbo”。
- Adobe Acrobat AI Assistant: 由文档巨头 Adobe 推出,主要是基于 ChatGPT 的”与文档对话”功能。
- Reka Core: 一个由前大型 AI 公司员工组建的小团队开发的多模态模型,与大型模型相当竞争。
- Idefics2: 一个更开放的多模态模型,建立在 Mistral 和 Google 较小模型的基础之上。
- OLMo-1.7-7B: AI2 公司 LLM 模型的更大版本,是通往 70B 规模模型的一个阶段。
- Pile-T5: 基于可靠的 T5 模型,针对代码数据库 Pile 进行微调,提升了编码能力。
- Cohere Compass: 一个专注于整合多种数据类型的”嵌入模型”,以覆盖更多应用场景。
- Imagine Flash: Meta 最新的图像生成模型,采用新的蒸馏方法来加速扩散,同时保持质量。
- Limitless: 一个基于个人历史数据的”个性化 AI”应用,跨网页、桌面和可穿戴设备。
这已经是11个了,因为在我写这篇文章的时候,又有一个新的模型被宣布了。这并不是本周发布或预览的所有模型!这只是我们看到并讨论过的那些。如果我们稍微放松一下纳入的条件,就会有几十个:一些微调过的现有模型,一些像 Idefics 2 这样的组合,一些实验性或小众的模型,等等。更不用提本周新推出的用于构建(torchtune)和对抗(Glaze 2.0)生成式AI的工具!
我们该如何看待这场永无止境的洪流呢?我们无法对它们全部进行”评论”。那么,我们如何帮助您这些读者理解并跟上所有这些变化呢?
事实是,您不需要跟上所有的变化。像ChatGPT和Gemini这样的一些模型已经发展成为整个网络平台,涵盖了多种用例和接入点。而其他大型语言模型,如LLaMa或OLMo,尽管在基本架构上有所共享,但实际上并不承担相同的角色。它们旨在作为服务或组件在幕后运行,而不是作为品牌名称出现在前台。
对这两种情况存在一些有意的混淆,因为模型开发者希望借用与主要AI平台发布相关的一些炒作。每个人都想让你认为他们的发布是重要的。但事实上,它可能对某人很重要,却几乎肯定不是你。
从汽车这样一个广泛而多样的类别的角度来看待这个问题。当汽车刚刚发明的时候,你只能买”一辆汽车”。后来,你可以选择大车、小车和拖拉机。如今,每年都会推出数百种汽车,但你可能只需要关注其中的十分之一,因为其余九成都不是你需要的车型或者不符合你对汽车的理解。同样,我们正从人工智能的大小型/拖拉机时代过渡到泛滥时代,即使是人工智能专家也跟不上不断涌现的新模型。
这个故事的另一面是,在ChatGPT和其他大型模型出现之前,我们已经处于这个阶段很长时间了。7、8年前,关于这个话题的讨论要少得多,但我们仍然一直在关注它,因为这显然是一项等待突破时刻的技术。不断有论文、模型和研究成果发布,SIGGRAPH和NeurIPS等会议上也充满了机器学习工程师交流心得、互相借鉴的场景。
那项活动每天仍在进行。但由于人工智能已经成为一个大生意 - 可以说是目前科技领域最大的生意 - 这些发展已经被赋予了一些额外的重要性,因为人们好奇是否会有一种像ChatGPT对其前辈那样的巨大飞跃。
事实真相是,这些模型中没有一个会有那种大的飞跃,因为OpenAI的进步是建立在机器学习架构的根本性变革之上的,而这种变革已经被其他公司所采用,并且还没有被超越。我们现在只能期待一些增量式的改进,比如在合成基准上提高一两个点,或者语言和图像稍微更有说服力。
这是否意味着这些模型都不重要?当然不是。没有2.1、2.2、2.2.1等版本,就不可能从2.0版本跳到3.0版本。有时这些进步是有意义的,解决了严重的缺陷,或暴露了意想不到的漏洞。我们试图报道有趣的那些,但这只是全部数量的一小部分。事实上,我们正在撰写一篇文章,收集所有我们认为ML爱好者应该了解的模型,大约有一打之多。
不要担心:当一个重大的突破出现时,你会知道的,不仅仅因为TechCrunch在报道它。它对你来说会像对我们一样显而易见。