OpenAI 最近宣布将跳过 GPT-5,直接开发代号为 Orion(猎户座)的 GPT-6 模型。OpenAI 的 Strawberry 项目已经被认为是 GPT-4 的下一代,具备更好的推理和数学能力。根据路透社的报道,OpenAI 在七月中向美国国家安全官员展示了这项技术,考虑到安全问题,强大的 Strawberry 模型不会直接对公众提供服务,而是会推出一个更小的蒸馏版供外部使用。完整的 Strawberry 模型将用于生成高质量的合成数据,以训练 GPT-6。
Strawberry 项目是 OpenAI 在人工智能领域的一项重大突破,旨在提升 AI 的推理能力和数学计算能力。该项目的前身是 Q,在去年首次被曝光时就引起了广泛关注。Strawberry 模型在超大规模数据集上完成预训练,并采用了一种特殊的方法,使其推理能力接近人类水平。
在七月中旬,OpenAI 向美国国家安全官员展示了 Strawberry 模型的能力。展示内容包括模型在数学和推理方面的表现,以及其在自主互联网搜索和深度研究中的应用。OpenAI 强调,Strawberry 模型能够自主规划和执行复杂任务,这使得它在处理高难度问题时表现出色。
为了确保技术的安全性,OpenAI 决定不直接向公众提供完整的 Strawberry 模型。相反,他们将推出一个更小的蒸馏版,以满足科研和企业的需求。蒸馏版模型的部署成本更低,且公众用户并不需要如此强大的推理能力。完整的 Strawberry 模型将被内部用来生成高质量的合成数据,用于训练下一代模型 GPT-6(Orion)。
在 Strawberry 项目的背景下,OpenAI 于 2024 年 5 月 14 日发布了新一代 AI 模型 GPT-4o。GPT-4o 是 GPT-4 的升级版本,具备更强的多模态能力和更快的推理速度。发布会上,OpenAI 展示了 GPT-4o 在文本、音频和视觉处理方面的表现。
GPT-4o 的 “o” 代表 “omni”,意为全能。该模型能够实时进行音频、视觉和文本推理,接受文本、音频和图像的任何组合作为输入,并生成文本、音频和图像的任意组合输出。GPT-4o 的反应速度显著提升,可以在短至 232 毫秒、平均 320 毫秒的时间内响应音频输入,与人类在对话中的反应速度一致。
发布会上,OpenAI 联合创始人兼总裁格雷格・布罗克曼展示了新版 ChatGPT 的对话能力。新版 ChatGPT 不仅能通过视觉 AI 能力理解摄像头中发生的事情,还能够将理解的内容通过语音与旧版本 ChatGPT 交互,进行互动。同时,新版 ChatGPT 支持中途打断和对话插入,具备上下文记忆能力。