OpenAI 跳过 GPT-5，直接开发代号 Orion 的 GPT-6模型！

OpenAI 最近宣布将跳过 GPT-5，直接开发代号为 Orion（猎户座）的 GPT-6 模型。OpenAI 的 Strawberry 项目已经被认为是 GPT-4 的下一代，具备更好的推理和数学能力。根据路透社的报道，OpenAI 在七月中向美国国家安全官员展示了这项技术，考虑到安全问题，强大的 Strawberry 模型不会直接对公众提供服务，而是会推出一个更小的蒸馏版供外部使用。完整的 Strawberry 模型将用于生成高质量的合成数据，以训练 GPT-6。

Strawberry 项目是 OpenAI 在人工智能领域的一项重大突破，旨在提升 AI 的推理能力和数学计算能力。该项目的前身是 Q，在去年首次被曝光时就引起了广泛关注。Strawberry 模型在超大规模数据集上完成预训练，并采用了一种特殊的方法，使其推理能力接近人类水平。

在七月中旬，OpenAI 向美国国家安全官员展示了 Strawberry 模型的能力。展示内容包括模型在数学和推理方面的表现，以及其在自主互联网搜索和深度研究中的应用。OpenAI 强调，Strawberry 模型能够自主规划和执行复杂任务，这使得它在处理高难度问题时表现出色。

为了确保技术的安全性，OpenAI 决定不直接向公众提供完整的 Strawberry 模型。相反，他们将推出一个更小的蒸馏版，以满足科研和企业的需求。蒸馏版模型的部署成本更低，且公众用户并不需要如此强大的推理能力。完整的 Strawberry 模型将被内部用来生成高质量的合成数据，用于训练下一代模型 GPT-6（Orion）。

在 Strawberry 项目的背景下，OpenAI 于 2024 年 5 月 14 日发布了新一代 AI 模型 GPT-4o。GPT-4o 是 GPT-4 的升级版本，具备更强的多模态能力和更快的推理速度。发布会上，OpenAI 展示了 GPT-4o 在文本、音频和视觉处理方面的表现。

GPT-4o 的 “o” 代表 “omni”，意为全能。该模型能够实时进行音频、视觉和文本推理，接受文本、音频和图像的任何组合作为输入，并生成文本、音频和图像的任意组合输出。GPT-4o 的反应速度显著提升，可以在短至 232 毫秒、平均 320 毫秒的时间内响应音频输入，与人类在对话中的反应速度一致。

发布会上，OpenAI 联合创始人兼总裁格雷格・布罗克曼展示了新版 ChatGPT 的对话能力。新版 ChatGPT 不仅能通过视觉 AI 能力理解摄像头中发生的事情，还能够将理解的内容通过语音与旧版本 ChatGPT 交互，进行互动。同时，新版 ChatGPT 支持中途打断和对话插入，具备上下文记忆能力。