Skip to content
毫河风报
菜单
  • 首页
  • 关于我们
  • 联系我们
  • 播记
 

OpenAI GPT-4o mini 刚一发布,就出 bug?

2024-07-20

今天凌晨 1:34 分,OpenAI 推出 GPT-4o mini,更智能且更实惠。

比较有意思的是,著名的前 OpenAI 研究员、 前特斯拉自动驾驶视觉总监 Andrej Karpathy 说:「LLM 模型大小的竞争正在加剧……倒退!」

价格更低,能力那可不弱

这一次 GPT-4o mini 的发布,再一次牵动了大家的神经,毕竟,这次的模型相对于 GPT-3.5 Turbo,更优,成本更低。

GPT-4o mini 输入的价格为 0.15 美元/100 万 token,输出为 0.6 美元/100 万 token。这一价格不仅比市场上的其他 SOTA(State of the Art)模型便宜一个数量级,更比 OpenAI 之前的 GPT-3.5 Turbo 模型便宜了超过 60%。

OpenAI CEO ⼭姆・奥特曼对 GPT-4o mini 的价格形容为“too cheap to meter”,意味着其成本之低,几乎可以忽略不计。

更有趣的是,GPT-4o mini 被称为“韭菜”…

GPT-4o mini 在多个学术基准测试中展现了其卓越的性能。在 MMLU(多语言多任务语言理解)测试中,得分高达 82%,超越了 Gemini Flash 和 Claude Haiku 等其他小型模型。

GPT-4o mini 在数学推理和编码任务上同样表现不俗。在 MGSM(数学推理)测试中,它以 87.0% 的得分率领先于 Gemini Flash 的 75.5% 和 Claude Haiku 的 71.7%。在 HumanEval(编码性能)测试中,GPT-4o mini 以 87.2% 的得分率再次占据榜首,显示出其在编程逻辑和代码生成方面的高效率。

除了文本和数学推理,GPT-4o mini 在多模态推理方面也展现了强劲的性能。在 MMMU(多模态推理评估基准)测试中,GPT-4o mini 以 59.4% 的得分率领先,相比 Gemini Flash 的 56.1% 和 Claude Haiku 的 50.2%,其优势明显。

开发者也没闲着,且大半是华人

正式宣传开始后,开发者就在 X 上开始宣传了,大张锣鼓,好不热闹。

按照惯例,OpenAI 还是在博客的末尾写下了本次的开发者。

GPT-4o mini 团队有 9 位核心成员,其中 5 位是华人面孔:

  1. Kevin Lu:2021 年从加州大学伯克利分校毕业,研究强化学习和序列建模,最近加入 OpenAI。
  2. Shengjia Zhao:2022 年加入 OpenAI,斯坦福大学计算机科学博士,清华大学本科,负责 ChatGPT 的训练和对齐。
  3. 任泓宇:去年加入 OpenAI,负责语言模型训练,是 GPT-4o 的核心开发者,本科北京大学,博士斯坦福大学。
  4. Haitang Hu:去年 9 月加入 OpenAI,本科同济大学,硕士约翰·霍普金斯大学,之前在 Google 工作了 7 年多,参与 TensorFlow 和大语言模型基础设施的研发。
  5. Mianna Chen:2023 年 12 月加入 OpenAI,项目经理,普林斯顿大学毕业,沃顿商学院 MBA,之前在 Google 和 DeepMind 担任产品经理。

其他核心成员:

  • Jacob Menick:2022 年 9 月加入 OpenAI,是 GPT-4o mini 的技术总负责人,之前在 DeepMind 参与多个语言模型项目。
  • Eric Wallace:去年 11 月加入 OpenAI,专注大模型的可靠性和安全性,目前在加州大学伯克利分校读博,之前在 DeepMind 和 Meta 实习。
  • Nick Stathas:去年 5 月加入 OpenAI,经验涵盖高性能计算、机器学习、自动驾驶和嵌入式系统,麻省理工学院本硕,曾在 MIT Driverless 担任首席工程师。
  • Felipe Petroski Such:2020 年加入 OpenAI,是 GPT-4o 的核心贡献者,之前在 Uber 担任研究科学家,罗切斯特理工学院计算机工程双学位。

最后

OpenAI 后续会推出 GPT-4o mini 微调版本。目前 GPT-4o mini 会在 ChatGPT 中替代 GPT-3.5 Turbo,Free、Plus 和 Team 用户今天起就能用上,企业用户下周也能用。

OpenAI 说过去几年 AI 进步很大,成本也降了不少。举个例子,从 2022 年的 text-davinci-003 到现在的 GPT-4o mini,每个 token 的成本下降了 99%。

需要注意的是,目前的 GPT-4o mini 疑似还有 bug,比如下面这位用户反馈,输入同一张图片,GPT-4o 的输入 token 为 500,而 GPT-4o mini 输入所耗的 token 为 14242,整整相差了 28 倍。

建议开发者们等一等再换 API,等这个问题有答复后再切换。

AI 日报

查看全部日报

  • AI 代理战场新核武!OpenAI 发布 o3 模型:比肩人类决策,媲美专业审核
  • 软银 5000 亿美元 AI「星门」陷融资困境,孙正义:短期波动不足为惧
  • 贝索斯加持 AI 搜索新星估值 140 亿!3 年超谷歌 7 年成绩
  • 苹果重磅爆料:秘密研发两大“杀手锏”芯片,剑指智能眼镜与 AI 服务器!
  • 千觉机器人完成千万融资!加速多模态触觉技术落地

©2025 毫河风报 沪ICP备18012441号-5