2024 年 9 月 20 日,OpenAI 宣布其最新的 o1-preview 和 o1-mini 模型现已在 GitHub Copilot 和 VS Code 中上线。这一消息迅速引起了开发者社区的广泛关注。GitHub 的 CEO Thomas Dohmke 在 X 上发布了一段视频,展示了 GitHub Copilot 在 VS Code 中运行 OpenAI 的 o1 模型。这一集成使得开发者可以通过 GitHub Copilot Chat、Visual Studio Code 和 GitHub Models 使用这些模型,提升了代码编写和调试的效率。
OpenAI 的 o1-preview 模型以其提升的推理能力而著称,能够帮助开发者更深入地理解代码约束和边缘情况,编写高质量代码。用户可以通过与 o1-preview 模型聊天,快速解释 API、生成模板代码、设计复杂算法或分析逻辑错误,并在 GitHub Models 中测试这些模型的功能和性能。
The Information 报道称,一些试用了 o1-preview 的用户表示,很多互动 “不值得额外等待 10 到 20 秒的时间”,他们更喜欢 GPT-4o 的响应速度。尽管如此,OpenAI 仍然计划在未来向所有用户免费提供 o1-mini。
OpenAI 的 o1-preview 模型不仅在推理能力上有所提升,还在技术细节上进行了多项优化。与之前的模型相比,o1-preview 能够更好地处理复杂的科学、编码和数学问题。OpenAI 在其博客中提到,这些模型被训练得更像人类一样,在回答问题之前会花更多时间思考,从而提高回答的准确性。在一项国际数学奥林匹克(IMO)资格考试中,o1-preview 模型的正确率达到了 83%,而 GPT-4o 仅为 13%。
与竞争对手相比,OpenAI 的 o1-preview 模型在推理能力上具有优势。Anthropic 和 Google 也在开发具有 “推理” 能力的高级 AI 模型,但 OpenAI 的 o1-preview 在处理复杂任务方面表现更为出色。
尽管 OpenAI 的 o1-preview 模型在推理能力和复杂问题解决方面表现出色,但用户反馈也指出了一些需要改进的地方。一些用户认为,o1-preview 的响应时间较长,影响了使用体验。对此,OpenAI 表示将继续优化模型的性能,并计划在未来增加更多功能,如浏览网页和上传文件。
未来,OpenAI 还计划推出更多版本的 o1 模型,以满足不同用户的需求。o1-mini 作为 o1-preview 的小型、经济实惠版本,已经在开发者中获得了积极反馈。