2024 年 8 月 6 日,OpenAI 宣布在其 API 中推出结构化输出功能。这一新功能允许模型输出可靠地遵循开发者提供的 JSON Schema,从而提高了输出的可控性和准确性。OpenAI 在其官网上表示:“通过利用结构化输出,开发者可以更轻松地集成和使用我们的模型。”
这一消息在社交媒体上引起了广泛讨论。许多开发者对这一功能表示欢迎。一位 Twitter 用户评论道:“结构化输出将使我们的应用程序更加稳定和可靠。” 另一位用户则表示:“OpenAI 的这一举措将使得 AI 模型的集成变得更加容易。” 然而,也有一些用户对这一功能的实际效果表示怀疑。一位 Reddit 用户指出:“虽然结构化输出听起来不错,但我担心在实际应用中可能会遇到一些问题,特别是在处理复杂数据时。”
OpenAI 在技术上的不断突破背后,是其高昂的运营成本和严峻的财务挑战。据报道,OpenAI 在 2024 年的亏损可能高达 50 亿美元,这使得公司面临在 12 个月内耗尽现金的风险。根据内部财务数据,OpenAI 今年的运营总成本可能达到 85 亿美元,其中推理和训练成本分别高达 40 亿和 30 亿美元。
为了应对这一挑战,OpenAI 采取了一系列措施,包括融资、降本和拓展营收。OpenAI 已经完成了七轮融资,筹集资金超过 110 亿美元,最近一次是在 2024 年 4 月与 ARK Investment Management 进行的私募融资。尽管如此,OpenAI 仍需要在未来 12 个月内完成另一轮融资,以增强其资产负债表。
在降本方面,OpenAI 通过实施构建模型的新技术,已经降低了运行 AI 模型的成本。微软向 OpenAI 每台 A100 服务器收取的费用约为每小时 1.30 美元,这使得 OpenAI 能够以较低的成本运行其模型。然而,如果推理成本不能最终降低,用户可能需要为 AI 技术支付更高的价格。
在拓展营收方面,OpenAI 已经向开发者收取访问旗下 GPT 系列模型的费用,供后者开发自己的对话式 AI 应用或编码助手。这项业务被称为应用编程接口(API),截至 2024 年 3 月,该公司这一业务每月的收入超过 8000 万美元。此外,OpenAI 还计划推出新产品,包括搜索引擎和计算机使用代理。今年 5 月,OpenAI 被曝正研发一款新的搜索引擎,可能叫 SearchGPT 或 Sonic。
OpenAI 在技术上的不断创新不仅体现在结构化输出功能的推出上,还包括其在高级语音模式和 SearchGPT 等领域的最新进展。2024 年 7 月 31 日,OpenAI 宣布开始向一小部分 ChatGPT Plus 用户推出基于 GPT-4o 的高级语音模式。这一模式提供更自然的实时对话,允许用户随时打断,并能感知和响应用户情绪。
高级语音模式的推出受到了用户的关注。许多收到邀请的用户已经开始试用,并分享了他们的体验。一位用户在社交平台上分享了一段由 ChatGPT 献上的快嘴 Rap 和 Beatbox 视频。另一位用户则表示:“ChatGPT 的高级语音模式与官方的演示差别并不大,几乎没有时延,各种语气也十分生动。” 然而,高级语音模式在安全方面也做了很多防护措施,ChatGPT 拒绝用户请求的几率变高了。一位用户在 Reddit 上分享道:“ChatGPT 拒绝了我所有的唱歌请求,也不愿意改变声线。”
与此同时,OpenAI 还在 2024 年 7 月 30 日宣布推出人工智能搜索引擎原型 SearchGPT,直接挑战谷歌在在线搜索市场的主导地位。SearchGPT 能为用户提供快速、及时的答案,并提供清晰、相关的信息来源。OpenAI 在其官网上表示:“通过利用网络实时信息增强我们模型的对话能力,可以更快、更轻松地找到您要找的东西。”
SearchGPT 的推出引发了广泛关注。The Atlantic 首席执行官 Nicholas Thompson 在一份书面声明中表示:“人工智能搜索将成为人们浏览互联网的主要方式之一,在这个早期阶段,关键是要以重视、尊重和保护新闻业和出版商的方式来构建这项技术。” 然而,这一举措也引发了人们对人工智能系统真正能提供的知识深度和广度的质疑,以及它们是否会在无意中制造假性信息。