在今年的 OpenAI Dev Day 上,尽管没有直播且现场不允许录像,但 @SimonW 提供了文本版现场直播。此次活动中,“实时语音 API” 正式开放,引发了广泛关注。该 API 的应用前景广阔,特别是在互动教育、向导、翻译和陪伴等场景中。
OpenAI Dev Day 是 OpenAI 举办的一次活动,旨在向开发者展示其最新的技术和产品。此次活动吸引了全球各地的开发者和技术爱好者,大家齐聚一堂,共同探讨 AI 技术的发展和应用。OpenAI 在活动中发布了一系列新产品和技术,包括最新的大语言模型和开发者工具。
实时语音 API 允许开发者创建能够理解语音命令并大声读出其响应的 AI 应用程序。该 API 的应用场景广泛,特别是在互动教育、向导、翻译和陪伴等领域。例如:
- 在互动教育中,教师可以利用该 API 创建智能助教。- 在旅游向导中,游客可以通过语音与 AI 向导互动,获取实时的旅游信息和建议。- 在翻译领域,实时语音 API 可以实现即时的语音翻译。- 在陪伴应用中,AI 助手可以通过语音与用户互动。
除了实时语音 API,OpenAI 还发布了一系列新的开发者工具。例如,OpenAI 引入了视觉微调功能,使开发者能够使用图像以及文本来微调他们的 GPT-4o 应用程序。OpenAI 的产品 API 负责人 Olivier Godement 表示,开发者将无法上传受版权保护的图像、描绘暴力的图像或其他违反 OpenAI 安全政策的图像。