2024 年 10 月 1 日,OpenAI 发布了最新的 Whisper V3 Turbo 模型,这一新模型在转录速度上实现了八倍的提升,同时保持了相当的准确性。Whisper V3 Turbo 通过 OpenAI 的 API 提供,方便开发者将其集成到他们的应用和服务中。社交媒体上,用户对这一新模型的反应热烈。例如,用户 @Ethan Walker 在推特上表示:“喜欢 Whisper Large v3 Turbo 的创新方法。我也在试验它,速度提升非常惊人。” 另一位用户 @Vaibhav (VB) Srivastav 则指出:“Whisper 是一个语音转录模型。它可以说是最好的多语言开放模型。历史上最好的模型是 large v3,但昨晚 OAI 发布了一个 Turbo 模型,比 large v3 快 8 倍,参数减少了一半。”
Whisper V3 Turbo 模型在技术上实现了显著的改进。与其前代模型 Large-v3 相比,Whisper V3 Turbo 的转录速度提高了八倍,同时保持了相当的准确性。模型的体积大约是前一个版本的一半,这种优化使得在各种平台上的部署变得更加容易。尽管尚未发布官方基准来量化准确性差异,但早期迹象表明性能的下降是微乎其微的。
Whisper V3 Turbo 模型的多功能性使其在处理不同语言和口音方面表现出色,广泛应用于从自动客户服务到内容创作等各种应用中。开发者可以通过 OpenAI 的 API 方便地将其集成到他们的应用和服务中,这为各种创新应用场景提供了可能。
在社交媒体上,用户对 Whisper V3 Turbo 的反馈非常积极。用户 @TerryWTech 表示:“我很期待 Whisper Turbo 在我当前项目中的表现,8 倍速度和 2 倍更少的参数听起来像是一个游戏规则改变者。” 另一位用户 @Sven theGuru 则提到:“我期待着试验 Whisper Turbo,特别是它的零样本能力和强大的泛化能力。很高兴看到这些创新在 Hugging Face 平台上发生。” Whisper V3 Turbo 的发布不仅吸引了开发者的关注,也引起了普通用户的兴趣。用户 @孙扣扣在推特上分享道:“openai 发布了一个更小更快的 whisper 版本,叫做 whisper-turbo。我正在制作一个本地 mac 应用程序,用麦克风替代键盘。” 这种应用展示了 Whisper V3 Turbo 在实际生活中的潜力。