Groq 最新发布的 Distil-Whisper 语音转文字功能,其速度提升至 240 倍,是目前最快的语音转文字端点。其成本为每 1000 分钟音频 0.33 美元,低于其他方案。尽管 Distil-Whisper 仅支持英语且词错误率为 12.7%,高于 Whisper v3 的 10.3%,但其在速度和成本上的优势使其适用于优先考虑速度和成本的英语使用场景。
Distil-Whisper 与 Whisper v3 的对比显示,尽管 Distil-Whisper 的词错误率略高,但其速度和成本优势使其在许多应用场景中更具吸引力。具体案例包括用户在几分钟内转录了长达数小时的视频内容。此外,Distil-Whisper 的低成本使其成为许多中小企业和个人用户的选择。
Groq 在 AI 芯片市场的竞争情况及其技术特点也值得关注。Groq 的 LPU 推理引擎以其高速度和低能耗著称,能够以 10 倍于传统 GPU 的速度运行生成式 AI 模型。最近,Groq 完成了 6.4 亿美元的融资,估值达到 28 亿美元。这笔资金将用于扩展其 LPU 推理引擎的容量,并添加新模型和功能。Groq 的 LPU 推理引擎在多个基准测试中表现出色,尤其是在处理大型语言模型(LLMs)时,其速度和成本优势明显。

