Eleven Labs 近日宣布推出全托管的 AI 自动配音服务,该服务能够将各种短视频和长视频内容自动翻译成多种语言,包括西班牙语、印地语、法语、葡萄牙语、德语、阿拉伯语和波兰语等。Eleven Labs 的这一服务可以自动匹配用户的声音音调、音色和说话风格,还支持不超过 10 个说话者的视频内容。平均自动翻译配音时间为 7 天,但在特殊情况下可当天完成。
Eleven Labs 的这一服务为视频内容创作者提供了一个工具,帮助他们进行跨语言的内容传播。
在 AI 语音生成领域,市场上还有其他一些竞争对手也在这一领域有所布局。例如,阿里巴巴的 FunAudioLLM 项目在多语言语音识别和生成方面表现出色。FunAudioLLM 包含两个核心模型:SenseVoice 和 CosyVoice,前者专注于多语言语音识别和情感识别,后者则擅长自然语音生成,具备多语言、音色和情感控制能力。
SenseVoice 支持超过 50 种语言,尤其在中文和粤语上表现优异,而 CosyVoice 则能够实现多语言语音生成、零样本语音生成和跨语言语音克隆。此外,FunAudioLLM 还在 Modelscope 和 Huggingface 平台上开源。
许多内容创作者和企业用户都选择了 Eleven Labs 的服务来提升他们的视频内容质量。例如,一家教育培训机构使用 Eleven Labs 的服务将其在线课程翻译成多种语言,从而吸引了更多的国际学生。另一家企业则利用这一服务为其宣传视频做了多语言配音。
用户反馈显示,Eleven Labs 的服务在翻译准确性和声音自然度上表现良好,还在服务速度和灵活性上得到了用户的评价。通过这一服务,Eleven Labs 帮助用户进行跨语言的内容传播。

