Play AI 最近发布了其最新的语音模型 PlayDialog,用于生成对话的播客内容。该模型能够关注对话的完整上下文,调整语调、语速、情感及语音节奏,以实现自然的语音体验。该模型经过数亿次真实对话的训练。PlayDialog 采用了 “自适应语音上下文化器”(ASC)架构,使其能够理解对话背景并生成一致的语音内容。模型适用于播客、旁白、语音配音等多种场景。此外,PlayDialog 支持流媒体技术,结合大型语言模型使用,能够提升实时互动质量。
Play AI 同步发布了 PlayNote 平台,一种多媒体转化为语音内容的工具。PlayNote 能将 PDF、文本、视频等转化为语音内容,用户只需几分钟即可制作出播客、简报或故事,并支持的 API 接口方便开发者大规模生成音频。
PlayDialog 和 PlayNote 的推出为 Play AI 在语音生成领域提供了新的发展基础。