Skip to content
毫河风报
菜单
  • 首页
  • 关于我们
  • 联系我们
  • 播记
 

火山引擎发布豆包大模型升级,综合能力提升 20.3%

2024-08-22

8 月 21 日,火山引擎在 AI 创新巡展活动上发布了豆包大模型的一系列产品升级。最新版豆包大语言模型的综合能力相比三个月前首次发布时提升了 20.3%。在六项关键能力评测中,角色扮演能力提升 38.3%,语言理解提升 33.3%,模型在长文任务、数学、专业知识、代码能力上也有不同程度提升。

豆包大模型团队的 Seed-ASR、Seed-TTS 研究成果已成功应用于豆包语音识别和语音合成模型,结合 RTC 技术发布了对话式 AI 实时交互解决方案,使用户能够在对话过程中适时打断或插话,提升了对话的自然性和流畅性。

火山引擎还携手多点 DMALL 成立零售大模型生态联盟,基于豆包大模型打造零售 AI 解决方案。首批联盟成员包括物美集团、抖音电商、百胜、麦当劳等。豆包大模型自 2024 年 5 月 15 日正式发布以来,迅速在市场上获得了广泛关注和应用。根据火山引擎总裁谭待的介绍,豆包大模型的日均 tokens 使用量已经超过 5000 亿,企业客户的使用量在短短两个月内增长了 22 倍。

豆包大模型的广泛应用不仅限于技术领域,还在多个行业中得到了实际应用。例如,在零售行业,火山引擎携手多点 DMALL 成立了零售大模型生态联盟,通过融合豆包大模型与 AI 能力,让零售企业能够以极低的试错成本将大模型技术应用到业务场景中。首批联盟成员包括物美集团、抖音电商、百胜、麦当劳等知名企业。

此外,豆包大模型还在汽车行业取得了进展。火山引擎与领克汽车、吉利银河、几何汽车、上汽荣威等多家汽车厂商合作,成立了汽车大模型生态联盟,推动大模型在汽车行业的应用创新。吉利汽车集团营销数字中心负责人沈稳杰表示,在豆包大模型的帮助下,吉利集团旗下领克汽车实现了智慧邀约坐席、AI 销售助手、智慧经营报表以及 AI 用车说明书等多项基于模型能力的功能。

豆包大模型家族包括通用模型 pro、通用模型 lite、语音识别模型、语音合成模型、文生图模型等九款模型,能够满足用户多样化、复杂化的需求。在智能客服领域,豆包大模型也展现了其能力。晓多科技通过使用豆包大模型的能力强化了其 “AI 训练场” 场景,不仅将客服培训周期缩短了 50% 以上,还通过更多元化的顾客模拟,训练出能力超越常规培训的客服团队。

豆包大模型的定价策略和广泛的应用场景也是其成功的因素之一。豆包主力模型的推理输入价格只有 0.0008 元 / 千 tokens,比行业便宜 99.3%,极大地降低了企业的使用成本。火山引擎总裁谭待表示,大模型的超低定价,来自对技术的信心,火山引擎能通过技术手段实现大模型推理成本的优化。

豆包大模型在语音识别和语音合成方面的技术进展也是此次升级的重要亮点。豆包大模型团队的 Seed-ASR、Seed-TTS 研究成果已成功应用于豆包语音识别和语音合成模型。通过这些技术的应用,豆包大模型在语音识别的准确率和灵敏度上有了提升,语音识别延迟更低,支持多语种的正确识别。而在语音合成方面,豆包大模型能够提供自然生动的语音合成能力。结合 RTC 技术(实时音视频),火山引擎发布了对话式 AI 实时交互解决方案。此方案让用户不仅能用语音与 AI 进行交谈,还能在对话过程中适时打断或插话,整体对话质量不受影响。

豆包大模型的语音能力升级不仅提升了用户体验,还为多个行业的应用场景提供了新的可能性。例如,在智能客服领域,豆包大模型的语音识别和语音合成能力能够帮助客服人员更准确地理解客户需求。在教育领域,豆包大模型的语音合成能力可以用于智能教学助手,提供个性化的教学内容和反馈。此外,豆包大模型的语音能力还在智能家居、智能终端等领域得到了应用。火山引擎与 OPPO、vivo、荣耀、小米、三星、华硕等知名终端厂商合作,成立了智能终端大模型联盟,推动大模型在智能终端领域的应用创新。通过豆包大模型的语音识别和语音合成能力,智能终端设备能够实现更自然的人机交互。

AI 日报

查看全部日报

  • AI 技术在医疗领域的突破性应用:从诊断到治疗的全新变革
  • AI 代理战场新核武!OpenAI 发布 o3 模型:比肩人类决策,媲美专业审核
  • 软银 5000 亿美元 AI「星门」陷融资困境,孙正义:短期波动不足为惧
  • 贝索斯加持 AI 搜索新星估值 140 亿!3 年超谷歌 7 年成绩
  • 苹果重磅爆料:秘密研发两大“杀手锏”芯片,剑指智能眼镜与 AI 服务器!

©2025 毫河风报 沪ICP备18012441号-5