为了与 Anthropic 和 OpenAI 等生成式 AI 对手竞争,Google 对其 AI 聊天机器人 Gemini 的免费版本进行了更新。这些更新将提升平台性能,并扩大其使用范围。从 2024 年 7 月 25 日开始,Google 将在网络和移动设备上推出多模态模型 Gemini 1.5 Flash。这个模型支持 40 种语言,覆盖约 230 个国家。
Google 表示,Gemini 1.5 Flash 在质量和延迟方面都有提升,尤其是在推理和图像理解上表现更好。这一升级也可能意味着后台运行成本的降低。上下文窗口从原来的 8,000 个 tokens 增加到了 32,000 个 tokens,这让它能够处理更加复杂的查询,并提供更丰富的上下文信息。这一改进提升了 Gemini 1.5 Flash 处理复杂任务的能力,提供更准确和详细的回答。
这个模型是 Gemini 1.5 Pro 的 “精简” 版本,专门为 “狭窄”、“高频” 的生成式 AI 工作负载而设计。Gemini 1.5 Flash 模型适用于需要即时响应客户或快速生成图像的任务。该模型在 Google AI Studio 和 Vertex AI 中均有提供,初始支持 100 万个 token,并可根据需求增加到 200 万个 token。这让它在处理大规模数据和复杂任务时显得尤为强大。
Gemini 1.5 Flash 模型在 LMSys 排行榜上高居榜首,ELO 评分达到 1300。与 OpenAI 的 GPT-4 Turbo 和 Anthropic 的 Claude 等竞争对手相比,Gemini 1.5 Flash 在多个基准测试中表现良好。Google DeepMind 的高级研究员 Jeff Dean 和 Oriol Vinyals 表示,新的 Gemini 1.5 Pro 和 Gemini 1.5 Flash 在大多数基准测试中都优于其前身和 OpenAI 的 GPT-4 Turbo。
Gemini 1.5 Flash 的多模态处理能力也得到了提升,能够更好地理解和处理文本、图像和视频等多种输入形式。