2024 年 8 月 20 日,Google 宣布其 Gemini API 每天将免费向开发者提供 15 亿个 Token。根据 Google 的公告,Gemini 1.5 Flash 免费套餐包括每分钟 15 次请求(RPM)、每分钟 100 万个 Token(TPM)以及每天 1500 次请求(RPD)。此外,开发者还可以享受免费上下文缓存,每小时最多可存储 100 万个 Token,并且可以进行免费微调。
Google Gemini 1.5 Flash 是 Google 最新推出的轻量级多模态模型,旨在提高效率和降低延迟。与 Gemini 1.5 Pro 相比,1.5 Flash 在性能上进行了优化,特别是在推理和图像理解方面有改进。Gemini 1.5 Flash 支持 100 万个 Token 的上下文窗口,并可根据请求增加到 200 万个 Token。
从 2024 年 7 月 25 日开始,Gemini 1.5 Flash 在网络和移动设备上提供,支持 40 种语言,覆盖约 230 个国家。Google 表示,Gemini 1.5 Flash 在质量和延迟方面进行了升级,特别是在推理和图像理解方面有改进。
在大模型领域,Google Gemini 1.5 Flash 与其他竞争对手如 OpenAI 的 GPT-4o mini、Anthropic 的 Claude 3 等相比,具有一些优势。首先,Gemini 1.5 Flash 在上下文窗口长度上具有优势,支持高达 200 万个 Token 的上下文窗口,而 GPT-4o mini 和 Claude 3 的上下文窗口相对较短。
其次,Gemini 1.5 Flash 在性能和效率上进行了优化,特别是在推理和图像理解方面有改进。根据 Google 的测试数据,Gemini 1.5 Flash 在多项基准测试中表现良好。例如,在 MMLU 测试中,Gemini 1.5 Flash 得分 77.9%,而 GPT-4o mini 得分 82%,Claude Haiku 得分 73.8%。在编程能力测试 HumanEval 上,Gemini 1.5 Flash 得分 87.2%。
Gemini 1.5 Flash 的应用场景非常广泛。它可以用于文本生成、图像和视频理解、编程辅助、数据分析等多个领域。例如,在文本生成方面,Gemini 1.5 Flash 可以生成文章、报告和创意写作;在图像和视频理解方面,它可以分析和理解复杂的图像和视频内容,生成描述和分析报告;在编程辅助方面,Gemini 1.5 Flash 可以帮助开发者编写和优化代码;在数据分析方面,它可以处理和分析大规模数据,生成洞见和报告。