Google 宣布 Gemini 1.5 Flash 每天免费提供 15 亿 Token，开发者狂喜！

2024 年 8 月 20 日，Google 宣布其 Gemini API 每天将免费向开发者提供 15 亿个 Token。根据 Google 的公告，Gemini 1.5 Flash 免费套餐包括每分钟 15 次请求（RPM）、每分钟 100 万个 Token（TPM）以及每天 1500 次请求（RPD）。此外，开发者还可以享受免费上下文缓存，每小时最多可存储 100 万个 Token，并且可以进行免费微调。

Google Gemini 1.5 Flash 是 Google 最新推出的轻量级多模态模型，旨在提高效率和降低延迟。与 Gemini 1.5 Pro 相比，1.5 Flash 在性能上进行了优化，特别是在推理和图像理解方面有改进。Gemini 1.5 Flash 支持 100 万个 Token 的上下文窗口，并可根据请求增加到 200 万个 Token。

从 2024 年 7 月 25 日开始，Gemini 1.5 Flash 在网络和移动设备上提供，支持 40 种语言，覆盖约 230 个国家。Google 表示，Gemini 1.5 Flash 在质量和延迟方面进行了升级，特别是在推理和图像理解方面有改进。

在大模型领域，Google Gemini 1.5 Flash 与其他竞争对手如 OpenAI 的 GPT-4o mini、Anthropic 的 Claude 3 等相比，具有一些优势。首先，Gemini 1.5 Flash 在上下文窗口长度上具有优势，支持高达 200 万个 Token 的上下文窗口，而 GPT-4o mini 和 Claude 3 的上下文窗口相对较短。

其次，Gemini 1.5 Flash 在性能和效率上进行了优化，特别是在推理和图像理解方面有改进。根据 Google 的测试数据，Gemini 1.5 Flash 在多项基准测试中表现良好。例如，在 MMLU 测试中，Gemini 1.5 Flash 得分 77.9%，而 GPT-4o mini 得分 82%，Claude Haiku 得分 73.8%。在编程能力测试 HumanEval 上，Gemini 1.5 Flash 得分 87.2%。

Gemini 1.5 Flash 的应用场景非常广泛。它可以用于文本生成、图像和视频理解、编程辅助、数据分析等多个领域。例如，在文本生成方面，Gemini 1.5 Flash 可以生成文章、报告和创意写作；在图像和视频理解方面，它可以分析和理解复杂的图像和视频内容，生成描述和分析报告；在编程辅助方面，Gemini 1.5 Flash 可以帮助开发者编写和优化代码；在数据分析方面，它可以处理和分析大规模数据，生成洞见和报告。