Google 发布 Gemini 1.5 Pro 和 Flash，AI 模型成本大幅降低 85%

2024 年 8 月 2 日，Google 发布了最新的 AI 模型 ——Gemini 1.5 Pro 和 Gemini 1.5 Flash，并宣布了大幅降价的消息。具体来说，Gemini 1.5 Flash 的输入成本降低了约 85%，输出成本下降了约 80%。为了进一步优化成本和延迟，Google 还引入了上下文缓存和批处理 API。现在，Gemini Flash 的输入成本每百万 token 仅需 0.075 美元，输出成本为 0.3 美元。

Gemini 1.5 Flash 和 Gemini 1.5 Pro 现在支持超过 100 种语言，在多语言任务中的表现有所提升。这些模型已经在 Google AI Studio 和 Gemini API 上上线，开发者们可以开始早期测试并提供反馈。

Gemini 1.5 Pro 在多语言任务、数学、复杂提示和编码等方面有良好表现，设计的灵活性和适应性让它能处理更复杂的任务。相比之下，Gemini 1.5 Flash 则针对高频率、大规模任务进行了优化，成本效益高，还具备长上下文窗口。

Google 还为 Gemini 1.5 Flash 和 Pro 模型带来了新的功能，比如上下文缓存和批处理 API。这些新功能主要是为了优化成本和延迟，使模型在处理大规模数据时更加高效。此外，这些模型现在支持超过 100 种语言，进一步扩大了其应用范围和用户群体。

在 LMSYS Chatbot Arena 排行榜上，Gemini 1.5 Pro 以 1300 的 ELO 评分领先，超越了 OpenAI 的 GPT-4o 和 Anthropic 的 Claude-3.5 Sonnet。

在企业应用领域，Gemini 1.5 Pro 和 Flash 模型在数据分析、软件开发和客户互动等方面具有优势，能够处理复杂的多模态输入，为自动化和决策支持提供了新的可能性。