2024 年 8 月 2 日,Google 发布了最新的 AI 模型 ——Gemini 1.5 Pro 和 Gemini 1.5 Flash,并宣布了大幅降价的消息。具体来说,Gemini 1.5 Flash 的输入成本降低了约 85%,输出成本下降了约 80%。为了进一步优化成本和延迟,Google 还引入了上下文缓存和批处理 API。现在,Gemini Flash 的输入成本每百万 token 仅需 0.075 美元,输出成本为 0.3 美元。
Gemini 1.5 Flash 和 Gemini 1.5 Pro 现在支持超过 100 种语言,在多语言任务中的表现有所提升。这些模型已经在 Google AI Studio 和 Gemini API 上上线,开发者们可以开始早期测试并提供反馈。
Gemini 1.5 Pro 在多语言任务、数学、复杂提示和编码等方面有良好表现,设计的灵活性和适应性让它能处理更复杂的任务。相比之下,Gemini 1.5 Flash 则针对高频率、大规模任务进行了优化,成本效益高,还具备长上下文窗口。
Google 还为 Gemini 1.5 Flash 和 Pro 模型带来了新的功能,比如上下文缓存和批处理 API。这些新功能主要是为了优化成本和延迟,使模型在处理大规模数据时更加高效。此外,这些模型现在支持超过 100 种语言,进一步扩大了其应用范围和用户群体。
在 LMSYS Chatbot Arena 排行榜上,Gemini 1.5 Pro 以 1300 的 ELO 评分领先,超越了 OpenAI 的 GPT-4o 和 Anthropic 的 Claude-3.5 Sonnet。
在企业应用领域,Gemini 1.5 Pro 和 Flash 模型在数据分析、软件开发和客户互动等方面具有优势,能够处理复杂的多模态输入,为自动化和决策支持提供了新的可能性。