成本降低 90%，谷歌新 AI 模型 Gemini 1.5 免费开放

2024 年 9 月 25 日，谷歌宣布推出两款更新后的 Gemini 1.5 模型，分别是 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002。这些模型在数学、长文本和多模态任务方面表现出提升。在 MMLU-Pro 基准测试中，性能提高约 7%；在 MATH 和 HiddenMath 基准测试中，改进约 20%。其中，Pro 版本以 86.5% 的成绩超过了 o1-preview（85.5%）。此外，视觉理解和代码生成的评估中也有 2%-7% 的提升。新模型的成本降低至原来的十分之一，输出速度提升 2 倍，延迟降为原来的三分之一。开发者可以通过 Google AI Studio 和 Gemini API 免费访问这些模型。

在具体应用场景方面，Gemini 1.5 Pro 和 Flash 模型展示了其在文本生成、代码生成和多模态任务中的能力。例如，在代码生成任务中，Gemini 1.5 Pro 的性能提升了约 32%。在多模态任务中，这些模型能够理解和生成图像和文本的组合内容。

在教育领域，Gemini 1.5 Pro 被用于生成个性化的学习内容和自动批改作业。例如，一家在线教育平台利用 Gemini 1.5 Pro 生成数学题目和解答，帮助学生理解和掌握数学知识。

在金融领域，Gemini 1.5 Flash 被用于实时风险评估和决策支持。一家金融科技公司利用 Gemini 1.5 Flash 分析大量的市场数据，实时评估投资风险并提供决策建议。

在医疗领域，Gemini 1.5 Pro 和 Flash 模型也展现了其潜力。一家医疗研究机构使用 Gemini 1.5 Pro 分析大量的医学文献和数据，帮助医生找到相关的研究成果和治疗方案。

与其他 AI 模型相比，Gemini 1.5 Pro 和 Flash 模型在性能和成本方面具有优势。例如，与 OpenAI 的 GPT-4o 模型相比，Gemini 1.5 Pro 在数学和代码生成任务中的表现更为出色，且成本仅为 GPT-4o 的一半。在多模态任务中，Gemini 1.5 Flash 的速率限制和低延迟使其在实时应用中表现优异。