2024 年 9 月 25 日,谷歌宣布推出两款更新后的 Gemini 1.5 模型,分别是 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002。这些模型在数学、长文本和多模态任务方面表现出提升。在 MMLU-Pro 基准测试中,性能提高约 7%;在 MATH 和 HiddenMath 基准测试中,改进约 20%。其中,Pro 版本以 86.5% 的成绩超过了 o1-preview(85.5%)。此外,视觉理解和代码生成的评估中也有 2%-7% 的提升。新模型的成本降低至原来的十分之一,输出速度提升 2 倍,延迟降为原来的三分之一。开发者可以通过 Google AI Studio 和 Gemini API 免费访问这些模型。
在具体应用场景方面,Gemini 1.5 Pro 和 Flash 模型展示了其在文本生成、代码生成和多模态任务中的能力。例如,在代码生成任务中,Gemini 1.5 Pro 的性能提升了约 32%。在多模态任务中,这些模型能够理解和生成图像和文本的组合内容。
在教育领域,Gemini 1.5 Pro 被用于生成个性化的学习内容和自动批改作业。例如,一家在线教育平台利用 Gemini 1.5 Pro 生成数学题目和解答,帮助学生理解和掌握数学知识。
在金融领域,Gemini 1.5 Flash 被用于实时风险评估和决策支持。一家金融科技公司利用 Gemini 1.5 Flash 分析大量的市场数据,实时评估投资风险并提供决策建议。
在医疗领域,Gemini 1.5 Pro 和 Flash 模型也展现了其潜力。一家医疗研究机构使用 Gemini 1.5 Pro 分析大量的医学文献和数据,帮助医生找到相关的研究成果和治疗方案。
与其他 AI 模型相比,Gemini 1.5 Pro 和 Flash 模型在性能和成本方面具有优势。例如,与 OpenAI 的 GPT-4o 模型相比,Gemini 1.5 Pro 在数学和代码生成任务中的表现更为出色,且成本仅为 GPT-4o 的一半。在多模态任务中,Gemini 1.5 Flash 的速率限制和低延迟使其在实时应用中表现优异。