2024 年 12 月 12 日,谷歌 DeepMind 发布了最新的 AI 模型 Gemini 2.0。这款模型专注于处理复杂的多模态任务,支持多种人工智能应用,包括在浏览器环境中帮助用户完成多步骤工作流程。发布过程中,谷歌展示了两项相关项目:Project Mariner 和 Project Astra。
Project Mariner 是一种能够理解并利用浏览器页面信息执行任务的 AI 代理;而 Project Astra 专注于多语言对话和本地工具使用。新版 Astra 增强了多语言对话能力,并支持长时间会话记忆。在实际应用中,Astra 可通过使用 Google Search、Google Lens 和 Google Maps 等工具进行多模态理解。Google 正在扩展 Astra 的应用范围,包括在可穿戴设备中的应用,并计划与 Supercell 等公司合作,探索 AI 智能体在游戏中的角色。
在 Gemini 2.0 的发布中,Gemini 2.0 Flash 以其改进的低延迟和多模态特性成为关注焦点。它支持多模态输入及图像与文本混合输出,并能调用 Google Search 等工具。这一实验版模型向开发者开放使用,以便开发者构建动态交互性的应用程序。
此外,Gemini 2.0 的空间推理能力正在用于开发智能 AI 游戏伙伴。通过与 Supercell 的合作,Google 探索 AI 在策略游戏中的表现,例如为 "Clash of Clans" 提供实时游戏建议。