Skip to content
毫河风报
菜单
  • 首页
  • 关于我们
  • 联系我们
  • 播记
 

谷歌 Gemini 1.5 Flash 改进:延迟减少 3 倍,输出增加 2 倍!

2024-09-17

2024 年 9 月 17 日,谷歌宣布对其 Gemini 1.5 Flash 进行了系列改进,使其延迟减少了三倍,输出每秒的 token 数量增加了两倍。这一改进显著提升了 Gemini 1.5 Flash 的性能。社交媒体上,用户对这一改进反应热烈。例如,用户 Rowan Cheung 在 Twitter 上表示:“Google 使 Gemini 1.5 Flash 的推理速度提高了 3 倍,延迟减少了 3 倍,输出令牌每秒增加了 2 倍。” 另一位用户逆瀬川则指出:“最近常用的 LLM:API: Gemini 1.5 Flash > Gemini 1.5 Pro > GPT-4o-mini。” 这些反馈显示了用户对 Gemini 1.5 Flash 性能提升的认可。

Gemini 1.5 Flash 首次在 2024 年 5 月的 Google I/O 大会上宣布,并在不久后向一些付费客户提供。Gemini 1.5 Flash 是从 Gemini 1.5 Pro 提炼出的轻量级模型,专为 “狭窄”、“高频” 生成式 AI 工作负载而构建。其主要特点包括低延迟响应和高效性能,特别是在推理和图像理解方面有显著改进。

Gemini 1.5 Flash 采用了最新的 Transformer 架构,结合了多模态预训练技术,使其在处理复杂任务时表现更加出色。该模型能够同时处理文本、图像和音频数据,实现跨模态的高效转换和理解。技术细节方面,Gemini 1.5 Flash 引入了新的优化算法,提升了模型的训练速度和推理效率。

在应用场景方面,Gemini 1.5 Flash 擅长摘要、聊天应用程序、图像和视频字幕、从长文档和表格中提取数据等。其上下文窗口从之前的 8,000 个 tokens 增加到 32,000 个 tokens,使其能够处理更复杂的查询,并为其生成的响应添加更多上下文。这一改进使得 Gemini 1.5 Flash 在处理大规模、大批量、高频任务时更加高效,服务更具成本效益。

此外,Gemini 1.5 Flash 还在多个基准测试中表现出色。例如,在推理、编码、视觉和视频基准测试中,Gemini 1.5 Flash 的性能均超过了之前的版本。

自 Gemini 1.5 Flash 发布以来,市场反应热烈,用户反馈积极。许多用户在社交媒体上分享了他们的使用体验。例如,用户 edtech_nash 在 Twitter 上表示:“Google Gemini 1.5 Flash 在 5 秒内识别了我的书。” 另一位用户 Esa Firman 则指出:“更改模型为 Gemini 1.5 Flash 解决了问题。较小的模型在这种情况下表现更好。”

Gemini 1.5 Flash 的性能提升也引起了业内的广泛关注。Google 的工程副总裁 Amar Subramanya 在博客文章中表示:“使用 Gemini 1.5 Flash,你会注意到质量和延迟的全面改进,尤其是在推理和图像理解方面的显著提升。”

在竞争对手方面,Google 的 Gemini 1.5 Flash 与 Anthropic 和 OpenAI 等生成式 AI 竞争对手展开了激烈的竞争。为了保持竞争力,Google 不断优化和升级 Gemini 1.5 Flash 模型,进一步提升其多模态处理能力和应用范围。例如,OpenAI 的 GPT-4o mini 虽然在某些方面表现出色,但在速度和效率上仍然不及 Gemini 1.5 Flash。

此外,Google 还通过降低运行成本来增强其竞争力。Gemini 1.5 Flash 的上下文缓存功能显著降低了使用模型时的 Token 消耗和费用,使其在成本效益方面具有明显优势。Google AI Studio 产品负责人 Logan Kilpatrick 表示:“这一功能支持 Gemini API 的 1.5 Flash 和 Pro 版本,成本比之前降低了一半,并已向所有用户开放。”

AI 日报

查看全部日报

  • AI 技术在医疗领域的突破性应用:从诊断到治疗的全新变革
  • AI 代理战场新核武!OpenAI 发布 o3 模型:比肩人类决策,媲美专业审核
  • 软银 5000 亿美元 AI「星门」陷融资困境,孙正义:短期波动不足为惧
  • 贝索斯加持 AI 搜索新星估值 140 亿!3 年超谷歌 7 年成绩
  • 苹果重磅爆料:秘密研发两大“杀手锏”芯片,剑指智能眼镜与 AI 服务器!

©2025 毫河风报 沪ICP备18012441号-5