2024 年 8 月 7 日,Google 宣布其最新的 Gemini AI 模型将集成到 Google Home 装置中。这一消息在社交媒体上引起了广泛关注,尤其是在 Twitter 上,用户 @TheAlphaSignal 在不到 24 小时内吸引了 1 万名用户访问 Google 的最新 Gemini 模型。Google 的官方推文达到了 50 万次浏览。
Gemini AI 的集成将使 Google Home 装置具备更强大的智能和自主能力。例如,Nest Camera 现在不仅可以进行简单的动作检测和人脸识别,还能理解真实环境中的复杂事件,并生成详细的文字描述或图说。用户可以通过 Google Home App 输入问题,AI 会自动搜索相关影像记录并提供摘要信息。
此外,Google Home App 还新增了自动化能力。用户可以通过 Home App 和自动化脚本编辑器设置和串联家中的联网装置。例如,用户可以输入或说出 “锁上门,关闭浴室所有电源”,系统会自动执行这些指令。
Google 表示,他们已经采取了多种措施来确保用户数据的安全,包括数据加密和严格的访问控制。
除了家庭监控和自动化,Gemini AI 还被应用于 Nest 智慧音箱和显示器。这些装置内建的 Google Assistant 在 Gemini 模型的加持下,能够更自然地与用户进行双向对话,并提供相关信息。今年内,Google 还计划为 Assistant 加入不同腔调和类型的新声音。
2024 年 7 月 26 日,Google 宣布推出 Gemini 1.5 Flash 模型,这是一个轻量化版本的多模态 AI 模型,旨在提高免费版服务的性能和用户体验。Gemini 1.5 Flash 在今年的 Google I/O 大会上首次亮相,随后向使用 Google API 的开发者提供了公开预览版。相比于之前的模型,Gemini 1.5 Flash 在速度和效率方面有了提升。
Gemini 1.5 Flash 模型支持多模态推理,能够解读图像、表格和文本,并生成摘要或互动内容。它还支持 100 万组词元输入,能够分析长达 1500 页的文档或超过 3 万行的代码。Google 还将免费版 Gemini 的上下文窗口扩展到 32K 字符,使用户能够进行更深入的对话和互动。
Google 引入了 “双重检查” 功能,通过比对生成内容和参考来源,确保 AI 的回答更符合事实。例如,当用户询问某个问题时,系统会在回答末尾附上相关的参考链接,用户可以点击链接查看详细信息。
Gemini 1.5 Flash 还支持从 Google Drive 或其他装置导入文件,用户可以更快地让 AI 分析文档内容。例如,用户可以上传 PDF 文件,Gemini 会自动生成摘要或提取关键信息。
除了在 Google Home 装置上的应用,Gemini AI 还被应用于其他 Google 服务中。例如,Google Drive 现在支持 Gemini AI 对 PDF 文件的分析和摘要功能,用户可以处理和管理文档内容。此外,Gemini AI 还被集成到 Google Messages 中,支持多种语言的对话功能,包括繁体中文。