Skip to content
毫河风报
菜单
  • 首页
  • 关于我们
  • 联系我们
  • 播记
 
谷歌 TPU vs 英伟达 GPU,苹果为何选择前者训练 AI?

谷歌 TPU vs 英伟达 GPU,苹果为何选择前者训练 AI?

2024-07-30

苹果公司最近宣布,他们的最新人工智能系统 Apple Intelligence 的基础模型(AFM)是使用谷歌的 TPU 芯片进行训练的,而不是传统的英伟达 GPU。根据苹果发布的技术论文,AFM 由两部分组成:服务器端的 AFM-server 和设备端的 AFM-on-device。AFM-server 在 8192 个 TPUv4 芯片上预训练,处理了 6.3 万亿个 tokens 的数据,而 AFM-on-device 则从更大的模型中蒸馏和修剪出来,以便在设备上高效运行。

AFM-server 主要用在云端,处理大规模数据和复杂任务,而 AFM-on-device 则是为设备端优化的小型版本,专注于本地高效计算。为了处理这些数据,苹果选用了谷歌的 TPUv4 芯片,总共用了 8192 个。这些芯片经过优化设计,使得 AFM-server 能在较短时间内完成大规模训练任务。为了让 AFM-on-device 在设备端高效运行,苹果采用了蒸馏和修剪技术,从更大的 AFM-server 模型中提取关键特性。这样不仅保留了模型的核心功能,还大大减少了模型体积和计算需求,确保其能在 iPhone 等设备上运行。

谷歌的 TPU 和英伟达的 GPU 各有特点。TPU 在速度和成本效益上表现突出,特别是在大规模并行计算任务中更为优异。而英伟达的 GPU 则以其通用性和广泛应用闻名,适用于各种不同的 AI 任务。苹果选择谷歌 TPU 主要是看重其性能和成本效益。TPU 在大规模训练任务中的成本效益更高。此外,TPU 的定制化和优化设计,让它在处理特定 AI 任务时表现更加出色。

苹果发布的技术论文详细介绍了 AFM 的开发和训练过程,主要章节包括:

  1. 引言:概述 AFM 的背景和目标。
  2. 硬件配置:详细描述端侧 AFM 和服务器 AFM 的硬件配置和训练环境。
  3. 模型架构:介绍 AFM 的模型结构和技术细节。
  4. 训练过程:详细说明训练数据、参数配置和优化策略。
  5. 实验结果:展示模型在不同任务上的性能和效果。

Apple Intelligence 在 iPhone 和其他设备上有广泛应用:

  • 智能助手:提升 Siri 的自然语言处理能力,更准确地理解和响应用户请求。
  • 图像处理:通过 AI 技术优化照片和视频处理效果。
  • 个性化推荐:根据用户行为和偏好,提供个性化内容推荐和服务。

在云端,Apple Intelligence 为开发者和企业提供 AI 服务:

  • 数据分析:利用 AI 进行大规模数据分析,帮助企业做出决策。
  • 自动化流程:通过 AI 自动化处理复杂业务流程。
  • 智能客服:提供智能客服解决方案。

AI 日报

查看全部日报

  • 贝索斯加持 AI 搜索新星估值 140 亿!3 年超谷歌 7 年成绩
  • 苹果重磅爆料:秘密研发两大“杀手锏”芯片,剑指智能眼镜与 AI 服务器!
  • 千觉机器人完成千万融资!加速多模态触觉技术落地
  • 智能驾驶新进展!地平线吕鹏专业解析,市场定位有何玄机?
  • 日本 AI 创企 CADDi 狂揽 3.8 亿美元!制造业采购效率暴增 60%

©2025 毫河风报 沪ICP备18012441号-5