2024 年 8 月,埃隆・马斯克宣布其人工智能初创公司 xAI 即将发布最新的大语言模型 Grok 2。马斯克在 X 平台上表示,Grok 2 已经完成训练,目前正在进行最后的错误修复,预计将在下个月正式发布。马斯克在接受乔丹・彼得森博士的专访时,详细介绍了 Grok 2 和 Grok 3 的研发进展,并透露 Grok 3 将在年底发布。
Grok 2 的技术细节成为讨论的焦点。根据马斯克的介绍,Grok 2 在训练数据的处理上进行了改进,减少了数据重叠问题,并对数据进行了更多整理。Grok 2 的训练使用了大约 20,000 个 Nvidia H100 芯片,这些芯片以其数据处理能力,成为支撑大语言模型的核心力量。
Grok 2 在多模态输入功能上也有改进。早在 5 月份,xAI 便透露将多模态输入功能融入 Grok,用户可以上传图像并即时获得文本回应。这一功能的加入,使得 Grok 2 在处理复杂任务时更加得心应手。
此外,Grok 2 的发布也引发了关于 AI 安全性的讨论。马斯克在专访中提到,他对当前人工智能领域普遍缺失的 “亲人类” 原则深感忧虑,并希望 Grok 2 能够在这方面有所改进。
在 Grok 2 即将发布的同时,马斯克也透露了 Grok 3 的研发进展。根据他的介绍,Grok 3 的训练使用了 100,000 个 Nvidia H100 芯片。马斯克表示,Grok 3 将在年底发布。
Grok 3 的训练资源投入引起了广泛关注。马斯克在专访中提到,Grok 3 的训练正在孟菲斯数据中心进行,预计在未来三到四个月内完成训练阶段,随后将进行细致的微调与漏洞修复。

