英特尔推出全新架构 Lunar Lake,采用 8 核混合设计
英特尔刚刚公布了其下一代 AI PC 旗舰处理器 Lunar Lake 的架构细节,采用 8 核混合设计,包括 4 个 Lion Cove 性能核和 4 个 Skymont 能效核。Lion Cove 性能核提升了 14%的每时钟指令数(IPC),并配备 2.5MB 的 L2 缓存和 12MB 的共享 L3 缓存。Skymont 能效核在单线程整数和浮点性能上分别提升了 1.38 倍和 1.68 倍,并增加了 AI 和向量计算的吞吐量。Lunar Lake 还引入了全新的调度机制,优先调用能效核以满足负载需求。
该处理器在图形和 AI 处理能力上有显著提升,特别是针对轻薄本的高能效计算性能进行了优化。Lunar Lake 将 SoC 功耗降低了最高达 40%,并带来了超过 3 倍的 AI 算力提升。第四代英特尔神经网络处理单元(NPU)的 AI 性能高达 48 TOPS,是上一代产品的 4 倍。全新代号为 Battlemage 的 GPU 设计结合了 Xe2 GPU 核心和 Xe 矩阵扩展(XMX)阵列,提供高达 67 TOPS 的 AI 性能。该处理器预计将于 2024 年第三季度出货。
多款 AI 工具因流量激增同时宕机,导致 AI 服务大规模中断
由于 ChatGPT 发生宕机,用户转向 Claude,但 Claude 无法浏览网页,用户又转向 Perplexity。然而,Perplexity 也因流量激增而宕机,导致用户再次回到 Claude,形成恶性循环,最终导致 ChatGPT、Claude 和 Perplexity 三款 AI 工具同时宕机。此外,尽管 Gemini 用户较少,但为了显示流量激增,Gemini 也选择关闭服务。这一系列事件导致了 AI 服务的大规模中断,被称为“AI 大停电”。
ChatGPT 订阅计划更新:新增全屏模式和多项改动
ChatGPT 订阅计划进行了更新,新增了全屏模式,并对其他功能进行了多项改动。此次更新将订阅计划分为个人(免费、Plus)和商业(团队、企业)两类,旨在更好地满足不同用户的需求。
英伟达展示 GPT-4 训练进展:1.8 万亿参数模型十天内完成
根据黄仁勋的最新演讲,GPT-4 是一个拥有 1.8 万亿参数的混合专家模型。通过使用 Blackwell 系统,现在可以在大约十天内训练完成这样的大模型。相比之下,两年前的 Hopper 世代,即使是几百亿参数的模型也需要几个月的时间才能完成训练。这一进展展示了英伟达在 GPU 互连技术上的显著提升。
Covariant 推出 RFM-1 模型,提升机器人任务适应能力
Covariant 由 OpenAI 的三位早期研究科学家创立,推出了名为 RFM-1 的新模型。该模型结合了大型语言模型的推理技能和先进机器人的物理灵巧性,能够接受文本、图像、视频、机器人指令和测量数据等五种不同类型的输入来执行任务。
Covariant 的联合创始人表示,这也是向着工地经理可以用人类语言下达指令的方向迈出的一步。Covariant 是一家专注于机器人 AI 技术的公司,致力于通过赋予机器人视觉识别、思考、行动和学习的能力,提升其在各种应用场景中的表现。
Google DeepMind 研究 AI 在喜剧创作中的应用
Google DeepMind 发布了一项关于 AI 在喜剧创作中应用的研究,研究团队采访了 20 位在创作过程中使用 AI 的喜剧演员。这项研究由 Google DeepMind 的团队成员与其他合作者共同完成,最新成果已在 arXiv 上发布,并在公平性、问责制和透明性会议(FAccT Conference)上进行了展示。
Cartesia AI 发布 Mamba-2,揭示 Transformer 与 SSM 的数学联系
Cartesia AI 发布了新一代架构 Mamba-2,状态空间扩大 8 倍,训练速度提高 50%。研究团队发现 Transformer 和状态空间模型(SSM)在数学上存在紧密联系,通过结构化状态空间二元性(SSD)理论框架统一了这两大模型家族。
Mamba-2 的论文成功入选 ICML 2024,作者 Albert Gu 和 Tri Dao 建议先阅读他们撰写的系列博客文章,再深入研究论文。Cartesia AI 是一家致力于开发高效 AI 架构的公司,由斯坦福大学 AI 实验室的博士生创立。
天工开源 146B 参数的 Skywork-MoE 模型
天工科技发布了一个名为 Skywork-MoE 的模型,该模型拥有 1460 亿参数,由 16 个专家模型组成,每个专家模型包含 220 亿参数。Skywork-MoE 引入了两项创新技术:门控对数归一化(Gating Logit Normalization),以增强专家模型的性能。该模型现已在 Hugging Face 平台上发布。
澜舟科技开源轻量化大模型 Mengzi3-8B,支持免费商用
澜舟科技近日开源了其最新的轻量化大模型 Mengzi3-8B,并支持免费商用。该模型具有高效、低显存需求的特点,半精度下显存占用小于 16G,适用于 PC 和大部分消费级显卡。今年 3 月底,澜舟科技刚开源了 Mengzi3-13B 大模型。
斯坦福团队承认抄袭清华大模型,AI 实验室主任发声批评
斯坦福团队因抄袭清华系大模型事件引发广泛关注。Llama3-V 团队成员悉达多(Siddharth Sharma)和阿克什(Aksh Garg)在推文中承认抄袭,并与另一位作者老穆(Mustafa Aljadery)切割。斯坦福人工智能实验室主任 Christopher Manning 批评团队避重就轻,不承认错误。网友质疑不断,指责团队有抄袭前科。
Backseat AI 推出《英雄联盟》实时游戏伴侣
Backseat AI 推出了一款专为《英雄联盟》玩家设计的实时游戏伴侣。该助手通过语音提供实时的游戏评论和建议,包括购买建议和对线策略。玩家可以在比赛中提出任何关于游戏的问题,并立即获得解答。每场比赛结束后,玩家还可以在赛后大厅页面查看比赛总结,包括各个玩家的表现分析。Backseat AI 支持多种语言,并能与玩家分成小组进行互动,提升游戏体验。