AI 早知道：英伟达推出多项机器人服务；谷歌发布视频转音频技术；加州大学新 Transformer 架构减少 GPU 依赖

波士顿动力、NVIDIA 与人工智能研究所合作推动四足机器人从虚拟到现实的部署

波士顿动力、NVIDIA 与人工智能研究所合作，通过 NVIDIA Isaac Lab 平台，使机器人专家和研究人员能够无缝地将四足机器人从虚拟环境部署到现实世界。这一合作旨在加速机器人技术的发展，提升四足机器人的应用能力。

NVIDIA 推出 Omniverse Cloud Sensor RTX 加速自主机器 AI 开发

NVIDIA 近日发布了 Omniverse Cloud Sensor RTX，这是一套生成合成数据的微服务，旨在加速各种自主机器的 AI 开发。该技术通过提供高质量的合成数据，帮助开发者更快地训练和优化 AI 模型，从而提升自主机器的性能和效率。NVIDIA Robotics 宣布推出 Isaac Sim 4.0 版本，该版本集成了 NVIDIA PhysX 5.4 和 Isaac Lab，带来了强大的新功能和 AI 增强，进一步提升了机器人模拟的能力。

谷歌发布视频转音频技术，实现高质量音效生成

谷歌（Google）近日发布了一项名为视频转音频（Video-to-audio）的新技术。该技术能够为任意视频素材自动生成与画面完全吻合的高质量音乐和音效，显著提升视频的整体效果。这一创新技术展示了谷歌在 AI 领域的强大研发能力和应用前景。

谷歌研究团队荣获 ACM Web Conference 2024 最佳论文奖

谷歌研究团队的 Paul Duetting、Vahab Mirrokni、Renato Paes Leme 和 Song Zuo 及其合著者因论文《大型语言模型的机制设计》荣获 ACM Web Conference 2024 最佳论文奖。该研究在大型语言模型的机制设计方面取得了重要突破，展示了其在 AI 领域的领先地位。

麻省理工学院开发 AI 聊天机器人，助力用户与未来自我对话

麻省理工学院开发了一款名为 Future You 的互动性 AI 聊天机器人，用户可以上传自己的照片，系统会生成他们 60 岁时的形象，并根据个人信息和未来愿望创建详细的未来故事。用户可以与这个虚拟的未来自我进行真实对话，旨在减轻焦虑和负面情绪，同时增强对未来的积极期待。实验结果显示，通过与未来自我对话，用户的负面情绪显著减少。

黄仁勋在加州理工学院演讲分享创业历程与坚持精神

黄仁勋在加州理工学院的演讲中，回顾了包括杰弗里・辛顿、ImageNet 和 AlexNet 对 Nvidia 的重要影响。他还详细讲述了创业初期与微软、AMD、英特尔、高通和 ARM 等公司的竞争经历，强调了坚持不懈的重要性。此外，他分享了在日本京都银阁寺的一位园丁如何用 25 年时间修剪苔藓的故事，传达了专注和耐心的重要性。黄仁勋的演讲激励人心，强调了毅力和专注在成功道路上的关键作用。

Runway 即将推出新视频生成模型 Gen-3 Alpha

Runway 宣布即将推出新的视频生成基础模型 Gen-3 Alpha。该模型在大规模多模态训练的新基础设施上训练而成，与前代 Gen-2 相比，在保真度、一致性和运动方面有重大改进。Gen-3 Alpha 支持文本到视频、图像到视频和文本到图像工具，并提供更精细的结构、风格和运动控制。Runway 表示，Gen-3 模型还可定制，以满足特定的艺术和叙事需求。Gen-3 Alpha 将在未来几天内发布。

Luma 推出视频控制功能，挑战 Runway 的 Gen-3 模型

Luma 发布了一项新的视频控制功能，旨在与 Runway 的 Gen-3 模型竞争。该功能允许用户在保持画面人物不变的情况下，选择多个背景环境，或在保持背景一致的前提下改变人物形象。这一创新为视频编辑和创作提供了更多的灵活性和创意空间。

Color Health 与 OpenAI 合作推出 GPT-4o 助力癌症筛查和治疗

Color Health 首席执行官奥斯曼・拉拉基（Othman Laraki）宣布推出与 OpenAI 合作开发的 Color Copilot，这一技术利用 GPT-4o 模型，旨在改进癌症筛查和治疗。通过这一创新，Color Health 希望提高癌症筛查的准确性和治疗效果，进一步推动医疗保健领域的进步。

加州大学新 Transformer 架构减少 GPU 依赖

加州大学研发出一种新的 Transformer 架构，完全消除了语言模型中的矩阵乘法，在保持高性能的同时显著减少内存使用。通过优化的 GPU 实现，内存使用减少了高达 61%，推理过程中内存消耗减少了 10 倍以上，推理速度提升了 4.57 倍。实验表明，该无矩阵乘法模型在 2.7B 参数规模下的性能与最先进的 Transformer 相当。此外，他们还展示了一种在 FPGA 上实现的自定义硬件解决方案，处理十亿参数规模的模型时功耗仅为 13W，接近人脑的效率。

麦当劳暂停得来速 AI 点单测试，探索新合作机会

麦当劳决定停止在得来速窗口测试 AI 点单系统，原本由 IBM 提供的服务将在下个月前结束合作并撤回所有测试设备。尽管如此，麦当劳仍认为 AI 点单是未来的一部分，并在探索其他合作机会。有猜测称，麦当劳可能在 2023 年 12 月宣布与 Google 达成协议，部分涉及一个名为 “Ask Pickles” 的聊天机器人，未来可能用于得来速 AI 点单。

聆心智能发布超拟人大模型 CharacterGLM Pro 版

聆心智能推出了新一代超拟人大模型 CharacterGLM Pro 版，经过 6 个月的测试和优化，该模型在对话连贯性、拟人性、流畅度和趣味性四个方面达到了当前最先进水平（SOTA）。CharacterGLM Pro 版提供了多个角色设定，包括 “好兄弟”、“邻家哥哥” 和 “恶魔女孩”，每个角色都有独特的个性和对话风格，极大提升了对话的沉浸感和互动体验。