Sakana 融资数千万美元,获 10 亿美元估值
据 The Information 报道,日本 AI 公司 Sakana 正在进行一轮融资,目标金额为数千万美元,估值达到 10 亿美元。本轮融资由 NEA、Khosla 和 Lux 领投。Sakana 致力于在 AI 领域取得突破,吸引了硅谷顶级投资者的关注和支持。
NVIDIA 发布 Nemotron-4 340B 模型,优化大语言模型训练
NVIDIA 推出 Nemotron-4 340B 模型系列,包括基础模型、指令模型和奖励模型,旨在生成高质量的合成数据以优化大语言模型(LLMs)的训练。该模型系列与 NVIDIA NeMo 和 TensorRT-LLM 框架兼容,能够在医疗、金融、制造和零售等多个行业中应用。Nemotron-4 340B 通过生成和筛选合成数据,提高了自定义大语言模型的性能和准确性。开发人员可以在 Hugging Face 上下载这些模型,并利用 NeMo 进行微调和优化推理。
NVIDIA GEAR 团队招聘,专注人形机器人和 AI 智能体开发
NVIDIA 的 GEAR 团队正在招聘多个职位,包括研究科学家、研究工程师、高级研究科学家、高级研究工程师、研究实习生和软件工程实习生。团队由 NVIDIA 高级研究经理兼 Embodied AI 负责人 Jim Fan 领导,致力于开发人形机器人和游戏中的 AI 智能体。Jim Fan 表示,他们优先考虑在大规模多模态 LLM 和生成模型训练以及深度机器人技术(如物理模拟、sim2real 和机器人)方面有专长的候选人。
杰弗里·辛顿拒绝埃隆·马斯克邀请,警告 AI 取代人类速度加快
深度学习领域的先驱杰弗里·辛顿在最新专访中透露,他为了婉拒埃隆·马斯克邀请其加入 xAI 顾问委员会,不得不谎称自己有会议。辛顿表示,马斯克和其他推动 AI 发展的关键人物也是 AI 潜在威胁的一部分,只有政府监管才能控制他们。他还支持一封由前 OpenAI 员工联名的信,呼吁加强对举报人的保护。辛顿警告,AI 取代人类的速度可能比预期快 30 年。
微软工程师 Tibor Blaho 透露 ChatGPT 新实验细节
微软工程师 Tibor Blaho 透露了 ChatGPT 的新实验细节,包括 “格式化复制粘贴”、“主线模型过渡未付 Sahara-V (ision)”、“Feather 记忆训练器(段)” 等。此外,他还提到动态(自动)模型实验的一个有趣配置,涉及 “impl: rm_score”。这些实验旨在进一步提升 ChatGPT 的功能和性能。
苹果发布无需联网的本地翻译 API
苹果在 WWDC24 上推出了全新的翻译 API,该 API 完全依赖本机大语言模型进行翻译,无需联网。开发者可以通过相关文档和示例代码,轻松在应用中实现文本翻译和自定义设备上的语音识别功能。
杨立昆团队发布洛伦兹等变卷积神经网络研究
杨立昆团队在最新的 ICML24 论文中展示了如何构建适用于闵可夫斯基空间多向量场的洛伦兹等变卷积神经网络和消息传递神经网络。这一研究对粒子物理学、纳维 – 斯托克斯方程和电动力学模拟具有重要意义。
Luma 发布 Dream Machine 模型,提升视频生成质量和速度
Luma 官方发布了他们的 Dream Machine 模型,展示了其在视频生成方面的多项优势。该模型生成的视频质量高,分辨率可达 1024 像素,能够理解提示并生成符合美学风格的视频。推理速度快,缩短了等待时间,有利于快速迭代创意。Dream Machine 还可以生成连贯的动作和运动,对物理和人物运动有很好的理解,并在同一视频中保持人物和物体的一致性。此外,该模型支持生成有趣的镜头运动,并允许输入文本提示和图像参考。
北卡罗来纳州立大学团队在 Nature 发表外骨骼机器人突破性研究
北卡罗来纳州立大学与北卡罗来纳大学教堂山分校的苏浩教授团队在 Nature 发表了一篇关于外骨骼机器人和人工智能算法相结合的突破性研究论文。研究团队开发了高保真的肌肉骨骼模型和闭环仿真训练方法,通过数百万轮的仿真训练,实现了无需昂贵且费时的人体实验和调试的外骨骼控制器。该设备能够支持多种动作,自主调整助力大小和曲线形状,适应不同受试者的个体差异。实验结果表明,使用该控制器后,受试者在行走、跑步和爬楼梯时的能量消耗显著降低。
银河通用发布 G1 人形机器人,具备夹爪手部和扫地机底座设计
北京银河通用机器人公司近日发布了其最新的 G1 人形机器人。该机器人手部设计为夹爪,底座类似于扫地机器,展示了其在多模态大模型机器人研发方面的创新能力。银河通用成立于 2023 年 5 月,由北京大学前沿计算研究中心助理教授王鹤博士创立,他同时也是北京智源研究院具身智能研究中心主任。
北京大学与快手 AI 推出 VideoTetris 框架攻克复杂视频生成难题
北京大学与快手 AI 合作推出了新的视频生成框架 VideoTetris,该框架能够轻松组合各种细节,类似于拼俄罗斯方块。VideoTetris 在复杂视频生成任务中表现优异。该框架不仅能增强现有模型的组合生成能力,还支持处理多复杂指令和多场景变更的长视频生成。
中山大学与联想团队推出 AutoStudio,实现 AI 连环画角色一致性
中山大学与联想团队联合开发了 AutoStudio,一个无需训练的多智能体协同框架,能够在创作连环画时保持角色的一致性。AutoStudio 采用基于大语言模型的三个智能体处理交互,并使用基于扩散模型的 Drawer 生成高质量图像。实验结果显示,AutoStudio 在定量和定性评估中均优于现有方法,能够处理频繁切换主体和复杂人物互动的场景。