企业动态
AI 芯片初创公司 Etched 获 1.2 亿美元融资
Etched 公司发布了基于自研芯片 Sohu 的 8 卡服务器,声称其每秒可生成 50 多万个 tokens,性能是 H100 服务器的 20 倍。该公司由哈佛大学辍学生 Gavin Uberti 和 Chris Zhu 创立,团队包括多位前英特尔和赛普拉斯半导体高管。Sohu 芯片专用于 Transformer 模型,无法运行其他 AI 模型。Etched 表示,随着摩尔定律的放缓,专用化是提高性能的唯一途径。本轮融资由 Primary Venture Partners 和 Positive Sum Ventures 领投,支持者包括 Peter Thiel、Stanley Druckenmiller 和 Kyle Vogt。
Stability AI 宣布融资,Prem Akkaraju 出任首席执行官
Stability AI 宣布获得来自 Greycroft、Coatue Management、Sound Ventures、Lightspeed Venture Partners、O’Shaughnessy Ventures,以及肖恩 – 帕克(Facebook 前总裁)、Prem Akkaraju、Eric Schmidt(前谷歌董事长)和 Robert Nelsen 等机构和个人的投资,融资金额超 1 亿美元。Prem Akkaraju 曾任视觉特效公司维塔数码(Weta Digital)的首席执行官。自 2024 年 3 月起担任临时联席首席执行官的 Shan Shan Wong 和 Christian Laforte 将继续留在公司,分别担任首席运营官和首席技术官。董事会成员包括肖恩 – 帕克、Dana Settle、Colin Bryant 和 Prem Akkaraju。
Stability AI 自创立以来,经历了快速崛起和近期的动荡。公司曾因其开源的 Stable Diffusion 模型而声名鹊起,但也面临着严重的财务问题和管理层动荡,2024 年 3 月,Stability AI 的创始人兼 CEO Emad Mostaque 突然宣布辞职,暴露了 Stability AI 背后的财务危机。尽管公司估值曾达到 10 亿美元,但每月高达 800 万美元的支出让公司难以为继。投资者对公司的财务状况表示担忧,并对管理层施加了巨大压力。从去年 3 月至今,已有至少 19 名高管或关键人物离职,包括 CTO 在内的核心研发团队也相继出走。
此次融资旨在解决 Stability AI 的资金链断裂问题。这笔资金将主要用于支付拖欠的供应商账单、员工工资以及继续推进公司的技术研发和产品开发。此外,投资集团还提出了一系列严格的管理和运营要求,以确保资金的有效使用和公司的可持续发展。
多家唱片公司起诉 Suno 和 Udio 涉嫌使用版权歌曲训练 AI 工具
索尼音乐、环球音乐、华纳唱片、卡皮托尔唱片和大西洋唱片等多家唱片公司以及美国唱片业协会对 Suno 和 Udio 提起诉讼,指控它们使用受版权保护的歌曲来训练其 AI 工具。原告通过测试发现,使用包含流行录音特征的提示会使 Suno 的产品生成与提示描述相关的音乐文件,显示出与特定版权录音在旋律或节奏上的高度相似性。这表明 Suno 可能在训练过程中复制了受版权保护的录音。
模型与应用
Anthropic 推出新功能 Projects,支持私有文档上传与工作流管理
Anthropic 推出了新的产品化功能 Projects,用户可以新建项目并设置为隐私,上传私有文档到项目知识库中,并在 Projects 中进行对话和使用 Artifacts 功能完成工作流。头部模型公司在产品上的探索不断增多,Instagram 联合创始人迈克・克里格已出任 Anthropic 首席产品官一个月。与此同时,OpenAI 的产品导向引发了一些专注于通用人工智能(AGI)和人工智能安全的研究员的不满。
Stable Diffusion 3 发布 ControlNet 合集
Stable Diffusion 3 的 ControlNet 合集已经发布,包括 SD3-Controlnet-Pose、SD3-Controlnet-Canny 和 SD3-Controlnet-Tile。这些模型由 InstantX 创作,未来可能会在其项目页面上继续更新。Stable Diffusion 是一种先进的图像生成技术,广泛应用于艺术创作和设计领域。
腾讯开源 MOFA-Video 视频控制方法
腾讯新开源了一个名为 MOFA-Video 的视频控制方法。该方法允许用户使用各种类型的控制信号(包括轨迹、关键点序列及其组合)对单个图像进行动画处理。MOFA-Video 通过采用稀疏到密集(S2D)运动生成和基于流的运动适应,可以有效地为单个图像制作动画。研究团队设计了多个领域感知运动场适配器(MOFA 适配器)来控制视频生成管道中的运动。在训练阶段,通过稀疏运动采样生成稀疏控制信号,并训练不同的 MOFA 适配器,通过预训练的 SVD 生成视频。在推理阶段,可以组合不同的 MOFA 适配器来共同控制静止的 SVD。
清华北大 00 后团队推出爆火 3D 生成模型,GitHub 星数超 1.6k
一个由清华大学和北京大学毕业生组成的年轻初创团队推出了一款高质量的 3D 生成模型,能够在 30 秒内将一张图像转换为 3D 模型。该模型在上线后迅速登上抱抱脸热榜,并在 GitHub 上获得超过 1.6k 的星标。Gradio 官方也发推文分享了这一模型,称其为目前最好的图像转 3D 模型之一。团队成员包括北京大学计算机系毕业的 CEO、清华大学姚班的 CTO 以及多位擅长 CG 艺术创作的成员。团队在成立一年内完成了三轮融资,并计划推出更多新功能,如一张图生成 3D 全景图和一键将视频人物替换为生成角色。
浪潮信息 AI 团队在 CVPR 2024 自动驾驶挑战赛中夺冠
在刚刚结束的 CVPR 2024 自动驾驶国际挑战赛中,浪潮信息 AI 团队在 “Occupancy & Flow” 赛道中以 48.9% 的成绩从全球 90 余支顶尖 AI 团队中脱颖而出,摘得桂冠。这是该团队继 2022 年和 2023 年登顶 nuScenes 3D 目标检测榜单后,再次展示其在 Occupancy 技术方面的实力。CVPR 自动驾驶国际挑战赛是国际计算机视觉与模式识别会议的重要组成部分,专注于自动驾驶领域的技术创新和应用研究。今年的比赛吸引了来自 17 个国家和地区的众多顶尖团队,比赛基于 nuScenes 数据集,要求参赛队伍利用相机图像信息对栅格化三维空间的占据情况和运动进行预测。
斯坦福大学 6 英尺高人形机器人 HumanPlus 实现自主穿鞋和行走
斯坦福大学的 6 英尺高人形机器人 HumanPlus 取得了显著进展,能够自主穿上耐克滑板鞋、系鞋带、站起来并行走。该机器人使用了两个 transformer 和双 RGB 视觉系统,通过模仿现实生活中的人类动作和在大规模仿真中学习来实现这些功能。这一突破展示了机器人在自主学习和执行复杂任务方面的潜力。
密歇根州引入 EMILY 救生机器人提升海滩安全
密歇根州圣约瑟夫的银滩近日引入了一艘名为 EMILY 的电池供电遥控救生机器人。EMILY 能够快速驶向溺水者,帮助他们漂浮,直到救生员到达现场。这艘价值 12800 美元的机器人由一位因溺水失去女儿的母亲捐赠,旨在提高海滩安全,避免更多悲剧的发生。每年五大湖溺亡人数平均超过 80 人,其中密歇根湖溺亡人数最多。EMILY 的引入标志着海滩救援技术的重大进步,为提高海滩游客的安全性提供了有力支持。
丝芭传媒启动 AIGC 产品内测,推出 “鹦鹉人” 和美踏元宇宙
丝芭传媒宣布其 AIGC 生成工具 APP “鹦鹉人” 将于 6 月 26 日启动技术测试,同时其核心产品 —— 图形化智能社交基座美踏元宇宙也即将开放首轮用户内测。这两款产品是丝芭传媒 AI 技术应用产品矩阵中率先进入内测阶段的产品,旨在为用户提供借助 AI 驱动的 UGC 和 PGC 创作工具,打造一个图形化和智能化的互动社区平台,提升用户的沉浸式创作和分享体验。
相关阅读
AI 早知道:OpenAI 封禁部分区域 API;阶跃星辰新融资估值 20 亿美元;ChatGPT 语音模式开启灰测