企业动态
AI 视频初创公司 Runway 融资 4.5 亿美元洽谈中
据 The Information 报道,AI 视频初创公司 Runway 正在与包括 General Atlantic 在内的投资者洽谈融资 4.5 亿美元,估值 40 亿美元。Runway 已是资金最充足的 AI 视频初创公司,此次融资将进一步巩固其在市场中的领先地位。
苹果前高管 Phil Schiller 加入 OpenAI 董事会担任观察员
据 9to5Mac 报道,苹果前高管 Phil Schiller 将加入OpenAI 董事会,担任无投票权的观察员。这一任命是在苹果与 OpenAI 达成 ChatGPT 合作协议后进行的。Schiller 的加入预计将为 OpenAI 带来更多的行业经验和战略指导。OpenAI 是一家致力于开发和推广人工智能技术的公司,其主要产品包括生成式 AI 模型和 ChatGPT。
Figure 与宝马签署协议,通用机器人将进入汽车生产
Figure 宣布与宝马制造公司达成商业协议,将其通用机器人引入汽车生产。此次合作将在宝马位于南卡罗来纳州斯帕坦堡的工厂进行,旨在实现完全自动化操作。项目中使用了 AI 驱动的视觉模型和神经网络,以确保所有抓取动作的精准和高效。合作将分阶段进行,首先验证机器人的可行性和有效性,然后逐步在工厂内部署。Figure 是一家专注于开发自主人形机器人的美国公司,其机器人采用先进的 AI 算法和传感器技术,能够自主导航、识别物体和与人互动。
马斯克挖走的研究员凯尔·科西奇重返 OpenAI
据《财富》杂志报道,OpenAI 研究员凯尔·科西奇(Kyle Kosic)在短暂加入马斯克的 xAI 团队后,又重返了 OpenAI。科西奇去年夏天离开 OpenAI,成为 xAI 新项目的创始工程师之一,但在今年四月,他已回到 OpenAI。尽管 xAI 在 5 月份宣布筹集了高达 60 亿美元的资金,但科西奇在此之前一个月就离开了。目前,xAI 的员工人数不到 100 人,除了科西奇之外的其他创始成员似乎仍在公司工作。
人物与发言
Andrej Karpathy 畅想未来计算:完全基于神经网络的 Software 2.0
知名 AI 专家 Andrej Karpathy 在 Twitter 上分享了他对未来计算的愿景。他提出了一个完全基于 Software 2.0 的计算模型,强调所有设备输入(如音频、视频、触摸等)将直接输入到神经网络中,输出则直接显示为音频或视频。这种计算模型不再依赖传统软件,而是完全由单一神经网络驱动,体现了对上下文理解的 “计算” 理念。
Aravind Srinivas 探讨如何利用无限速度的大语言模型重塑搜索引擎
Perplexity AI 公司 CEO Aravind Srinivas 在讨论中提出了利用无限速度的大语言模型(LLM)来重塑搜索引擎的构想。他认为,传统搜索引擎在处理特定查询时存在局限性,尤其是在规模扩大时问题更加明显。通过结合搜索引擎和 LLM,Perplexity 能够生成引用网络上人类创建的来源的答案,减少幻觉现象,提高用户体验。Srinivas 强调,未来的搜索引擎应更加注重用户需求,提供更准确和相关的答案,而不是简单地依赖传统的搜索结果。Perplexity 的目标是成为一种知识发现引擎,帮助用户不断探索和扩展知识。
论文与研究
谷歌 AI 团队利用 TensorStore 重建复杂生物大脑
谷歌 AI 团队通过结合先进的 AI 算法和 TensorStore 技术,成功重建了更复杂生物的大脑。这一成就显著加快了大脑神经元连接的绘制过程,相比于手工追踪 302 个神经元的线虫大脑所需的 10 多年时间,效率大幅提升。
模型与应用
Meta 推出 Meta 3D Gen:一分钟内生成高质量 3D 资产
Meta 推出了全新的 Meta 3D Gen 工具,可以在不到一分钟的时间内从文本生成高质量的 3D 资产,并支持基于物理的渲染(PBR)。Meta 3D Gen 结合了两个关键技术组件:Meta 3D AssetGen 和 Meta 3D TextureGen,分别用于从文本到 3D 资产以及从文本到纹理的生成。通过结合这两项技术,Meta 3D Gen 能够在视图空间、体积空间和 UV(或纹理)空间中同时表示 3D 对象。
苹果计划在秋季宣布与谷歌 Gemini 聊天机器人的整合
据 9to5Mac 报道,苹果公司计划在 2024 年秋季宣布与谷歌的 Gemini 聊天机器人进行整合。这一举措旨在提升 iOS 设备的智能化水平,为用户提供更丰富的 AI 功能和体验。苹果公司软件工程高级副总裁克雷格・费德里吉透露,苹果将在即将发布的 iOS 18 中引入 Google Gemini 和其他 AI 模型。
苹果将推出支持人工智能功能的升级版 Safari 浏览器
据 AppleInsider 报道,苹果计划在 iOS 18 和 macOS 15 中推出支持人工智能的 Safari 浏览器。新功能包括智能搜索、Web 橡皮擦、用户界面更新和 AI 增强的视觉查找。智能搜索将引入 Ajax 语言模型提供文本摘要;Web 橡皮擦功能将简化用户界面并增强隐私保护;用户界面更新将关键工具集中,提高访问效率;AI 增强的视觉查找功能预计在 2025 年推出,允许用户通过图像获取信息。
Runway 推出 Gen-3 Alpha,实现文本提示生成高质量过渡视频
Runway 的 Gen-3 Alpha 通过精细的时间控制,允许用户仅使用文本提示生成场景内不可能的过渡和效果。该技术展示了出色的运镜和视频质量,但目前尚未开放使用。Runway 是一家专注于提供创意工具的公司,其技术在视频制作领域具有广泛应用前景。
Empirical Health 利用 AI 和真实医生提升 Apple Watch 健康管理
Empirical Health 现已在 Apple Watch 上应用人工智能技术,结合用户数据和真实医生的专业知识,进一步提升健康管理功能。这一创新使用户能够更好地监测和管理自己的健康状况,提供个性化的健康建议和实时反馈。
NVIDIA Metropolis 推出多摄像头 AI 追踪技术,优化大空间管理
NVIDIA Robotics 推出了基于 AI 的多摄像头追踪技术,旨在通过优化基础设施和运营管理,提升大空间的管理效率。该技术是 NVIDIA Metropolis 计划的一部分,利用先进的计算机视觉和人工智能算法,实现对大范围区域内的精确监控和管理。
GroqInc 即将推出多模态模型
GroqInc 公司即将发布备受期待的多模态模型,该功能一直是用户呼声最高的需求之一,GroqInc 的 Sunny Madra 在预览中透露了这一消息,引发了广泛关注。
相关阅读
AI 早知道:马斯克宣布 Grok-2 于 8 月推出;Meta 发布基于 LLM 的编译器
AI 早知道:特斯拉 Optimus 将亮相世界人工智能大会;腾讯元宝推出深度搜索
AI 早知道:Hebbia 获 1 亿美元融资;OpenAI 考虑收购 Scale AI;亚马逊聘请 Adept CEO