Stable Diffusion 3 正式开源,提供三天免费试用
Stable Diffusion 3 (SD 3) 正式宣布开源。该模型包含 20 亿参数,适用于消费类 PC、笔记本电脑和企业级 GPU。用户现在可以在 Stable Assistant 和 Stable Artisan 上进行为期三天的图像服务试用。
Stable Diffusion 3 Medium 模型发布,提升图像生成质量
Stable Diffusion 3 Medium 模型正式发布,带来了多项显著改进。新模型在照片写实主义方面表现出色,克服了手部和面部常见的伪像问题,提供高质量图像。其提示遵循能力增强,能够理解复杂的空间关系、构图元素、动作和风格提示。借助 DiT 架构,模型在生成文本时避免了伪影和拼写错误。此外,SD 3 Medium 模型资源利用效率高,适合在标准消费级 GPU 上运行而无性能降级。模型文件包括不同版本,满足不同需求,并提供示例工作流程以供参考。
OpenAI CEO 奥特曼会见三星会长李在镕
据《韩国时报》报道,OpenAI 首席执行官山姆·奥特曼在美国会见了三星集团会长李在镕,讨论 AI 芯片合作事宜。今年 1 月,奥特曼曾访问韩国并参观三星电子的半导体工厂,但这是两人首次在硅谷单独会面。此次会面发生在苹果 WWDC24 开发者大会之前,尽管 OpenAI 与苹果公司有合作关系,奥特曼仍显示出与三星继续合作的决心。奥特曼一直致力于开发自有 AI 芯片,以减少对英伟达的依赖。
埃隆·马斯克撤回对 OpenAI 及其联合创始人的诉讼
埃隆·马斯克在加州州法院撤回了对 OpenAI 及其联合创始人山姆·奥特曼和格雷格·布罗克曼的诉讼。该案原定于旧金山举行听证会,法官将考虑是否根据被告要求驳回此案。法律专家指出,马斯克的诉讼缺乏法律依据,因为相关合同尚未签署完整。马斯克声称 OpenAI 从一个“为人类造福”的项目变成了由微软主导的营利性实体。马斯克去年成立了自己的 AI 公司 xAI,并成功获得了 60 亿美元的 B 轮融资。
亚马逊投资 MultiOn,或在 AI 代理竞赛中下注
据 The Information 报道,亚马逊可能通过投资 MultiOn 在 AI 代理竞赛中下注。MultiOn 是一家专注于AI代理技术的初创公司,其技术有望在未来的 AI 应用中占据重要地位。亚马逊的这一举动表明其在 AI 领域的战略布局和对未来技术的重视。
OpenAI 澄清与微软和甲骨文云基础设施的合作关系
OpenAI 澄清其与微软和甲骨文云基础设施的合作关系,强调与微软的战略云关系保持不变。OpenAI 将利用甲骨文云基础设施上的 Azure AI 平台进行推理和其他需求,但其前沿模型的所有预训练仍在与微软合作建造的超级计算机上进行。
美图发布 DiT 视频模型并推出 AI 视频编辑平台 Moki
美图在最新发布会上展示了其 DiT 视频模型,尽管演示效果显示该模型仍处于早期阶段。同时,美图还推出了 AI 视频编辑平台 Moki,计划于 7 月 31 日上线。
上海交通大学发布 PowerInfer-2.0,实现手机流畅运行 470 亿大模型
上海交通大学 IPADS 实验室推出了面向手机的大模型推理引擎 PowerInfer-2.0,能够在内存有限的智能手机上实现快速推理,使 Mixtral 47B 模型在手机上达到 11 tokens/s 的速度。与热门开源推理框架 llama.cpp 相比,PowerInfer-2.0 的推理加速比平均达到 25 倍,最高达 29 倍。为充分释放 PowerInfer-2.0 的潜力,团队还提出了配套的大模型优化技术 Turbo Sparse。
清华大学发布 Sora 级视频生成大模型 YiSu
极佳科技联合清华大学自动化系正式发布了国产 Sora 级视频生成大模型“视界一粟 YiSu”。YiSu 模型具备原生 16 秒超长时长,并可生成至 1 分钟以上的视频,具有超大运动、超强表现力和物理世界理解能力。相比现有模型,YiSu 在成本、速度和端侧可用性方面具有显著优势。研究团队提出的 WorldDreamer 概念,旨在增强对一般世界物理和运动的全面理解,显著提升视频生成能力。