马斯克预测明年实现 AGI
多个 AI 领域的专家对通用人工智能(AGI)的实现时间进行了预测。尽管观点不一,但大多数专家认为,AGI 的实现可能还需要数十年的时间。一些乐观的预测认为,AGI 可能在未来 20 至 30 年内实现,而保守的估计则认为这一目标可能需要更长时间。马斯克则在 X 上回复评论明年实现 AGI。
Indent 团队宣布加入 OpenAI,致力 AGI 安全技术
Indent 团队近日宣布将于 2024 年 7 月 15 日关闭服务。同时,团队成员在 X 上宣布加入 OpenAI,OpenAI 联合创始人 Greg Brockman 发帖表示欢迎。Indent 是一个专注于安全领域的技术团队,已成立六年时间,服务覆盖了从客户数据、生产基础设施到日常业务软件的各个方面,旨在确保这些关键领域得到安全保护,同时不降低团队的工作效率。
中国移动发布全栈国产化大模型“九天智能基座”
中国移动近日发布了全栈国产化生态大模型“九天智能基座”,该基座包括万卡算力、千亿模型及百汇平台三部分。九天智能基座由中国移动自主研发,模型部分为全栈国产训练的千亿参数大模型,能力达到 GPT-4 的 90%水平。该基座已布局 17 个细分领域行业大模型,覆盖政务、医疗、办公、金融风控等多个行业。此外,中国移动还宣布年内将建成 3 个国产近 2 万卡智算中心,并发布了 23 个 AI 软硬产品和 20 个行业应用。
阿里巴巴开源 FunClip 自动视频剪辑工具
阿里巴巴推出了 FunClip,这是一款开源的视频剪辑工具,利用 Paraformer 系列模型进行视频语音识别。FunClip 支持多功能视频处理和定制化剪辑,集成了高性能的 Paraformer-Large 模型和 CAM++说话人识别模型,提供优秀的中文语音识别和说话人分辨功能。用户可以通过 Gradio 界面在浏览器中使用该工具,简化了安装和使用流程。FunClip 还支持热词定制化功能,提升特定词汇的识别准确率,并正在开发集成英文视频剪辑能力的 Whisper 模型和大语言模型。最新版本 v1.1.0 带来了 UI 升级和多项功能改进。
Chess.com 推出 Dr. Wolf 语音功能提升学习体验
Chess.com 宣布其学习应用“Learn Chess with Dr. Wolf”新增语音功能,解决了用户对文字评论难以理解的问题。Dr. Wolf 是一位互动虚拟国际象棋教师,通过语音讲解每一步棋,提供个性化的 1:1 国际象棋辅导,帮助用户提升棋艺。这一改进旨在为全球玩家提供更具吸引力和个性化的学习体验。
FIFO-Diffusion 开源技术实现无限长视频生成
FIFO-Diffusion 是一种无需训练的基于预训练扩散模型的新型推理技术,能够从文本生成无限长的视频。该方法通过迭代进行对角去噪处理,并通过前向参考机制和潜在分区、前瞻去噪技术,提升帧间去噪效果,减少训练-推理差距。FIFO-Diffusion 支持生成高质量、长时间的视频,已在多种文本到视频生成基线模型上展示了其有效性,并在 TextVQA、DocVQA 等基准测试中表现优异,超过了一些非开源模型。项目结构包括基本调用方法、微调示例和 OpenAI API 格式调用示例,帮助开发者快速上手应用。