Skip to content
毫河风报
菜单
  • 首页
  • 关于我们
  • 联系我们
  • 播记
 

AI 早知道:Sam Altman 否认 Toner 爆料;旷视推出多模态大模型 Fox;ChatTTS 官网上线

2024-06-02

Sam Altman 回应 Helen Toner 在 TED AI Show 中的爆料

在联合国“AI for Good”峰会上,OpenAI 首席执行官山姆·奥特曼(Sam Altman)对前董事会成员 Helen Toner 在 TED AI Show 中的爆料作出了回应。Toner 声称她和董事会是通过 Twitter 了解到 ChatGPT 发布的,并指责奥特曼隐瞒信息和歪曲公司情况。奥特曼表示不同意 Toner 的记忆,但尊重她对 AI 良好发展的关心,并解释了 ChatGPT 发布时的情况。

ChatTTS 发布中文支持最优的文本到语音模型

开源 TTS 工具 ChatTTS 一夜之间引起广泛关注,其强大的功能让用户惊叹不已。近日,ChatTTS 官网正式上线,用户可以直接在线体验其文本到语音(TTS)模型。该模型专为对话场景设计,经过超过 10 万小时的训练,公开版本在 HuggingFace 上提供了一个 4 万小时预训练的模型。ChatTTS 模型能够支持多种说话人语音和中英文混合,优化了对话任务的表现。

AI 初创公司 Poolside 寻求 20 亿美元估值

根据 The Information 的报道,AI 初创公司 Poolside 目前正在寻求 20 亿美元的估值,这家初创公司由前 GitHub 首席技术官 Jason Warner 联合创立,正在开发一种专门的大语言模型来实现编码自动化。自去年 4 月成立以来,它已经筹集了 1.26 亿美元,新的融资可能是之前估值的大约四倍。

微软、OpenAI、Anthropic 和 Google 高层预计大语言模型将继续快速进展

沃顿商学院教授伊桑·莫里克(Ethan Mollick)近日表示,关于“大语言模型(LLM)进展是否停滞”的问题,未来几个月内将会有答案。他指出,微软、OpenAI、Anthropic 和 Google 的关键人物最近几周都公开强烈表示,他们预计大语言模型将继续快速进展。

GitHub CEO Thomas Dohmke:AI 助力人人成为程序员

GitHub CEO Thomas Dohmke 在 Ted 演讲中探讨了 AI 对编程的影响。他指出,随着 ChatGPT 等大语言模型的出现,编程变得更加简便。GitHub 推出的 Copilot 工具可以辅助开发人员编写代码,自动生成建议代码,极大地简化了编程过程。尽管 AI 工具如 Copilot 能够简化编程,但专业软件开发者仍然在设计和维护复杂软件系统中起着关键作用。AI 作为协作工具,开发者需要根据需求将大问题分解为小问题,并逐步实现。这也是许多 AI 辅助工具被命名为 Copilot 的原因,因为仍需要人类开发者做出专业决策。

旷视推出多模态大模型 Fox,实现复杂文档细粒度理解

旷视团队近日发布了一款名为 Fox 的多模态大模型,专为处理复杂文档设计。Fox 能够轻松实现对多页文档的交互式感知理解,支持中英混合、单栏多栏格式混合的极端场景。对于信息密集的 PDF 文档,Fox 提供高可控性的细粒度理解,包括文字识别、段落翻译和图片内容描述等功能。该模型在视觉感知理解方面取得了突破,使得高密度信息得以真正压缩和理解,提升了文档处理的效率和准确性。

港大与百度联合发布首个智慧城市大模型 UrbanGPT

港大与百度联合团队推出了新型时空大型语言模型 UrbanGPT,旨在捕捉和预测城市生活的动态变化。该模型借鉴大型语言模型的思想,通过结合时空依赖编码器和指令微调方法,增强了对时间和空间复杂关系的理解。即使在数据稀缺的条件下,UrbanGPT 也能提供精确的预测。广泛实验表明,该模型在多个城市相关任务上表现出色,展示了其在零样本学习领域的强大潜力。

AI 日报

查看全部日报

  • AI 代理战场新核武!OpenAI 发布 o3 模型:比肩人类决策,媲美专业审核
  • 软银 5000 亿美元 AI「星门」陷融资困境,孙正义:短期波动不足为惧
  • 贝索斯加持 AI 搜索新星估值 140 亿!3 年超谷歌 7 年成绩
  • 苹果重磅爆料:秘密研发两大“杀手锏”芯片,剑指智能眼镜与 AI 服务器!
  • 千觉机器人完成千万融资!加速多模态触觉技术落地

©2025 毫河风报 沪ICP备18012441号-5