Sam Altman 回应 Helen Toner 在 TED AI Show 中的爆料
在联合国“AI for Good”峰会上,OpenAI 首席执行官山姆·奥特曼(Sam Altman)对前董事会成员 Helen Toner 在 TED AI Show 中的爆料作出了回应。Toner 声称她和董事会是通过 Twitter 了解到 ChatGPT 发布的,并指责奥特曼隐瞒信息和歪曲公司情况。奥特曼表示不同意 Toner 的记忆,但尊重她对 AI 良好发展的关心,并解释了 ChatGPT 发布时的情况。
ChatTTS 发布中文支持最优的文本到语音模型
开源 TTS 工具 ChatTTS 一夜之间引起广泛关注,其强大的功能让用户惊叹不已。近日,ChatTTS 官网正式上线,用户可以直接在线体验其文本到语音(TTS)模型。该模型专为对话场景设计,经过超过 10 万小时的训练,公开版本在 HuggingFace 上提供了一个 4 万小时预训练的模型。ChatTTS 模型能够支持多种说话人语音和中英文混合,优化了对话任务的表现。
AI 初创公司 Poolside 寻求 20 亿美元估值
根据 The Information 的报道,AI 初创公司 Poolside 目前正在寻求 20 亿美元的估值,这家初创公司由前 GitHub 首席技术官 Jason Warner 联合创立,正在开发一种专门的大语言模型来实现编码自动化。自去年 4 月成立以来,它已经筹集了 1.26 亿美元,新的融资可能是之前估值的大约四倍。
微软、OpenAI、Anthropic 和 Google 高层预计大语言模型将继续快速进展
沃顿商学院教授伊桑·莫里克(Ethan Mollick)近日表示,关于“大语言模型(LLM)进展是否停滞”的问题,未来几个月内将会有答案。他指出,微软、OpenAI、Anthropic 和 Google 的关键人物最近几周都公开强烈表示,他们预计大语言模型将继续快速进展。
GitHub CEO Thomas Dohmke:AI 助力人人成为程序员
GitHub CEO Thomas Dohmke 在 Ted 演讲中探讨了 AI 对编程的影响。他指出,随着 ChatGPT 等大语言模型的出现,编程变得更加简便。GitHub 推出的 Copilot 工具可以辅助开发人员编写代码,自动生成建议代码,极大地简化了编程过程。尽管 AI 工具如 Copilot 能够简化编程,但专业软件开发者仍然在设计和维护复杂软件系统中起着关键作用。AI 作为协作工具,开发者需要根据需求将大问题分解为小问题,并逐步实现。这也是许多 AI 辅助工具被命名为 Copilot 的原因,因为仍需要人类开发者做出专业决策。
旷视推出多模态大模型 Fox,实现复杂文档细粒度理解
旷视团队近日发布了一款名为 Fox 的多模态大模型,专为处理复杂文档设计。Fox 能够轻松实现对多页文档的交互式感知理解,支持中英混合、单栏多栏格式混合的极端场景。对于信息密集的 PDF 文档,Fox 提供高可控性的细粒度理解,包括文字识别、段落翻译和图片内容描述等功能。该模型在视觉感知理解方面取得了突破,使得高密度信息得以真正压缩和理解,提升了文档处理的效率和准确性。
港大与百度联合发布首个智慧城市大模型 UrbanGPT
港大与百度联合团队推出了新型时空大型语言模型 UrbanGPT,旨在捕捉和预测城市生活的动态变化。该模型借鉴大型语言模型的思想,通过结合时空依赖编码器和指令微调方法,增强了对时间和空间复杂关系的理解。即使在数据稀缺的条件下,UrbanGPT 也能提供精确的预测。广泛实验表明,该模型在多个城市相关任务上表现出色,展示了其在零样本学习领域的强大潜力。