前谷歌 CEO Eric Schmidt 在受邀参加斯坦福大学计算机会议时,发表了激情演讲,抱怨「谷歌认为,工作与生活的平衡、早早回家、在家工作比获胜更重要」,因而谷歌才会在 AI 上输给 OpenAI。
由于这些观点引发了很大的争议,尤其是涉及到远程工作对谷歌影响的批评以及关于 AI 创业公司的法律策略的言论,根据《华尔街日报》报道,Eric Schmidt 要求斯坦福大学删除视频,Eric Schmidt 也随之表示道歉,说「我对自己的错误表示遗憾。」
Eric Schmidt 是美国著名的企业家、软件工程师和风险投资家。2001 年,Google 的创始人 Larry Page 和 Sergey Brin 聘请 Schmidt 担任公司的 CEO,在他的领导下,Google 实现了快速增长,从一家搜索引擎公司转型为一个广泛的互联网平台。Schmidt 带领 Google 于 2004 年成功上市,并在全球范围内扩展了其业务。
Schmidt 在 2011 年卸任 Google CEO,转任公司执行董事长,继续为公司的战略发展提供指导。2017 年,他辞去了 Alphabet 董事会执行主席的职务,但仍担任技术顾问,直到 2020 年正式离开公司。在离开 Google 之后,Schmidt 投身于风险投资,成立了 Schmidt Futures 基金会,专注于支持科学研究和技术创新。
我们将这一演讲内容保存下来,并摘出了关键要点:
- 人工智能的发展方向:Schmidt 认为,人工智能(AI)在未来一年或两年内将会有显著的发展,特别是在大规模上下文窗口、智能体(agents)和文本到行动(text-to-action)方面。他强调,这些技术的结合可能会对世界产生巨大影响,甚至超过目前社交媒体带来的影响。
- 头部公司与竞争者的差距:Schmidt 提到,当前头部公司与其他竞争者之间的差距正在拉大,尤其是在人工智能领域。他提到,几个月前他认为差距在缩小,因此他投资了许多小公司。但现在他不太确定,因为大公司告诉他,他们需要巨额资金(如 100 亿、200 亿甚至更多)来继续保持领先地位。
- 开源与闭源的争论:Schmidt 提到,开源和闭源之间的争论非常大。虽然他本人一直支持开源,并且他的整个职业生涯都基于开源软件,但由于资本成本的巨大压力,未来的软件开发可能会更多地转向闭源。
- 技术垄断与反垄断:他也提到像 NVIDIA 这样的公司由于其在 CUDA 优化和硬件方面的巨大优势,几乎形成了技术垄断。而尽管他曾帮助微软免于被拆分,但目前看起来政府对于这些大公司的分拆意愿并不强烈,因为这些公司能够为建立数据中心等大型基础设施提供必要的资金。
- 文本到行动(Text-to-Action)的应用:在文本到行动方面,他提出了一个假设:用户可以使用 AI 系统来快速生成应用程序,甚至复制现有的流行应用,如 TikTok。他指出,这种能力可能会彻底改变软件开发和用户交互的方式。
- 对 Google 和 NVIDIA 的批评与分析:Schmidt 对 Google 当前的工作生活平衡政策表示了不满,认为这削弱了公司的竞争力。同时,他还分析了为什么 NVIDIA 在当前市场中占据主导地位,认为其 CUDA 优化是其他竞争者难以复制的关键优势。
- 国家安全与地缘政治:他谈到了 AI 在国家安全和地缘政治中的作用,尤其是在中美竞争中。他认为美国目前在芯片技术方面领先中国约 10 年,并强调了继续保持这一优势的必要性。
以下是演讲对话全文,我们做了不改变原意的翻译和编辑。
事情变化得太快了,我感觉每六个月我都需要重新做一次关于未来发展的演讲。
有人能为大家解释一下什么是百万令牌上下文窗口吗?
(学生)基本上,它允许你用大约一百万个令牌或者一百万个单词之类的东西进行提示。所以你可以问一个一百万字的问题。我了解到,这是当前通识教育关注的一个重要方向。
不,他们的目标是 10 个一百万。
接着,Anthropic 已经达到了 20 万个令牌,并计划扩展到一百万个。你可以想象,OpenAI 也有类似的目标。
有人能在这里给出一个技术上的定义,解释什么是 AI 智能体吗?
(学生)AI 智能体是一种执行某种互动的实体。这可能代表你可以处理许多不同的事项,各种各样的事情。
一个智能体就是执行某种任务的实体,另一个定义是,它是一个大语言模型,具有状态和记忆功能。再来一次,计算机科学家们,你们中有谁能解释一下什么是文本到行动吗?就是将文本转变为行动。
(学生)对的,不是将文本转化为更多的文本,让文本触发 AI 的行动。
另一个定义是,将语言转化为 Python 代码,一种我从未想过会存活的编程语言,而如今 AI 的一切都在用 Python 完成。最近有一种叫做 Mojo 的新语言问世,它看起来终于解决了 AI 编程问题,但我们还要看看它是否能在 Python 的主导地位下存活。
再来一个技术问题。为什么 NVIDIA 价值 2 万亿美元,而其他公司却在挣扎?
(学生)我认为归根结底,大多数代码都需要使用 CUDA 优化来运行,而目前只有 NVIDIA GPU 支持。其他公司可以做任何他们想做的事情,但除非他们拥有 10 年的软件经验,否则就不会拥有机器学习优化。
我喜欢将 CUDA 视为 GPU 的 C 编程语言。它成立于 2008 年。我一直认为它是一种糟糕的语言,但它却占据了主导地位。
还有另一种见解。有一组开源库针对 CUDA 进行了高度优化,而没有针对其他任何东西以及构建所有这些堆栈的每个人,这一点在任何讨论中都被完全忽略了。从技术上讲,它被称为 VLM 和一大堆类似的库。高度优化的 CUDA,如果你是竞争对手,很难复制。
那么这一切意味着什么?
明年,你将会看到非常大的上下文窗口、代理和文本动作。当它们大规模应用时,将对世界产生前所未有的影响。 在我看来,这比社交媒体给我们造成的可怕影响要大得多。在上下文窗口中,你基本上可以将其用作短期记忆,而我很震惊上下文窗口竟然这么长。
技术原因与服务难度、计算难度等有关。关于短期记忆,最有趣的是,当你给它提供输入,比如阅读 20 本书,你将这些书的文本作为查询输入,然后你问它这些书在说什么。它忘记了中间部分,而这正是人类大脑的工作方式。这正是我们所处的情况。
关于智能体,现在有些人正在构建 LLM 智能体,他们这样做的方式是阅读一些类似化学的东西,他们发现化学原理,然后对其进行测试,然后将其重新添加到他们的理解中。这非常强大。
然后第三件事,正如我提到的,是从文本到行动。 我给你举个例子。政府正在试图禁止 TikTok。我们将看看这是否真的会发生。如果 TikTok 被禁,我建议你们每个人都这样做。向你的 LLM 说以下内容:为我制作一个 TikTok 的副本,窃取所有用户,窃取所有音乐,把我的喜好放进去,在接下来的 30 秒内制作这个程序,发布它,一小时内,如果它没有流行起来,就做一些类似的事情。
这就是命令。你知道这有多么强大。如果你可以从任意语言转到任意数字命令,这本质上就是这个场景中的 Python,想象一下地球上的每个人都有自己的程序员,他们可以做他们想做的事情,而不是为我工作的程序员不按我的要求做,对吗?
这里的程序员知道我在说什么。一个不傲慢的程序员实际上可以做你想做的事情,而你不必支付那么多钱,而且这些程序的供应是无限的。 这一切都将在未来一两年内发生。
很快,以上三件事,我确信,下一波浪潮中将会同时发生这三件事。 所以你问还会发生什么。每六个月我都会摇摆不定。因此,我们处于一个奇偶振荡状态。
目前来看,前沿模型之间的差距,只有三家,而所有其他公司之间的差距在我看来正在拉大。 六个月前,我确信差距正在缩小。所以我向这些小公司投资了很多钱。现在我不太确定了。我正在与大公司交谈,大公司告诉我,他们需要 100 亿、200 亿、500 亿、1000 亿。
(主持)Stargate 是 1000 亿美元,对吗?
这非常非常困难。我与萨姆·奥特曼(Sam Altman)交谈过,他是我的一位亲密朋友。他认为这将需要大约 3000 亿美元,甚至更多。我向他指出我已经计算过所需的能源量。
然后,为了完全公开透明,我在星期五去了白宫,告诉他们我们需要和加拿大成为最好的朋友,因为加拿大不仅有非常友善的人,还帮助发明了人工智能,并且有大量的水电资源。因为我们这个国家没有足够的电力来支持这些计算。
另一种选择是让阿拉伯国家来资助这一切,而我个人很喜欢阿拉伯国家,我在那里花了很多时间,对吧?但他们不会遵守我们的国家安全规则。而加拿大和美国是一个三国联盟的一部分,我们都同意合作。
(主持)因此,这些 1000 亿到 3000 亿的数据中心,电力将成为稀缺资源。
顺便说一句,如果你跟随这种推理,那么为什么我要讨论 CUDA 和 NVIDIA?如果这 3000 亿美元都将流向 NVIDIA,你知道该在股票市场上做什么。好吧,这不是股票推荐,我没有执照。
(主持)部分原因是我们将需要更多的芯片,但 Intel 正在从美国政府那里获得大量资金,AMD 也在试图在韩国建造工厂。
举手示意一下,如果你的计算设备中有 Intel 芯片。好吧,垄断基本没了。但是,这就是问题所在。
(主持)他们曾经确实拥有垄断地位,NVIDIA 现在拥有垄断地位。所以,那些进入壁垒,比如 CUDA,是其他公司难以复制的关键。我在和 Percy Landy 谈话时,他在不同的情况下使用 TPUs 和 NVIDIA 芯片,取决于他能获得哪些资源来训练模型。
那是因为他别无选择。如果他有无限的资金,他今天会选择 NVIDIA 的 B200 架构,因为它会更快。我并不是说这是竞争的好事,我和 AMD 的 Lisa Su 谈了很长时间。他们建立了一个东西,可以从你描述的 CUDA 架构转换为他们自己的架构,叫做 Rockum。它还不能完全工作,他们还在努力。
(主持)你在 Google 工作了很长时间,他们发明了 Transformer 架构。
Peter,都是 Peter 的错。
(主持)感谢那里的才华横溢的人,比如 Peter 和 Jeff Dean 以及其他人。但现在,似乎他们已经失去了对 OpenAI 的主动权,甚至在我看到的最新榜单上,Anthropic 的 Claude 也名列前茅。我问了 Sundar(皮查伊),他没有给我一个非常清晰的答案。也许你有一个更清晰或更客观的解释,关于这方面发生了什么。
我已经不再是 Google 的员工了。坦白说,Google 觉得工作与生活的平衡、早点回家以及在家工作比赢得比赛更重要。 初创公司成功的原因是因为人们拼命工作。
很抱歉这么直白,但事实是,如果你们从大学毕业后去创办公司,你不会让人们只在家工作,每周只来一天,如果你想与其他初创公司竞争的话。
(主持)创业初期的 Google 和 Microsoft 就是这样的。
在我的行业里,这种企业赢得比赛并以创造性方式主导市场却没有在下一次转型中保持这种优势的现象有着很长的历史。这非常清楚地记录在案。
我认为,真相是创始人是特别的。创始人需要掌舵,他们难以相处,但他们推动团队努力工作。
尽管我们不喜欢埃隆的个人行为,但看看他从人们身上得到了什么。我和他一起吃饭时他正在飞行。我当时在蒙大拿州。他当晚 10 点就乘飞机去参加午夜的 x.ai 会议。
我去过台湾,不同的地方,不同的文化。他们说这是台积电,我对他们印象非常深刻。他们有一条规定,优秀的物理学博士必须在工厂的地下一层工作。现在,你能想象让美国物理学家做到这一点吗?几乎不可能。
这里的问题是,我之所以对工作如此严格,是因为这些系统具有网络效应。所以时间很重要。在大多数行业中,时间并不是那么重要。 你有很多时间。可口可乐和百事可乐仍将存在,可口可乐和百事可乐还会存在,竞争也将继续,而且这种竞争是缓慢的。当我与电信公司打交道时,典型的电信协议需要 18 个月才能签署。没有理由花 18 个月的时间来做任何事情,尽快完成。
我们正处于最大增长、最大收益的时期。这也需要疯狂的想法。就像微软与 OpenAI 达成交易时一样,我认为那是我听过的最愚蠢的想法。基本上将你的 AI 领导权外包给 OpenAI 和 Sam 及其团队。我的意思是,这太疯狂了。无论在微软还是其他任何地方,没人会这么做。但如今,他们已经逐渐成为最有价值的公司。他们肯定与苹果公司平分秋色。苹果没有好的人工智能解决方案,但看起来他们做成了。
(学生)在国家安全或者地缘政治利益方面,您认为人工智能将如何发挥作用或与中国竞争?
我曾担任过一个 AI 委员会的主席,专门研究这个问题。你可以阅读我们的报告,长达 752 页。我简单总结一下:我们目前处于领先地位,必须保持领先地位,为此需要大量资金。我们的客户是参议院和众议院。由此推动了《芯片法案》和其他类似的政策。
一种可能的情况是,如果我们假设前沿模型继续推进,而开源模型中的少数几个也在进展,那么很可能只有少数几个国家能够参与这场游戏。哪些国家会参与?拥有大量资金、强大的人才储备、健全的教育系统以及渴望胜利的国家。美国是其中之一。中国是另一个。还有其他国家吗?可能有,但我不确定。
但是,在你们的有生之年,美国和中国之间的知识霸权之争将成为大斗争的主线。
因此,美国政府实际上禁止了 NVIDIA 芯片进入中国,尽管他们不被允许明说,但实际上就是这样做的。在次紫外光刻,即小于 5 nm 的芯片方面,我们大约领先中国 10 年左右。 例如,今天我们大约领先中国几年,我猜我们会进一步拉大这个差距。中国对此非常愤怒,这让他们非常生气。这是特朗普政府做出的决定,并由拜登政府推动。
(主持)_你认为现任政府和国会会听取你的建议吗?你认为他们会做出那样的规模投资吗?显然,有《芯片法案》,但除此之外,是否会建设一个大规模的 AI 系统?
如你所知,我领导了一个非正式的、临时的、非法律性质的小组。这与非法不同,仅此澄清。这个小组包括了所有我们通常见到的人。在过去一年里,他们提出了为拜登政府 AI 法案提供依据的基本推理,这也是有史以来最长的总统指令。
(主持)你说的是“特别竞争研究项目”吗?
不,这是来自总统办公室的实际法案,他们正忙于实施细节。到目前为止,他们的做法是正确的。例如,我们去年讨论的一个问题是,如何检测一个系统中潜在的危险?即它学会了某些东西,但你不知道要问它什么问题。换句话说,这是一个核心问题。它学会了某种坏事,但它无法告诉你它学到了什么,而你也不知道该问它什么。
有太多威胁了,比如它学会了如何用你不知道的方式混合化学物质。所以人们在努力解决这个问题。
最终,我们在给他们的备忘录中写道,有一个我们任意命名为 10 的 26 次方浮点运算的门槛,这在技术上是一个计算量的度量,超过这个门槛你必须向政府报告你正在做的事情。这是规则的一部分。欧盟为了与美国有所不同,设定了 10 的 25 次方,但这些都差不多。
我认为所有这些区分最终都会消失,因为技术现在开始采用所谓的“联合训练”,基本上你可以将不同的部分联合起来。因此,我们可能无法保护人们免受这些新技术的威胁。有传言说,这正是 OpenAI 为了应对能源消耗不得不分散训练的原因之一。
(主持)我想转向一个有点哲学性的问题。去年你和 Henry Kissinger 以及 Dan Huttenlocher 写了一篇关于知识性质及其演变的文章。前几天我也就这个问题进行了一次讨论。在人类历史的大部分时间里,人类对宇宙的理解是神秘的,然后发生了科学革命和启蒙运动。在你的文章中,你们认为,现在这些模型变得如此复杂和难以理解,以至于我们不再真正知道它们内部发生了什么。
我引用 Richard Feynman 的一句话:“我无法创造的东西,我无法理解。” 但现在人们正在创造他们可以创造的东西,却不真正理解其中的奥秘。知识的本质是否在改变?我们是否需要开始依赖这些模型而不再要求它们向我们解释其中的原理?
我会用青少年做个比喻。如果你有一个青少年,你知道他们是人类,但你却不太清楚他们在想什么。但我们社会还是适应了青少年的存在,他们最终也会成长。我是认真的。所以,很可能我们将会拥有一些我们无法完全描述的知识系统,但我们理解它们的边界。我们理解它们的能力极限。这可能是我们能够得到的最佳结果。
(主持)您认为我们会了解这些边界吗?
我们会做得很好。
我每周与我的团队会面,他们的共识是,最终所谓的对抗性 AI(adversarial AI)将会成为一种实际存在的商业模式。你会雇佣并付钱给某些公司,这些公司的工作就是破坏你的 AI 系统,找到它们的漏洞,特别是那些我们无法弄清楚的知识漏洞。这对我来说是合理的。
这也是你们在斯坦福的一个绝佳项目,因为如果你们有研究生能够搞清楚如何攻击这些大型模型,并理解它们的行为,那将为下一代培养出非常重要的技能。所以我认为这两者将齐头并进。
(好的,我们来回答一下学生的一些问题。)
(学生)早些时候你提到,让 AI 做你想让它做的事情是一个未解决的问题。你刚刚提到了对抗性 AI,我想请你进一步解释。除了为了获得更高效的模型,还有其他理由让 AI 模型能够更好地执行任务吗?
你必须假设当前的幻觉问题(hallucination problems)会随着技术的进步而减少,但我并不认为它会完全消失。你还必须假设有有效性测试的方法。因此,必须有某种方式知道这些模型是否达到了预期目标。
在我给出的 TikTok 竞争者的例子中,顺便说一句,我并不是说你应该非法地窃取所有的音乐。如果你是硅谷的企业家,理想情况下你会这样做,如果它成功了,你会雇一大堆律师来处理烂摊子,对吧?但如果没有人使用你的产品,那你窃取的内容也无关紧要。
但你明白我的意思。换句话说,硅谷将进行这些测试并收拾残局。这通常是这些事情的处理方式。
我的看法是,你将会看到越来越多的表现性系统(performative systems),它们有更好的测试,最终包括对抗性测试,这将使它们保持在某个安全范围内。技术术语叫做“链式推理”(chain of thought reasoning)。人们相信在未来几年内,你将能够生成一千步的链式推理,比如做这个,做那个。就像制作食谱一样,你可以运行食谱,并实际测试它是否产生了正确的结果。这就是系统的工作方式。
(学生)你提到你对 AI 的潜在问题持非常乐观的态度。我很好奇,你认为这种乐观态度背后的驱动力是什么?是更多的计算能力?更多的数据?还是基础算法的变革?
是的,所有这些。我同意。
目前投入的资金数量令人难以置信。我基本上是在所有领域投资,因为我无法确定谁会最终胜出。 追随我的资金量如此之大,我认为部分原因是早期的钱已经赚到了,而那些不知道自己在做什么的大投资者必须有一个 AI 组件。现在每个投资都成了 AI 投资,所以他们无法分辨什么是好的投资。我将 AI 定义为学习系统,真正能学到东西的系统。所以我认为这是其中之一。
第二个是现在出现了非常复杂的新算法,它们属于后 Transformer 架构。 我的朋友和长期合作伙伴发明了一种新的非 Transformer 架构。我在巴黎资助的一个团队声称也做到了这一点。那里有很多创新,斯坦福大学也有很多新东西。
最后一个因素是,市场普遍认为智能的发明具有无限的回报。假设你向一个公司投入 500 亿美元的资本,你必须从智能中赚取大量利润才能收回这些投资。所以很可能我们会经历一场巨大的投资泡沫,然后市场会自行调整。这在过去一直如此,现在也可能如此。
(学生)您之前说过,您认为领导者正在拉开与其他__人__之间的距离。
是的,目前是这样。问题基本上是这样的:在法国有一家公司叫做 Mistral,他们做得非常好。我显然是个投资者。他们已经推出了第二版产品。他们的第三个模型可能会是闭源的,因为成本太高,他们需要收入,无法免费提供他们的模型。
所以,在我们行业内的开源与闭源之争非常大。
我的整个职业生涯都基于人们愿意分享开源软件。我做的所有事情几乎都是开源的。Google 的许多基础设施也是开源的。我技术上做的一切都是开源的。
然而,可能是因为资本成本如此之高,根本改变了软件的构建方式。
我们之前谈到软件程序员,我认为软件程序员的生产力至少会翻倍。有三四家公司在努力做到这一点。我投资了所有这些公司,出于这样的精神。他们都在努力使软件程序员更高效。
我最近遇到的一个最有趣的公司叫做 Augment。我总是想到一个独立的程序员,而他们说,这不是我们的目标。我们的目标是那些拥有 100 个软件程序员的团队,他们在数百万行代码中工作,没有人知道到底在发生什么。
这是一个非常好的 AI 项目。他们会赚钱吗?我希望如此。
(学生)在开始时你提到上下文窗口的扩展、智能体和文本到行动的结合将会带来难以想象的影响。首先,为什么这种结合很重要?其次,我知道你不是预言家,不能准确预测未来,但为什么你认为它的影响会超出我们的想象?
我认为主要是因为上下文窗口可以解决时效性问题。当前的模型大约需要一年时间来训练,大约 18 个月,6 个月的准备时间,6 个月的训练时间,6 个月的微调时间。因此,它们总是过时的。
上下文窗口,你可以输入发生的事件。你可以在上下文中问它关于哈马斯以色列战争的问题。这非常强大。它变得像 Google 一样具有时效性。
关于智能体,我给你举个例子。我设立了一个基金会,资助一个非营利组织。我不知道这里有没有化学家,我真的不太懂化学。有一个工具叫做 ChemCrow,它是一个基于大型语言模型的系统,学习化学。它的工作方式是生成化学假设,尤其是关于蛋白质的,然后他们在实验室里进行测试,过夜完成测试,然后系统学习。这极大地加速了化学和材料科学等领域的研究。这就是一个智能体模型。
我认为文本到行动可以通过想象拥有大量廉价程序员来理解,对吧?我不认为我们完全理解了每个人都有自己程序员时会发生什么情况,这是你们的专长领域。
我不是在说开灯关灯。举个例子,假设你不喜欢 Google。那么你可以说:“给我建立一个 Google 的竞争对手。”是的,你个人可以说:“给我建立一个 Google 的竞争对手。”“搜索网络,构建用户界面,生成有趣的生成式 AI,将它组合在一起,30 秒内完成,看看是否有效。”所以,很多人认为包括 Google 在内的现有企业都可能会受到这种攻击的威胁。我们拭目以待。
(学生)我们如何防止 AI 在即将到来的选举中影响公众舆论,传播错误信息?短期和长期的解决方案是什么?
在即将到来的选举和全球范围内,大部分错误信息将出现在社交媒体上。社交媒体公司没有足够的组织能力来监管这些内容。例如,TikTok 被指控偏向某种类型的错误信息。很多人声称(没有证据证明)中国在背后施压。我认为我们这里有个烂摊子,这个国家必须学会批判性思考。这对美国来说可能是个不可能的挑战。
但事实是,有人告诉你某件事并不意味着那是真的。
这可能会走向另一个极端吗?
那些确实是真实的东西,没人再相信了。你会得到一些人称之为“认识论危机”的情况,现在,Elon 说,“不,我从未做过那件事。证明吧。”哦,让我们用唐纳德·特朗普做例子。
看看,我认为我们社会有一个信任问题。民主可能会失败。我认为对民主的最大威胁是错误信息,因为我们将会非常擅长制造错误信息。
当我管理 YouTube 时,我们面临的最大问题是人们上传虚假的视频,结果有人因此丧命。我们有一个“无死亡政策”。令人震惊。尝试解决这个问题非常困难。而这是在生成式 AI 之前。我没有一个好的答案。
一个技术性的——不算答案的可能解决方案是公共密钥认证。我不明白为什么它没有得到更广泛的使用。 例如,当乔·拜登发言时,为什么他的言论不进行数字签名,就像 SSL 那样?或者名人或公众人物,难道他们不能有一个公共密钥吗?是的,这是一种公共密钥的形式,然后是某种确定性的系统。
当我把信用卡号发送给 Amazon 时,我知道这是 Amazon。我与 Jonathan Haidt 一起发表了一篇论文,他是研究焦虑生成问题的那位。那篇文章完全没有影响。他是一位非常好的传播者。我可能不是。
所以我的结论是,该系统并没有组织起来做你所说的事情。我的结论是,CEO 们通常在最大化收入。为了最大化收入,你需要最大化参与度。为了最大限度地提高参与度,你需要最大限度地激发愤怒。算法选择愤怒,因为这会带来更多收入。因此,人们倾向于喜欢疯狂的东西。就所有方面而言,我在此不发表任何党派声明。这真是个问题。民主国家必须解决这个问题。
我对 TikTok 的解决方案是,我们之前私下谈到的,我年轻时有一个叫做“平等时间规则”的东西,因为 TikTok 实际上并不是社交媒体。它实际上是电视,对吧?
有个程序员在给你制作内容,顺便说一句,美国的 TikTok 用户每天观看 90 分钟,观看 200 个 TikTok 视频。这很多,对吧?政府不会制定平等时间规则,但这是正确的做法。某种形式的平衡是必要的。
(学生)两个快速问题。一,关于大型语言模型(LLMs)的经济影响。你最初预期的市场影响是否会放缓?CHEG 和一些服务提供商是否会受到影响?二,你认为学术界应该得到 AI 补贴吗?还是应该与大公司合作?
我在推动为大学争取数据中心的资源。如果我是这里计算机科学系的教员,我会因为无法和我的研究生一起构建用于博士研究的算法而感到非常沮丧,而不得不与这些公司合作。在我看来,这些公司在这方面做得还不够慷慨。
我与很多教员交流,他们中很多你们都认识,他们花了大量时间在等待 Google Cloud 的计算资源,这是非常糟糕的。这是一场我们希望美国能够赢得的爆炸式发展。我们希望美国的大学能够领先。 有很多理由表明,正确的做法是让这些资源到达他们手中。所以我在这方面努力推动。
至于你的第一个问题,关于劳动力市场的影响,我将这个问题交给真正的专家。作为你的业余经济学家,Eric 教授,我坚信拥有大学教育和高技能的任务将会没事,因为人们将会与这些系统一起工作。我认为这些系统与任何其他技术浪潮没有什么不同。危险的工作和那些需要很少人类判断的工作将会被取代。
(学生)我非常好奇文本到行动以及它对计算机科学教育等方面的影响。我想知道您对计算机科学教育应如何转变以适应时代有何看法。
好吧,我认为本科阶段的计算机科学家群体总会有一个程序员伙伴。因此,当您学习第一个 for 循环等等时,您将拥有一个可以成为您的天然伙伴的工具。这就是教学的方式。这是我的猜测。
(学生)你提到了非 Transformer 架构,这些架构让你感到兴奋。我想知道你在这方面看到了什么进展?
我不太了解数学。我很高兴我们为数学家创造了就业机会,因为这里的数学非常复杂。基本上,它们是做梯度下降、矩阵乘法等更快更好的不同方式。
Transformer 架构是一种同时进行系统化乘法的方式。这是我的理解方式。新架构与此类似,但数学不同。
(学生)你提到在你的国家安全报告中,美国和中国正在掌控现代架构,接下来的十年以及下一个层级的国家都将是美国的盟友或正在成为美国的盟友。你对那些不是正式盟友的国家有什么看法?他们是否会加入我们的安全联盟?他们不愿意加入的原因是什么?
最有趣的国家是印度,因为顶尖的人工智能人才都来自印度。我们应该让印度保留一些顶尖人才。虽然不是全部,但有一部分是。他们也不具备我们这里丰富的培训设施和项目。
在我看来,印度在这方面是一个关键国家。中国已经失去了机会,它不会再回来。他们不会改变政权,尽管人们希望他们能改变。日本和韩国显然在我们的阵营中。台湾硬件很棒,但软件很糟糕,所以这不会奏效。其余的国家没有足够的体量。
欧洲被布鲁塞尔搞得一团糟。这不是新鲜事。我花了 10 年时间与他们斗争。我非常努力地促使他们修正欧盟法案,但他们仍然有所有的限制,使我们在欧洲进行研究变得非常困难。我的法国朋友们花了所有时间与布鲁塞尔斗争,而马克龙是我的个人朋友,他正在努力为此而战。所以我认为法国还有机会。我不认为德国会参与进来,其余的国家也不够大。
(学生)我知道你是工程师出身,像你说的那样会编译器。鉴于你所设想的这些模型的能力,我们还需要花时间学习编程吗?
因为归根结底,这还是一个老问题:如果你能说英语,为什么还要学英语?你会变得更擅长的。你确实需要理解这些系统是如何工作的,我对此非常坚定。
(学生)我很好奇您是否探索过分布式设置,我之所以问这个问题,是因为,当然,创建一个大型集群很困难,但 MacBook 功能强大。世界各地有很多小型机器。所以你认为像“在家折叠”(folding at home)或类似的想法适合训练 AI 吗?
不适合。是的,我们仔细研究过这个问题。算法的工作方式是,你有一个非常大的矩阵,并且你基本上有一个乘法功能。所以想象一下来回、来回的计算。这些系统完全受限于从内存到 CPU 或 GPU 的速度。事实上,下一代 NVIDIA 芯片已经将所有这些功能集成到一个芯片中。这些芯片现在非常大,以至于它们都被胶合在一起。而且实际上,封装是如此敏感,以至于封装的过程也必须在洁净室中完成,就像芯片本身一样。
所以,短期内不太可能实现。
(学生)是否有办法对大型语言模型进行分割?
Jeff Dean 去年在这里演讲时谈到了如何将这些模型的不同部分分别训练,然后将它们联合起来。要做到这一点,你需要有一千万个这样的东西,然后你问问题的方式会太慢。他在谈论的是八到十或十二个超级计算机。是的,不是 MacBooks 的级别。
(学生)我知道在 GQQ 发布后,《纽约时报》决定不允许他们的作品用于训练 AI 模型。你认为这会走向何方,这对数据处理意味着什么?
我曾在音乐版权方面做过大量工作。我了解到在 60 年代,有一系列的诉讼,最终达成了一项协议,每当你的歌曲被播放时,你会获得规定的版税,即使他们不知道你是谁,它也会直接支付到银行。
我的猜测是,这次也会发生类似的情况。会有大量的诉讼,最后达成某种规定的协议,规定你必须支付你收入的一定比例才能使用这些内容。这将类似于 ASCAP BMI 这样的机构。
你可以查一下 ASCAP BMI。它会让你觉得非常老旧,但我认为这将是最终的解决方式。
(学生)看起来有少数玩家在 AI 领域占据主导地位,对吗?而且他们将继续占据主导地位。而且它们似乎与所有反垄断法规重点关注的大公司有重叠。您如何看待这两种趋势?您是否认为监管机构会拆分这些公司以及会产生什么影响?
在我的职业生涯中,我帮助微软免于被分拆,但它并没有被分拆。我为 Google 争取不被分拆,Google 也没有被分拆。所以看起来趋势是公司不会被分拆。只要这些公司避免成为约翰·D·洛克菲勒那样的企业主,我研究过这个。你可以查一下,这是反垄断法的起源。
我不认为政府会采取行动。你看到这些大公司主导市场的原因是谁有资本来建造这些数据中心,对吧?
我的朋友 Reed 和 Mustapha,两个星期后 Reed 会来,他们决定让 Inflection 分拆成微软的合作伙伴。基本上,他们认为他们无法筹集到数百亿美元。
之前提到的数字是公开的吗?不。让 Reed 告诉你这个数字。也许 Reed 会说出来。
(学生)我想知道这一切将会给那些没有参与前沿模型开发和计算访问的国家带来什么影响。
富人越来越富,穷人尽其所能。事实上,这是富裕国家的游戏,对吗?雄厚的资本、大量技术强的人才、强有力的政府支持,对吗?有两个例子。许多其他国家也存在各种各样的问题。他们没有那些资源。他们必须找到一个合作伙伴。他们必须和其他人一起加入,诸如此类。
(学生)因为我记得我们上次见到你时,你正在 AGI House 参加一场黑客马拉松,我知道你花了很多时间帮助年轻人创造大量财富,你非常热情地表示想要这样做。您对这里正在建造的人们有什么建议吗?
在我参与的一次黑客马拉松中,获胜团队的任务是“让无人机在两座塔楼之间飞行”,这是在一个虚拟的无人机空间中进行的。他们设法理解了“之间”这个词的含义,用 Python 生成代码,并在模拟器中通过塔楼飞行无人机。
这对于优秀的专业程序员来说可能需要一两周时间。而我告诉你,现在你可以在一天内用各种工具构建原型。如果你不能在一天内完成原型开发,那你就应该考虑一下了,对吧?因为这就是你的竞争对手正在做的事情。
所以,我的最大建议是,当你开始考虑创办公司时,写商业计划是可以的。事实上,你可以让计算机为你写商业计划,只要它是合法的。
我认为使用这些工具尽快进行原型开发非常重要,因为你可以确定,在另一个公司、另一个大学、你从未去过的地方,有另一个人在做同样的事情。