本次访谈由 A16Z 的合伙人之一 David George 主持,访谈对象是 Scale AI 的创始人兼 CEO Alexandr Wang。访谈围绕人类数据对 AI 发展的重要性展开,讨论了数据在推动 AI 技术进步中的关键作用。自成立以来,Scale AI 开发了多个标志性项目,致力于为 AI 模型提供高质量的训练数据,推动生成式 AI 的发展。
现阶段,Scale AI 不仅专注于数据标注和处理,还广泛涉足数据生成和管理领域。Alexandr Wang 在访谈中首先说明了他对人类数据的定义,指出人类数据不仅仅是指由人类生成的内容,还包括人类行为、决策和互动的所有数据。他提到,目前的 AI 模型在某些具体任务上表现出色,但距离真正的通用人工智能(AGI)还有一定距离。通过与大型实验室和企业合作,Scale AI 致力于生产最前沿的数据,以推动尖端技术的发展,并帮助各企业和政府利用他们的专有数据来推动 AI 开发。
Alex Wang 的核心观点包括:
- AI 发展依赖三要素:计算能力、数据和算法是推动 AI 发展的关键因素。Scale AI 旨在生产前沿数据,以促进技术进步。
- 数据生成的重要性:随着易于获取的公开数据资源枯竭,如何生成更复杂的数据以推动 AI 智能水平的提升成为新的挑战。
- 语言模型的进化:从研究为主到初步扩展,再到即将到来的创新周期,语言模型的发展经历了不同阶段,未来将更加依赖于创新。
- 数据壁垒和创新:尽管大型科技公司拥有数据资源优势,但监管问题和数据的有效利用是挑战。创新和数据生产方法的探索是未来发展的关键。
- 模型的商业化挑战:纯粹的模型租赁业务可能不是最优质的长期商业模式,需要探索更多元化的商业路径。
- 企业 AI 应用的现实:企业在实施 AI 时经历了从兴奋到现实的过程,AI 的实际应用更多体现在成本节约和客户体验提升上。
以下是本期播客内容的完整翻译,我们作了不改变原意的删减。
向前沿数据迈进
大卫·乔治(David George)
今天我们非常荣幸邀请到 Scale AI 的创始人兼首席执行官 Alex Wang。Alex,感谢你能来。
亚历山大·王(Alexandr Wang)
谢谢你的邀请。
大卫·乔治(David George)
我很喜欢和你交流,每次都能学到很多。或许我们可以先聊聊你在 Scale AI 的项目,再深入探讨。
亚历山大·王(Alexandr Wang)
从宏观角度来看,我们正在构建一个 AI 数据工厂。简而言之,AI 的发展依赖于三个关键因素:计算能力、数据和算法。 我们所见的所有进展都源于这三个方面:Nvidia 等公司提供的计算能力、大型实验室如 OpenAI 引领的算法进步,以及数据规模的驱动。因此,我们的目标是生产最前沿的数据,以推动尖端技术的发展,与所有大型实验室合作,同时帮助各企业和政府利用他们的专有数据来推动 AI 开发。
大卫·乔治(David George)
关于前沿数据这一话题,您是如何获取这些数据的?
亚历山大·王(Alexandr Wang)
我认为这将成为我们这个时代最伟大的人类项目之一。在我看来,我们唯一可以参考的智能模型就是人类本身。因此,前沿数据的生成似乎是人类专家与技术和算法模型相结合的结果,从而产生大量这种类型的数据。顺便提一下,我们今天生产的所有数据,互联网也有类似的特征。互联网在很多方面就像是人机合作,目的是生成大量内容和数据。可以想象一下,如果互联网不仅仅是一个人类娱乐工具,而是一个大规模的数据生成实验,会是什么样子。
大卫·乔治(David George)
您对行业现状有着独到的见解。能否请您先简单介绍一下当前模型,特别是语言模型的现状?我也很想深入探讨市场结构等方面的问题。
亚历山大·王(Alexandr Wang)
我认为我们现在可能正接近语言模型开发的第二阶段末期。第一阶段可以说是早期几乎完全以研究为主的阶段。这个阶段的标志性事件包括最初的 Transformer 论文、早期的小规模 GPT 实验,直到 GPT-3 的出现,这一阶段主要集中在小规模实验和算法进步上。
第二阶段大约从 GPT-3 开始到现在,可以称为初步扩展期。我们有了效果显著的 GPT-3,随后 OpenAI 开始大规模扩展这些模型,推出了 GPT-4 及更高版本。接着,许多公司如 Google、Anthropic、Meta、xAI 等也加入了这场扩展模型能力的竞赛。在过去的两三年里,这一阶段更多关注执行层面的任务,比如如何顺利进行大规模训练,如何确保代码中没有奇怪的错误,如何设置更大的集群等。这一阶段主要是执行性的任务,最终我们拥有了一些非常先进的模型。
我认为我们正在进入一个新的阶段,在这个阶段,研究将变得更加重要。 各个实验室在选择研究方向上会有更多的分歧,不同的研究方向可能会在不同时间点上取得突破。这是一个令人兴奋的过渡阶段,从纯粹的执行转向更多依靠创新的周期。
大卫·乔治(David George)
他们已经达到了一个阶段,尽管计算资源不是非常充足,但足以训练模型并达到当前水平。这并不是一个瓶颈。他们已经在前沿实验室中充分利用了所有数据。是的,接下来将在这方面取得突破,并在数据方面取得进展。这样说合理吗?
亚历山大·王(Alexandr Wang)
是的,我明白。基本上,如果你看看计算基础,我们显然在不断扩大训练集群的规模,所以这个方向是相当明确的。在算法方面,我认为会有很多创新。老实说,我认为这是许多实验室真正努力的方向。在基础研究方面也是如此。至于数据,你提到的这一点,我们已经用尽了所有易于获取的数据。
大卫·乔治(David George)
所有人都完成了各自的任务,并且每个人都获得了相同的访问权限。
亚历山大·王(Alexandr Wang)
确实,很多人都在谈论数据壁垒的问题。我们似乎已经利用了所有公开可用的数据,遇到了瓶颈。因此,下一阶段的一个标志就是数据生产。各个实验室将采用什么方法来生成必要的数据,以实现更高的智能水平? 我们如何丰富数据?我认为这需要多个领域的高级工作和研究。首先是提升数据的复杂性,向前沿数据迈进。我们希望在模型中实现的许多功能,最大的障碍实际上是数据的缺乏。例如,过去两年中,代理一直是热门词汇,但基本上没有哪个代理真正运行良好。事实是,互联网上根本没有代理数据,也没有任何有价值的代理数据池。因此,我们必须找到生产高质量数据的方法。
大卫·乔治(David George)
在这个项目中,我们的目标是利用先进技术提高生产效率。我们相信,通过不断创新和改进,我们可以在市场上保持竞争力。
亚历山大·王(Alexandr Wang)
我们即将发布一些研究成果,这些研究显示,当前所有最先进的模型在组合使用工具时表现不佳。 如果需要连续使用多个工具,例如查找信息、编写 Python 脚本和绘制图表,它们的表现非常糟糕。而这些对人类来说是非常自然的。
大卫·乔治(David George)
对,但这并没有被记录下来,对吗?这才是关键,对吧?没错。实际上,我们无法捕捉到某人从一个窗口切换到另一个应用程序的过程,然后将其输入模型进行学习。
亚历山大·王(Alexandr Wang)
没错。这种推理链条就像是人类在解决复杂问题时自然会使用的各种工具。我们会思考问题,预测接下来会发生什么。我们会遇到错误和失败,然后重新考虑。这种推理链条的数据目前还不存在,这是一个需要产生的例子。但是,退一步说,首先需要在数据上发生的事情是增加数据的复杂性,向前沿数据迈进。其次是激励数据生产,增加数据的生成。
大卫·乔治(David George)
收集更多关于人类在工作领域实际从事的具体工作。
亚历山大·王(Alexandr Wang)
为了更全面地了解人类行为,我认为还需要在合成数据等领域进行投入。当然,混合数据集也是必不可少的。通过利用合成数据并让人类参与其中,可以产生更多高质量的数据。就像我们讨论芯片时,会谈到芯片的边界以及如何确保有足够的生产手段。
同样的道理也适用于数据。我们需要明确有效数据的边界,并具备大量生成数据的能力,以支持这些模型的训练。 此外,我认为经常被低估的一个环节是模型的评估。过去一段时间,行业内通常只是简单地增加数据,然后观察模型的表现。我们增加更多数据,再看看模型的表现。然而,我们需要更科学地理解模型目前的不足之处,从而明确需要增加哪种具体数据来提升模型的性能。
纯粹的模型租赁业务可能不是最优质的业务
大卫·乔治(David George)
大型科技公司在数据资源方面相比独立实验室具有什么样的优势?
亚历山大·王(Alexandr Wang)
这些公司在利用数据时面临许多监管问题。现有的数据语料库早在所有这些生成式 AI 工作之前就已经存在。例如,Meta 曾经进行了一项研究,几乎利用了所有公开的 Instagram 照片及其标签来训练非常优秀的图像识别算法,但在欧洲遇到了很多监管问题。这项研究最终变成了一个巨大的麻烦。
因此,我认为从监管角度来看,特别是在欧洲,这些公司在多大程度上能够利用他们的数据优势是一个难以理清的问题。这一点还有待观察。我认为许多大型实验室拥有显著优势的真正原因在于它们有非常盈利的业务,可以为这些 AI 项目提供几乎无限的资金来源。 我对此非常关注,也很好奇未来会如何发展。
大卫·乔治(David George)
情况在不断变化。业内普遍关注的问题是,他们是否过度投资?如果你听听那些大科技公司的财报电话会议,他们会说,我们的风险在于投资不足,而不是投资过度。你怎么看这个问题?
亚历山大·王(Alexandr Wang)
假设你是这些公司的 CEO,比如 Sundar Pichai、Mark Zuckerberg 或 Satya Nadella。按照你的观点,如果他们在 AI 领域取得突破,可能很容易再创造一万亿美元的市值。如果他们领先于竞争对手,并且成功将其产品化,那么一万亿美元的市值几乎是显而易见的。如果他们不每年额外投资 200 亿到 300 亿美元的资本支出,可能会错失这个机会。
而且,我认为每个大公司都面临真正的生存风险。是的,他们的业务模式可能被 AI 技术深刻颠覆。所以,对他们来说,风险和回报是非常明显的。从战术层面看,他们可以通过提高核心业务的效率来收回资本支出投资,例如使用 GPU 等技术。
大卫·乔治(David George)
Facebook 广告的效果。
亚历山大·王(Alexandr Wang)
如果 Facebook 和 Google 稍微改进他们的广告系统,就能收回数十亿美元的收入。
亚历山大·王(Alexandr Wang)
如果苹果加快升级周期,很容易收回成本。我认为这一点是显而易见的。
大卫·乔治(David George)
这对整个行业来说是件好事,因为这些公司投入了大量资本,并出租计算资源,至少 Google 和 Microsoft 是这样做的。
亚历山大·王(Alexandr Wang)
机器学习模型正在逐渐普及,例如开源的 Llama 3.1。因此,所有投资的实际成果也变得广泛可及。开源这些模型所带来的附加价值非常惊人。
大卫·乔治(David George)
这真是令人难以置信。那么,这就引出了市场结构的话题。你认为实际情况会是怎样的?是否会有我们现在已经识别出的少数几家公司彼此竞争?你认为这是一个有利可图的业务吗?开源对业务的影响如何?请展望一下未来几年,给我们你的预测。
亚历山大·王(Alexandr Wang)
在过去的一年半时间里,模型推理的成本大幅下降,降幅达到了两个数量级。这一现象表明,智能可能会成为一种商品。然而,在纯模型层面上,定价能力的严重不足表明,仅仅出租模型本身可能并不是最佳的长期业务模式。 这可能是一个相对平庸的长期业务。
大卫·乔治(David George)
我认为这取决于是否有突破性的进展,这是之前提到的关键点,对吗?如果有人或多个人真的取得了持久的突破,那么市场结构可能会发生变化。
亚历山大·王(Alexandr Wang)
首先,如果 Meta 继续开源其模型,这将对你从模型层获得的价值设定一个相当严格的上限。其次,如果至少有几家实验室能够随着时间的推移达到类似的性能,那么这也会显著改变定价模型。因此,我们认为,虽然不能百分之百确定,但纯粹的模型租赁业务可能不是最优质的业务,因为在其上下游有很多更优质的业务。 当然,Nvidia 显然是一家非常优秀的公司,但云服务提供商也有非常好的业务,因为实际上在物流上设置大型 GPU 集群是相当复杂的。因此,云服务提供商在出租时实际上有相当高的利润率。
大卫·乔治(David George)
传统的数据中心业务在很大程度上依赖于规模效应,因此相对于小型企业,他们拥有巨大的优势。
亚历山大·王(Alexandr Wang)
对,没错。所以我认为选择“基础工具”是个好主意。如果你在基础层面,我认为那里有很好的商业机会。 如果你在模型之上构建应用程序,比如 ChatGPT,这是一个很好的商业案例,很多初创公司的应用程序实际上也运行得相当不错。当然,没有一个能像 ChatGPT 那样大,但很多应用程序如果能在早期找到产品市场契合点,就能成为相当不错的业务。因为如果他们能把用户体验做得很好,为客户创造的价值远远超过模型的推理成本。这里有一些很酷的东西,比如,我认为 Anthropic 推出的 Claude 中的 Artifact 就像是这个重大主题的第一个信号,所有的实验室都将推动更深入的产品集成,以推动更高质量的业务发展。
我认为,另一个趋势是我们将在产品层面和产品级别看到大量的迭代, 那种无聊的聊天机器人不会是最终的产品,那将是一个令人失望的结果。对,没错。所以,我认为产品迭代和创新周期是非常难以预测的,因为你知道,ChatGPT 的成功和受欢迎程度让我感到惊讶。我认为对我或业内任何人来说,哪些产品会成功并推动下一波增长并不显而易见。但你必须相信,OpenAI 和 Anthropic 能够构建出伟大的应用程序业务,使其长期独立和可持续发展。
收益主要体现在成本节约和客户体验提升上
大卫·乔治(David George)
那么,是什么驱动了竞争优势呢?显然,你有一个紧密集成了产品的模型,然后是传统的模式。对吧?工作流程、集成,所有这些因素。
亚历山大·王(Alexandr Wang)
我相信你能清楚地看到这一点。我的意思是,OpenAI 和 Anthropic 的首席项目官在大约两个月内都采取了类似的行动。他们正在解决这个问题。
大卫·乔治(David George)
他们会说:“我们确实非常专注于这一点。”接着又说:“好吧,我认为他们意识到了。”你有一个应用业务,并且有一些非常有趣的客户。你从企业那里听到的关于他们实际如何实施的反馈是什么?
亚历山大·王(Alexandr Wang)
我们看到,企业界曾经历过一阵巨大的兴奋。许多企业认为必须采取行动,必须领先一步,必须开始尝试人工智能。我认为这导致了他们进入一个快速的概念验证(PoC)周期,他们会想,好吧,我们有哪些容易实现的想法。让我们尝试一下这些方法。有些效果不错,有些则不尽如人意。
但我认为,无论如何,这都是一股热潮。你知道,进入生产阶段的概念验证(PoC)项目比整个行业预期的要少得多。我认为很多企业现在看到,末日预言并未真正应验。例如,AI 并未完全改变和改造大多数主要行业。并非完全如你们所知。
大卫·乔治(David George)
例如,提高效率、提供支持,以及一些创造性任务和类似的工作。
亚历山大·王(Alexandr Wang)
确实如此,否则事情将变得更加简单。我们经常思考的是,哪些 AI 改进、AI 转型或 AI 努力能够真正有效地推动我们关注的公司的股价。因此,我们鼓励所有客户认真考虑这一点,因为归根结底,几乎每个企业都有潜力在某种程度上实施 AI,从而显著提升其表现。
大卫·乔治(David George)
股票价格主要反映在成本节约和效率上。
亚历山大·王(Alexandr Wang)
收益主要体现在成本节约和客户体验提升上。 我认为在许多行业,尤其是那些需要大量手动客户互动的行业,通过实现更多的标准化和自动化,可以提升客户互动,从而在市场竞争中占据优势。这是我们引导客户前进的方向。我们合作的一些 CEO 非常支持并理解这是一个长期投资周期。他们可能不会在下个季度看到收益,但如果坚持下去,将会看到巨大的转变。是的,我认为围绕小型和边缘用例的热潮是好的,这很令人兴奋,他们应该这样做。但对我来说,这不是我们的全部目的。
大卫·乔治(David George)
确实,目前的应用阶段类似于初期阶段,尽管有一些自动化,但主要集中在聊天机器人上。作为一名初创企业投资者,我希望随着时间的推移,会出现一个窗口期,让初创企业通过产品创新赢得市场,击败现有的竞争者。我的合伙人 Allison Phil 有一句话说得好,初创企业能否在现有企业找到创新之前实现分销是关键。 我认为这是一个机会,但目前技术还不够成熟。不知道你是否同意这个观点。
亚历山大·王(Alexandr Wang)
我认为这项技术还处于非常早期阶段,因此难以评估其潜力。是的,主要目的是为了节省成本。但如果大部分好处仅在于节省成本,那么这不足以颠覆那些在增长和分销成本上已有优势的大型企业。
大卫·乔治(David George)
你认为企业内部的数据有多大价值?例如,JP Morgan 拥有大约 15 PB 的数据。这些数据的价值是否被高估了?其中有多少数据实际上是有用的?因为到目前为止,大部分数据并没有为他们带来显著的竞争优势。你认为这种情况会改变吗?
亚历山大·王(Alexandr Wang)
是的,我认为 AI 可能是你第一次能看到潜在改变的技术。显然,大数据浪潮已经到来。大数据的核心在于更好的分析,这对商业决策有帮助,虽然只是边际上的改进,但并不深刻。
大卫·乔治(David George)
他们的产品设计不会有大幅改变。
亚历山大·王(Alexandr Wang)
是的,没错。现在你可以想象产品的工作方式将会发生巨大的转变。比如说,在任何一家大银行,用户与像 JP Morgan 或 Morgan Stanley 这样的大银行之间的许多有价值的互动都是由人来完成的。他们尽力而为,很多人参与其中,确保整体体验的质量非常高。但显然,对于任何大型的手动过程,保证的程度是有限的。所以,我认为,所有你之前的客户互动以及业务的历史运作方式是唯一可用的数据,可以用来训练模型在这个特定任务上表现良好。而且,如果你考虑财富管理,互联网上几乎没有可以用来训练模型的相关数据。
亚历山大·王(Alexandr Wang)
许多数据可能对业务转型帮助不大,但其中一些数据却极具价值。然而,企业在利用这些数据时面临巨大挑战。数据通常组织不当,分散各处。企业花费数千万甚至上亿美元聘请咨询公司进行数据迁移,但结果往往没有显著改善。因此,企业在推动转型时一直面临巨大的历史性困难。这就像是一场竞赛:他们能否比某些初创公司更快地找到利用数据价值的方法。
初创公司的经验与教训
大卫·乔治(David George)
创建一个完全不同的产品,只需要少量数据。是的,没错。你曾提到在 2020 年和 2021 年的繁荣时期,为了扩展规模,你认为必须大量招聘,这是你犯的一个错误。这也是我们所有投资的公司都经历过的情况,大家都觉得必须要大量招聘。那么,通过这个过程你学到了什么教训?你又是如何改变你的做事方式的?
亚历山大·王(Alexandr Wang)
在过去的几年里,我们基本上保持了员工数量的稳定。我的意思是,随着业务的增长,我们的员工数量略有增加,但业务本身已经增长了很多倍。结论是,更多的人意味着更好的结果和更多的工作完成,这似乎很合逻辑。但矛盾的是,我认为,如果你有一个非常高效的团队和组织,几乎不可能在不失去高效和成功文化的情况下大幅扩展。
大卫·乔治(David George)
减少沟通和协调所耗费的时间和精力实际上可以提高生产力。
亚历山大·王(Alexandr Wang)
确实,这涉及更深层次的问题,即一个高效团队就像一个复杂的系统,团队成员之间的互动非常微妙。如果突然加入新成员,即使这些人都很优秀,也会打破团队的平衡。总之,当你增加人员时,团队的表现往往会趋于平均水平。 观察那些成功扩展规模的企业可以发现,这对他们的财务结果至关重要。我认为他们也承认这种平均回归效应。因此,如果你考虑大规模扩展销售团队,虽然会面临这种平均回归,但通过有效的运营管理,可以使团队表现高于平均水平。如果能做到这一点,那么整个财务模型仍然是可行的。
大卫·乔治(David George)
是的,我认为销售和产品是不同的。
亚历山大·王(Alexandr Wang)
当然。不过我们注意到,初创公司成功的原因在于拥有高效的团队,并希望长期保持这种高效。我认为初创公司常见的失败模式是,尽管你们有一些有效的策略或方法,但公司员工普遍年轻。当你们扩展时,事情开始变得混乱。投资者会建议你们雇佣高管,你们会经历让人心力交瘁的招聘过程。
大卫·乔治(David George)
如果对其进行评分,它的工作效果只能达到 50%。
亚历山大·王(Alexandr Wang)
你进行精准的搜索,得到精确的结果,然后给予这些结果很大的自由度。你的高管们可能会说:“我们需要雇佣一个庞大的团队来实现我们的目标。”你可能会想:“是的,我很有经验,你看起来也很有经验,那就按你说的做吧。”于是你开始组建这些大团队。但现实是,这几乎总是导致失败。
这并不是说你不能从外部雇佣高管,但我认为当你这样做时,需要让他们真正深入了解公司的运作。在提出任何重大建议之前,他们需要融入公司的节奏和运营,理解公司运作的原因及其有效之处。 然后,他们可以提出经过深思熟虑的建议,采取小步骤,你可以信任并验证每一步。最终,他们也许可以提出更大的建议,但那时他们应该已经有了通过小步骤取得显著成效的记录。
大卫·乔治(David George)
这既有趣又实用,不是吗?就像在雇佣高管时从小事做起。这有点反直觉,也不是高管们所期望的方式。
亚历山大·王(Alexandr Wang)
我注意到,尤其是在硅谷,年轻的创始人和高管们常常有一种普遍的幻想,认为自己可以介入并解决所有问题。我认为这些高管非常出色,但确实存在一种幻想,即他们认为自己可以修复一切。我将介入并解决整个问题,把它变成一个专业的运作。
你正在招募团队成员。归根结底,你不是在寻找什么魔法解决方案,而是在寻找一个你相信能在长期内在业务决策上表现出色的团队成员。这也是我们曾犯的错误之一。你不是在购买一个神奇的公式,这个公式会突然让整个业务运转起来。另一方面,还有一种创始人的幻想。创始人幻想或 CEO 幻想是,哦,我只需要雇一群不可思议的高管,他们都是专业人士,然后我就可以离开了。
大卫·乔治(David George)
他们会完成我不愿意做的事情,并且彻底完成所有任务。
亚历山大·王(Alexandr Wang)
所有我不想做的事情,我可以坐下来,像看着齿轮转动、机器运作一样观察。但这非常不现实,因为反过来也一样。你之所以能成为一名优秀的创始人和 CEO,是因为你长期以来不断做出明智的决策。将自己从这些决策循环中抽离出来,这有些疯狂。
大卫·乔治(David George)
我们经常遇到这样的情况:当我雇佣了高管后,我会稍微退居幕后,但随后发现一些重大决策出现了问题。这时我会想,等等,这不正是我存在的意义吗?是的,我认为确实如此。
亚历山大·王(Alexandr Wang)
如果你的行业非常稳定,这可能会奏效。
大卫·乔治(David George)
观察任何一家上市公司,当公司更换 CEO 时,股价可能会波动 2%,这看起来影响不大。实际上,这只是一个小因素。然而,这与由创始人运营的高速成长型初创公司有很大不同。
亚历山大·王(Alexandr Wang)
我认为,许多初创公司和企业的价值体现在其创新溢价上。投资者相信,由创始人领导的公司能够在市场上实现创新突破。因此,你的任务就是在市场上实现这一创新突破。
关于优点、卓越和智慧的雇佣理念
大卫·乔治(David George)
你应该参与所有事务的战略决策。你最近推出了一个新概念。我发现我的社交媒体动态里有一半的人在称赞你,实际上可能超过一半。当然,也有一些人在批评你。能谈谈这个概念,以及你推出以来的观察吗?
亚历山大·王(Alexandr Wang)
我们提出了关于优点、卓越和智慧的理念。我们的基本思想是,在每个岗位上,我们都会雇佣最合适的人选,而不考虑他们的人口统计特征。我们不会为了达到某些人口统计目标而进行任何配额调整。这并不意味着我们不关心多样性,实际上我们非常重视在所有岗位上拥有多样化的候选人来源和初始筛选。但最终,每个岗位上最优秀和最有能力的人将是我们雇佣的对象。这是一个略有争议的话题,但如果我们退一步思考公司应该雇佣什么样的人,我认为这是显而易见的。
大卫·乔治(David George)
确实如此。
亚历山大·王(Alexandr Wang)
显然,这有些偏离主题。公司应当雇佣最有才华的人才。我认为这引发了一个重要问题,即公司在其行为中应承担多少社会责任。我的看法是,我所在的行业竞争非常激烈。Scale 的角色是推动人工智能这一重要技术的发展。我们需要极其聪明的人才来实现这一目标。我认为这是大多数在 Scale 工作的人都认同的隐含真理。但对我们来说,将其明确化非常有价值。这意味着即使公司随着时间的推移发生变化,我们也不会改变这一质量标准,从而增强了每个人的信心。
大卫·乔治(David George)
这真是令人振奋。我想以一个乐观的问题和预测来结束:你如何定义通用人工智能(AGI)?你预计我们何时能实现这一目标?
亚历山大·王(Alexandr Wang)
我喜欢这个定义,比如说,80%以上的工作可以完全用计算机完成。因此,以数字化为主的工作可以由 AI 来完成。这并不会立刻发生,但大约在 4 年内,你会看到一些迹象。而且,根据我们之前讨论的算法和创新周期,这一进程可能会大大提前。