在伦敦举行的 AI 技术演讲中,微软首席执行官 Satya Nadella 探讨了人工智能如何变革计算界面,并为智能代理设定了目标。他在演讲中明确表示,微软的目标是通过技术赋能英国的每一位个人和组织,帮助他们实现更高成就。这不仅包括提升小企业的生产力,还涵盖提高跨国公司的竞争力,以及增强公共部门的效率。
为实现这一目标,微软正在构建三个关键平台。其中不仅有作为 AI 用户界面的 Copilot,还有一个完整的 AI 技术栈,以及支持新设备的 Copilot 设备。这些措施展示了微软在推动人工智能普及和应用方面的承诺,旨在为社会带来切实的提升和变革。
Satya Nadella 在伦敦演讲的核心观点包括:
- 技术能力的指数级增长: 萨提亚·纳德拉强调了“人工智能时代”的到来,提出了“AI 扩展定律”,即技术能力每六个月翻倍,这得益于计算能力的提升和更优的数据及算法使用技术。
- 计算界面的根本性变化: 随着自然语言处理和多模态输入输出能力的发展,计算界面将经历一场革命。推理引擎的进化将使其能够处理数据并拥有更丰富的上下文和记忆。
- 技术平台的协同作用: 微软致力于通过三个平台——Copilot 作为 AI 用户界面、完整的 AI 技术栈,以及支持新设备的 Copilot 设备——来帮助个人和组织实现更多成就。这些平台将通过智能代理连接起来,使用户能够创建自己的智能代理和应用程序。
- 边缘设备的重要性: 纳德拉预见到边缘设备在 AI 时代的重要性,认为它们的发展将成为关键。他提到了将 CPU、GPU 和 NPU(神经网络处理单元)结合在一起的 Copilot 设备,这将开启一个新时代,允许在边缘设备上进行更复杂的应用开发。同时,他强调了可信的 AI、隐私和安全的重要性,认为技术信任是技术扩散的核心。
以下是本期内容的完整翻译,我们作了不改变原意的删减。
技术能力每六个月就会翻倍成长
萨提亚·纳德拉(Satya Nadella)
早上好。很高兴再次回到伦敦,回到英国,特别是在这一新技术平台即将面世之际。今早,我意识到微软已经在英国扎根四十年,而我个人在过去三十多年里也多次来到这里。回想起 1990 年代初我在英国的首次演讲,那时我演示的是 Excel。这段科技之旅让我目睹了 PC 客户端服务器的兴起、互联网的发展,以及云计算与移动技术的革命。
如今,我们正处于人工智能时代技术转型的初期。理解这股核心驱动力是我们大有裨益。我在 1992 年加入微软时的技术见解主要源于摩尔定律,该定律奠定了我们对未来技术发展的理解基础。而今天,我们面临一股新的潮流,即“AI 扩展定律”。这一经验法则显示,技术能力每六个月就会翻倍成长,这主要得益于计算能力的提升以及更优的数据和算法使用技术。
我们可以看到计算界面的根本性变化。自然语言处理以及多模态输入和输出的能力将彻底革新每一种计算界面。此外,我们还见证了推理引擎的进化,它不仅能处理数据,还有更丰富的上下文和记忆。
我们的目标是通过技术帮助英国的每个人和每个组织实现更多成就。这包括提升小企业的生产力,提高跨国公司的竞争力,以及增强公共部门的效率。我们现在正致力于建立三个平台:Copilot 作为 AI 用户界面、完整的 AI 技术栈,以及支持新设备的 Copilot 设备。
Copilot 将把这些智能代理连接起来,就像 PC 或电话成为用户接口一样,而 Copilot 是 AI 的用户界面。更重要的是,它能通过 Copilot Studio 让用户创建自己的智能代理和应用程序。通过这种方式,任何人都可以轻松创建和使用 AI 代理。
这些工具已经在多个领域,尤其是销售、市场营销和客户服务中取得了显著的影响。不仅提升了效率,还降低了成本。这种变革正在英国的各个行业发生,我们正在见证这些创新工具为用户带来的积极变化和反响。
贾里德·斯帕塔罗(Jared Spataro)
感谢 Satya。很多人对麦肯锡公司都很熟悉,这是一家全球领先的管理咨询公司。对于麦肯锡来说,客户体验是其首要任务,他们始终致力于优化和改善与客户的每一个接触点。因此,当他们同意与我们合作,利用 Copilot Studio 开发一个自动化代理简化客户体验时,我们感到非常高兴。让我们一同来了解一下这一过程。
一切都始于一封潜在客户发来的电子邮件,正如你在屏幕上看到的。在过去,他们需要安排人员接收这些邮件,并逐一解析,以确定下一步行动:邮件需要转交给谁?公司内部有什么专业知识?这正是自动化代理介入的地方。现在,邮件一到,代理就立即开始工作。你可以看到,代理在解析邮件,处理人类语言的模糊之处,比如识别会议主题,检查会议记录,并将其映射到行业标准术语。最后,它会在公司内部锁定合适的人选推进下一步。掌握这些信息后,代理会撰写一封总结邮件,并发送给相关人员。这正是你在屏幕上看到的内容。
面对大量邮件的涌入,代理能够处理、总结并将信息发送给公司中合适的合作伙伴以采取行动。现在,我们需要停下来反思所见所闻。发生这一切的速度之快,可能让你错过了核心要点。这个代理系统只需一套通用指令,就可以处理所有人类交流中的复杂性,并判断出客户所需的正确接触点。更令人兴奋的是,我们将追溯回去,看看建立这样一个代理是多么简单。
为此,我们进入了 Copilot Studio。在这里,你可以看到,我们与麦肯锡合作开发了这个代理, 而不是依赖复杂编程,而是用自然语言,就如同向同事解释任务一样。你还可以看到建立这个自动化代理的关键在于设置一个所谓的触发因素。在这个例子中,触发因素是监控一个电子邮件地址,邮件送达即触发反应。实际上,你也可以将其设置为监控更广泛的系统事件,始终准备响应。此外,你还可以像对待普通同事一样,添加知识,如 Word 文档、SharePoint 站点和会议数据库。当然,还可以添加其他知识来源,包括 SAP 或 ServiceNow 等业务平台,甚至是数据库。
最后,为了让代理完成任务,你需要为它提供一系列的操作。在这个流程中,我们看到这些操作包括提取相关信息和总结人类撰写的内容。所有这些结合起来,使代理系统强大无比,能够轻松处理人类交流中的不确定性。现在,我们收到了一封新的客户会议邮件。令人振奋的是,这一流程具备可扩展的潜力。它是如何实现可扩展性的呢?我们进入活动面板,查看它正在处理的大量会议列表。放大顶部区域,可以看到它完成了超过 1,300 次会议,目前还有 33 个正在进行中。如果需要了解更多细节,进入分析选项卡即可。这意味着代理系统一直代表公司在高效运作,这让我们深感振奋。
与此同时,虽然代理系统非常出色,但有时仍需要人类的帮助。因此,我们深入一个案例,从第二步开始,看看遇到的一些问题。当你查看时,会发现代理完成了前面的步骤,但在寻找合适的合作伙伴上遇到了难题。如果进一步查看,可以发现原因,比如它找到的合适合作伙伴已经离职。此时,指令要求汇报给人类管理者,以寻找其他合适的人选。为了进一步查看,我们转到 Copilot,观察与人类管理者的互动界面。在右下角,你会看到在 Copilot 中出现了一条通知。然后,管理者获得所需的信息,来确定谁是合适的邮件接收人。
回到总部的代理系统,你会看到它获取这些信息并完成需要执行的内容。对此我们感到振奋,因为麦肯锡的试验证明这项技术能将交付周期缩短 90%,并降低 30%的行政管理成本。查看这份列表,我们可以设想这是一种编排机制,帮助个人、团队和部门简化并自动化流程。这些代理的创建非常简单,任何人都可以做到。你将在 Copilot Studio 中设计和配置这些,而 Copilot 则与它们互动。我们对此技术感到兴奋,期待与您分享其应用。
萨提亚·纳德拉(Satya Nadella)
希望这些信息能让您理解 Copilot 如何发展成为一个优化工作、工作流程和创造工作的集成平台。Copilot Studio 和代理在这个过程中实际上扮演了协调者的角色,通过与 Copilot 接口,帮助各个代理在个人、组织或业务流程的背景下协同工作。这就是这些元素协同运作的方式。
现在,我想介绍下一个平台,即 Copilot 与代理栈或 AI 平台。我们的最终目标是让每位软件开发人员利用我们在 Copilot、Copilot Studio 和代理中构建的各层技术栈,开发自己的 AI 系统。要实现这一切,需要最广泛的基础设施。当谈到 Azure 时,我们将其视为全球计算平台,目前已在 60 多个地区扩展。在英国,我们有 UK West 和 UK South。
去年,我们宣布将通过超过 25 亿美元的投资来进一步扩展这项设施,这让我们倍感振奋。这是一个持续发展的过程。我们将为英国带来最佳的基础设施,包括传统计算和 AI 计算,让您能够利用这一基础。我们正在进行大量工作以确保基础设施能够对 AI 负载进行优化,包括与 NVIDIA 合作开发的硅片。我最近还看到了即将上线的 GB200 及其浸没式液体冷却技术。事实上,我们也通过 Maia 的硅片设计工作借鉴了部分浸没式液体冷却技术,目前这项技术甚至可以在不同的硅片上使用。我们还与 AMD 合作,在硅片层面建立了出色的伙伴关系。
接下来,我们致力于打造最佳的优化方案,无论是用于训练还是推理,以便您能够构建自己的 Copilot。在核心基础设施方面正在进行大量工作。对于任何开发 AI 应用程序的开发人员来说,数据是另一个非常关键的因素,因为无论是用于训练还是推理,执行诸如检索增强生成之类的操作,您都需要完善的数据资产。为了实现这一目标,您需要能够将所有数据迁移到云端,并与 AI 结合。这实际上是一种引力效应,无论 AI 计算在何处,数据都会随之迁移。因此,我们正在确保您可以将 Oracle 资产、Snowflake 资产等数据资源迁移到云端。基于此,我们建立了一流的云原生数据基础设施,适用于从 OLTP 开始的各类数据库,包括 Cosmos DB,SQL 和 Postgres。
边缘设备的发展将成为关键
萨提亚·纳德拉(Satya Nadella)
实际上,考虑到 AI 与数据的结合,每一个 AI 应用程序都需要存储状态。 AI 的 API 是无状态的,但一旦涉及到实际应用和真实工作负载时,就会变得相当有状态。例如,ChatGPT 就是像 Cosmos DB 或 Azure Search 这样的服务的最大用户之一。这表明,当你构建像 Copilot 或 ChatGPT 这样的应用时,需要一个稳健的数据资产。我们正着手构建应用服务。如果你拥有基础设施和数据,自然就需要应用服务。
我记得以前提到过 。NET 的相关工作中做了很多贡献。事实上,现在我们进入了一个新的应用服务时代。我们为云原生应用程序构建各种服务,无论是容器应用还是应用服务,AKS 和函数依然是必要的。回顾 ChatGPT 的架构,实际使用的每个 GPU 都有基于 AKS 的常规计算比。这样就涉及到应用服务,以及新兴的 AI 应用服务。事实上,AI 应用服务在开始时就提供了最广泛的模型选择。我们对于与 OpenAI 的合作创新感到非常兴奋,包括从 GPT-o1 到 GPT-4o 以及所有顶尖的前沿模型,还包括开源模型如 Llama 和 Mistral,甚至闭源的提供商如 Cohere,都提供了丰富的模型选择。
一旦拥有最广泛的模型,AI 应用服务接下来提供的就是监督微调 (SFT),以便在这些模型基础上进行微调并集成到应用中。我们有所有工具来支持这些功能,例如 Azure Search 帮助你在数据或应用中将大型语言模型 (LLM) 与数据结合。不仅如此,还提供确保应用安全的服务。对于应用服务领域的每一次创新,我们都感到兴奋。你拥有应用服务、AI 应用服务和最强大的工具链。
事实上,我感到最自豪的是自 1975 年以来,Microsoft 对为软件开发者构建工具的投入。 这是我们的核心所在。利用 VS Code 和 GitHub 以及 GitHub Copilot,软件开发者能够借此工具链达到新的高度。我最近看到的最酷的事情之一就是 O1 映射到 GitHub Copilot,你可以使用 AI 实现接下来的优化。幻灯片上展示了我们用 O1 优化的 GitHub Copilot 自编码器。试想一下其递归性,我们正在用 AI 构建 AI 工具,以打造更佳的 AI。这是一个全新生产力提升的领域。
GitHub 计划在接下来的 GitHub Universe 活动中展现我们的成就,我对此充满期待。我非常期待看到我们在 GitHub Copilot 工作空间中的努力结晶。事实上,仅在英国就有 370 万 GitHub 开发者。这一快速增长使英国位列全球第五,增长率达到了 22%。看到这些发展令人振奋,我认为这会成为一个真正的转折点。门槛降低后,我总开玩笑说,现在每个周末我都能重新写代码。因为 GitHub Copilot,我们任何人都能快速克隆代码库,并在有限时间内完成项目。这真是令人兴奋。
今天早上,我有机会见到了许多合作伙伴,包括英国心脏基金会,他们在机器学习和 AI 的应用上表现卓越。Azure 语音服务甚至被用来模拟紧急呼叫,让人在关键时刻更为安心,这是一个重要的应用例子。汇丰银行也在积极应用 AI 工具,提升客户经理整个过程中对信用审批的处理效率。他们有效创建了一个 AI 代理,整合到了他们的移动应用,并为客户经理提供支持。我还见到了 Mondra 的开发团队,他们正在为英国及其他地区构建一个完整的食品安全和供应链数字孪生,借此改善其可持续性。这一产品在现实世界中必将产生积极影响。
另一家让我关注许久的初创公司是 Wayve。Wayve 探索了一种 AI 优先的方法,致力于从根本上重新构建 ADAS 系统,以更好地实现 AI 驱动的自动驾驶理念。
萨提亚·纳德拉(Satya Nadella)
接下来,我想讨论最后一个平台,即 Copilot 设备。Copilot 设备与 PC 搭配,是我们在半年前推出的,我们对其代表的意义感到十分振奋。这开启了一个全新的时代,允许在边缘设备上使用 CPU、GPU 和 NPU(神经网络处理单元)。
仔细思考一下,尽管摩尔定律在云端一直表现优异,但我认为展望未来,AI 时代不仅由云端发展决定,边缘设备的发展也将成为关键。 我们甚至可能在某些模型架构上取得基础性突破,实现这种混合应用方式。因此,不应再将其视为传统的客户机和服务器模型,因为这已不再适用。我们必须将其视作一个连续分布的架构,而这正是我们的设计理念。我们并不将 Copilot PC 视为独立存在的设备。当然,它可以用来保护隐私,但更重要的是,它能与云端进行全面的整合。这就是这些设备即将带来的变革。
对于你们这些游戏玩家而言,令人激动的是,当充分利用 GPU 时,还可以利用 NPU 进行所有向量化操作,这种应用开发类型将逐步实现。这将成为一个新平台,正如人们为 PC 和 GPU 构建创新应用一样,现在你会看到人们开始为一个由 NPU、GPU 和 CPU 组成的世界构建。这将是一个非常有趣的世界。所以我想通过谈论这三个平台可能具备的基础特性来结束,我认为这些特性至关重要,即可信的 AI、可信的隐私和可信的安全。因为技术信任将是我之前提到的所有扩散的核心。 如果人们不信任它,就无法使用它,这对任何人都没有好处。
因此,我们所做的非常明确。首先,我们制定了一套核心原则,无论是关于安全、隐私还是 AI 安全。比我们承诺更重要的是,我们实际构建了什么能力来实现这些承诺。事实上,即便是今天,当你考虑安全性时,在部署新的 AI 模型时,首先要做的就是测试它抵御对抗性攻击的能力。这不仅涉及发现漏洞,还包括一些如提示注入攻击对模型产生的影响。能够模拟对抗攻击是一个重要的考虑因素。
此外,我们在隐私方面结合机密计算的工作,必须与最新、最优的模型结合进行。同样,我们知道大语言模型(LLM)会出现幻觉,因此,在讨论 AI 安全时,使用 AI 来评估任何输出的基础性是非常重要的。这些是我们在平台中集成的具体能力,使软件开发人员可以信任它们,并确保这些 AI 平台开发的软件产品的用户对其充满信任。我认为这是我们的核心所在。所有这些都回到我最初所说的,技术最终必须对现实世界产生影响,包括对个人和组织,无论在英国还是其他地方,只有这样我们才能推动经济增长和盈余,真正改善整个经济体的表现。我对未来几年在这里看到的一些创新及你们和合作伙伴通过这些创新将实现的成就感到无比振奋。非常感谢大家。谢谢。