本次访谈由红杉资本主办,采访对象是 Google NotebookLM 的产品和设计负责人 Riza Martin 和 Jason Spielman。访谈主题聚焦于今年备受关注的 AI 产品 NotebookLM,深入探讨其创新功能“音频概述”的背后技术,以及如何利用 AI 将多模态输入转化为引人入胜的播客内容。访谈还展望了未来在源驱动 AI 方面的发展路径。从技术挑战到实际应用,此次对话详细探讨了 NotebookLM 在处理复杂信息时如何提供简明、实用的解决方案,并分享了其在教育、销售等多领域的创新使用案例。
NotebookLM 团队的核心观点包括:
- AI 技术的震撼力:Notebook LM 作为一款 AI 驱动的研究工具,能够从任何源材料中创作出逼真的播客内容,这种能力让人震惊,类似于 ChatGPT 的影响。
- 用户需求的深入理解:用户不仅因为音频概述功能而来,还因为其他功能而留在平台上,这帮助团队深入了解用户希望从 Notebook 这样的工具中获得什么。
- 设计的挑战和选择:设计团队在确保产品性能卓越和用户界面直观方面做出了重要决策,如清晰的来源面板设计和一键音频概览功能。
- AI 设计的趋势:团队认为 AI 领域正在经历一个拟物设计时代,需要构建用户界面以更好地满足用户需求。
- 产品的创新和扩展:团队对交互式用户界面非常感兴趣,并正在尝试多种方法来帮助用户在阅读和写作时,同时避免他们被其他可能性所困扰。
- 产品的快速迭代和发布:在 Google 的环境下,团队能够快速行动,广泛收集用户反馈,并迅速迭代产品,这与 Google 的传统印象不同,显示了团队的灵活性和创新能力。
以下是本期播客内容的完整翻译,我们作了不改变原意的删减。
语音将是未来发展的方向之一
桑娅·黄(Sonya Huang)
两周前,Google 推出了一款神秘实验产品,备受关注。Notebook LM 是一款由 AI 驱动的研究工具,因其能从任何源材料中创作出令人惊艳且有趣的逼真播客内容而走红。今天,我们很高兴邀请到 Google Notebook LM 的产品和设计负责人 Riza Martin 和 Jason Spielman。我们与 Riza 和 Jason 讨论了这款产品的灵感来源,以及在像 Google 这样的大型组织中开发此类项目的过程及出现的一些意想不到的使用案例,当然,还有 Notebook LM 的未来发展。Riza 和 Jason,非常感谢你们今天的到来。在 AI 技术主导播客市场之前,很高兴能邀请到你们,非常感谢你们的参与。
雷扎·马丁(Raiza Martin)
谢谢你的邀请。
桑娅·黄(Sonya Huang)
请问,现在很多人将 Notebook 和语言模型(LM)比作是谷歌的 ChatGPT 时刻。这些都是处于预览阶段的实验性产品,却迅速走红。GPU 运转时伴随着嗡嗡声,现在你们成为了热门话题。对此你怎么看?
雷扎·马丁(Raiza Martin)
对于我来说,ChatGPT 的影响相当大。这样的情况总是让我感到惊讶:“哇,这是真的吗?”而从许多人的反应来看,它似乎也带来了类似的震撼,比如“哇,这就是 AI,它居然能做到这些。”这确实很酷。
贾森·斯皮尔曼(Jason Spielman)
是的,在某种程度上,我同意这种看法。第一次听到音频概述时,第二位主持人的出现确实让我震惊。但我认为这与我们掌握的基础技术有关。实际上,Gemini 1.5 Pro 可以处理所有这些非常复杂的信息,并以简明的方式呈现。我认为这些因素结合在一起,对我来说,真是一个令人难以置信的时刻。
桑娅·黄(Sonya Huang)
Notebook 是一种便携式计算机,配有内置屏幕和键盘,通常用于个人和专业用途。对于那些尚未使用过这些产品的人来说,Notebook 是一种非常实用的工具。
雷扎·马丁(Raiza Martin)
我认为 Notebook 是一种由 AI 驱动的研究和写作工具,但它的另一项更为人熟知的功能是可以上传资料,然后为你生成音频概述或播客。这样的发展是一种意外吗?
桑娅·黄(Sonya Huang)
您一开始是否想创建一个能够取代播客主机服务的平台,还是这样的目标在某种程度上是意外出现的呢?
雷扎·马丁(Raiza Martin)
坦白讲,我们一直在研究不同的输出模式。我认为语音将是未来发展的方向之一,所以我们选择了对话。 我们是否预料到它会成为一个重要的突破?对此,我要说并没有。我觉得它非常神奇,它能如此打动人心确实让人感到既愉悦又惊讶。
帕特·格雷迪(Pat Grady)
好的,我了解到你们开发 Notebook LM 已经有一段时间了。能否带我们回顾一下这个项目的起始阶段?当初的构思是什么?这个项目是如何诞生的?
雷扎·马丁(Raiza Martin)
我记得去年参与了 AI Test Kitchen 的工作。Notebook 最初其实是作为一个 20%的时间项目开始的。当时,一位工程师正在开发一个名为“Talk to Small Corpus”的项目。这个项目非常有趣且引人注目。
雷扎·马丁(Raiza Martin)
当时我开始思考,语料库究竟是什么?在与他交流时,他解释道,这实际上是一种理念,可以利用大型语言模型与数据互动,从中提取信息。我心想,这真是太有趣了。于是我开始考虑这些技术的实际应用场景。成年后,我才开始接受教育。我想,如果我能运用大型语言模型并理解其功能,是否可以利用它们与教材等学习资料互动,这让我感到振奋。我意识到这不仅可能改变我的生活,也可能改变许多人的生活。因此,我们开始认真思考如何开发出一个早期产品版本,让更多人接触这一技术。2023 年 5 月,我们推出了 Project Tailwind,用户可以上传诸如 PDF 的文档,与之进行互动。
贾森·斯皮尔曼(Jason Spielman)
我认为,我们这个产品的独特性在于它的来源基础。即使在刚开始考虑这个项目时,我也没有意识到,我生活中创造的一切,通常都有一些先前的文档或材料作为基础,用于创造新的东西。因此,我现在至少会将其称为一个基于来源的工具。但实际上,我们正在成为一个用于创作及多种其他用途的基于来源的工具。
桑娅·黄(Sonya Huang)
您是否可以分享有关 NotebookLM 的统计数据?
雷扎·马丁(Raiza Martin)
我想分享的是,在我们推出音频评论功能之前,我们的增长路径一直是稳定的。然而,自从这个功能上线以来,增长速度迅速加快,这让人倍感振奋。这个功能实际上是吸引用户使用我们产品的一个很好的切入点。需要强调的是,虽然这个功能能吸引用户初次使用,但用户往往是因为其他功能才决定长久留在我们的平台中。这也让我们对用户希望从 Notebook 这样的工具中获得什么产生了深入的了解,非常有趣。
桑娅·黄(Sonya Huang)
播客或音频概览的体验确实令人惊叹。能否为我们介绍一下它背后的运作机制?比如,你们是如何让其表现得如此生动逼真的,又是如何让谈话如此出色且引人入胜的?
雷扎·马丁(Raiza Martin)
我想说,这确实是一项非常庞大的工作。这个任务需要大量的团队合作,整个过程要求许多细致的工艺。而这一切实际上依赖于谷歌的模型。比如,Gemini 1.5 这个模型,在接收你输入到 Notebook LM 的所有数据后,能够生成新的内容,确实表现出色。此外,还有支持 Notebook LM 的语音模型和音频模型。我认为,这些模型之间真正的核心驱动力是我们构建的 Content Studio。Content Studio 真正实现了从输入内容到最终播客的编辑过程。在工作室中,我们也具备一定的编辑自由度。
桑娅·黄(Sonya Huang)
那么,在未来,你是否考虑过通过让这部作品变得更有趣或更严肃,让更多人了解 Studio 元素呢?
雷扎·马丁(Raiza Martin)
是的,我认为我们听到了很多这样的声音,尤其是因为有这么多人在使用它,其中不少人感到满意。我想下一步,人们希望能对它进行更多的控制,对吧?他们希望能够与其互动。此时,我本能的反应是,好的,我们来提供这些控制工具。然而,我试图更有条理地考虑这个问题。人们之所以喜爱它,是因为它带来了愉悦和神奇。那么,我如何才能提供同样充满愉悦和神奇的控制工具呢?虽然我能做的事情有限,但我认为是有办法的。因此,我对此非常感兴趣。
贾森·斯皮尔曼(Jason Spielman)
我认为音频评论之所以广泛流行,部分原因在于它提供了简单的一键式体验。 比如,我在电话里试着向奶奶解释怎么使用它,其实根本不需要解释。我说,只需导入一个源文件。她就说,哦,我明白了,只要按一下这个按钮就可以。我认为这种便捷性确实助长了它的广泛普及。因此,当我们考虑扩展这些功能时,我认为我们需要非常有针对性地去执行。
我们正处于所谓的 AI 拟物设计时代
桑娅·黄(Sonya Huang)
你提到人们是因为播客而来,但留在了其他内容。你见过哪些最好的“其他”使用案例呢?
雷扎·马丁(Raiza Martin)
这是让我非常意外的一个例子。之前我提到了一些与教育相关的应用,而这对我来说非常贴近个人经验。我注意到许多学生和教育工作者都在使用 Notebook LM。令我惊讶的是,有如此多的人在工作中使用 Notebook LM。在 Google 内部,我们进行了一项试点案例研究,这是一个很好的例子。我们的广告团队中有不少广告销售人员和专家,我起初并不知道他们的销售培训和相关文档竟有多达数百页。我想,人们如何掌握如此多的信息呢?而且这些信息不断变化,跟上变化以有效销售确实很困难。
在 Notebook LM 推出之前,销售团队通常通过互相请教来解决问题,比如问:“嘿,Joe,这个东西怎么运作?我该如何为这个客户定位?” Joe 通过回复后,他们会把信息复制粘贴到自己的电子邮件中,稍作修改后发送。然而,事实证明,那些像 Joe 这样熟练掌握知识并阅读了所有这些文档的人,会创建笔记本并分享给销售同事,这样大家可以直接参考使用,而不必总去请教 Joe。对我而言,这是一个非常有趣的例子,因为这是一个简单实用的应用场景,并且可以在此基础上进行更多拓展和创新。
贾森·斯皮尔曼(Jason Spielman)
事实上,我刚刚还在这里和一位做销售的朋友聊天,他说现在的情况不错。我准备了一本完整的笔记本,这样在打电话时如果碰到不知道的问题,可以迅速地查询并得到答案。所以,我认为知识分配的理念对大型销售团队或数据中心非常有帮助。
我觉得还有一个同样有趣的使用案例。许多从事风险投资和私募股权的朋友提到关于机密信息备忘录的概念,我之前从未听说过。不过,我有个朋友的工作基本上就是审核这些材料包。他的做法是把收到的文件或幻灯片放到笔记本中,这样就能够比以前更快地处理这些复杂的信息。他告诉我,他的工作效率提高了十倍,效果非常好。这使得他能够更快速地完成工作。
桑娅·黄(Sonya Huang)
作为播客主持人和风险投资者,你们是否真的打算取代我们的工作呢?
贾森·斯皮尔曼(Jason Spielman)
我们正在帮助你完成任务。
桑娅·黄(Sonya Huang)
在设计 Notebook 时,你们做了哪些选择,以确保其性能卓越且用户界面直观?
贾森·斯皮尔曼(Jason Spielman)
我想澄清一下,我们仍然在做相关决定。目前,我们正处于快速发布产品阶段,密切与用户合作以了解他们的需求。由于技术发展迅速,有时我们难以预测什么是可行的。因此,我们致力于快速发布,并与用户共同开发最佳产品。
具体来说,我们在设计方面做了一项重要的工作。其中一个出乎意料的收获是,我们将左侧的来源面板设计得非常清晰明了。这一设计对我们的项目至关重要,因为它展示了用户正在与上传的来源进行对话。此外,一键音频概览功能似乎也非常有效,使我们能够专注于提供简洁的体验。当然,还有更多功能即将推出,我们正在积极与用户合作以改进产品。
雷扎·马丁(Raiza Martin)
我对设计选择和产品优先级有一些看法。思考如何让新事物变得直观易用,确实是一个挑战,尤其是在必须先完成一些细节时。比如用户在上传源文件时,常常感到困惑。这是为什么呢?他们可能会想:在使用 ChatGPT 或 Gemini 时,我并不需要上传任何源文件,这些产品仍能正常工作。因此,我认为我们在实现“即插即用”的体验方面还有很多工作要做。
桑娅·黄(Sonya Huang)
您认为在引导人们进入全新、以 AI 为核心的体验时,最大的挑战是什么?
贾森·斯皮尔曼(Jason Spielman)
我认为我们正处于所谓的 AI 拟物设计时代。拟物设计指的是虚拟物品模仿现实世界的物品。 这种设计早期在 iOS 系统中就可以看到,比如记事本应用顶部的皮革边框和黄色的便签。这样的设计意在帮助用户从物理世界逐步过渡到虚拟世界。我认为,现在在 AI 领域,我们也观察到类似的趋势,我们需要构建用户界面,以更好地满足用户需求。在全力进行创新并构建新奇体验的同时,我们必须意识到,对于许多用户来说,这可能是他们首次与人工智能互动。
桑娅·黄(Sonya Huang)
我认为 Midjourney 在帮助用户轻松克服所谓的“空白提示”问题上,做得非常出色。除此之外,你还特别欣赏哪些在用户界面设计上表现出色的其他应用程序呢?
雷扎·马丁(Raiza Martin)
最近,我尝试了一款名为 Pika 的新工具。Pika 功能强大,可以直观地展示图片上传后的变化。我非常喜欢它,因为你可以上传一张图片,选择或设置效果,然后获得预期的结果。它的功能类似于预览,同时其压缩处理能力也让我非常感兴趣。例如,我上传了一张饮料的照片,并希望将其转换为蛋糕的效果,出于好奇,我想看看这个工具是如何实现这种转换的。我甚至考虑立即付费使用这一功能,这足以证明预览功能能有效激励用户期待最终结果。对我而言,支付 10 美元来体验这一独特功能我也愿意。Pika 的方法确实非常有效。
贾森·斯皮尔曼(Jason Spielman)
我个人非常喜欢 Claude,因为我认为它们在协同创作中表现极为出色。我们以前多次探讨过写作中的合作创作,因此,看到其他人在这一领域的思考让我感到欣慰。目前,我们正处于努力平衡 AI 与人类关系的阶段。我们的目标不是取代你的工作,而是希望通过 Claude 来支持和协助你的工作。 Claude 是一个很好的例子,它不仅让你可以与聊天系统互动,也能从事一些创造性工作。
桑娅·黄(Sonya Huang)
您如何比较和对比您的产品与 Claude 所采用的方法?您认为双方追求的目标是否相似?或者,您如何看待它们之间的差异?
贾森·斯皮尔曼(Jason Spielman)
我认为,至少目前,我们首先是一个基于来源的工具,这使得我们与众不同。尽管如此,我认为我们正全面考虑如何利用您上传的来源进行创作。
雷扎·马丁(Raiza Martin)
我认为,在这一点上,你的大语言模型(LLM)的情境化交互功能非常强大,这将创造出更具吸引力的用户体验。 我猜 Claude 团队可能已经意识到了这点,Anthropic 团队也可能知道,而 OpenAI 的人肯定对此心知肚明,Google 团队也是如此。不过,关键在于何时引入此功能以及什么应用场景合适。因此,我对 Notebook LLM 充满期待,因为这正是我们的起点。随着人们越来越重视基于来源的工作流和讲故事的重要性,这可能正是大家一直在寻找的工具。如果我们能够快速推进,可能会领先于那些同时处理许多其他用例的公司。
桑娅·黄(Sonya Huang)
您之前提到过,聊天是一种模仿用户界面的形式,你们正尝试一些更具创新的事物。那么,这些创新事物可能是什么样子或给人怎样的感觉?能否为我们稍作预览?
贾森·斯皮尔曼(Jason Spielman)
总体而言,我对交互式用户界面(UI)非常感兴趣。我认为 Claude 是一个很好的例子,您怎么看?您会发现一些原本不存在的特性开始出现。我觉得我们一直在思考如何在不增加用户压力的前提下,让他们充分利用当前正在做的事情。我们正在尝试多种方法,比如在阅读和写作时为用户提供帮助,但在用户感到压力之前,我们能做的其实有限。因此,我认为我们正在深入研究如何利用用户当前的行为,同时避免他们被其他可能性所困扰。
雷扎·马丁(Raiza Martin)
我常常思考如何更多地依赖新的互动方式,这会带来输入和输出的变化。我经常做一些原型设计,尝试多种不同的行为模式。其中一个让我特别着迷的想法是,我可以与大型语言模型(LLM)互动,或者与类似 AI 的生态系统交流。
最近让我满意的一个例子是,我开始采用这种方式撰写每日日志,而不再手动记录。我通过与系统的反复交流,让系统为我生成日志。然后,它会为我制作可视化图表,比如“本周你经历的糟糕日子多还是美好日子多。”图表还会显示哪些事情让我开心,哪些让我沮丧。我觉得这种互动中有很多值得探索的内容。此外,这是基于开源 AI 的驱动。当然,这涉及一些实用的工作和教育应用,但个人层面的应用也是极具吸引力的。因此,我在考虑如何将这些学习成果融入到笔记日志管理中,并在类似的移动应用程序中看到更多这种应用。
AI会取代播客吗:个性化生成的魅力
桑娅·黄(Sonya Huang)
那么,现在你们已经有了这个“神奇笔记本”Notebook LM,你们希望将它发展到什么层次?
雷扎·马丁(Raiza Martin)
我认为,只需要继续前进。我希望能够继续创造更多有趣的内容,深化用户体验并使其更加实用。 如今有很多惊喜和乐趣。我们希望实现最初吸引用户的承诺,并让大家知道,你可以长时间留在这个平台上,因为这将带来绝佳的体验。
帕特·格雷迪(Pat Grady)
您认为当前产品最缺乏的是什么?
雷扎·马丁(Raiza Martin)
如果我能回到过去,在这次内容发布中加入更多功能,我一定会优先改善分享体验。 在浏览社交平台时,我常常发现用户更倾向于使用各种视频和数据可视化工具,而不是我们原生的工具。作为产品负责人,我意识到我们可能无法统计到这些用户,因为他们使用的是其他平台。因此,我认为我们目前确实缺乏一些围绕音频概览的分享和协作功能。
贾森·斯皮尔曼(Jason Spielman)
我非常兴奋能够帮助提升用户的写作体验。我们了解到,人们经常通过问答的方式,将获得的答案用于创造新的内容。因此,我非常期待能够帮助用户完善整个体验过程。
桑娅·黄(Sonya Huang)
你是如何实现的?是通过提示设计的方法来调整它,使其更符合你的要求吗,比如让交流更具对话性和趣味性?在这项技术上你做了哪些调整或改进?
帕特·格雷迪(Pat Grady)
我对你是如何设计这些个性特征的也很好奇,你能详细讲讲吗?
雷扎·马丁(Raiza Martin)
在幕后我们完成了很多工作。我认为你提到了几个重要方面,尤其是关于名为 Deep Dive 的节目。显然,这个节目有两个主持人。我想说的是,角色自己生成内容时,节目具有更多的编辑自由。对我而言,我总是很好奇,他们会如何根据上传的资料来引导节目的走向。
桑娅·黄(Sonya Huang)
哦,有趣。你为每个来源赋予了独特的个性和处理方式,然后让它们来创建播客。
雷扎·马丁(Raiza Martin)
简而言之,我认为这是对我们当前情况的最佳解释。因此,在考虑编辑体验时,我们需要思考应该提供哪些控制选项。基本的选项可能包括:我不想深入细节,只需不同类型或长度的内容,比如希望内容更短或更长。或者我仅希望指定一个主题,而不是整个内容,因为今天的内容更像是一个音频概述。所以,我认为有许多细节可以调整,但核心在于赋予用户根据其资源进行编辑的自由,同时尝试提供一个概述。
桑娅·黄(Sonya Huang)
每次我开玩笑说你们要取代我们的工作时,你们总是表示不会这样。但我不知道你们是否只是出于礼貌,因为你们生成的内容确实非常出色。我的问题是,当你们说这些内容还不足以取代真正的播客时,你们的依据是什么?在我看来,这已经好得足以替代一个真正的播客了。
雷扎·马丁(Raiza Martin)
我觉得这确实是个很好的问题,我会非常认真地对待。特别是当存在真正的风险时,我希望我们能直面问题,然后思考,“好,我们该如何应对?”然而,我注意到,很多人所做的事情不足以让我专门为此制作一个播客来讨论。这让我思考,我想听这样的内容吗?我会愿意替换掉我喜欢的播客之一,比如说 Lenny’s,把一篇文章转成播客吗?我一直在听 Lenny’s,我并不想做这样的替换,我更想听 Lenny 对这个话题的见解。
有趣的是,现在有人在做一些音频方面的尝试,比如将他们的简历、Linkedin 简介制作成音频,或者让创业者把音频放到他们的着陆页上,以便确认“哦,我的信息传达是否清晰?”这些尝试非常有趣,因为目前还没有人专门为此类内容制作播客。至少在现阶段没有。不过,这正是我觉得好的地方。我们似乎开辟了一个新的空间,通过个性化内容生成解决了我们的需求,而市场上还没有现成的产品。这种创新真的很特别。
贾森·斯皮尔曼(Jason Spielman)
这几乎让人感觉像是一种不同类型的媒体。尽管它听起来像播客,但你提供了很好的例子,展示了人们利用它实现各种随机的使用场景。Reaction 类视频在网上非常受欢迎是有原因的。因为观众不仅仅是来收听节目的,也想听到你们两个作为该领域专家的意见。我认为在讨论播客时,记住这一点也很重要。
雷扎·马丁(Raiza Martin)
我认为其中一个有趣的方面是,尽管人们分享他们生成的音频概述时,这些内容却非常个人化。就好像这些是专为自己制作的,而不是为了让别人了解他们的简历,而是属于他们自己的东西。他们对自己的简历音频感到非常满意。
举例来说,有一个很酷的 TikTok 视频,一位女性上传了她 2004 年的日记。和大家一起聆听这段音频很有趣,但更有意思的是她对自己旧日记的反应,因为她可能永远不会听与那些事情相关的播客。其实,我最喜欢的一个用例是,有人在 Discord 上分享了一个故事:某个周末,他们的大学好友群突然活跃起来。他没有去逐一查看这些消息,而是把它们全部复制粘贴到一个文档中。于是,他计划周一早上开车去上班的路上听同学们聊天的内容。我觉得这就是个性化生成的魅力。
帕特·格雷迪(Pat Grady)
在一个充满聊天窗口的世界中,是什么促使人们产生这样的想法:“人们会想听这个,他们会希望通过播客来获取这种内容”?
雷扎·马丁(Raiza Martin)
我觉得这又涉及到 Jason 之前提到的问题,那就是我们如何以一种易于理解和识别的方式呈现新事物,以便让人们愿意去尝试。 上传素材后,我们可以产生新的声音组合,这促使我们思考:我们能生成哪些类型的声音?我们的语音模型非常强大,经过许多试验,我们发现可以构建独白、进行对话,甚至为用户提供一个可选的开关。但是,最终打动用户的是对话这种形式,因为它更贴近播客的体验,而不仅仅是传统的文本到语音转换。当我们看到用户对此感到非常满意时,我们就知道这就是我们要发布的产品。
桑娅·黄(Sonya Huang)
你现在在播客中拥有了这个杀手级功能,同时还有一个非常通用的横向扩展平台。接下来,你会采取什么策略呢?是更深入地专注于播客领域,还是扩展到其他领域?
雷扎·马丁(Raiza Martin)
我认为,这只是一个成本问题。
贾森·斯皮尔曼(Jason Spielman)
你现在可以将这些内容作为输入。但对于输出部分,我认为我们还需要进一步改进。
雷扎·马丁(Raiza Martin)
我感到非常兴奋,因为谈到这个发展路线图时,我不打算轻描淡写地说它非常简单明了。我担心这么说可能会导致一些意外情况。不过,我们明确了解自己的目标,那就是整合对你重要的信息,并让你利用 AI 的力量创造新事物。我认为播客绝对是我们希望深入探索的一种输出形式,尤其是因为我们注意到人们对此非常感兴趣。
这只是其中的一部分。我们还希望推进其他方面的发展,比如提供更加实用的功能。毕竟,每个人的喜好都不相同,对吧?甚至在两天前,有人对我说,嘿,能不能用 AI 生成更好的代码呢?播客不错,但你能生成更好的代码吗?当时我心想,这真是个不错的建议。其实这在我们的计划之中,但我仍然觉得,我们确实需要更加关注输出的质量。
Google平台的助益
帕特·格雷迪(Pat Grady)
这个问题可能涉及敏感内容。你们看起来在执行这个项目时,采用了类似初创公司的方式,比如使用精简的小团队,快速行动,广泛收集用户反馈,迅速迭代,将尚未完善的产品推向市场,并在生产环境中进行测试。这种方式似乎与大家对 Google 项目的传统印象有所不同。因此,我想了解,成为 Google 的一部分在哪些方面对 Notebook LM 有所帮助?你们在哪些方面可能打破了常规?
雷扎·马丁(Raiza Martin)
我觉得这是个很好的问题。我想从两个方面谈谈在 Google 工作的独特之处。首先,就是在模型完全准备好之前,我们就能提前接触到,并了解即将推出的功能。 这让我能够从不同的角度思考产品的构建方式。知道这些功能即将上线时,我思考如何优化具体的使用流程,这实在令人兴奋。其次,特别之处在于这里的人才。与我共事的人都非常聪明、才华横溢且高度协作,他们同样热衷于创造出色的产品。 结合这两点,对于我这样的产品构建者来说,无疑是再理想不过了。我需要做的,就是执行计划,将产品推向市场。我相信,只要持续努力,我们就能够推出一些令人振奋的产品。
在这样一个创新的环境中,我明白关键是要及时发布产品。事实上,产品容易被搁置,而不是去实际实现它。特别是在 Google,我常常会感到犹豫,考虑这样做会如何影响各方面?需要权衡的因素很多。然而,一旦明确首要任务是发布产品,就必须不惜一切代价去实现。 这些话是在播客中说,希望我们的工程师没在听。我常常设定一些虚假的最后期限,这倒很有意思。因为最坏的情况是,我告诉大家,10 月 10 日我们必须完成和发布。大家反应说,10 月 10 日?那不是还有两周吗!然后我就说,对,那我们该怎么做呢?他们便会答,好吧,我们现在得加紧了。我说,对,我知道。然后我们一起加快进度。尽管我让它听起来轻松,但多数时候人们并没有真正去问 10 月 10 日有什么特别的。因此,这个方法有效,并且已经实施两年了。
贾森·斯皮尔曼(Jason Spielman)
项目进展顺利,这很好。然而,我确实认为,目前存在一种误解,认为 Google 发展缓慢。事实上,在我为 Google 工作的七年中,让我惊讶的是公司进展得如此之快。 同时,你会发现,Google 的团队规模庞大,每天影响着数十亿用户。我认为,我们现在正处于一个最佳状态,能够享受大公司在规模和数据方面的所有优势。此外,我们是一个约十人组成的小团队,因此也可以快速采取行动。
桑娅·黄(Sonya Huang)
是的,我们非常期待你们继续利用这个产品创造更多价值。希望你们的创新不会让我们感到过大的压力,不过你们至今取得的成果确实令人欣慰。祝贺你们。