2024 年 9 月 17 日,Ginkgo Bioworks 宣布推出两项新产品,旨在助力制药和生物技术公司更容易开发新药。这些产品包括与 Google Cloud 合作构建的蛋白质大型语言模型(LLM),以及一个公开发布的模型 API。该蛋白质 LLM 将使个人研究人员和企业公司能够利用 Ginkgo 私人数据的见解开发药物,而模型 API 则为机器学习科学家提供了直接访问生物 AI 模型的工具。
Ginkgo Bioworks 与 Google Cloud 的合作始于对生物技术和人工智能的共同愿景。此次推出的蛋白质大语言模型(LLM)和模型 API,旨在利用 AI 和专有生物数据来加速药物发现。Ginkgo 的蛋白质 LLM 基于其庞大的蛋白质序列数据库,结合 Google Cloud 的计算能力和 AI 技术,能够提供药物开发建议。
Ginkgo Bioworks 的 CEO Jason Kelly 表示:“我们很高兴看到社区在这些模型和 API 的基础上进行构建。AA-0 是首个基于 Ginkgo 专有数据训练的模型。”Google Cloud 战略产业副总裁 Chris Sakalosky 也表示:“Ginkgo 的新蛋白质 LLM 和开放 API 标志着在使先进的 AI 工具可用于药物发现和生物研究方面迈出了重要一步。”
Ginkgo Bioworks 与 Google Cloud 合作推出的蛋白质大语言模型(LLM)和模型 API,技术上有许多创新之处。首先,蛋白质 LLM 基于 Ginkgo 庞大的蛋白质序列数据库,结合了 Google Cloud 的计算能力和 AI 技术。这个模型能够处理和分析大量的生物数据,从而提供药物开发建议。
技术实现方面,Ginkgo 的蛋白质 LLM 利用了 Google Cloud 的 Vertex AI Model Garden,这使得模型的训练和部署更加高效。模型 API 则提供了一种简单且可扩展的方式来访问基于蛋白质和 DNA 数据训练的复杂模型。首个发布的模型是 AA-0,一个基于超过 20 亿个 Ginkgo 专有蛋白质序列训练的大规模模型。
这些技术创新使得 Ginkgo 的蛋白质 LLM 在多个应用场景中表现出色。例如,在药物发现过程中,研究人员可以利用这个模型快速筛选出潜在的药物分子,从而缩短研发周期。此外,模型 API 还可以用于生物研究中的其他领域,如基因编辑、蛋白质工程等。