Ginkgo Bioworks 与 Google Cloud 合作推出蛋白质 LLM，助力药物开发

2024 年 9 月 17 日，Ginkgo Bioworks 宣布推出两项新产品，旨在助力制药和生物技术公司更容易开发新药。这些产品包括与 Google Cloud 合作构建的蛋白质大型语言模型（LLM），以及一个公开发布的模型 API。该蛋白质 LLM 将使个人研究人员和企业公司能够利用 Ginkgo 私人数据的见解开发药物，而模型 API 则为机器学习科学家提供了直接访问生物 AI 模型的工具。

Ginkgo Bioworks 与 Google Cloud 的合作始于对生物技术和人工智能的共同愿景。此次推出的蛋白质大语言模型（LLM）和模型 API，旨在利用 AI 和专有生物数据来加速药物发现。Ginkgo 的蛋白质 LLM 基于其庞大的蛋白质序列数据库，结合 Google Cloud 的计算能力和 AI 技术，能够提供药物开发建议。

Ginkgo Bioworks 的 CEO Jason Kelly 表示：“我们很高兴看到社区在这些模型和 API 的基础上进行构建。AA-0 是首个基于 Ginkgo 专有数据训练的模型。”Google Cloud 战略产业副总裁 Chris Sakalosky 也表示：“Ginkgo 的新蛋白质 LLM 和开放 API 标志着在使先进的 AI 工具可用于药物发现和生物研究方面迈出了重要一步。”

Ginkgo Bioworks 与 Google Cloud 合作推出的蛋白质大语言模型（LLM）和模型 API，技术上有许多创新之处。首先，蛋白质 LLM 基于 Ginkgo 庞大的蛋白质序列数据库，结合了 Google Cloud 的计算能力和 AI 技术。这个模型能够处理和分析大量的生物数据，从而提供药物开发建议。

技术实现方面，Ginkgo 的蛋白质 LLM 利用了 Google Cloud 的 Vertex AI Model Garden，这使得模型的训练和部署更加高效。模型 API 则提供了一种简单且可扩展的方式来访问基于蛋白质和 DNA 数据训练的复杂模型。首个发布的模型是 AA-0，一个基于超过 20 亿个 Ginkgo 专有蛋白质序列训练的大规模模型。

这些技术创新使得 Ginkgo 的蛋白质 LLM 在多个应用场景中表现出色。例如，在药物发现过程中，研究人员可以利用这个模型快速筛选出潜在的药物分子，从而缩短研发周期。此外，模型 API 还可以用于生物研究中的其他领域，如基因编辑、蛋白质工程等。