科学家们正在使用 AlphaFold 和 ESMFold 等模型重新绘制病毒谱系,探索病毒之间的亲缘关系。这些模型帮助揭示了病毒家族的进化史,并有助于应对未来的生化风险。传统方法需要根据基因组比较来理解病毒进化,但由于病毒进化速度快且基因复杂,传统方法难以应对。新模型的应用使得科学家能够更深入地理解病毒的进化关系。
AlphaFold 和 ESMFold 是当前的蛋白质结构预测模型。AlphaFold 由 DeepMind 开发,依赖于相似蛋白质的多个序列进行预测,而 ESMFold 则是由 Meta 开发的蛋白质语言模型,能够从数千万个蛋白质序列中提取信息。
在病毒研究中,AlphaFold 和 ESMFold 的应用推动了科学家的工作进展。传统的基因组比较方法由于病毒进化速度快且基因复杂,难以应对。而这些新模型能够预测病毒蛋白质的三维结构,从而揭示病毒之间的亲缘关系。例如,科学家们利用这些模型发现了一些看似毫无关联的病毒之间的深层联系,这些发现有助于理解病毒的进化路径和传播机制。
ESMFold 团队在被 Meta 解散后发布了最新的生命科学大模型 ESM3,这一事件在科学界和社交媒体上引起了广泛关注。ESMFold 团队此前开发的 ESMFold 模型能够处理海量生物数据来预测蛋白质结构,成功预测了超过 6 亿个蛋白质三维结构,包含大量前所未见的结构,并且预测速度最高可达 AlphaFold 的 60 倍。这些数据组成了全球首个大规模的宏基因组蛋白质结构图谱。
然而,作为整个公司层面裁员的一部分,ESMFold 团队于今年春被解散。尽管如此,团队在解散前发布的 ESM3 大模型进一步推动了这一研究领域的发展。ESM3 不仅继承了 ESMFold 的优势,还在性能和准确性上有了提升。科学家们利用 ESM3 模型,能够更快速、更准确地预测蛋白质结构,从而加速生物医学研究的进展。