近日,哈佛大学医学院的研究团队及其合作者提出了一种名为临床组织病理学成像评估基础(CHIEF)的 AI 模型,用于提取病理成像特征以进行系统的癌症评估。该模型在包含 11 种癌症类型的 15 个数据集上实现了近 94% 的准确率。在从独立队列收集的 5 个活检数据集中,CHIEF 在包括食道癌、胃癌、结肠癌和前列腺癌在内的多种癌症类型中达到了 96% 的准确率。相关研究论文已发表在科学期刊《Nature》上。
CHIEF 模型是一个适用于弱监督组织病理学图像分析的通用机器学习框架。研究团队使用代表 19 个解剖部位的 60530 张全切片图像以弱监督的方式对 CHIEF 进行了预训练。在预训练过程中,他们将全切片图像裁剪成不重叠的图像瓦片,并使用对比语言 – 图像预训练(CLIP)嵌入方法编码每个全切片的解剖部位信息,以获得每个解剖部位的特征向量。然后,使用 CHIEF 提取的病理成像特征直接推断癌症类型。
在基因组学预测和预后预测任务中,CHIEF 特征作为为每个特定任务微调模型的基础。CHIEF 在这些任务中的表现比最先进的深度学习方法高出多达 36.1%。平均来说,CHIEF 的表现比传统方法高出 9%。CHIEF 模型在病理图像分析中展现出通用性和泛化能力,能够在多种癌症类型中应用于多种病理评估任务,其中包括癌症检测、肿瘤来源预测、基因组特征预测以及生存预测。
CHIEF 在代表 11 种癌症类型的 15 个数据集上实现了 0.9397 的宏观平均受试者操作特征曲线下面积(AUROC),比现有的三种深度学习方法均高出 10% 及以上。在从独立队列收集的所有五个活检数据集中,CHIEF 在包括食管、胃、结肠和前列腺在内的几种癌症类型中的 AUROCs 均大于 0.96。在使用涵盖五种癌症类型(即结肠、乳腺、子宫内膜、肺和宫颈)的七个手术切除切片集进行独立验证时,CHIEF 的 AUROCs 大于 0.90。这些结果证明了 CHIEF 在国际上不同来源的多样化癌症组织和样本中的泛化能力。
除了 CHIEF 模型,其他相关研究也在不断推进。例如,7 月,哈佛医学院的研究团队与合作伙伴共同开发了一款针对人类病理学领域的视觉语言通用 AI 助手 ——PathChat。该系统在处理活检切片时,能够正确识别疾病的准确率达到近 90%。相关研究论文已发表在科学期刊《Nature》上。
此外,有研究团队致力于利用 AI 技术操控细胞命运,实现了将癌细胞转化为免疫细胞的突破。今年 8 月,南加州大学(USC)凯克医学院的学者们在美国国立卫生研究院(NIH)的资助下,开展了一项研究。他们利用 AI 识别并重新编程胶质母细胞瘤细胞的基因,将其转变为具有抗癌能力的树突状细胞,有效地瞄准并摧毁周围的癌细胞。在胶质母细胞瘤小鼠模型中,这一方法显著提高了 75% 的生存机会。