在 2024 年 8 月 20 日,Google 宣布其最新的 Health Acoustic Representations (HeAR) 模型将被用于通过咳嗽声检测结核病(TB)。这一消息引起了广泛关注,特别是在印度,结核病的负担日益加重。印度初创公司 Salcit Technologies 计划利用 HeAR 模型来增强其现有产品 Swaasa 的早期疾病检测能力。Swaasa 自 2020 年推出以来,已经使用 AI 算法来评估人类肺部的异常情况。
Google 在其博客中提到,HeAR 模型是一个生物声学基础模型,训练数据包括约 3 亿条音频数据,其中约 1 亿条是咳嗽声。HeAR 模型的推出旨在帮助研究人员构建能够监听人类声音并标记疾病早期迹象的模型。
HeAR 模型的技术细节显示,它是基于大规模音频数据训练的生物声学基础模型,能够识别出与疾病相关的声学生物标志物。Google 的产品经理 Sujay Kakarmath 表示,声音相比血液测试和影像更容易获取,HeAR 模型可以通过咳嗽声检测出胸部 X 光片的发现、结核病,甚至新冠肺炎。在医疗资源匮乏的地区,HeAR 模型可以帮助医疗专业人员通过手机收集声音样本并提供临床护理建议。
Salcit Technologies 计划将 HeAR 模型与其现有产品集成,以便更广泛地进行结核病筛查。
HeAR 模型的应用场景非常广泛,除了结核病检测外,还可以用于其他呼吸系统疾病的早期检测。联合国主办的终结结核病伙伴关系(Stop TB Partnership)也支持这一方法,认为 AI 驱动的声学分析可以在结核病筛查和检测中开辟新天地,为最需要的人群提供一种低影响、易获取的工具。
HeAR 模型还在其他疾病的检测中展现了潜力。例如,HeAR 模型可以通过咳嗽声检测新冠肺炎,这在疫情期间具有重要意义。相比传统的检测方法,HeAR 模型的优势在于其非侵入性和便捷性。用户只需通过手机录制咳嗽声,即可进行初步筛查,这对于资源有限的地区尤为重要。
与其他 AI 医疗技术相比,HeAR 模型的独特之处在于其基于声音的检测方法。传统的 AI 医疗技术通常依赖于影像数据或生物标志物,而 HeAR 模型则通过分析声音数据来识别疾病。这种方法不仅降低了检测成本,还提高了检测的便捷性和可及性。
纽约大学格罗斯曼医学院的 Lior Jankelson 博士表示,通过声音数据进行疾病检测,为医疗资源匮乏的地区提供了一种新的解决方案。联合国主办的终结结核病伙伴关系的数字健康专家 Zhi Zhen Qin 也表示,HeAR 模型的应用将为结核病筛查和检测带来变化,特别是在那些最需要帮助的地区。

