谷歌最近推出了 SynthID 文本水印技术,用于识别 AI 生成的文本。此技术已被整合到谷歌的 Gemini 系列产品中,并在大规模用户群中进行测试。谷歌还通过 Hugging Face 平台和其负责任生成 AI 工具包将此技术开源,供开发者和企业免费使用,以应对 AI 生成内容带来的挑战。
SynthID 的工作机制基于大语言模型。它将语言分解为 “词元”,并通过改变生成过程中的概率来嵌入水印。实验表明,这种方法不会显著影响文本质量和实用性,即便用户可能察觉不到生成与否的差异。
然而,SynthID 存在一定局限性:对于短文本效果不佳,翻译和重写可以影响水印的可靠性,事实性回答的概率调整空间有限,且在特定内容变化较小时表现也不理想。但在对抗文本裁剪方面,SynthID 的表现仍相对较好。
当前,SynthID 仅适用于谷歌自有模型生成的内容,谷歌希望通过开源扩大其兼容性。这项技术可以被应用于如新闻、教育、法律、内容创作和企业通信等诸多领域,用于识别 AI 生成的内容。