英特尔 RAG Foundry：四大模块助力简化 LLM 训练流程

2024 年 8 月 7 日，英特尔发布了一个新的开源框架 RAG Foundry，旨在简化检索增强生成（RAG）技术的实施步骤。RAG 技术虽然能提升大型语言模型（LLM）回答的准确性，但其实施过程通常非常复杂，涉及选择知识源、选择检索引擎、与 LLM 集成训练以及评估训练结果等多个步骤。英特尔的 RAG Foundry 将这些步骤集成到一个工作流中，降低了 RAG 部署的门槛，减少了开发人员的工作周期。

RAG Foundry 主要由四个模块组成：数据集创建、训练模块、推理模块和评估模块。数据集创建模块负责加载和处理数据，训练模块使用参数高效微调（PEFT）进行模型训练，推理模块进行预测，评估模块则对输出进行多种指标评估。

RAG 技术的复杂性一直是其广泛应用的主要障碍。传统的 RAG 实施过程不仅需要选择合适的知识源，还需要选择合适的检索引擎，并将其与大型语言模型（LLM）集成进行训练。整个过程还包括对训练结果的评估，这些步骤都需要大量的时间和资源。

英特尔的 RAG Foundry 框架通过将这些步骤集成到一个工作流中，简化了 RAG 的实施过程。具体而言，RAG Foundry 由四个模块组成：

数据集创建模块：该模块负责创建包含 RAG 交互的数据集，涵盖数据加载、列规范化、数据聚合、信息检索、API 集成和模板化提示等内容。通过这一模块，开发人员可以准备和处理数据，为后续的训练和推理做好准备。
训练模块：使用参数高效微调（PEFT）进行高效训练，用户可以在增强数据集上训练任意模型，并将结果推送到 Hugging Face。PEFT 技术使得训练过程更加高效，减少了计算资源的消耗，同时提高了模型的性能。
推理模块：用上一步训练出来的模型进行推理预测。该模块能够快速地对输入数据进行处理，并生成高质量的输出结果。
评估模块：对推理生成的输出进行评估，支持多种指标，如 EM（完全匹配）、F1、ROUGE 和 BERTScore。通过这一模块，开发人员可以全面评估模型的性能，确保其输出结果的准确性和可靠性。

RAG 技术在其他公司的应用也取得了进展。例如，百度近期在人工智能领域宣布了一项创新成果，开发出一种 “自我推理” 框架。该框架赋予 AI 系统以批判性思维，使其能够自主评估并验证自身知识与决策过程的准确性。

百度的自我推理框架包含三个核心过程：相关性感知、证据感知的选择以及轨迹分析。通过内置的自我推理机制，AI 系统不再局限于简单的信息检索与生成，而是能够像人类专家一样，批判性地审视并评估自己的输出。这一创新不仅解决了 AI 生成信息的能力问题，更向前迈进了一步，实现了对信息的验证与具体化。

在具体实施上，百度的自我推理 AI 首先评估检索信息的相关性，随后像人类研究员一样选择并引用相关证据，最后通过深入分析推理路径，生成既有充分依据又准确无误的答案。这种多步骤、严谨的推理流程，使得 AI 在信息处理上更加谨慎，同时也为其输出提供了清晰可追溯的依据。

在多个权威问答和事实验证数据集上的测试中，百度的自我推理系统均表现出色，甚至在某些情况下，仅使用少量训练样本（如 2000 个样本）就达到了与顶尖 AI 模型 GPT-4 相媲美的性能水平。