Skip to content
毫河风报
菜单
  • 首页
  • 关于我们
  • 联系我们
  • 播记
 
英特尔 RAG Foundry:四大模块助力简化 LLM 训练流程

英特尔 RAG Foundry:四大模块助力简化 LLM 训练流程

2024-08-07

2024 年 8 月 7 日,英特尔发布了一个新的开源框架 RAG Foundry,旨在简化检索增强生成(RAG)技术的实施步骤。RAG 技术虽然能提升大型语言模型(LLM)回答的准确性,但其实施过程通常非常复杂,涉及选择知识源、选择检索引擎、与 LLM 集成训练以及评估训练结果等多个步骤。英特尔的 RAG Foundry 将这些步骤集成到一个工作流中,降低了 RAG 部署的门槛,减少了开发人员的工作周期。

RAG Foundry 主要由四个模块组成:数据集创建、训练模块、推理模块和评估模块。数据集创建模块负责加载和处理数据,训练模块使用参数高效微调(PEFT)进行模型训练,推理模块进行预测,评估模块则对输出进行多种指标评估。

RAG 技术的复杂性一直是其广泛应用的主要障碍。传统的 RAG 实施过程不仅需要选择合适的知识源,还需要选择合适的检索引擎,并将其与大型语言模型(LLM)集成进行训练。整个过程还包括对训练结果的评估,这些步骤都需要大量的时间和资源。

英特尔的 RAG Foundry 框架通过将这些步骤集成到一个工作流中,简化了 RAG 的实施过程。具体而言,RAG Foundry 由四个模块组成:

  1. 数据集创建模块:该模块负责创建包含 RAG 交互的数据集,涵盖数据加载、列规范化、数据聚合、信息检索、API 集成和模板化提示等内容。通过这一模块,开发人员可以准备和处理数据,为后续的训练和推理做好准备。

  2. 训练模块:使用参数高效微调(PEFT)进行高效训练,用户可以在增强数据集上训练任意模型,并将结果推送到 Hugging Face。PEFT 技术使得训练过程更加高效,减少了计算资源的消耗,同时提高了模型的性能。

  3. 推理模块:用上一步训练出来的模型进行推理预测。该模块能够快速地对输入数据进行处理,并生成高质量的输出结果。

  4. 评估模块:对推理生成的输出进行评估,支持多种指标,如 EM(完全匹配)、F1、ROUGE 和 BERTScore。通过这一模块,开发人员可以全面评估模型的性能,确保其输出结果的准确性和可靠性。

RAG 技术在其他公司的应用也取得了进展。例如,百度近期在人工智能领域宣布了一项创新成果,开发出一种 “自我推理” 框架。该框架赋予 AI 系统以批判性思维,使其能够自主评估并验证自身知识与决策过程的准确性。

百度的自我推理框架包含三个核心过程:相关性感知、证据感知的选择以及轨迹分析。通过内置的自我推理机制,AI 系统不再局限于简单的信息检索与生成,而是能够像人类专家一样,批判性地审视并评估自己的输出。这一创新不仅解决了 AI 生成信息的能力问题,更向前迈进了一步,实现了对信息的验证与具体化。

在具体实施上,百度的自我推理 AI 首先评估检索信息的相关性,随后像人类研究员一样选择并引用相关证据,最后通过深入分析推理路径,生成既有充分依据又准确无误的答案。这种多步骤、严谨的推理流程,使得 AI 在信息处理上更加谨慎,同时也为其输出提供了清晰可追溯的依据。

在多个权威问答和事实验证数据集上的测试中,百度的自我推理系统均表现出色,甚至在某些情况下,仅使用少量训练样本(如 2000 个样本)就达到了与顶尖 AI 模型 GPT-4 相媲美的性能水平。

AI 日报

查看全部日报

  • AI 技术在医疗领域的突破性应用:从诊断到治疗的全新变革
  • AI 代理战场新核武!OpenAI 发布 o3 模型:比肩人类决策,媲美专业审核
  • 软银 5000 亿美元 AI「星门」陷融资困境,孙正义:短期波动不足为惧
  • 贝索斯加持 AI 搜索新星估值 140 亿!3 年超谷歌 7 年成绩
  • 苹果重磅爆料:秘密研发两大“杀手锏”芯片,剑指智能眼镜与 AI 服务器!

©2025 毫河风报 沪ICP备18012441号-5