英伟达最近开源了 AI 模型 Llama-3.1-Nemotron-70B-Instruct,该模型在多个基准测试中表现优异,超越了 OpenAI 的 GPT-4 和 Anthropic 的 Claude 3.5。模型旨在提高生成响应的有用性,特别是在 Arena Hard 等基准测试中获得了高排名。模型权重已在 Hugging Face 平台 供开发者和研究人员获取。
Llama-3.1-Nemotron-70B-Instruct 模型是基于 Llama-3.1-70B 架构开发的,采用人类反馈强化学习技术进行训练。模型利用 Nemotron 的训练数据集并开源,通过 HelpSteer2-Preference 引导,该模型在复杂科学、编码和数学问题上表现良好,但并未针对数学等专业领域进行特别优化。
该模型适用于聊天、语言生成、文本到文本转换以及代码生成等应用领域。英伟达在 Hugging Face 和 build.nvidia.com 提供多种访问方式,但运行大型模型需要相当的硬件资源。英伟达建议用户使用其云服务来不足硬件资源。
需要注意的是,AI 模型可能产生不准确或有偏见的结果,英伟达提醒用户在使用过程中保持警觉。英伟达在开发过程中仍然面对技术使用的伦理挑战。