英伟达新 AI 模型：Llama-3.1-Nemotron-70B 如何超越 GPT-4？

英伟达最近开源了 AI 模型 Llama-3.1-Nemotron-70B-Instruct，该模型在多个基准测试中表现优异，超越了 OpenAI 的 GPT-4 和 Anthropic 的 Claude 3.5。模型旨在提高生成响应的有用性，特别是在 Arena Hard 等基准测试中获得了高排名。模型权重已在 Hugging Face 平台供开发者和研究人员获取。

Llama-3.1-Nemotron-70B-Instruct 模型是基于 Llama-3.1-70B 架构开发的，采用人类反馈强化学习技术进行训练。模型利用 Nemotron 的训练数据集并开源，通过 HelpSteer2-Preference 引导，该模型在复杂科学、编码和数学问题上表现良好，但并未针对数学等专业领域进行特别优化。

该模型适用于聊天、语言生成、文本到文本转换以及代码生成等应用领域。英伟达在 Hugging Face 和 build.nvidia.com 提供多种访问方式，但运行大型模型需要相当的硬件资源。英伟达建议用户使用其云服务来不足硬件资源。

需要注意的是，AI 模型可能产生不准确或有偏见的结果，英伟达提醒用户在使用过程中保持警觉。英伟达在开发过程中仍然面对技术使用的伦理挑战。