Mistral Large 2 挑战 Meta 和 OpenAI，代码榜单并列第三！

2024 年 8 月 7 日，Mistral Large 2 在最新的 lmsys 排行榜中引起了广泛关注。这款模型在代码榜单中并列第三，在编程和长查询榜单中排名第四，在指令跟随榜单中排名第六。Mistral Large 2 于 7 月 24 日发布，具有 128k 的上下文窗口，支持包括法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语在内的多种语言，以及 80 多种编程语言，如 Python、Java、C、C++、JavaScript 和 Bash。该模型专为单节点推理设计，具有 1230 亿参数，能够在单个节点上以大量吞吐量运行。此外，Mistral Large 2 还配备了增强的函数调用和检索功能，能够执行并行和顺序函数调用，帮助构建更复杂的商业应用。

Mistral AI 公司在 7 月 24 日发布了这款新模型，紧随 Meta 推出 Llama 3.1 系列 LLM 之后。Llama 3.1 系列包括其模型 405B，具有 128K 的上下文长度，并支持八种语言。Mistral Large 2 的发布是对 Meta 和 OpenAI 发布的 GPT-4o mini 的直接竞争。

基准测试显示，Mistral Large 2 在编码和推理等领域的表现与领先模型如 GPT-4o、Claude 3 Opus 和 Llama 3 405B 相当。在流行的基准测试 MMLU 中，Mistral Large 2 取得了 84% 的得分，而 Llama 3.1 405B 得分为 88.6%，GPT-4o 得分为 88.7%。GPT-4o mini 得分为 82%。

Mistral Large 2 的应用场景非常广泛，特别是在需要处理大量数据和复杂任务的领域。其 128k 的上下文窗口使其在处理长查询和复杂任务时表现良好，适用于金融分析、法律文档处理、科学研究等领域。此外，Mistral Large 2 支持数十种语言和 80 多种编程语言，使其在全球范围内的应用更加广泛。