2024 年 8 月 7 日,Mistral Large 2 在最新的 lmsys 排行榜中引起了广泛关注。这款模型在代码榜单中并列第三,在编程和长查询榜单中排名第四,在指令跟随榜单中排名第六。Mistral Large 2 于 7 月 24 日发布,具有 128k 的上下文窗口,支持包括法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语在内的多种语言,以及 80 多种编程语言,如 Python、Java、C、C++、JavaScript 和 Bash。该模型专为单节点推理设计,具有 1230 亿参数,能够在单个节点上以大量吞吐量运行。此外,Mistral Large 2 还配备了增强的函数调用和检索功能,能够执行并行和顺序函数调用,帮助构建更复杂的商业应用。
Mistral AI 公司在 7 月 24 日发布了这款新模型,紧随 Meta 推出 Llama 3.1 系列 LLM 之后。Llama 3.1 系列包括其模型 405B,具有 128K 的上下文长度,并支持八种语言。Mistral Large 2 的发布是对 Meta 和 OpenAI 发布的 GPT-4o mini 的直接竞争。
基准测试显示,Mistral Large 2 在编码和推理等领域的表现与领先模型如 GPT-4o、Claude 3 Opus 和 Llama 3 405B 相当。在流行的基准测试 MMLU 中,Mistral Large 2 取得了 84% 的得分,而 Llama 3.1 405B 得分为 88.6%,GPT-4o 得分为 88.7%。GPT-4o mini 得分为 82%。
Mistral Large 2 的应用场景非常广泛,特别是在需要处理大量数据和复杂任务的领域。其 128k 的上下文窗口使其在处理长查询和复杂任务时表现良好,适用于金融分析、法律文档处理、科学研究等领域。此外,Mistral Large 2 支持数十种语言和 80 多种编程语言,使其在全球范围内的应用更加广泛。