2024 年 7 月 24 日,Mistral AI 发布了他们的最新模型 ——Mistral Large 2。这款模型在代码生成、数学推理和多语言支持方面有了提升。Mistral Large 2 只有 1230 亿参数,在特定领域的表现特别是在代码生成和数学推理上表现出色。在 MMLU 基准测试中,Mistral Large 2 取得了 84.0% 的准确率。
Mistral Large 2 的设计让它可以在单节点系统上运行,部署成本更低,适合通过无服务器 API 进行访问。Mistral Large 2 的权重已经发布,但仅限于非商业用途。如果要进行商业使用,需要获得 Mistral 的许可。
具体来看,它有以下特点:
- 参数数量:1230 亿参数
- 上下文窗口:128k tokens
- 多语言支持:覆盖 80 多种语言,包括英语、德语、法语、西班牙语和中文
- 编程语言支持:支持超过 80 种编程语言,如 Python、Java 和 C++
- 许可证:非商业许可,仅限研究用途
此外,Mistral Large 2 引入了函数调用功能。在 HumanEval 测试中,Mistral Large 2 取得了良好成绩,能处理各种编程语言的复杂代码生成任务,包括 Python、Java 和 C++。在数学推理领域,Mistral Large 2 在多个数学基准测试中表现良好,适用于科学研究和工程计算。