2024 年 2 月 27 日,Mistral AI 发布了其最新的旗舰模型 Mistral Large,该模型直接对标 OpenAI 的 GPT-4。Mistral AI 还宣布与微软合作,将其模型引入 Azure 云平台。
Mistral AI 成立于 2023 年 5 月,由来自 Meta Platforms 和 Alphabet 的几位前研究人员 Arthur Mensch、Guillaume Lample 和 Timothee Lacroix 共同创立。成立不到四周,Mistral AI 就获得了 1.13 亿美元的种子轮融资,估值约为 2.6 亿美元。成立半年后,他们在 A 轮融资中筹集了 4.15 亿美元,估值达到 20 亿美元,而此时,他们仅有 22 名员工。
Mistral Large 2 是 Mistral AI 最新发布的旗舰模型,拥有 1230 亿参数,支持 128,000 个 tokens 的上下文窗口,并且支持多种语言,包括法语、德语、西班牙语、阿拉伯语、中文、日语和韩语。该模型在代码生成和数学性能方面表现良好,在 Java 代码生成方面超过了 GPT-4。
在与其他 AI 模型的对比中,Mistral Large 2 在多个基准测试中表现良好。例如,在多语言理解任务基准 MMLU 上,Mistral Large 2 的表现仅次于 GPT-4;在多语言能力的基准测评对比中,Mistral Large 2 的表现优于 70B 参数规模的 Llama 2。此外,Mistral Large 2 还支持超过 80 种编程语言,包括 Python、Java、C、C++、JavaScript 和 Bash。
根据公告,微软与 Mistral AI 的合作主要集中在三个核心领域:
- 超算基础设施:微软将通过 Azure AI 超级计算基础设施支持 Mistral AI,为 Mistral AI 旗舰模型的 AI 训练和推理工作负载提供性能和规模。
- 市场推广:微软和 Mistral AI 将通过 Azure AI Studio 和 Azure 机器学习模型目录中的模型即服务(MaaS)向客户提供 Mistral AI 的模型。除 OpenAI 模型外,模型目录还提供了多种开源和商业模型。
- 人工智能研发:微软和 Mistral AI 将探索为特定客户训练特定目的模型的合作。
除了微软,Mistral AI 还一直在与亚马逊和谷歌合作,分销自己的模型。Mistral AI 的部分模型可以通过 Google Cloud Platform 的 Vertex AI、Amazon Bedrock 和 IBM Watsonx 等平台获取。
Mistral AI 的市场推广策略也非常明确。公司计划通过多种渠道推广其模型,包括 API 接口、开发者文档和示例代码,旨在降低开发者的使用门槛,加速生成式 AI 技术的普及和应用。Mistral AI 还推出了名为 Le Chat 的聊天助手,直接对标 ChatGPT。