法国人工智能初创公司 Mistral AI 最近发布了其多模态模型 Pixtral Large。该模型具有 1240 亿参数,能够处理文本和图像,具备多语言光学字符识别(OCR)及复杂图表理解能力。Pixtral Large 被整合到聊天应用 Le Chat 中,提供网页搜索、写作画布及图像生成功能,所有功能目前在 Le Chat 平台上均可免费体验。
Pixtral Large 设计用于多模态任务,结合了 1230 亿参数的解码器和一个 10 亿参数的视觉编码器,其 128K 上下文窗口可处理高达 30 张高分辨率图片。
Mistral 提供的研究许可证下,Pixtral Large 模型开放给学术研究用途。Le Chat 平台经过更新,支持 Mistral 模型,提供实时网页搜索和画布接口。Le Chat 还能够分析复杂的 PDF 和图像,通过与 Flux Pro 模型的结合,在聊天界面中生成图像。此外,自动化任务代理功能简化了工作流程。