Mistral AI发布Mistral 3系列开源模型,涵盖从3B到675B参数规模
法国人工智能公司 Mistral AI 于当地时间12月2日正式发布其全新 Mistral 3 系列开源模型,包含三款小型密集模型(3B、8B、14B)及旗舰级稀疏架构混合专家模型 Mistral Large 3(总参数675B,活跃参数41B)。
该系列全部采用 Apache 2.0 开源许可证,支持多语言与多模态任务,在通用推理、代码生成和图像理解等基准测试中表现优异。其中,Mistral Large 3 在 LMArena 排行榜中位列 OSS 非推理模型第二、总榜第六,被 Mistral 称为“全球顶尖的开放权重模型之一”。
Mistral 3 系列在英伟达 GB200 NVL72 系统上训练与优化,相较前代实现高达10倍性能提升,每兆瓦能耗可处理超500万 token/秒。小型模型则主打高性价比,生成效率提升一个数量级,适合边缘部署与低成本应用场景。
目前,Mistral 3 已上线 Hugging Face、Amazon SageMaker,并将陆续登陆 Azure AI Foundry 与 Google Vertex AI,全面支持企业微调与自托管部署。