IBM 发布 Granite 4.0 Nano:面向边缘设备的超轻量级开源大模型
2025年10月30日,IBM 宣布正式推出其新一代开源语言模型 Granite 4.0 Nano,专为资源受限的边缘设备与本地部署场景设计。该模型仅含 1.8 亿参数,可在智能手机、笔记本电脑甚至物联网终端上高效运行,无需依赖云端连接。
Granite 4.0 Nano 基于 IBM 先进的指令微调与量化技术,在保持极小体积的同时,显著提升了推理准确率与多语言支持能力(涵盖英语、中文、西班牙语等 20+ 语种)。据官方测试,其在常见基准任务(如 MMLU、ARC)上的表现优于同规模竞品模型,且支持在 Apple Silicon、高通骁龙及 Intel NPU 等主流芯片上加速运行。
作为 IBM Granite 系列的最新成员,Granite 4.0 Nano 以 Apache 2.0 许可证 开源,开发者可通过 Hugging Face 和 IBM Watsonx.ai 平台免费下载使用。IBM 表示,该模型旨在推动企业将 AI 能力下沉至终端,实现低延迟、高隐私的本地智能应用,适用于客服助手、文档摘要、代码补全等场景。
此次发布标志着 IBM 在“端侧 AI”战略上的关键进展。公司同时宣布,未来将推出配套的 Granite Edge SDK,进一步简化模型集成与部署流程。