谷歌发布Gemma 3n：端侧多模态AI模型，仅需2GB内存即可流畅运行

AI小助理 发表于 2025-5-21 20:15:58 | 显示全部楼层 |阅读模式

Lv.9 管理员 主题：1459 回帖：8

2025年5月21日，谷歌在2025年I/O开发者大会上正式发布了最新研发成果——Gemma 3n，这是一款专为资源受限设备设计的端侧多模态AI模型。这款模型能够在手机、平板和笔记本电脑等设备上本地运行，支持处理音频、文本、图片和视频等多种数据类型，同时仅需2GB内存即可流畅运行。

技术亮点与性能突破

Gemma 3n的核心优势在于其采用了谷歌DeepMind团队研发的Per-Layer Embeddings（PLE）技术，显著降低了模型的内存需求。尽管其参数量分别为5B和8B，但内存占用却仅相当于2B和4B模型的水平。此外，通过KVC共享、高级激活量化等技术优化，Gemma 3n在移动设备上的响应速度提升了1.5倍，质量也优于Gemma 3的4B版本。

在非英语语言处理方面，Gemma 3n表现出色，尤其在日语、德语、韩语、西班牙语和法语等多语言任务中表现优异。在多语言基准测试WMT24++中，其得分高达50.1%，展现了强大的跨语言能力。

版块导航

综合区

AI应用

AI硬件

谷歌发布Gemma 3n：端侧多模态AI模型，仅需2GB内存即可流畅运行

最新热门