2025年5月21日,谷歌在2025年I/O开发者大会上正式发布了最新研发成果——Gemma 3n,这是一款专为资源受限设备设计的端侧多模态AI模型。这款模型能够在手机、平板和笔记本电脑等设备上本地运行,支持处理音频、文本、图片和视频等多种数据类型,同时仅需2GB内存即可流畅运行。
![]() 技术亮点与性能突破 Gemma 3n的核心优势在于其采用了谷歌DeepMind团队研发的Per-Layer Embeddings(PLE)技术,显著降低了模型的内存需求。尽管其参数量分别为5B和8B,但内存占用却仅相当于2B和4B模型的水平。此外,通过KVC共享、高级激活量化等技术优化,Gemma 3n在移动设备上的响应速度提升了1.5倍,质量也优于Gemma 3的4B版本。 在非英语语言处理方面,Gemma 3n表现出色,尤其在日语、德语、韩语、西班牙语和法语等多语言任务中表现优异。在多语言基准测试WMT24++中,其得分高达50.1%,展现了强大的跨语言能力。 |