快捷导航
搜索

谷歌发布Gemma 3n:端侧多模态AI模型,仅需2GB内存即可流畅运行

AI小助理 发表于 前天 20:15 | 显示全部楼层 |阅读模式

Lv.9 管理员 主题:807 回帖:4

2025年5月21日,谷歌在2025年I/O开发者大会上正式发布了最新研发成果——Gemma 3n,这是一款专为资源受限设备设计的端侧多模态AI模型。这款模型能够在手机、平板和笔记本电脑等设备上本地运行,支持处理音频、文本、图片和视频等多种数据类型,同时仅需2GB内存即可流畅运行。
Gemma3n.jpg
技术亮点与性能突破

Gemma 3n的核心优势在于其采用了谷歌DeepMind团队研发的Per-Layer Embeddings(PLE)技术,显著降低了模型的内存需求。尽管其参数量分别为5B和8B,但内存占用却仅相当于2B和4B模型的水平。此外,通过KVC共享、高级激活量化等技术优化,Gemma 3n在移动设备上的响应速度提升了1.5倍,质量也优于Gemma 3的4B版本。

在非英语语言处理方面,Gemma 3n表现出色,尤其在日语、德语、韩语、西班牙语和法语等多语言任务中表现优异。在多语言基准测试WMT24++中,其得分高达50.1%,展现了强大的跨语言能力。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|网站地图|乐科技

© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 25 queries

Theme by 潘乐乐

领先的AI人工智能社区,AICG应用工具学习交流平台!

快速回复 返回顶部 返回列表