2025年10月15日,阿里巴巴旗下通义实验室今日正式发布 Qwen3-VL(Vision-Language)轻量级多模态大模型,专为移动端、边缘设备及低资源场景优化,显著降低多模态AI应用的部署门槛。
Qwen3-VL在保持强大图文理解能力的同时,模型体积压缩至原版Qwen-VL的三分之一以下,推理速度提升2倍以上,支持在智能手机、平板及IoT设备上流畅运行。该模型可精准完成图像描述、视觉问答、多语言图文检索等任务,适用于电商、教育、无障碍辅助等高频场景。
通义实验室表示,Qwen3-VL采用先进的知识蒸馏与量化技术,在轻量化过程中最大限度保留语义理解能力,并已通过阿里内部多个业务线验证。模型即日起在魔搭(ModelScope)平台开源,支持学术研究与商业应用。
此次发布标志着通义千问多模态技术体系进一步完善,为端侧智能提供高效、安全、可落地的AI解决方案。