SuperCLUE-VLM 12月评测揭晓:Gemini-3-Pro强势霸榜,国产模型集体崛起
2025年12月31日,权威AI评测机构SuperCLUE发布最新一期《中文多模态视觉语言模型基准测评(SuperCLUE-VLM)》12月榜单。谷歌最新大模型 Gemini-3-Pro 以总分 83.64 分遥遥领先,三项核心能力——基础认知(89.01)、视觉推理(82.82)与视觉应用(79.09)均位列第一,稳居全球榜首。
国产大模型表现亮眼:商汤SenseNova V6.5 Pro 以75.35分位居第二,字节跳动豆包大模型 凭借73.15分跻身前三。此外,阿里巴巴Qwen3-VL 成为首个突破70分的开源模型,彰显中国在多模态AI领域的快速进步。
值得注意的是,OpenAI的 GPT-5.2(high) 本次仅得69.16分,意外跌出第一梯队;Anthropic的Claude-opus-4-5得分71.44,亦未进入前三。
SuperCLUE-VLM评测体系聚焦真实场景,涵盖常识问答、空间推理、医疗影像、自动驾驶等数十项任务,已成为衡量多模态大模型“眼力+脑力”的重要标尺。本次结果标志着全球多模态AI竞争格局正加速重塑。