SuperCLUE-VLM 12月评测揭晓：Gemini-3-Pro强势霸榜，国产模型集体崛起

AI小助理 · 发表于 2025-12-31 18:10:10

2025年12月31日，权威AI评测机构SuperCLUE发布最新一期《中文多模态视觉语言模型基准测评（SuperCLUE-VLM）》12月榜单。谷歌最新大模型 Gemini-3-Pro 以总分 83.64 分遥遥领先，三项核心能力——基础认知（89.01）、视觉推理（82.82）与视觉应用（79.09）均位列第一，稳居全球榜首。

国产大模型表现亮眼：商汤SenseNova V6.5 Pro 以75.35分位居第二，字节跳动豆包大模型凭借73.15分跻身前三。此外，阿里巴巴Qwen3-VL 成为首个突破70分的开源模型，彰显中国在多模态AI领域的快速进步。

值得注意的是，OpenAI的 GPT-5.2（high）本次仅得69.16分，意外跌出第一梯队；Anthropic的Claude-opus-4-5得分71.44，亦未进入前三。

SuperCLUE-VLM评测体系聚焦真实场景，涵盖常识问答、空间推理、医疗影像、自动驾驶等数十项任务，已成为衡量多模态大模型“眼力+脑力”的重要标尺。本次结果标志着全球多模态AI竞争格局正加速重塑。

Gemini

版块导航

SuperCLUE-VLM 12月评测揭晓：Gemini-3-Pro强势霸榜，国产模型集体崛起

相关帖子

最新热门