快手发布Keye-VL-2.0-30B-A3B多模态大模型,DSA机制解锁256K超长上下文
快手团队正式发布了新一代多模态大模型Keye-VL-2.0-30B-A3B。该模型作为Keye家族的30B级主力基座,首次在多模态理解场景中成功应用了DSA(DeepSeek Sparse Attention)机制,从而突破了超长视觉上下文带来的算力瓶颈,实现了256K超长上下文的深度感知与几乎无损的时序推理能力。
在权威基准测试中,Keye-VL-2.0-30B-A3B展现出卓越的长视频理解能力,在TimeLens等细粒度视频时序理解榜单上,其性能与Gemini 3 Flash、Gemini 3.1 Pro等顶级闭源模型相当甚至超越,并在VideoMME V2等测试中打破了“输入帧数越多准确率越低”的魔咒。
此外,模型首次内置了Agent协作机制,在代码生成、工具使用与搜索等复杂任务中具备初步的系统级协作与执行潜力,在LivecodeBench等代码基准上超越了部分参数量更大的开源模型。快手团队还构建了专为长视频训练服务的Infra系统,通过异构并行等优化手段将长序列训练性能相比开源方案直接翻倍,有效降低了推理与训练成本。
|
|
|
|
|
|
|