商汤科技开源日日新 SenseNova U1 模型,基于 NEO-Unify 架构实现多模态理解生成统一
商汤科技正式发布并开源日日新 SenseNova U1 系列原生理解生成统一模型。SenseNova U1 基于商汤自研 NEO-Unify 架构,首次在单一模型上实现多模态理解、推理与生成的真正统一,摒弃了传统视觉编码器与大语言模型拼凑的模式。SenseNova U1 支持连续性图文创作,能在推理同时同步生成图像,保持逻辑连贯性,并可自动提炼核心信息生成排版精美的信息图。在性能方面,SenseNova U1 Lite 参数量仅为 8B/A3B,却在图像理解、生成及视觉推理测试中达到同量级开源模型 SOTA 水平,生成质量逼近大型商业闭源模型,信息图生成延迟约 15 秒。应用场景涵盖智能文档解析、营销海报生成、图像精准编辑及机器人具身智能等领域。目前 SenseNova U1 已在 GitHub 和 Hugging Face 全面开源。
|
|
|
|
|
|
|
|