2025年12月26日 — 小红书智能创作AIGC团队与复旦大学联合发布并开源全新布局可控图像生成框架 InstanceAssemble,显著提升AI在复杂多对象场景下的构图精准度。
InstanceAssemble 基于扩散变换器(DiT)架构,创新性引入“实例组装注意力”(Assemble-Attention)机制与级联生成流程,可在仅增加约3%参数量的前提下,精确控制图像中每个物体的位置、语义与风格。该方法特别适用于高密度、多实例、空间关系复杂的图像生成任务。
项目已在 GitHub 开源(
https://github.com/FireRedTeam/InstanceAssemble),包含预训练模型与推理代码,并同步发布新评测基准 DenseLayout 与指标 LGS(Layout Grounding Score),推动布局生成领域的标准化评估。
该技术已应用于小红书图文内容创作场景,未来有望拓展至广告设计、虚拟制片、智能排版等领域。