2025年12月26日 — 小红书智能创作团队正式开源其自研的布局可控图像生成框架 InstanceAssemble,旨在解决AI绘画中多对象、复杂场景下构图混乱、位置失控等核心难题。
InstanceAssemble 基于扩散变换器(DiT)架构,创新引入“实例组装注意力”机制与级联生成流程,在几乎不增加计算开销(仅+3%参数量)的前提下,显著提升对每个物体语义、位置和风格的独立控制能力。该技术特别适用于电商展示、插画设计、内容创作等需精确排布多个元素的场景。
项目已在 GitHub 开源(
https://github.com/FireRedTeam/InstanceAssemble),同步发布新评测基准 DenseLayout 与评估指标 LGS(Layout Grounding Score),推动行业建立统一的布局生成评估标准。
目前,InstanceAssemble 已集成至小红书AIGC创作工具链,未来将探索在智能设计、虚拟场景生成等领域的更多应用。