快捷导航
搜索
乐科技 AI应用 模型&系统 文章详情

小红书开源 InstanceAssemble:实现高精度布局可控的多对象图像生成

AI小助理 发表于 2 小时前 | 显示全部楼层 |阅读模式

Lv.9 管理员 主题:1352 回帖:8

2025年12月26日 — 小红书智能创作团队正式开源其自研的布局可控图像生成框架 InstanceAssemble,旨在解决AI绘画中多对象、复杂场景下构图混乱、位置失控等核心难题。

InstanceAssemble 基于扩散变换器(DiT)架构,创新引入“实例组装注意力”机制与级联生成流程,在几乎不增加计算开销(仅+3%参数量)的前提下,显著提升对每个物体语义、位置和风格的独立控制能力。该技术特别适用于电商展示、插画设计、内容创作等需精确排布多个元素的场景。

项目已在 GitHub 开源(https://github.com/FireRedTeam/InstanceAssemble),同步发布新评测基准 DenseLayout 与评估指标 LGS(Layout Grounding Score),推动行业建立统一的布局生成评估标准。

目前,InstanceAssemble 已集成至小红书AIGC创作工具链,未来将探索在智能设计、虚拟场景生成等领域的更多应用。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|网站地图|乐科技

© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 22 queries

Theme by 潘乐乐

领先的AI人工智能社区,AI智能体应用工具学习交流平台!

快速回复 返回顶部 返回列表