PartCrafter:一句话、一张图生成3D模型
北京大学、字节跳动公司及卡内基梅隆大学联合研发的PartCrafter技术,于2025年6月在计算机视觉领域顶级会议上发表,成功实现了一张照片即可生成完整3D模型并拆解为独立零件的突破性进展。这项技术不仅能够识别物体的外观,还能推测其内部结构,即使部分结构被遮挡也能准确重建。与传统3D重建技术仅能生成整体模型不同,PartCrafter通过“同时多任务”策略,将模型分解为可操作的独立零件,如椅子的椅背、座垫、扶手和椅腿等,每个零件都能单独调整,极大提升了设计与制造的灵活性。
PartCrafter的核心创新在于其“本地-全局”注意力机制,使AI既能关注每个零件的细节,又能统筹整体结构的协调性,确保生成的零件在形状和配合上都达到高质量标准。此外,研究团队通过大量数据挖掘,从3D模型中提取零件信息,开发了专门的“考古工具”,并精心筛选高质量模型用于训练,确保数据的多样性和准确性。在实战测试中,PartCrafter不仅准确识别和重建复杂场景中的物体,还显著优于现有技术,在生成质量和速度上均取得突破。
这一技术的发布标志着AI在3D建模领域迈出了重要一步,为游戏设计、工业制造、建筑可视化等多个行业提供了前所未有的便利。未来,随着更多类似工具的出现,如Artefacts.Ai和One-2-3-45等,从单张图片生成3D模型的速度将越来越快,甚至可在45秒内完成。这些进展不仅降低了3D建模的门槛,也为创意产业带来了无限可能。