2025年6月6日,字节跳动正式发布了其最新一代图像编辑模型 SeedEdit 3.0,标志着图像编辑技术迈入了一个更加高效、自然、可控的新阶段。该模型基于其文生图大模型 Seedream 3.0,结合多种数据融合策略和专用奖励模型,实现了对图像主体、背景和细节的深度保持与精准编辑。
核心功能与技术亮点
更高效、更自然的图像编辑
SeedEdit 3.0 在图像编辑的“丝滑”和“高效”方面表现突出,尤其在人像编辑、背景更改、视角与光线转换等复杂场景中,模型能够自然地处理编辑区域,同时高保真地维持其他信息。例如,当用户需要移除图片中的行人及其影子时,模型不仅能够准确识别并移除场景内的无关人物,还能一并处理其影子,确保编辑结果的自然完整。
支持4K图像处理
该模型能够处理并生成4K分辨率的图像,确保在精细且自然地处理编辑区域的同时,还能高保真地维持其他信息。这种能力使得 SeedEdit 3.0 在处理高分辨率图像时,能够提供更高质量的输出。
更强的指令理解与执行能力
SeedEdit 3.0 在“哪里改与哪里不改”的取舍上表现出更佳的理解力和权衡力,可用率相应提高。用户只需通过简单的自然语言指令,即可实现修图、换装、美化、风格转换、在指定区域添加或删除元素等操作。例如,用户可以通过一句话指令将“STOP”改为“WARM”,从而实现对图像的精准控制。
多轮编辑与连续创作
除了单次编辑,SeedEdit 3.0 还支持多轮编辑操作,允许用户对同一图像进行连续的创意编辑。这一功能使得用户可以逐步优化图像效果,实现更复杂的编辑任务。
数据融合与奖励模型优化
为了实现上述能力,团队在 SeedEdit 3.0 的研发工作中提出了一种高效的数据融合策略,并构建了多种专用奖励模型。通过将这些奖励模型与扩散模型联合训练,团队针对性地改善了关键任务的编辑质量,如人脸对齐、文本渲染等。
推理加速与实际落地
在实际落地中,团队对推理加速进行了同步优化,确保模型在实际应用中能够快速响应,提升用户体验。
未来发展方向
字节跳动表示,除进一步优化编辑性能外,未来团队还将探索更丰富的编辑操作,让模型拥有连续多图生成、多张图像合成、故事性内容生成等能力。这将为用户带来更加多样化的创作体验,推动图像编辑技术向更高层次发展。
应用场景与用户反馈
目前,SeedEdit 3.0 已在即梦网页端和豆包 App 上线测试,用户可以通过这些平台体验其强大的图像编辑功能。许多用户对其简便的操作和高质量的编辑效果表示赞赏,但也有一些用户提出了改进建议,例如希望增加更多的编辑选项以满足更复杂的需求。