2025年9月28日,腾讯在AI技术领域再迎重大突破——正式发布并开源全新一代图像生成模型“混元图像3.0”(HunyuanImage 3.0)。该模型参数规模高达800亿,是目前业界参数最大、能力最强的开源工业级原生多模态生图模型,生成效果对标全球顶尖闭源模型。
混元图像3.0采用统一架构,实现文字、图像等多模态信息的深度融合与协同生成,具备常识推理、复杂语义理解、高精度文字渲染与极致美学质感等核心能力。用户仅需输入一段长文本指令,即可生成结构清晰、风格统一、图文并茂的高质量图像,广泛适用于广告海报、电商素材、插画设计、表情包创作等多元场景。
作为首个“原生多模态”开源模型,混元图像3.0摒弃了传统“语言模型+图像模型”的拼接方式,由单一模型完成从理解到生成的全过程,显著提升生成一致性与创作效率。实测显示,模型可精准还原“鸡排哥”等真实人物场景,生成包含复杂中文文案的街头海报,甚至完成多角色、多动作的市井生活图景。
目前,混元图像3.0已在腾讯混元官网开放体验入口,并同步上线GitHub与Hugging Face等开源平台,支持企业和个人开发者免费下载与商用。腾讯表示,未来将持续开放图生图、图像编辑、多轮交互等进阶功能,进一步推动AIGC技术在创意产业的普惠化与专业化落地。
体验地址:
https://hunyuan.tencent.com/image