Meta 发布了 DINOv3,这是一个在自监督学习领域具有里程碑意义的视觉模型。DINOv3 通过自监督学习(SSL)技术,无需人工标注数据即可训练,从而在多个视觉任务中取得了卓越的性能。该模型在 1.7 亿张图像上进行了训练,模型参数规模达到 70 亿,显著超越了前代模型 DINOv2。DINOv3 的核心优势在于其创新的自监督学习技术和庞大的训练数据集,使其在密集预测任务(如目标检测、语义分割和相对深度估计)中表现出色。
DINOv3 的发布不仅标志着自监督学习在计算机视觉领域的重大突破,也为图像理解开启了新的篇章。该模型的开源和商业许可模式,为研究人员和开发者提供了强大的工具,以推动计算机视觉领域的进一步发展。此外,DINOv3 的应用范围广泛,包括环境监测、医疗影像分析、自动驾驶和安全监控等领域。