苹果公司最近发布了小模型DCLM-7B,该模型在性能上超越了Mistral-7B。根据多条证据显示,DCLM-7B包含两种参数规模——70亿和14亿,并且发布即开源。其中,最大70亿参数的版本在基准测试中表现尤为突出,不仅超越了Mistral-7B,还接近Llama 3和Gemma等其他领先的开源模型。
此外,苹果的ML小组研究科学家Vaishaal Shankar也参与了这一项目的开发,并对DCLM-7B的性能进行了详细评估。值得注意的是,苹果此次发布的DCLM-7B模型不仅在性能上具有优势,而且其开源策略也得到了广泛好评,包括模型权重、训练代码和预训练数据集的全面开放。 尽管Mistral AI团队也在积极推广其Mistral 7B模型,并在多个任务中表现出色,但苹果的DCLM-7B无疑在小模型领域中占据了重要地位,并且通过开源进一步推动了技术的发展和应用。 ![]() |