阿里通义千问的Qwen2-72B模型在斯坦福大学的大模型测评榜单HELM MMLU中取得了显著的成绩,成为排名最高的开源大模型。这一成就得到了斯坦福大学基础模型研究中心主任Percy Liang的确认和公开发文表扬。Qwen2-72B的性能不仅超越了Llama3-70B模型,还超过了其他业界知名的模型,如文心4.0和豆荚大模型。
此外,Qwen2-72B在大规模模型上实现了非常大幅度的效果提升,特别是在预训练语言模型的评估中,与当前最优的开源模型相比,Qwen2-72B在多个方面都表现出色。这一成果不仅展示了阿里巴巴在AI领域的技术实力,也吸引了众多AI开发者的关注。 |