美团于2025年9月1日正式发布了其自主研发的大型语言模型 LongCat-Flash-Chat,并同步在GitHub和Hugging Face平台开源,同时上线官网。该模型是美团在人工智能领域的重要成果之一,旨在提供高效、准确的对话体验,并推动大模型技术的发展。
技术亮点与创新
LongCat-Flash-Chat 采用了创新的混合专家模型(Mixture-of-Experts, MoE)架构,总参数量高达560B,但通过“零计算专家”机制,仅激活18.6B-31.3B参数(平均约27B),实现了算力的高效利用和推理速度的提升。该模型在智能体任务中表现突出,推理速度超过100tps,适合复杂应用场景。