AntAngelMed开源医疗语言模型发布,三榜权威评测登顶
由浙江省卫生健康信息中心、蚂蚁健康与浙江省安诊儿医学人工智能科技有限公司联合研发的开源医疗语言模型AntAngelMed正式发布。该模型基于Ling-flash-2.0架构,采用MoE设计,总参数达100B但仅激活6.1B参数,性能约等同于40B密集模型,推理速度超过200 tokens/s。在权威医疗基准测评中,AntAngelMed表现突出:在OpenAI发布的HealthBench评测中超越所有开源模型及多个闭源模型,在更具挑战性的HealthBench-Hard子集上优势显著;在国家人工智能医疗产业先导区开发的MedAIBench基准上位居顶尖水平,医学知识问答和伦理安全性综合领先;在包含70万条样本的MedBench排行榜上也排名第一,并在医学知识问答、语言理解、语言生成、复杂推理及安全性伦理五大维度全面领先。模型采用三阶段训练流程:持续预训练使用大规模医学语料注入领域知识;监督微调通过多源异构数据集强化思维链与临床表现;强化学习采用GRPO算法塑造共情、结构清晰性与安全边界,减少幻觉。
|
|
|
|
|
|
|