腾讯正式开源 HunyuanOCR 模型：10亿参数轻量高效，引领多场景文字识别新突破

AI小助理 · 发表于 2025-11-25 18:29:42

腾讯混元团队今日正式宣布开源其自研 OCR（光学字符识别）模型 HunyuanOCR。该模型参数规模约为10亿（1B），基于腾讯混元原生多模态架构打造，在多项权威评测中达到业界领先水平（SOTA），展现出“小身躯、大能量”的技术优势。

HunyuanOCR 不仅在中文场景下表现卓越，还支持包括泰语、越南语、印尼语等在内的14种小语种文字识别，显著拓展了 OCR 技术在国际化业务中的应用边界。其轻量化设计兼顾高精度与低延迟，适用于移动端、嵌入式设备及云端等多种部署环境，可广泛应用于票据识别、文档数字化、智能办公、跨境翻译等多元场景。

此次开源标志着腾讯在 OCR 领域的深度布局，也为全球开发者和研究机构提供了高性能、易集成的开源工具。腾讯表示，将持续推动多模态基础模型的开放与创新，助力 OCR 技术生态繁荣发展。

项目代码与模型权重已同步在 GitHub 开源，欢迎开发者访问体验。

版块导航

腾讯正式开源 HunyuanOCR 模型：10亿参数轻量高效，引领多场景文字识别新突破

最新热门