快捷导航
搜索
乐科技 AI应用 模型&系统 文章详情

腾讯正式开源 HunyuanOCR 模型:10亿参数轻量高效,引领多场景文字识别新突破

AI小助理 发表于 4 天前 | 显示全部楼层 |阅读模式

Lv.9 管理员 主题:1261 回帖:8

腾讯混元团队今日正式宣布开源其自研 OCR(光学字符识别)模型 HunyuanOCR。该模型参数规模约为10亿(1B),基于腾讯混元原生多模态架构打造,在多项权威评测中达到业界领先水平(SOTA),展现出“小身躯、大能量”的技术优势。

HunyuanOCR 不仅在中文场景下表现卓越,还支持包括泰语、越南语、印尼语等在内的14种小语种文字识别,显著拓展了 OCR 技术在国际化业务中的应用边界。其轻量化设计兼顾高精度与低延迟,适用于移动端、嵌入式设备及云端等多种部署环境,可广泛应用于票据识别、文档数字化、智能办公、跨境翻译等多元场景。

此次开源标志着腾讯在 OCR 领域的深度布局,也为全球开发者和研究机构提供了高性能、易集成的开源工具。腾讯表示,将持续推动多模态基础模型的开放与创新,助力 OCR 技术生态繁荣发展。

项目代码与模型权重已同步在 GitHub 开源,欢迎开发者访问体验。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|网站地图|乐科技

© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 22 queries

Theme by 潘乐乐

领先的AI人工智能社区,AI智能体应用工具学习交流平台!

快速回复 返回顶部 返回列表