百度文心发布 PaddleOCR 文心作为文心衍生模型
近日,百度百度正式发布 PaddleOCR-VL-1.6。文心作为文心衍生模型,发布PaddleOCR-VL-1.6 在 OmniDocBench v1.6 权威评测中准确率突破 96.3%,百度在 Real5-OmniDocBench、文心OmniDocBench v1.5上也取得了最领先的发布分数,综合性能全球第一,百度刷新业界SOTA,文心在复杂文档理解和真实场景解析能力方面进一步突破。发布

在OmniDocBench v1.6上,百度PaddleOCR-VL-1.6在多项能力中实现SOTA
在权威评测集 OmniDocBench v1.6 上,文心PaddleOCR-VL-1.6 总指标达到 96.33%,发布超越Gemini-3-Pro、百度GPT-5.2、文心MinerU-2.5-Pro、发布GLM-OCR等,综合性能全球第一,领跑全球通用大模型和专用OCR模型;在面向真实复杂场景构建的 Real5-OmniDocBench 评测中,PaddleOCR-VL-1.6 总指标达到 93.19%,较 Gemini-3-Pro 提升近4个百分点,在扫描件、弯折文档、屏幕拍照、光照变化及倾斜文档等五大真实场景下均保持领先表现。
测试结果显示,PaddleOCR-VL-1.6 在文本、公式、表格等核心识别能力上全面领先当前主流开源及闭源方案,在表格、古籍、生僻字识别等复杂场景能力显著提升,在印章、Spotting、图表识别等多项关键能力同步增强,可更好满足文档数字化的需求。

据了解,PaddleOCR基于文心大模型训练而来,是文心大模型多模态能力的重要部分,支持超100种语言识别,用户覆盖170多个国家和地区。此次发布的 PaddleOCR-VL-1.6 在 PaddleOCR-VL-1.5 基础上进一步升级,通过模型驱动的数据构建机制和渐进式训练优化,在保持0.9B轻量化架构的情况下,模型准确率和复杂场景适应能力进一步提升。由于两代模型模型结构一致,开发者和企业用户无需进行额外适配,即可平滑迁移。
近年来,PaddleOCR 持续推进文档理解能力升级,先后推出 PaddleOCR-VL、PaddleOCR-VL-1.5 等多款模型。其中,PaddleOCR-VL-1.5 创新支持异形框定位,在真实文档场景中展现出较强解析能力。此前,PaddleOCR GitHub Star 数已突破79.2K,超过谷歌开源OCR项目 Tesseract OCR,成为全球最受开发者欢迎的开源OCR项目之一。
目前,PaddleOCR-VL-1.6 已上线 PaddleOCR 官网,支持网页端和API调用。同时,模型代码及权重已同步开源至 GitHub 和 Hugging Face,面向全球开发者开放使用。
相关文章

消息称三星 Galaxy Z Fold 8 折叠屏手机重 201 克,4500mAh 电池 +45W 快充
IT之家 6 月 2 日消息,过去一周,三星 Galaxy Z Fold 8 和 Galaxy Z Fold 8 Ultra 接连出现大量爆料。据悉,机身更宽的“阔折叠”新机将命名为 Galaxy Z2026-06-03
通用磨坊向柠季出售哈根达斯中国门店 零售及餐饮业务仍自主运营
6月2日上午消息,通用磨坊官宣,将旗下中国大陆哈根达斯实体门店业务出售给本土茶饮企业柠季。根据协议约定,柠季将获得通用磨坊的独家授权,可在中国大陆的冰淇淋门店及礼品业务中使用哈根达斯品牌;哈根达斯在中2026-06-03
◎ 科技日报记者 雍黎近日,在世界超级摩托车锦标赛WSBK)捷克站第二回合比赛中,张雪机车再度登顶,斩获本赛季第五个冠军。法国选手瓦伦丁·德比斯驾驶53号张雪机车820RR赛车在世界超级摩托车锦标赛葡2026-06-03
快科技6月2日消息,据媒体报道,软银集团掌门人孙正义Masayoshi Son)近日公开表示,人工智能浪潮才刚刚开始,其规模有可能是20多年前互联网热潮的“50倍”。“这轮AI浪潮的规模至少是互联网时2026-06-03
深耕手持影像十二年,大疆发布技术白皮书,Osmo Pocket 4P以口袋机身落地电影级画质
新浪数码讯,6月2日下午消息,大疆于北京召开“大疆光影十二载暨手持影像技术分享会”,现场发布《大疆手持影像十二载·技术历程》,复盘品牌十二年来在手持影像赛道的技术迭代与研发沉淀。本次发布会将Osmo2026-06-03
新浪科技讯 6月2日上午消息,近日,小红书App完成版本更新,并启用了“世界杯直播”新图标。5月27日,中央广播电视总台与小红书在北京举办战略合作签约仪式,正式宣布小红书成为2026年美加墨世界杯持权2026-06-03

最新评论