全球领先的 OCR 工具包与文档 AI 引擎
[English](../README.md) | 简体中文| [繁體中文](./README_tcn.md) | [日本語](./README_ja.md) | [한국어](./README_ko.md) | [Français](./README_fr.md) | [Русский](./README_ru.md) | [Español](./README_es.md) | [العربية](./README_ar.md)
[](https://pepy.tech/projects/paddleocr)
[](https://github.com/PaddlePaddle/PaddleOCR/network/dependents)



[](https://www.paddleocr.com)
[](https://deepwiki.com/PaddlePaddle/PaddleOCR)
[](../LICENSE)
**PaddleOCR 以业界领先的精准度,将 PDF 文档和图像转换为结构化、LLM 友好的数据格式(JSON/Markdown)。凭借 70,000+ Stars 的成绩,PaddleOCR 已获得 Dify、RAGFlow、Cherry Studio 等顶级项目的广泛信赖,是构建智能 RAG 和 Agentic 应用的核心基础组件。**
## 🚀 核心特性
### 📄 智能文档解析(面向大模型)
> *为大模型时代将杂乱的文档视觉信息转化为结构化数据。*
* **SOTA 级文档视觉语言模型 (VLM)**: 业界领先的轻量级文档解析视觉语言模型 **PaddleOCR-VL-1.6 (0.9B)**。该模型以 96.3% 精度刷新 OmniDocBench v1.6,文本、公式、表格识别全面领先,并在古籍、生僻字、印章、图表等多场景能力显著增强,支持以 **Markdown** 和 **JSON** 格式输出结构化结果。
* **版面结构分析**:由 **PP-StructureV3** 驱动,无缝将复杂的 PDF文档 和图像转换为 **Markdown** 或 **JSON** 格式。与 PaddleOCR-VL 系列模型不同,它提供更细粒度的坐标信息,包括表格单元格坐标、文本坐标等。
* **生产级高效能**:以极小的模型体积实现商业级别的准确率。在公开基准测试中超越众多闭源解决方案,同时保持极高的资源利用率,完美适配边缘计算与云端部署。
### 🔍 通用文本识别(场景 OCR)
> *快速、精准的多语言文本检测与识别,被全球开发者广泛采用。*
* **支持 100+ 种语言**:原生支持庞大丰富的全球语种库。**PP-OCRv6** 单模型统一支持 50 种语言(中、英、日及 46 种拉丁语系),无需切换模型即可应对多语言混合排版文档。
* **复杂场景支持**:除了标准的文本识别,还支持在各种广泛的环境下进行**自然场景文本检测与识别**,涵盖身份证件、街景、书籍以及工业零部件等。
* **性能提升**:PP-OCRv6 相比 PP-OCRv5 检测精度提升 **4.6%**、识别精度提升 **5.1%**,超越主流视觉语言大模型,CPU 推理加速 5.2×。
PaddleOCR 的发展离不开社区贡献!💗衷心感谢所有开发者、合作伙伴与贡献者!
| 项目名称 | 简介 |
| ------------ | ----------- |
| [RAGFlow](https://github.com/infiniflow/ragflow)

|基于RAG的AI工作流引擎|
| [pathway](https://github.com/pathwaycom/pathway)

|用于流处理、实时分析、LLM流水线和RAG的Python ETL框架|
| [MinerU](https://github.com/opendatalab/MinerU)

|多类型文档转换Markdown工具|
| [Umi-OCR](https://github.com/hiroi-sora/Umi-OCR)

|开源批量离线OCR软件|
| [cherry-studio](https://github.com/CherryHQ/cherry-studio)

|一个支持多个LLM提供商的桌面客户端|
| [OmniParser](https://github.com/microsoft/OmniParser)

|基于纯视觉的GUI智能体屏幕解析工具|
| [QAnything](https://github.com/netease-youdao/QAnything)

|基于任意内容的问答系统|
| [PDF-Extract-Kit](https://github.com/opendatalab/PDF-Extract-Kit)

|高效复杂PDF文档提取工具包|
| [Dango-Translator](https://github.com/PantsuDango/Dango-Translator)

|屏幕实时翻译工具|
| [更多项目](../awesome_projects.md) | [更多基于PaddleOCR的项目](../awesome_projects.md) |
## 👩👩👧👦 贡献者