全球領先的 OCR 工具包與文檔 AI 引擎
[English](../README.md) | [简体中文](./README_cn.md)| 繁體中文 | [日本語](./README_ja.md) | [한국어](./README_ko.md) | [Français](./README_fr.md) | [Русский](./README_ru.md) | [Español](./README_es.md) | [العربية](./README_ar.md)
[](https://pepy.tech/projects/paddleocr)
[](https://github.com/PaddlePaddle/PaddleOCR/network/dependents)



[](https://www.paddleocr.com)
[](https://deepwiki.com/PaddlePaddle/PaddleOCR)
[](../LICENSE)
**PaddleOCR 以業界領先的精準度,將 PDF 文件和圖像轉換為結構化、LLM 友好的資料格式(JSON/Markdown)。憑藉 70,000+ Stars 的成績,PaddleOCR 已獲得 Dify、RAGFlow、Cherry Studio 等頂級專案的廣泛信賴,是建構智慧 RAG 和 Agentic 應用的核心基礎元件。**
## 🚀 核心特性
### 📄 智能文檔解析(面向大模型)
> *為大模型時代將雜亂的文檔視覺信息轉化為結構化數據。*
* **SOTA 級文檔視覺語言模型 (VLM)**: 業界領先的輕量級文檔解析視覺語言模型 **PaddleOCR-VL-1.6 (0.9B)**。該模型以 96.3% 精度刷新 OmniDocBench v1.6,文本、公式、表格識別全面領先,並在古籍、生僻字、印章、圖表等多場景能力顯著增強,支持以 **Markdown** 和 **JSON** 格式輸出結構化結果。
* **版面結構分析**:由**PP-StructureV3**驅動,無縫將複雜的PDF和圖像轉換為**Markdown**或**JSON**格式。與PaddleOCR-VL系列模型不同,它提供更細粒度的坐標信息,包括表格單元格坐標、文本坐標等,
* **生產級高效能**:以極小的模型體積實現商業級別的準確率。在公開基準測試中超越眾多閉源解決方案,同時保持極高的資源利用率,完美適配邊緣計算與雲端部署。
### 🔍 通用文本識別(場景 OCR)
> *快速、多語言文本檢測與識別的全球黃金標準。*
* **支持 100+ 種語言**:原生支持龐大豐富的全球語種庫。**PP-OCRv6** 單模型統一支持 50 種語言(中、英、日及 46 種拉丁語系),無需切換模型即可應對多語言混合排版文檔。
* **複雜場景支持**:除了標準的文本識別,我們還支持在各種廣泛的環境下進行**自然場景文本檢測與識別**,涵蓋身份證件、街景、書籍以及工業零部件等。
* **性能提升**:PP-OCRv6 相比 PP-OCRv5 檢測精度提升 **4.6%**、識別精度提升 **5.1%**,超越主流視覺語言大模型,CPU 推理加速 5.2×。
PaddleOCR 的發展離不開社區貢獻!💗衷心感謝所有開發者、合作夥伴與貢獻者!
| 項目名稱 | 簡介 |
| ------------ | ----------- |
| [RAGFlow](https://github.com/infiniflow/ragflow)

|基於RAG的AI工作流引擎|
| [pathway](https://github.com/pathwaycom/pathway)

|用於流處理、實時分析、LLM流水線和RAG的Python ETL框架|
| [MinerU](https://github.com/opendatalab/MinerU)

|多類型文檔轉換Markdown工具|
| [Umi-OCR](https://github.com/hiroi-sora/Umi-OCR)

|開源批量離線OCR軟件|
| [cherry-studio](https://github.com/CherryHQ/cherry-studio)

|一個支持多個LLM提供商的桌面客戶端|
| [OmniParser](https://github.com/microsoft/OmniParser)

|基於純視覺的GUI智能體屏幕解析工具|
| [QAnything](https://github.com/netease-youdao/QAnything)

|基於任意內容的問答系統|
| [PDF-Extract-Kit](https://github.com/opendatalab/PDF-Extract-Kit)

|高效複雜PDF文檔提取工具包|
| [Dango-Translator](https://github.com/PantsuDango/Dango-Translator)

|屏幕實時翻譯工具|
| [更多項目](../awesome_projects.md) | [更多基於PaddleOCR的項目](../awesome_projects.md) |
## 👩👩👧👦 貢獻者