Kit de OCR líder mundial y motor de IA para documentos
[English](../README.md) | [简体中文](./README_cn.md) | [繁體中文](./README_tcn.md) | [日本語](./README_ja.md) | [한국어](./README_ko.md) | [Français](./README_fr.md) | [Русский](./README_ru.md) | Español | [العربية](./README_ar.md)
[](https://pepy.tech/projects/paddleocr)
[](https://github.com/PaddlePaddle/PaddleOCR/network/dependents)



[](https://www.paddleocr.com)
[](https://deepwiki.com/PaddlePaddle/PaddleOCR)
[](../LICENSE)
**PaddleOCR convierte documentos e imágenes en datos estructurados y listos para LLM (JSON/Markdown) con una precisión líder en la industria. Con más de 70 000 estrellas y la confianza de proyectos de primer nivel como Dify, RAGFlow y Cherry Studio, PaddleOCR es la base para construir aplicaciones inteligentes de RAG y Agentic.**
## 🚀 Características principales
### 📄 Análisis inteligente de documentos (listo para LLM)
> *Transformando contenido visual complejo en datos estructurados para la era de los LLM.*
* **SOTA Document VLM**: Featuring **PaddleOCR-VL-1.6 (0.9B)**, the industry's leading lightweight vision-language model for document parsing. It achieves 96.3% accuracy on OmniDocBench v1.6, leads in text, formula, and table recognition, and shows significantly enhanced capabilities in ancient documents, rare characters, seals, and charts, with structured outputs in **Markdown** and **JSON** formats.
* **Conversión con reconocimiento de estructura**: Impulsado por **PP-StructureV3**, convierte sin problemas PDFs e imágenes complejas en **Markdown** o **JSON**. A diferencia de los modelos de la serie PaddleOCR-VL, proporciona información de coordenadas más detallada, incluyendo coordenadas de celdas de tablas, coordenadas de texto y más.
* **Eficiencia lista para producción**: Logra precisión de nivel comercial con una huella ultrapequeña. Supera a numerosas soluciones de código cerrado en benchmarks públicos, manteniéndose eficiente en recursos para despliegue en el borde o en la nube.
### 🔍 Reconocimiento universal de texto (Scene OCR)
> *El estándar de oro mundial para la detección de texto multilingüe de alta velocidad.*
* **Compatibilidad con más de 100 idiomas**: Reconocimiento nativo de una amplia biblioteca global. **PP-OCRv6** soporta 50 idiomas con un único modelo unificado (chino, inglés, japonés y 46 idiomas latinos) — sin necesidad de cambiar modelos.
* **Dominio de elementos complejos**: Más allá del reconocimiento de texto estándar, admitimos la **detección de texto en escenas naturales** en una amplia gama de entornos, incluyendo documentos de identidad, vistas de calles, libros y componentes industriales.
* **Salto en rendimiento**: PP-OCRv6 logra **+4.6% en detección** y **+5.1% en reconocimiento** sobre PP-OCRv5, superando a los principales modelos de lenguaje visual. Aceleración 5.2× en inferencia CPU end-to-end.
| Nombre del proyecto | Descripción |
| ------------ | ----------- |
| [Dify](https://github.com/langgenius/dify)

|Plataforma lista para producción para el desarrollo de flujos de trabajo agénticos.|
| [RAGFlow](https://github.com/infiniflow/ragflow)

|Motor RAG basado en la comprensión profunda de documentos.|
| [pathway](https://github.com/pathwaycom/pathway)

|Framework ETL de Python para procesamiento de flujos, análisis en tiempo real, pipelines de LLM y RAG.|
| [MinerU](https://github.com/opendatalab/MinerU)

|Herramienta de conversión de documentos de múltiples tipos a Markdown.|
| [Umi-OCR](https://github.com/hiroi-sora/Umi-OCR)

|Software de OCR offline por lotes, gratuito y de código abierto.|
| [cherry-studio](https://github.com/CherryHQ/cherry-studio)

|Cliente de escritorio compatible con múltiples proveedores de LLM.|
| [haystack](https://github.com/deepset-ai/haystack)

|Framework de orquestación de IA para construir aplicaciones LLM personalizables y listas para producción.|
| [OmniParser](https://github.com/microsoft/OmniParser)

|OmniParser: herramienta de análisis de pantalla para agentes GUI basados únicamente en visión.|
| [QAnything](https://github.com/netease-youdao/QAnything)

|Preguntas y respuestas basadas en cualquier cosa.|
| [Ver más proyectos](./awesome_projects.md) | [Más proyectos basados en PaddleOCR](./awesome_projects.md)|
## 👩👩👧👦 Colaboradores