Según el monitoreo de 1M AI News, el conjunto de herramientas de OCR de código abierto PaddleOCR de Baidu Paddle, con 73.300 estrellas en GitHub, superó al motor OCR de larga trayectoria mantenido por Google Tesseract (73.200), convirtiéndose en el proyecto de OCR con más estrellas en GitHub. El MinerU, en el tercer puesto, tiene 57.500 estrellas. PaddleOCR se lanzó como código abierto en 2020, admite más de 100 idiomas y cubre más de 160 países y regiones.
PaddleOCR ha tenido actualizaciones recientes y frecuentes: la PP-OCRv5 publicada la semana pasada, con solo 5 millones de parámetros, alcanza una precisión comparable a la de modelos multimodales de visión y lenguaje a nivel de miles de millones de parámetros en los puntos de referencia estándar de OCR; PaddleOCR-VL-1.5, en el punto de referencia de análisis de documentos OmniDocBench v1.5, actualizó el récord con una precisión del 94,5%.