5 millones de parámetros igualan a modelos de mil millones de niveles: Baidu PaddleOCR supera a Tesseract y se posiciona en la cima del OCR en GitHub

BlockBeatNews

Según el monitoreo de 1M AI News, el conjunto de herramientas de OCR de código abierto PaddleOCR de Baidu Paddle, con 73.300 estrellas en GitHub, superó al motor OCR de larga trayectoria mantenido por Google Tesseract (73.200), convirtiéndose en el proyecto de OCR con más estrellas en GitHub. El MinerU, en el tercer puesto, tiene 57.500 estrellas. PaddleOCR se lanzó como código abierto en 2020, admite más de 100 idiomas y cubre más de 160 países y regiones.

PaddleOCR ha tenido actualizaciones recientes y frecuentes: la PP-OCRv5 publicada la semana pasada, con solo 5 millones de parámetros, alcanza una precisión comparable a la de modelos multimodales de visión y lenguaje a nivel de miles de millones de parámetros en los puntos de referencia estándar de OCR; PaddleOCR-VL-1.5, en el punto de referencia de análisis de documentos OmniDocBench v1.5, actualizó el récord con una precisión del 94,5%.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios