Hemos probado ambos modelos con 500 documentos reales. Los resultados te sorprenderán.
La clasificación de documentos empresariales es uno de los casos de uso más prácticos de la IA generativa. Pero no todos los modelos son iguales. Hemos realizado una prueba exhaustiva con 500 documentos reales de distintos tipos (facturas, contratos, albaranes, informes) para comparar el rendimiento de Google Gemini 1.5 Pro y GPT-4o en esta tarea específica.
Proporcionamos a cada modelo el texto extraído de cada PDF (mediante OCR estándar) y le pedimos que lo clasificara en una de 8 categorías predefinidas. Medimos: precisión de clasificación, tiempo de respuesta y coste por documento.
En precisión general, los resultados fueron muy similares:
La diferencia es estadísticamente no significativa. Sin embargo, hay diferencias notables por tipo de documento: Gemini fue superior en facturas con formatos poco comunes, mientras que GPT-4o destacó en contratos con terminología legal compleja.
Aquí sí hay una diferencia clara. Gemini 1.5 Pro respondió de media en 1,2 segundos, frente a los 2,8 segundos de GPT-4o. Para un sistema que procesa decenas de documentos simultáneamente, esto importa.
GPT-4o es aproximadamente un 40% más caro por token que Gemini 1.5 Pro para este tipo de tarea. Procesando 1.000 documentos al mes, la diferencia supone unos 8-12€ adicionales con GPT-4o.
🏆 Conclusión: Para clasificación de documentos empresariales, Gemini 1.5 Pro ofrece mejor relación calidad-precio. GPT-4o tiene ventaja en documentos con terminología muy especializada.
En Findest utilizamos una combinación de modelos según el tipo de documento y el contexto. Para la mayoría de los casos, Gemini 1.5 Pro es nuestra opción principal por su velocidad y coste. Para documentos legales o financieros complejos, complementamos con GPT-4o cuando la precisión es crítica.
Prueba Findest gratis — sin tarjeta de crédito, listo en 2 minutos.