Gemini vs GPT-4 para clasificar documentos: comparativa real

Por qué comparar modelos de IA para documentos

La clasificación de documentos empresariales es uno de los casos de uso más prácticos de la IA generativa. Pero no todos los modelos son iguales. Hemos realizado una prueba exhaustiva con 500 documentos reales de distintos tipos (facturas, contratos, albaranes, informes) para comparar el rendimiento de Google Gemini 1.5 Pro y GPT-4o en esta tarea específica.

Metodología

Proporcionamos a cada modelo el texto extraído de cada PDF (mediante OCR estándar) y le pedimos que lo clasificara en una de 8 categorías predefinidas. Medimos: precisión de clasificación, tiempo de respuesta y coste por documento.

Resultados: Precisión

En precisión general, los resultados fueron muy similares:

GPT-4o: 94,2% de precisión media
Gemini 1.5 Pro: 93,8% de precisión media

La diferencia es estadísticamente no significativa. Sin embargo, hay diferencias notables por tipo de documento: Gemini fue superior en facturas con formatos poco comunes, mientras que GPT-4o destacó en contratos con terminología legal compleja.

Resultados: Velocidad

Aquí sí hay una diferencia clara. Gemini 1.5 Pro respondió de media en 1,2 segundos, frente a los 2,8 segundos de GPT-4o. Para un sistema que procesa decenas de documentos simultáneamente, esto importa.

Resultados: Coste

GPT-4o es aproximadamente un 40% más caro por token que Gemini 1.5 Pro para este tipo de tarea. Procesando 1.000 documentos al mes, la diferencia supone unos 8-12€ adicionales con GPT-4o.

🏆 Conclusión: Para clasificación de documentos empresariales, Gemini 1.5 Pro ofrece mejor relación calidad-precio. GPT-4o tiene ventaja en documentos con terminología muy especializada.

¿Qué usa Findest?

En Findest utilizamos una combinación de modelos según el tipo de documento y el contexto. Para la mayoría de los casos, Gemini 1.5 Pro es nuestra opción principal por su velocidad y coste. Para documentos legales o financieros complejos, complementamos con GPT-4o cuando la precisión es crítica.