O3 y O4-mini de OpenAI: IA que analiza fotos, navega y razona como nunca antes

OpenAI acaba de soltar una bomba tecnológica: O3 y O4-mini, sus nuevos modelos de razonamiento, ya están disponibles y llegan con todo lo que hasta ahora parecía imposible para este tipo de IA. Desde analizar imágenes con lógica hasta usar herramientas como navegación web, generación de imágenes, análisis de archivos y hasta modo de voz avanzado.

Sí, leíste bien: ahora pueden “pensar” con imágenes, navegar por internet y ayudarte a razonar tareas complejas, todo sin tener que cambiar de modelo. Esto cambia por completo el juego para quienes trabajan con IA en programación, ciencia, planificación y tareas visuales.

Razonan con imágenes, no solo las describen

Lo más llamativo de estos nuevos modelos es cómo procesan el contenido visual. No se limitan a describir una imagen como antes, ahora interpretan, analizan y deciden qué es importante y qué no, como si tuvieran un sentido visual activo.

Pueden rotar, ampliar detalles o ignorar distracciones para darte respuestas más inteligentes. Es como tener un colaborador que sabe cuándo mirar más de cerca una foto o un diagrama para sacar conclusiones precisas.

Más precisión y menos errores en tareas difíciles

El modelo O3 logró una puntuación del 69.1% en la prueba SWE-bench, una de las más exigentes en habilidades de codificación, y comete un 20% menos de errores que su predecesor O1 en tareas del mundo real.

Por su parte, O4-mini es más ligero, económico y ágil, pero no se queda atrás: obtuvo un 68.1% en esa misma prueba, superando incluso a Claude 3.7 Sonnet de Anthropic (62.3%). Esto lo hace ideal para tareas matemáticas, visuales y de programación que requieren velocidad y precisión.

Herramientas integradas, por fin en modelos de razonamiento

Hasta ahora, las herramientas como la web, el análisis de archivos o la voz solo estaban disponibles en los modelos GPT principales. Pero con O3 y O4-mini, ya no tienes que alternar entre uno y otro modelo. Puedes hacerlo todo desde un solo lugar:

  • Leer y razonar archivos PDF, hojas de cálculo, etc.

  • Investigar directamente desde internet.

  • Generar imágenes con IA.

  • Usar el modo de voz avanzada para conversaciones naturales.

¿Para quiénes son ideales estos nuevos modelos?

Si tu trabajo implica resolver problemas complejos, planificar flujos de trabajo con varios pasos, hacer análisis detallados o programar, O3 y O4-mini son justo lo que necesitas. No están diseñados para crear poesía o responder trivialidades, pero sí para razonar y ayudarte a tomar decisiones con lógica y datos reales.

¿Ya los puedes usar?

Sí. A partir de hoy, los modelos están disponibles para usuarios de ChatGPT Plus, Pro y Team. Y se espera que O3-pro, una versión aún más potente, llegue muy pronto al plan Pro.

Mientras tanto, puedes seguir usando O1-pro si ya eres usuario de paga, aunque después de probar O3, probablemente no quieras volver atrás.

También te podría interesar