OpenAI, la empresa detrás del popular ChatGPT, ha presentado OpenAI o1, el primer modelo de inteligencia artificial de su serie capaz de «razonar» y «pensar» sus respuestas utilizando matemáticas y ciencia, reduciendo así la cantidad de errores. Según un comunicado de la compañía, este avance representa un hito en el desarrollo de modelos de lenguaje más precisos y fiables.
«Entrenamos estos modelos para que dediquen más tiempo a pensar en los problemas antes de responder, de manera muy similar a como lo haría una persona. A través del entrenamiento, aprenden a refinar su proceso de pensamiento, probar diferentes estrategias y reconocer sus errores», explicó OpenAI.
Hasta ahora, los modelos de OpenAI habían sido entrenados para imitar patrones basados en grandes cantidades de datos de internet. Sin embargo, debido a que la web contiene información inexacta o falsa, los modelos podían reproducir esas mismas imprecisiones. OpenAI o1 utiliza una técnica conocida como aprendizaje por refuerzo, que enseña al sistema mediante recompensas y penalizaciones. Al resolver problemas matemáticos, el modelo aprende qué métodos conducen a respuestas correctas y cuáles no.
Como resultado de esta nueva metodología de entrenamiento, OpenAI afirma que el modelo es más preciso y reduce las llamadas «alucinaciones»—cuando la IA proporciona respuestas bien estructuradas pero incorrectas. Jerry Tworek, líder de investigación de OpenAI, comentó al medio especializado The Verge que esta mejora es significativa en la calidad de las respuestas.
En una demostración para The New York Times, OpenAI mostró al chatbot resolviendo un acróstico complejo, respondiendo a una pregunta de química a nivel de doctorado y diagnosticando una enfermedad basándose en un informe detallado de síntomas y historial del paciente. «En un examen de clasificación para la Olimpiada Internacional de Matemáticas (IMO), GPT-4o (el modelo anterior) resolvió correctamente solo el 13% de los problemas, mientras que el nuevo modelo obtuvo una puntuación del 83%», señaló la empresa.
Gigantes tecnológicos como Google y Meta están desarrollando tecnologías similares, y Microsoft, socio de OpenAI, planea incorporar pronto el nuevo sistema en sus productos. Además, OpenAI ha lanzado una versión llamada OpenAI o1-mini, descrita como «un modelo de razonamiento más rápido y económico, particularmente eficaz en la codificación».
Los usuarios de ChatGPT Plus y Team ya tienen acceso a o1 y o1-mini, mientras que los suscriptores de Enterprise y Edu podrán utilizarlos a principios de la próxima semana.