OpenAI anunció que su modelo de razonamiento aún sin lanzar acaba de ganar un oro en la Olimpiada Internacional de Matemáticas 2025 (IMO 2025), al completar cinco de los seis problemas del evento y obtener una puntuación de 35 puntos.
La noticia fue compartida en la red social X por Alexander Wei, un miembro del equipo de la compañía. “Evaluamos nuestros modelos en los problemas de la IMO 2025 bajo las mismas reglas que los concursantes humanos: dos sesiones de examen de 4,5 horas, sin herramientas ni Internet, leyendo los enunciados oficiales de los problemas y escribiendo pruebas en lenguaje natural”, escribió.
OpenAI no fue el único que se llevó medalla de oro en la IMO 2025. Google DeepMind dijo que una versión avanzada de Gemini con Deep Think obtuvo el mismo lauro, certificado oficialmente por los coordinadores del evento.
“Podemos confirmar que Google DeepMind ha alcanzado el ansiado hito, obteniendo 35 de los 42 puntos posibles, una medalla de oro. Sus soluciones fueron sorprendentes en muchos aspectos. Los evaluadores de la IMO las consideraron claras, precisas y, en su mayoría, fáciles de seguir, afirmó el presidente de la IMO, Dr. Gregor Dolinar.
La diferencia entre ambas es que Google si es un colaborador oficial de la IMO, y como tal su herramienta pudo ser evaluada con las normas del evento. OpenAI utilizó a matemáticos independientes para la tarea. Según Noam Braum, integrante de la empresa de Altman, declinaron la oferta de los organizadores para intervenir en la competencia.
Esto ha generado una ola de críticas debido al momento del anuncio, que se considera eclipsa la actuación de los estudiantes. Fuera de esto, es un llamado de atención (otro) de las capacidades que están adquiriendo los sistemas de IA en áreas como la solución de problemas complejos y la educación, el enfoque de inteligencia general y el modo en que son entrenados estos sistemas.
Flash del día

La empresa de inteligencia artificial xAI, está trabajando en una versión infantil de su chatbot Grok, según anunció Elon Musk en una publicación en la red social X.
Se espera que la nueva versión se lance como una aplicación independiente, aunque aún no se han anunciado más detalles. Recientemente, X deshabilitó las menciones a Grok en la plataforma para solucionar problemas relacionados con el spam.
Prompt de la semana

Vamos a buscar soluciones a un problema cotidiano con ayuda de inteligencia artificial:
Ayúdame a pensar en esta situación [descríbela] paso a paso y sugiere 2 o 3 formas posibles de avanzar con pros y contras.