Inicio / Inteligencia Natural / Open AI revoluciona (de nuevo) la inteligencia artificial con Chat GPT-4o

Open AI revoluciona (de nuevo) la inteligencia artificial con Chat GPT-4o

Ernesto Guerra
15 mayo 2024 | 0 |

Pareciera que los momentos de sorpresa con Open AI se habían terminado después de su impresionante herramienta de generación de videos Sora. Sin embargo, esta semana lo ha vuelto a hacer con Chat GPT-4o.

Intentaré ser breve y conciso, pero es que lo que ha hecho Open AI es una salvajada. Imagino que en este momento Elon Musk y Google estarán arrancándose los pelos. Pero vayamos al lío.

Esta nueva versión de Chat GPT se ha anunciado como de acceso gratuito para todos. Es decir, no requerirás de una suscripción o algún otro truco como hasta el momento era necesario para el uso de la cuarta versión del modelo, aunque tendrá limitaciones en el número de peticiones que podrás hacerle.

¿Qué novedades trae Chat GPT-4o?

Chat GPT-4o llega con funciones mejoradas y realiza análisis multimodal. Veamos cada una de estas nuevas funciones, tal y como están descritas en su blog corporativo.

Capacidades de voz integradas

Una de las mejoras más importantes es la llegada de interacción mediante un modelo de reconocimiento de voz con una latencia de hasta 2.8 segundos. Para la información que maneja es bastante rápido, aunque lo ideal sería llegar a la instantaneidad.

De este modo es capaz de reconocer palabras, frases y prompts que puedes dictarle directamente.

Funciones de identificación de objetos y accesibilidad

El reconocimiento de objetos en nuestro campo visual así como las capacidades de convertir texto a voz de forma natural son un punto a favor de la accesibilidad. En este caso las personas con problemas de visión total o parcial pueden auxiliarse de su móvil para que Chat GPT identifique objetos en su espacio. Asimismo puede responder a preguntas como qué monumento tengo delante o si determinado lugar es, por ejemplo, de interés histórico o comercial. Todo esto, en tiempo real.

Ayuda para estudiantes

Un estudiante puede contar con la ayuda de Chat GPT a partir de la fotografía de una figura geométrica o fórmula. Con el prompt adecuado, la IA será capaz de explicar de manera pedagógica la solución y abordajes del desafío planteado.

Traductor en tiempo real

Las funciones de traducción hacen que la comunicación sea más accesible. Antes se requería de escribir en el idioma original para llegar a una equivalencia en otra lengua. Ahora, con solo escuchar, la nueva versión de Chat GPT puede ofrecer traducciones en tiempo real ya sea en audio o en texto.

Asistencia en reuniones

En reuniones de equipo en línea vía Zoom o apps similares, Chat GPT es capaz de mantenerse al tanto de los acontecimientos e intervenir para ofrecer datos y apoyar la comunicación entre las partes.

Análisis y procesamiento de imágenes

Chat GPT no solo podrá generar imágenes, sino que será capaz de procesar aquellas que le introduzcamos junto a nuestro prompt. El ejemplo que ofrece la compañía es adjuntarle una fotografía y pedirle una versión en caricatura.

También es capaz de crear textos con una tipografía a la medida, historias en bloques de imágenes (como cuadros de una historieta) y devolver incluso efectos de sonido que acompañen a la imagen.

Por otra parte, puede convertir objetos planos a renders en tres dimensiones, generar renders de marca en el mundo real o diseñar posters de películas super realistas.

Interrupciones y cambio de tono

Otra de las funciones más impresionantes es que puedes pedirle un prompt a Chat GPT y si no te convence, puedes pedirle que cambie el tono o el contenido sin que haya terminado de generar el material.

Sin dudas todas estas novedades ponen mucha presión en la competencia, por lo que la guerra de las IAs aún no está terminada. Al momento de escribir esta entrada no se tenían noticias del Google I/O 2024, pero de tener algo sobre IA lo estaremos debatiendo la próxima semana en Inteligencia Natural.

Deja un comentario

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

6 + 17 =