Deepseek: todo lo que necesitas saber de la IA China que derrumbó el precio de Nvidia

(Foto: Euronews)

Esta semana las acciones de Nvidia cayeron en picada. En todo el mundo se hizo tema de interés Deepseek, la nueva IA generativa china que fascina a inversores, apasionados de la tecnología y público general.

Pero, ¿qué hace a Deepseek tan atractivo?

¿Qué es Deepseek?

Deepseek es un nuevo bot conversacional de factura china. Según se autodefine, “soy DeepSeek-V3, un modelo de lenguaje avanzado desarrollado por DeepSeek, diseñado para asistir en una amplia variedad de tareas, desde responder preguntas y generar texto, hasta resolver problemas complejos”.

Es decir, una alternativa de tantas a Chat GPT, Gemini o Copilot.

¿Qué puedo hacer en Deepseek?

Según la autodefinición de este bot, su objetivo es proporcionar respuestas precisas, útiles y contextualizadas, “adaptándome a las necesidades del usuario. Estoy entrenado para ser eficiente, claro y versátil, ayudando en áreas como educación, tecnología, negocios y más”.

A continuación una lista de cosas que puedes hacer con esta herramienta, creada en su entorno:

– Interactuar con modelos de lenguaje avanzados
– Desarrollar aplicaciones de IA
– Procesamiento de lenguaje natural
– Investigación y desarrollo
– Soluciones empresariales
– Educación y formación
– Generación de contenido
– Análisis de datos

¿Deepseek es multimodal?

De momento, no hay rastros de capacidades multimodales en esta herramienta. Esto, de manera más sencilla, es que ahora mismo no acepta audios, videos o imágenes complejas. De hecho, sí que puedes enviarle imágenes pero para la extracción y análisis de textos.

¿Por qué es tan relevante?

Al principio de este texto dijimos que hasta Nvidia sintió el repentino empuje de Deepseek. Veamos un poco el por qué.

Lanzada el 20 de enero, la app china logró posicionarse rápidamente en el top de las más descargadas para móviles en Estados Unidos. Además, el modelo de IA que lo impulsa -llamado R1- es el mayor de fuente abierta publicado hasta el momento, con alrededor de 670 mil millones de parámetros.

Eso no es todo. Este modelo es equiparable en capacidad al modelo O1, que impulsa Chat GPT, con la diferencia de que el realizado en China costó 6 millones de dólares. Los modelos desarrollados por Open AI han costado miles de millones de dólares.

Supuestamente, el entrenamiento de Deepseek ocurrió gracias a que su fundador guardó chips de Nvidia antes de que no fuera posible la exportación de los mismos a China. Los combinó con otros de menos calidad y precio y alcanzó los resultados descritos.

En resumen, China logró hacer un modelo de IA muchísimo más barato y abierto, presionando directamente a dos puntos de dolor de los modelos occidentales.

¿Todo es positivo?

Es muy pronto para emitir un criterio. Según el uso de Deepseek crezca, sabremos más sobre los sesgos, alucinaciones y cómo el material de base que entrenó al modelo influye en sus respuestas, desde un punto de vista más sesgados.

Además, para continuar el avance, China deberá importar más chips de Nvidia o intentar construir los adecuados, cosa que hasta el momento no está hecha. De momento, en el caso de Cuba, Chat GPT requiere de VPN para funcionar y Deepseek no. Eso, sin dudas, le dará aliados naturales.