Análisis de DeepSeek R1

30 enero 2025Actualizado: 30 enero 2025

0 48 2 minutos de lectura

Contenidos

1. ¿Qué es DeepSeek y por qué es tan impactante?

2. Impacto en los mercados

3. ¿DeepSeek mintió sobre su hardware?

4. DeepSeek imágenes

5. ¿Cómo puedes usar DeepSeek R1?

El mundo de la inteligencia artificial ha sido sacudido por DeepSeek R1, un modelo chino que ha generado un gran revuelo, afectando incluso a los mercados bursátiles y a gigantes tecnológicos como NVIDIA.

¿Qué es DeepSeek y por qué es tan impactante?

DeepSeek R1 es una IA que ha demostrado un rendimiento excepcional con una fracción del costo y el tiempo de entrenamiento de modelos occidentales como GPT-4. Esto ha puesto en duda la necesidad de hardware costoso para desarrollar modelos avanzados de IA, lo que ha generado pánico entre los inversores.

Diferencias clave en entrenamiento:

DeepSeek V3 (modelo previo) requirió 2.78 millones de horas de GPU en H800.
GPT-4 necesitó 60 millones de horas en A100 (hardware de NVIDIA más avanzado).
DeepSeek logró entrenar su modelo en un 95% menos de tiempo y con hardware inferior.

Comparación de rendimiento:

Supera a GPT-4.0 y es comparable a Claude 3.5 Sonnet en varias pruebas.
En matemáticas y programación, DeepSeek V3 obtuvo mejores resultados que GPT-4.
En benchmarks generales, está a la par de OpenAI y supera a muchos competidores en código y razonamiento lógico.

Revolución con DeepSeek R1:

Utiliza una técnica de aprendizaje por refuerzo sin supervisión para mejorar su precisión.
Implementa Chain of Thought prompting, permitiendo que el modelo razone y corrija su propio proceso en tiempo real.
Se vuelve más competitivo con modelos cerrados de OpenAI, pero es de código abierto.

Impacto en los mercados

La llegada de DeepSeek R1 provocó una reacción extrema en los mercados financieros:

El valor de las acciones de NVIDIA cayó significativamente, con una pérdida estimada de $465 mil millones. Esto no significa que NVIDIA vaya mal, al contrario si comparamos la gráfica del último años es un simple bache como otras veces.
También afectó a otras grandes tecnológicas como Meta, Google y Oracle.
La teoría detrás de esta caída es que si entrenar IA ahora es mucho más barato, la demanda de GPUs de alto rendimiento de NVIDIA podría disminuir.

AAAAAnRSTlMAAHaTzTgAAABGSURBVHja7cExAQAAAMKg9U9tCj+gAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAB4GL7QAAE6rkCZAAAAAElFTkSuQmCC

Sin embargo, analistas creen que esto no significa el fin de NVIDIA. En cambio, podría aumentar la demanda de IA, ya que más empresas podrían acceder a este tipo de tecnología.

¿DeepSeek mintió sobre su hardware?

Algunos expertos como Alexander Wang (CEO de Scale AI) y analistas de Citibank sugieren que DeepSeek pudo haber utilizado más GPUs de las que afirma. Se especula que:

En realidad usaron 50,000 GPUs más poderosas (H100 en lugar de H800).
O bien, aprovecharon modelos preexistentes como Llama en lugar de entrenar desde cero.
Sin embargo, no hay evidencia concreta de que DeepSeek haya mentido.

DeepSeek imágenes

El 27 de enero, la misma empresa lanzó Janice Pro 7B, un modelo de generación de imágenes que:

Supera a modelos como DALL-E 3, Stable Diffusion XL y PixArt.
Muestra que DeepSeek no solo se enfoca en lenguaje, sino que busca dominar la IA generativa en múltiples frentes.

¿Cómo puedes usar DeepSeek R1?

DeepSeek R1 ya está disponible de varias maneras:

Página web oficial: Puedes acceder a DeepSeek R1 desde deepseek.com.
App móvil: Es la app número uno en descargas en iOS, superando incluso a ChatGPT.
Modo local con LM Studio: Permite descargar el modelo y usarlo sin conexión.

A largo plazo, la competencia con OpenAI, Google y Meta se intensificará, y NVIDIA podría beneficiarse más de lo esperado. Lo que parecía una crisis para el fabricante de GPUs, podría convertirse en una nueva ola de inversión en IA.

Etiquetas

30 enero 2025Actualizado: 30 enero 2025

0 48 2 minutos de lectura