China vs. Silicon Valley: cómo DeepSeek está cambiando la inteligencia artificial

DeepSeek INTK

China vs. Silicon Valley: cómo DeepSeek está cambiando la inteligencia artificial

La irrupción de DeepSeek, empresa china de inteligencia artificial, ha sorprendido al mundo tecnológico por su capacidad para desafiar a gigantes como OpenAI, Anthropic o Cohere. Su propuesta combina eficiencia, innovación y bajos costos, lo que podría redefinir el futuro del sector.

DeepSeek y la eficiencia del modelo Mixture of Experts

Los modelos DeepSeek V2 y V3 emplean la arquitectura Mixture of Experts (MoE), que activa solo las partes necesarias en cada operación. Este enfoque reduce costes y optimiza recursos.

El modelo DeepSeek V3 cuenta con 671 mil millones de parámetros, pero solo utiliza 37 mil millones por inferencia, apoyándose en técnicas como Multi-Head Latent Attention (MLA) y entrenamiento en FP8, lo que mejora la gestión de memoria y eleva la eficiencia sin perder calidad.

Costos reducidos y estrategia agresiva de precios

Mientras el entrenamiento de Llama 3.1 de Meta costó diez veces más, DeepSeek entrenó su V3 por 5,6 millones de dólares usando 2,7 millones de horas de GPU H800. Además, ofrece su API a $0,14 por millón de tokens, frente a los $7,50 de OpenAI.

Esta estrategia agresiva genera dudas: ¿se trata de un modelo sostenible o de una táctica para ganar cuota de mercado rápidamente?

Controversia por el entrenamiento de datos

DeepSeek también enfrenta acusaciones de haber usado respuestas de GPT-4 para entrenar sus modelos mediante “distillation” sin permiso de OpenAI. Análisis comparativos han detectado respuestas similares, lo que plantea dudas legales y éticas.

Incluso se han identificado sesgos pro-occidentales en sus respuestas, un detalle llamativo tratándose de una IA desarrollada en China, lo que refuerza la teoría de que se entrenó con datos externos no autorizados.

Impacto en NVIDIA y la industria de semiconductores

El modelo DeepSeek R1 mostró un rendimiento superior a lo esperado, lo que afecta directamente a NVIDIA, ya que los inversores empiezan a cuestionar su dependencia en hardware costoso.

Este avance revela que China está más adelantada en IA de lo previsto, debilitando la efectividad de las sanciones tecnológicas de EE. UU.

Un desafío directo a Silicon Valley

El avance de DeepSeek podría obligar a OpenAI, Anthropic y Cohere a replantear sus estrategias de negocio, mientras que compañías como Amazon, Apple y Meta podrían beneficiarse de modelos más baratos para integrar en sus productos.

La gran incógnita sigue abierta: ¿lograrán las empresas occidentales proteger su propiedad intelectual y mantener la rentabilidad frente a esta nueva ola de modelos disruptivos?

📑 Más información en: