tech

Meta le dice adiós a las GPUs de NVIDIA (por ahora) y firma con Amazon para mover su IA agentica con Graviton5

tech · 6 min de lectura

Meta le dice adiós a las GPUs de NVIDIA (por ahora) y firma con Amazon para mover su IA agentica con Graviton5

Meta acaba de firmar un acuerdo multimillonario con AWS para usar decenas de millones de cores Graviton5 en sus cargas de IA. Esto no es un capricho: es la señal más clara de que el mercado de chips está cambiando de forma permanente.

Meta le dice adiós a las GPUs de NVIDIA (por ahora) y firma con Amazon para mover su IA agentica con Graviton5

El 24 de abril, Meta confirmó algo que nadie esperaba con tanta contundencia: en lugar de seguir llenando sus data centers de GPUs de NVIDIA, firmó un acuerdo multimillonario y multianual con Amazon Web Services para usar decenas de millones de cores Graviton5 en sus cargas de inteligencia artificial agentica. No es que Meta esté rompiendo con NVIDIA. Es algo más interesante que eso.

Qué firmaron exactamente

Meta anunció en su blog oficial que su acuerdo con AWS cubre al menos tres años y convierte a la empresa de Zuckerberg en uno de los clientes más grandes de Graviton en el mundo. El trato arranca con decenas de millones de cores Graviton5 corriendo en data centers de Amazon en Estados Unidos, con flexibilidad para escalar.

No publicaron el número exacto de dólares, pero tanto Bloomberg como GeekWire lo describen como un acuerdo de varios miles de millones. Nada chico.

El chip que Meta va a usar a lo grande es el Graviton5, que Amazon presentó en diciembre de 2025: 192 cores ARM (arquitectura Neoverse V3), fabricado en proceso de 3 nanómetros, con un rendimiento 25% superior a su generación anterior, latencia inter-core 33% menor y un caché L3 de 180 MB, cinco veces más grande que el Graviton4. En resumen, es una bestia para procesamiento paralelo de tareas de inferencia.

Por qué CPUs y no GPUs

Aquí está el punto que más importa entender. Este acuerdo no es para entrenar modelos. Para entrenar LLMs de cero, NVIDIA todavía manda y va a seguir mandando un buen rato. Las GPUs H100 y B200 siguen siendo irreemplazables para eso.

El tema es que la IA está evolucionando. Ya no se trata solo de entrenar un modelo enorme y que la gente le haga preguntas en un chat. Ahora hablamos de IA agentica: sistemas que razonan paso a paso, ejecutan tareas encadenadas, hacen búsquedas, generan código, coordinan múltiples modelos al mismo tiempo y responden en tiempo real a miles de millones de usuarios. Facebook, Instagram, WhatsApp, Threads, todo corriendo con agentes de IA en el fondo.

Ese tipo de carga, que es básicamente inferencia intensiva y orquestación de tareas, no necesita la potencia bruta de una GPU. Lo que necesita son CPUs rápidas, con buen acceso a caché y bajo costo por operación. Ahí entra Graviton5.

Según TechCrunch, esto representa “una nueva carrera de chips” donde los CPUs dejan de ser el apoyo y empiezan a ser la capa de orquestación central de los sistemas de IA. Los GPUs entrenan, los CPUs piensan en tiempo real.

El contexto más grande: Meta gasta en todos lados

Para entender por qué este acuerdo no es abandono de NVIDIA sino diversificación estratégica, hay que ver el portafolio completo de Meta en infraestructura de IA para 2026:

ProveedorInversión estimada
AMD$60 mil millones
NVIDIA$50 mil millones
CoreWeave$35 mil millones
Nebius$27 mil millones
AWS (Graviton)multimillonario (sin cifra exacta)

Su capex anual para 2026 está entre $115 y $135 mil millones. Meta está comprando cómputo de donde puede conseguirlo, porque la demanda de sus propios sistemas ya superó lo que cualquier proveedor puede darles solo.

Además, Meta desarrolla sus propios chips MTIA (Meta Training and Inference Accelerator) para bajar su dependencia de terceros a largo plazo. Graviton es parte de una estrategia donde diversificar no es una opción, es supervivencia.

Lo que esto significa para NVIDIA

La neta, NVIDIA no está en problemas inmediatos. Pero los números ya empiezan a hablar: según análisis de The Next Web, la participación de mercado de NVIDIA en aceleradores de IA bajó de alrededor del 87% en su pico de 2024 a una proyección del 75% para finales de 2026. Mientras tanto, el mercado de chips custom (ASICs propios de cada empresa) crece al 45% anual contra solo 16% de crecimiento en GPUs.

Este acuerdo de Meta con Amazon es otro ladrillo en esa pared. Y no están solos: Google tiene sus TPUs, Microsoft tiene sus chips Maia, Apple tiene sus Neural Engine. Todos los gigantes están construyendo su propio stack de silicio.

Si ya leíste nuestro análisis de Nvidia Vera Rubin y lo que cambia para México y las startups de IA en LATAM, sabes que NVIDIA está respondiendo con su propio CPU ARM llamado Vera, que compite directamente con Graviton. La carrera ya no es solo entre GPUs, es entre ecosistemas completos de cómputo.

¿Y México qué?

La pregunta que nos toca hacernos es si esta movida tiene impacto práctico para empresas y devs en México y LATAM. La respuesta corta: sí, pero en el mediano plazo.

Cuando Meta usa Graviton5 para inferencia agentica en lugar de GPUs, reduce costos operativos. Esos ahorros eventualmente se reflejan en las APIs que Meta pone disponibles para desarrolladores, y en los precios que AWS cobra por sus instancias de cómputo. Las instancias basadas en Graviton ya son consistentemente más baratas que las equivalentes en x86 en AWS, y con mayor oferta, esa brecha podría crecer.

Para startups mexicanas que corren cargas de inferencia en AWS, esto es bueno. Las instancias m8g y r8g de Graviton4 que Amazon ya comercializa dan hasta 205% más tokens por dólar corriendo Llama 3.1 comparado con instancias AMD equivalentes. Si tu startup hace inferencia de LLMs en la nube, las instancias Graviton deberían estar en tu radar ahorita, no cuando sean noticia vieja.

El punto más amplio: si los gigantes diversifican sus stacks de chips, la presión sobre los precios de cómputo en general aumenta. Eso se traduce en mejores opciones y precios más competitivos para cualquier empresa que consuma cloud, incluyendo las que operan desde México. Como apuntamos en nuestro texto sobre cómo la IA acabó con los proyectos de TI de 12 meses en México, las consultoras y empresas que no están monitoreando estas movidas de infraestructura van a llegar tarde al partido, de nuevo.

El resumen al chile

Meta no está traicionando a NVIDIA. Está haciendo lo que hacen todas las empresas inteligentes cuando crecen demasiado: dejar de depender de un solo proveedor y construir un portafolio de cómputo que equilibre costo, disponibilidad y eficiencia.

El Graviton5 es un chip una raja para lo que Meta necesita ahora: inferencia masiva, orquestación de agentes, respuestas en tiempo real a escala de miles de millones de usuarios. Las GPUs siguen ahí para entrenar. Los CPUs ya llegaron para pensar.

Si trabajas en infraestructura de IA o eres dev que paga facturas de AWS, esto te importa. Las instancias Graviton5 ya están disponibles y son más baratas. Úsalas.

¿Tu empresa ya migró cargas de inferencia a Graviton o sigue pagando de más por instancias GPU? Cuéntanos en los comentarios.

Fuentes

Comentarios

No te pierdas ningún post

Recibe lo nuevo de Al Chile Tech directo en tu correo. Sin spam.

También te puede interesar