#quantization

1 artículo con este tag

ia 8 abr 2026 · 3 min

Google TurboQuant: de $1 a $0.05 por millón de tokens y el golpe que le metió a los chips de memoria

Google comprimió los KV caches de LLMs 6 veces sin perder precisión. Los costos de inferencia bajan 20x y Samsung, SK Hynix y Micron ya sienten el madrazo. Qué significa para devs y startups en México.

Leer