ia
ia
Google TurboQuant: de $1 a $0.05 por millón de tokens y el golpe que le metió a los chips de memoria
Google comprimió los KV caches de LLMs 6 veces sin perder precisión. Los costos de inferencia bajan 20x y Samsung, SK Hynix y Micron ya sienten el madrazo. Qué significa para devs y startups en México.
Leer