Claude Managed Agents: Anthropic quiere hospedar, escalar y correr tus agentes de IA para que tú solo escribas el prompt
Anthropic lanzó su plataforma de agentes gestionados el 8 de abril: infraestructura lista para producción a $0.08 USD por hora de sesión activa. Notion, Rakuten y Asana ya la usan. Esto es lo que debes saber si eres dev o startup en México.
Tienes una idea para un agente de IA. Le preguntas a Claude cómo construirlo, te ves cabrón en el prototipo local, tu jefe o tu cliente queda encantado, y luego llega el momento de mandarlo a producción. Y ahí empieza el calvario: orquestación, sandboxing, manejo de estado, credenciales, reconexiones, escalado automático, monitoring. De repente ya no eres dev de IA, eres SRE a tiempo completo. Eso es exactamente lo que Anthropic quiere que ya no tengas que hacer.
El pasado 8 de abril, Anthropic lanzó Claude Managed Agents en beta pública para todas las cuentas de la API. La propuesta es directa: tú defines el agente, ellos corren toda la infraestructura.
Qué es exactamente y cómo funciona
Claude Managed Agents no es un nuevo modelo ni una nueva UI. Es una capa de infraestructura gestionada que vive entre tu código y Claude. El sistema tiene cuatro piezas clave:
- Agent: el modelo + tu system prompt + tools + servidores MCP. Lo defines una vez, lo reutilizas por ID.
- Environment: un contenedor cloud configurado con sus paquetes, reglas de red y archivos montados.
- Session: una instancia del agente corriendo una tarea específica, generando outputs.
- Events: los mensajes entre tu app y el agente, entregados vía server-sent events (SSE).
La arquitectura separa el “cerebro” (el harness con Claude y el loop agentivo) de las “manos” (el sandbox de ejecución de código), conectados por un event log append-only que vive fuera de ambos. Si el harness falla, arranca uno nuevo y retoma desde el último checkpoint. Si el sandbox falla, igual. Ningún componente tumba al otro.
Eso en la práctica significa sesiones que corren horas, sobreviven desconexiones del cliente, y retoman desde donde se quedaron sin que el agente tenga que repetir trabajo.
El pricing: cuánto cuesta en la vida real
El modelo de cobro tiene tres componentes simultáneos:
| Componente | Costo |
|---|---|
| Tokens de entrada | Tarifas estándar del modelo (ej: Claude Opus 4.6 a $5/millón) |
| Tokens de salida | Tarifas estándar (ej: Claude Opus 4.6 a $25/millón) |
| Tiempo de sesión activa | $0.08 USD por hora, cobrado al milisegundo |
| Web search dentro de sesión | $10 USD por 1,000 búsquedas |
Lo importante: el tiempo idle no se cobra. Si el agente espera confirmación del usuario o está en cola, ese tiempo no te cuesta nada del $0.08/hr.
Un ejemplo concreto: una sesión de coding de 1 hora con Claude Opus 4.6, 50K tokens de entrada y 15K de salida, sale alrededor de $0.70 USD total. Con prompt caching activo sobre el 80% de los inputs, baja a unos $0.52. Para una startup o equipo pequeño, eso es irrisorio comparado con mantener la infraestructura propia o contratar un SRE.
Quién ya lo está usando y qué logró
Las empresas en la beta privada reportaron mejoras concretas, no solo marketing:
Rakuten desplegó agentes especialistas en producto, ventas, marketing y finanzas, integrados a Slack y Teams para que los empleados les asignen tareas directamente. Cada agente especialista quedó en producción en menos de una semana.
Asana construyó “AI Teammates”: agentes que trabajan junto a humanos dentro de los proyectos, toman tareas y entregan borradores de entregables. Su CTO dijo que agregaron funcionalidades avanzadas dramáticamente más rápido de lo que hubiera sido posible antes.
Notion usa Managed Agents para que Claude actúe como un delegado del workspace: organiza notas, resume juntas, genera estructura de documentos y presentaciones de manera autónoma.
Sentry conectó su herramienta de debugging Seer a un agente que escribe parches y abre pull requests. El pipeline va de “bug detectado” a “fix listo para review” sin intervención humana. Lo construyeron y pusieron en producción en semanas.
Anthropic publica los detalles técnicos de la arquitectura en su engineering blog si quieres ver cómo separaron harness, sandbox y session log a nivel sistema.
El ángulo para México: de prototipo a producción en días
La neta, este producto no está pensado para Google ni Microsoft, que ya tienen sus propias plataformas. Está pensado para startups, agencias y equipos de dev que quieren subir agentes de IA a producción sin montar toda una pila de DevOps.
En México y LATAM hay muchos equipos que ya usan Claude para prototipos internos pero se quedan ahí porque la parte de infraestructura se les va de las manos. Con esto, la brecha entre “funciona en mi máquina” y “funciona en producción para mis clientes” se achica bastante.
Si ya estás usando herramientas de Anthropic para programar, como revisamos en nuestra comparativa de Claude Code vs Cursor vs Copilot vs Windsurf, Managed Agents es el siguiente paso natural: de “Claude me ayuda a escribir código” a “Claude ejecuta tareas largas en producción de forma autónoma”.
Lo que el beta todavía no puede hacer
Es beta pública, y hay limitaciones reales que debes conocer antes de comprometerte:
- Sin VPC peering ni endpoints privados. Todo el tráfico sale por infraestructura pública de Anthropic. Para empresas con requisitos de seguridad estrictos, eso puede ser un bloqueador.
- Sin cron nativo ni webhook listeners. Si necesitas que tu agente se dispare en horario o reaccione a eventos externos, tienes que implementarlo tú afuera.
- Solo disponible en la infraestructura de Anthropic. No está en AWS Bedrock ni en Google Vertex AI. Eso es vendor lock-in real que tienes que pesar.
- Multi-agent (Agent Teams) está en research preview, con acceso por waitlist. Si necesitas agentes que coordinen entre sí en paralelo, por ahora no es GA.
La comunidad de Hacker News lo señaló directo: Anthropic está dejando de ser solo un proveedor de tokens y se convierte en dueño del runtime de tus agentes. Eso tiene consecuencias a largo plazo si en algún momento quieres migrar.
Una alternativa si prefieres control total: construir sobre LangGraph o Kubernetes propios. Si la idea de depender de un solo proveedor no te convence, está la guía de correr tu propia IA local con Ollama y LM Studio para entender qué significa tener el stack completamente en tu control.
Vale la pena o no: el veredicto honesto
Para startups y equipos pequeños en México que quieren poner agentes en producción rápido y sin armar infraestructura: sí vale. Los precios son accesibles, el setup es de minutos no semanas, y los resultados de los early adopters son concretos.
Para empresas con requisitos de compliance, datos sensibles o que ya tienen equipo DevOps montado: espera a que salga de beta y resuelvan el tema de VPC y endpoints privados. El servicio todavía no está listo para esos casos de uso.
Lo que más me llama la atención no es el producto en sí, sino la señal que manda. Anthropic lleva meses posicionándose como empresa que no solo vende modelos sino que quiere ser el stack completo de la era agentiva. Ya lo vimos cuando se pusieron firmes contra el Pentágono en el debate de IA autónoma: tienen una visión clara de hacia dónde va esto y están construyendo en consecuencia.
El acceso beta ya está abierto para todas las cuentas de la API en platform.claude.com. No necesitas aplicar a nada, solo tener una cuenta activa con acceso a la API.
Qué onda, ¿ya tienes algún agente en mente que querrías correr con esto? Cuéntalo en los comentarios, me interesa saber qué tipo de automatizaciones están intentando armar desde México.
Fuentes
Comentarios
No te pierdas ningún post
Recibe lo nuevo de Al Chile Tech directo en tu correo. Sin spam.
También te puede interesar
Claude Opus 4.7 ya llegó: 67% más barato, visión 3x mejorada y 3 cambios de API que te van a tronar el código
Anthropic lanzó hoy Claude Opus 4.7: input a $5/MTok (era $15), resolución de imagen triplicada y un nuevo nivel xhigh de razonamiento. Pero el tokenizador nuevo puede comerte el ahorro. Todo lo que necesitas saber antes de migrar.
Claude Mythos ya tiene early access real: qué confirmó Anthropic y cómo entrar desde México
Anthropic confirmó el 2 de abril que está expandiendo acceso a Claude Mythos, el modelo Capybara que supera a Opus. Te explico qué se sabe, qué va a costar y si desde México puedes aplicar (spoiler: ahorita no, pero hay forma de prepararte).
Anthropic filtró sin querer 'Claude Mythos': el modelo de IA que aterró a las bolsas de ciberseguridad
Un error de configuración en el CMS de Anthropic expuso ~3,000 assets internos y reveló su modelo más poderoso: Capybara, por encima de Opus, con capacidades de ciberseguridad que hacen temblar a CrowdStrike y SentinelOne.