El Ecosistema Startup > Última noticia > Claude Code Pro Max 5x: cuota agotada en 1.5 horas

Claude Code Pro Max 5x: cuota agotada en 1.5 horas

El problema que está afectando a desarrolladores y founders: cuota agotada en tiempo récord

Si usas Claude Code con el plan Pro Max 5x y has notado que tu cuota se termina mucho más rápido de lo esperado, no estás solo. Desde finales de marzo de 2026, cientos de desarrolladores y founders tech han reportado el mismo fenómeno: la ventana de sesión de 5 horas se agota en apenas 90 minutos, incluso con cargas de trabajo moderadas y sin cambiar sus flujos habituales.

El issue #45756 en el repositorio oficial de Anthropic en GitHub documenta este comportamiento en detalle, y no es un caso aislado. Hay al menos media docena de reportes similares que apuntan a un mismo origen: algo en la forma en que se contabilizan ciertos tipos de tokens, en particular los cache_read tokens, está consumiendo cuota a un ritmo desproporcionado.

¿Qué es el plan Pro Max 5x y cómo funciona su cuota?

El plan Claude Max 5x, disponible por aproximadamente $100 USD al mes, promete hasta 5 veces más uso por ventana de sesión de 5 horas en comparación con el plan Pro estándar de $20. Está diseñado para developers y equipos que trabajan intensamente con Claude Code en tareas de programación asistida, automatización y workflows agénticos.

👥 ¿Quieres ir más allá de la noticia?

En nuestra comunidad discutimos las tendencias, compartimos oportunidades y nos ayudamos entre emprendedores. Sin humo, solo acción.

👥 Unirme a la comunidad

La cuota se mide por ventanas de 5 horas que se reinician periódicamente. El total semanal de uso no debería verse afectado, pero en la práctica, los usuarios reportan agotamiento acelerado durante horas pico (de lunes a viernes, entre las 5:00 am y las 11:00 am PT / 1:00 pm a 7:00 pm GMT). Anthropic reconoció oficialmente que ajustó los límites en horario peak para gestionar la demanda, lo que impacta a aproximadamente el 7% de los usuarios de los planes Pro y Max, aunque esto no explica completamente la magnitud del problema reportado.

El rol de los tokens cache_read: ¿el verdadero culpable?

Aquí está el nudo técnico del asunto. En la API de Claude, existen tres tipos principales de tokens que se pueden consumir en una llamada:

  • Input tokens: el contenido nuevo que se envía al modelo en cada solicitud.
  • Cache write tokens: el costo de almacenar en caché un prompt o contexto para reutilizarlo.
  • Cache read tokens: el costo (mucho menor) de recuperar un contexto ya cacheado, en lugar de procesarlo desde cero.

La lógica de la caché fue diseñada precisamente para ahorrar tokens: reutilizar contexto largo (como el código de un repositorio completo) sin reprocesarlo en cada turno. Normalmente, los cache_read tokens se facturan a una fracción del costo de los input tokens. Sin embargo, múltiples usuarios sospechan que, bajo ciertas condiciones, estos tokens están siendo contabilizados a la misma tasa que los tokens de entrada estándar, inflando artificialmente el consumo de cuota.

En sesiones con múltiples contextos activos simultáneamente, o en flujos agénticos donde el modelo consulta el mismo código base varias veces, este error se amplifica. El resultado: la cuota que debería durar varias horas desaparece en cuestión de minutos.

Issues relacionados: un patrón que se repite desde marzo de 2026

El problema reportado en el issue #45756 no surgió en el vacío. Es parte de una cadena de reportes que comenzó a aparecer masivamente en el repositorio de Claude Code en GitHub desde el 23 de marzo de 2026:

  • Issue #38335: usuarios del plan Max informan que la ventana de 5 horas se agota anormalmente rápido al usar Claude vía CLI desde esa fecha.
  • Issue #44453: un developer reporta haber consumido toda su cuota Pro Max 5x en una hora, usando exactamente el mismo flujo de trabajo que antes con Opus 4.6.
  • Issue #37394: la cuota de Max se agota en menos de 30 minutos al trabajar con Opus 4.6 high, cuando dos días antes el rendimiento era normal.
  • Issue #34410: plan Max x20 agotado en aproximadamente 10 prompts, antes de poder completar una sola feature; el mismo task fue terminado sin problemas por GPT-4.5.
  • Issue #41605: el toggle /fast en el plan Pro Max reporta «extra usage credits exhausted», aparentemente porque verifica el balance de créditos extra ($0.00) en lugar del quota del plan.

El medio MacRumors también cubrió el fenómeno a finales de marzo, citando múltiples testimonios de suscriptores de Claude Max que ven sus sesiones de 5 horas agotarse en una o dos horas con las mismas cargas de trabajo de siempre.

Impacto real para founders y equipos de desarrollo

Para un equipo de startup que depende de Claude Code como su asistente de programación principal, este bug tiene consecuencias muy concretas:

  • Productividad interrumpida: tareas que antes se completaban en una sesión ahora quedan a medias, obligando al equipo a esperar el reinicio de cuota.
  • Costo oculto: se paga por 5x de uso y se obtiene, en la práctica, menos que el plan base. La propuesta de valor del plan premium queda comprometida.
  • Planificación imposible: si no se puede predecir cuánto va a durar la cuota, es difícil asignar tareas de desarrollo que dependan de la herramienta.
  • Desventaja competitiva: en al menos un caso documentado, la misma tarea que Claude no pudo terminar por límite de cuota fue completada exitosamente por GPT-4.5.

El impacto es especialmente severo para quienes trabajan con flujos agénticos: tareas de larga duración, generación de código iterativa, o exploración de grandes codebases son exactamente los casos de uso que más se beneficiarían de la caché, pero también los que más sufren si esta se contabiliza incorrectamente.

¿Qué hacer mientras Anthropic resuelve el problema?

Aunque no existe una solución oficial confirmada a la fecha de publicación de este artículo, hay algunas medidas que puedes implementar para mitigar el impacto:

  1. Trabaja fuera del horario peak: evita las franjas de 5:00 am a 11:00 am PT (1:00 pm a 7:00 pm GMT) los días hábiles. Según Anthropic, es cuando se aplican restricciones adicionales de demanda.
  2. Evita el toggle /fast en Pro Max: este modo parece verificar un balance de créditos extra separado, que en muchos casos está en $0.00, en lugar de usar la cuota del plan.
  3. Monitorea activamente tu consumo: aunque la visibilidad de cuota en Claude Code es limitada, intenta correlacionar el número de solicitudes con el agotamiento observado para identificar patrones.
  4. Divide sesiones largas: en lugar de dejar correr flujos agénticos extensos de forma continua, intenta fragmentarlos para no concentrar todo el consumo en una sola ventana.
  5. Reporta tu caso: si experimentas el problema, añadir tu caso en los issues de GitHub ayuda a Anthropic a priorizar el fix. Incluye el modelo utilizado (Opus 4.6, etc.), el tipo de tarea y la velocidad de agotamiento observada.

¿Qué sabemos sobre la respuesta de Anthropic?

A la fecha, Anthropic ha reconocido los ajustes de límites en horario peak, pero no ha emitido una respuesta pública específica sobre el posible bug de contabilización de tokens cache_read. La empresa indicó que estos cambios buscan mantener la estabilidad del servicio durante períodos de alta demanda, preservando los límites semanales totales sin reducción.

Sin embargo, la escala y consistencia de los reportes en GitHub apunta a algo que va más allá de simples ajustes de capacidad: hay un comportamiento inesperado en la contabilización de tokens que requiere una investigación técnica profunda. La comunidad de developers sigue monitoreando la situación activamente.

Conclusión

El agotamiento acelerado de cuota en el plan Pro Max 5x de Claude Code es un problema real, documentado y que afecta directamente la productividad de developers y founders que han apostado por esta herramienta como parte de su stack de IA. La hipótesis más sólida apunta a una contabilización incorrecta de los tokens cache_read, lo que convierte una feature de optimización de costos en un vector de consumo acelerado.

Mientras se espera una solución oficial de Anthropic, la mejor estrategia es trabajar fuera del horario peak, evitar el modo /fast, y monitorear de cerca el consumo. Y si tu startup depende de modelos de lenguaje para escalar, este es el momento de diversificar: conocer bien las limitaciones y costos reales de cada herramienta es parte del juego.

Descubre cómo otros founders implementan y optimizan herramientas de IA sin quemarse la cuota ni el presupuesto. Únete gratis a la comunidad de Ecosistema Startup.

Aprender con founders

Fuentes

  1. https://github.com/anthropics/claude-code/issues/45756 (fuente original)
  2. https://www.macrumors.com/2026/03/26/claude-code-users-rapid-rate-limit-drain-bug/ (fuente adicional)
  3. https://github.com/anthropics/claude-code/issues/44453 (fuente adicional)
  4. https://github.com/anthropics/claude-code/issues/38335 (fuente adicional)
  5. https://github.com/anthropics/claude-code/issues/37394 (fuente adicional)
  6. https://github.com/anthropics/claude-code/issues/34410 (fuente adicional)
  7. https://github.com/anthropics/claude-code/issues/41605 (fuente adicional)
  8. https://github.com/anthropics/claude-code/issues/16157 (fuente adicional)
¿te gustó o sirvió lo que leíste?, Por favor, comparte.

👥 ¿Quieres ir más allá de la noticia?

En nuestra comunidad discutimos las tendencias, compartimos oportunidades y nos ayudamos entre emprendedores. Sin humo, solo acción.

👥 Unirme a la comunidad

Daily Shot: Tu ventaja táctica

Lo que pasó en las últimas 24 horas, resumido para que tú no tengas que filtrarlo.

Suscríbete para recibir cada mañana la curaduría definitiva del ecosistema startup e inversionista. Sin ruido ni rodeos, solo la información estratégica que necesitas para avanzar:

  • Venture Capital & Inversiones: Rondas, fondos y movimientos de capital.
  • IA & Tecnología: Tendencias, Web3 y herramientas de automatización.
  • Modelos de Negocio: Actualidad en SaaS, Fintech y Cripto.
  • Propósito: Erradicar el estancamiento informativo dándote claridad desde tu primer café.

📡 El Daily Shot Startupero

Noticias del ecosistema startup en 2 minutos. Gratis, cada día hábil.


Share to...