El Ecosistema Startup > Blog > Actualidad Startup > CLI vs MCP: Cómo reducir costos de tokens en agentes IA 94%

CLI vs MCP: Cómo reducir costos de tokens en agentes IA 94%

El impuesto oculto que pagan todos los agentes IA

Cada startup que usa agentes de IA con Model Context Protocol (MCP) está pagando un impuesto invisible. No se trata de los costos de las llamadas a la API, esas están bien. El problema está en el manual de instrucciones.

Antes de que tu agente pueda hacer algo útil, necesita saber qué herramientas tiene disponibles. La solución de MCP es volcar todo el catálogo de herramientas en la conversación como JSON Schema. Cada herramienta, cada parámetro, cada opción. Todo. Desde el inicio.

Existe una alternativa que hace el mismo trabajo pero con 94% menos tokens: CLI (Command Line Interface).

Mismo trabajo, empaquetado diferente

El desarrollador Kan Yılmaz tomó un servidor MCP y generó una CLI desde él usando CLIHub, una herramienta que él mismo creó. Mismas herramientas, mismo OAuth, misma API subyacente. Solo cambian dos cosas: qué se carga al inicio de sesión y cómo el agente llama a una herramienta.

Los números que compartió asumen una configuración típica: 6 servidores MCP, 14 herramientas cada uno, 84 herramientas en total.

Carga inicial de sesión

MCP vuelca cada esquema de herramienta en la conversación desde el principio. CLI usa una lista ligera de habilidades: solo nombres y ubicaciones. El agente descubre los detalles cuando los necesita.

MCP carga aproximadamente 15,540 tokens al inicio (~185 tokens por herramienta × 84 herramientas). Incluye toda la estructura JSON Schema con propiedades, tipos, descripciones y validaciones.

CLI carga solo 300 tokens (~50 tokens por herramienta × 6 herramientas). Una lista simple en XML con nombre, descripción y ubicación.

Llamadas a herramientas

Una vez que el agente sabe qué está disponible, necesita ejecutar una herramienta.

La llamada de MCP usa aproximadamente 30 tokens porque las definiciones ya están precargadas. Es eficiente en la ejecución, pero costoso en el setup.

La llamada de CLI usa aproximadamente 610 tokens en la primera vez: ~4 tokens para descubrir herramientas con –help, ~600 tokens para recibir la referencia completa de comandos (14 herramientas), y ~6 tokens para ejecutar. En llamadas subsecuentes al mismo comando, solo paga los 6 tokens de ejecución.

Los números completos

Cuando comparas el uso total de tokens en diferentes escenarios, la diferencia es dramática:

  • Solo inicio de sesión: MCP 15,540 tokens vs CLI 300 tokens (98% de ahorro)
  • Con 1 herramienta: MCP 15,570 tokens vs CLI 910 tokens (94% de ahorro)
  • Con 10 herramientas: MCP 15,840 tokens vs CLI 964 tokens (94% de ahorro)
  • Con 100 herramientas: MCP 18,540 tokens vs CLI 1,504 tokens (92% de ahorro)

CLI usa aproximadamente 94% menos tokens en general. Para una startup que procesa miles de sesiones de agentes al mes, esto se traduce en ahorros reales de costos operativos.

Qué pasa con Anthropic Tool Search

Anthropic lanzó Tool Search, una funcionalidad que carga un índice de búsqueda en lugar de cada esquema, y luego obtiene herramientas bajo demanda. Típicamente reduce el uso de tokens en 85%.

Es la misma idea que la carga diferida (lazy loading) de CLI. Pero cuando Tool Search obtiene una herramienta, todavía extrae el JSON Schema completo.

Comparando los tres enfoques:

  • Inicio de sesión: MCP 15,540 | Tool Search 500 | CLI 300 tokens
  • Con 1 herramienta: MCP 15,570 | Tool Search 3,530 | CLI 910 tokens (74% menos que Tool Search)
  • Con 10 herramientas: MCP 15,840 | Tool Search 3,800 | CLI 964 tokens (75% menos que Tool Search)
  • Con 100 herramientas: MCP 18,540 | Tool Search 12,500 | CLI 1,504 tokens (88% menos que Tool Search)

Tool Search es más costoso que CLI, y además solo funciona con modelos de Anthropic. CLI es más barato y funciona con cualquier modelo: OpenAI, Google, Anthropic, modelos open source.

CLIHub: de MCP a CLI en un comando

Kan Yılmaz enfrentó dificultades para encontrar CLIs para muchas herramientas, así que construyó CLIHub: un directorio de CLIs diseñados específicamente para uso de agentes.

El proyecto es open source y ofrece un conversor que permite crear CLIs desde servidores MCP existentes. Literalmente en un comando.

Esto es especialmente relevante para founders técnicos que están construyendo agentes IA internos o productos basados en agentes. Puedes tomar tus integraciones MCP actuales (Notion, Linear, GitHub, Slack, etc.) y convertirlas a CLI para reducir costos operativos inmediatamente.

Casos de uso prácticos

Esta optimización tiene impacto real en varios escenarios:

  • Agentes de soporte al cliente que necesitan acceso a múltiples herramientas (CRM, base de conocimiento, ticketing)
  • Asistentes internos que integran herramientas de productividad (Notion, Google Workspace, proyecto management)
  • Agentes de automatización que orquestan workflows entre diferentes servicios
  • Sistemas de análisis que consultan múltiples fuentes de datos

En todos estos casos, CLI reduce el costo por sesión en más de 90% comparado con MCP tradicional, sin cambiar funcionalidad.

Consideraciones de implementación

Migrar de MCP a CLI no es solo copiar y pegar. Hay trade-offs que considerar:

Ventajas de CLI:

  • Reducción masiva de tokens (92-98% en inicio de sesión)
  • Compatible con cualquier modelo de IA
  • Descubrimiento diferido (pagas solo por lo que usas)
  • Menos contexto = más espacio para conversación real

Consideraciones:

  • Primera llamada a cada herramienta es más costosa (~610 tokens vs ~30)
  • Requiere que el agente sepa ejecutar comandos de terminal
  • Necesitas gestionar las CLIs instaladas en tu infraestructura

Para la mayoría de casos de uso con agentes que manejan múltiples herramientas, el ahorro inicial compensa ampliamente el costo de descubrimiento.

Conclusión

MCP resolvió un problema real: estandarizar cómo los agentes IA acceden a herramientas. Pero su enfoque de cargar todo upfront crea un impuesto de tokens que la mayoría de founders no notan hasta que escalan.

CLI ofrece una alternativa probada que reduce costos en 94% sin sacrificar funcionalidad. Con herramientas como CLIHub, la migración es trivial: un comando convierte tus servidores MCP existentes.

Para startups construyendo productos basados en agentes IA, esto no es optimización prematura. Es la diferencia entre márgenes saludables y subsidiar tokens innecesarios a escala.

¿Implementando agentes IA en tu startup? Únete gratis a Ecosistema Startup y conecta con founders que están resolviendo los mismos desafíos de optimización, costos y arquitectura de agentes.

Conectar con founders

Fuentes

  1. https://kanyilmaz.me/2026/02/23/cli-vs-mcp.html (fuente original)
  2. https://modelcontextprotocol.io/introduction
  3. https://www.anthropic.com/engineering/advanced-tool-use
  4. https://github.com/thellimist/clihub
¿te gustó o sirvió lo que leíste?, Por favor, comparte.

Daily Shot: Tu ventaja táctica

Lo que pasó en las últimas 24 horas, resumido para que tú no tengas que filtrarlo.

Suscríbete para recibir cada mañana la curaduría definitiva del ecosistema startup e inversionista. Sin ruido ni rodeos, solo la información estratégica que necesitas para avanzar:

  • Venture Capital & Inversiones: Rondas, fondos y movimientos de capital.
  • IA & Tecnología: Tendencias, Web3 y herramientas de automatización.
  • Modelos de Negocio: Actualidad en SaaS, Fintech y Cripto.
  • Propósito: Erradicar el estancamiento informativo dándote claridad desde tu primer café.

📡 El Daily Shot Startupero

Noticias del ecosistema startup en 2 minutos. Gratis, cada día hábil.


Share to...