Etched levanta $800M: chips de inferencia IA compiten con Nvidia

Etched acaba de cerrar una ronda de US$800 millones en 2026 con el respaldo de Jane Street, la firma de trading de alta frecuencia, y VentureTech Alliance, un fondo vinculado estratégicamente a TSMC, el fabricante de chips más grande del mundo. La startup de hardware para IA, que diseña chips especializados exclusivamente para inferencia (ejecutar modelos ya entrenados), reveló además haber firmado contratos de venta por US$1.000 millones.

Para founders que dependen de infraestructura de IA para sus productos, esto señala un cambio crítico: la industria está migrando de la obsesión por entrenar modelos a optimizar la inferencia, donde están los costos reales y la experiencia del usuario final. Si tu startup consume tokens de APIs de IA o corre modelos propios, las alternativas a las GPU de Nvidia que están emergiendo podrían reducir tus costos de infraestructura entre 10x y 20x.

¿Qué hace exactamente Etched y por qué es diferente?

Etched no es otra startup de IA genérica. Es una empresa de semiconductores que desarrolló Sohu, un chip ASIC (Application-Specific Integrated Circuit) que cablea físicamente la arquitectura Transformer —la base de modelos como Llama, GPT y la mayoría de los LLMs actuales— directamente en el silicio.

👥 ¿Quieres ir más allá de la noticia?

En nuestra comunidad discutimos las tendencias, compartimos oportunidades y nos ayudamos entre emprendedores. Sin humo, solo acción.

👥 Unirme a la comunidad

A diferencia de las GPU de Nvidia (como las H100 o Blackwell), que son hardware genérico programable para múltiples tareas, Sohu está optimizado para una sola cosa: ejecutar inferencia de modelos Transformer con velocidad extrema. Esta especialización tiene implicaciones profundas:

Rendimiento: Sohu puede ejecutar hasta 500.000 tokens por segundo con modelos como Llama 70B.
Eficiencia: Un solo servidor con 8 chips Sohu puede reemplazar hasta 160 GPU Nvidia H100, según la empresa.
Costo: Al eliminar pasos intermedios de software y optimizar el hardware para una arquitectura específica, el costo por token se reduce drásticamente.
Software abierto: Etched proporciona una pila de software de código abierto para facilitar la integración con frameworks de IA estándar.

La apuesta es arriesgada: si la industria migra a arquitecturas diferentes a Transformer en el futuro, el chip quedaría obsoleto. Pero si Transformer se mantiene como estándar (como todo indica hasta 2026), Etched tiene una ventaja competitiva difícil de replicar.

¿Por qué Jane Street y TSMC invirtieron US$800 millones?

Los backers de esta ronda no son inversores de venture capital tradicionales. Cada uno tiene una razón estratégica clara:

Jane Street es una firma de trading de alta frecuencia que compite en milisegundos. Para ellos, la latencia casi nula de los chips de Etched es crítica: ejecutar estrategias de trading antes que la competencia genera ganancias masivas. No están invirtiendo por retorno financiero únicamente; están asegurando acceso prioritario a tecnología que afecta su núcleo de negocio.

VentureTech Alliance, con su partnership estratégico con TSMC, representa al fabricante de chips más importante del mundo. TSMC produce los chips de Apple, Nvidia, AMD y ahora también los de Etched. Al invertir, TSMC asegura demanda de producción para un chip de alto rendimiento que utiliza sus nodos avanzados (probablemente 3nm o 2nm), posicionándose mejor en la carrera de hardware para IA.

Este tipo de inversores estratégicos (clientes + proveedores) es una señal de madurez del ecosistema: ya no son solo fondos de VC apostando por promesas, sino actores industriales con piel en el juego.

¿Quiénes son los competidores en el mercado de inference chips?

Etched no está sola. El mercado de chips de inferencia de IA está calentándose en 2026 con varios jugadores notables:

Groq desarrolla la LPU (Language Processing Unit), un chip que usa memoria SRAM ultra-rápida para lograr inferencia en tiempo real sin latencia. Fundada en 2016 por Jonathan Ross (uno de los creadores del TPU de Google), Groq se especializa en aplicaciones que requieren respuestas instantáneas, como soporte al cliente interactivo o análisis financiero en vivo.

Cerebras fabrica chips a escala de oblea (30 cm de lado), con 6.000 veces más velocidad de acceso a memoria que una Nvidia H100. Su chip está diseñado casi exclusivamente para ofrecer respuestas inmediatas a usuarios humanos, aunque paga el precio en flexibilidad.

VSORA, una startup europea, completó el tape-out de Jotunn8, su chip de inferencia con 3.200 Tflops de potencia y 288 GB de memoria HBM3e. Consume 50% menos energía que los chips líderes del mercado y posiciona a Europa como actor clave en hardware de IA.

Meta también desarrolla sus propios chips bajo el programa MTIA (Meta Training and Inference Accelerator), optimizados para los modelos de recomendación y clasificación que usan en Facebook e Instagram.

Lo sin precedentes: Nvidia, AMD e Intel están co-invirtiendo en startups de este espacio. La colaboración entre competidores históricos indica que la crisis de eficiencia en hardware de IA es tan crítica que todos deben remar en la misma dirección.

¿Por qué el mercado se obsesiona ahora con inferencia y no con training?

Hasta 2024-2025, la industria estaba obsesionada con entrenar modelos más grandes y potentes. En 2026, el foco cambió a inferencia, y la razón es económica:

El entrenamiento es un costo único: entrenas un modelo una vez (aunque sea caro). La inferencia es un costo recurrente: cada vez que un usuario interactúa con tu modelo, estás consumiendo computación. Con millones de usuarios diarios, los costos de inferencia eclipsan rápidamente los de entrenamiento.

Además, la experiencia del usuario depende de la inferencia: nadie tolera 5 segundos de latencia en un chatbot o un agente de voz. Las aplicaciones de IA en producción (soporte al cliente, análisis financiero, agentes autónomos) requieren respuestas en tiempo real, y las GPU genéricas de Nvidia no están optimizadas para eso.

Según análisis del sector, el mercado de inferencia de IA está creciendo exponencialmente debido a la demanda de aplicaciones de tiempo real. Las startups que resuelven este problema están levantando rondas masivas y elevando sus valoraciones.

¿Qué significa esto para tu startup?

Si eres founder de una startup que usa IA en su producto, esto no es solo noticia curiosa: es información accionable que afecta tu estrategia de infraestructura y costos.

Primero, evalúa tu dependencia de Nvidia. Si estás corriendo inferencia en GPU H100 o similares para modelos Transformer, estás pagando por hardware genérico cuando existen alternativas especializadas. Etched, Groq y Cerebras ofrecen reducciones de costo de 10x a 20x según sus especificaciones. Incluso si no migras hoy, tener alternativas en tu radar te da poder de negociación con proveedores actuales.

Segundo, considera la arquitectura de tus modelos. Si usas modelos basados en Transformer (como la mayoría), los chips ASIC especializados como Sohu de Etched pueden ser significativamente más eficientes. Pero si tu startup depende de arquitecturas experimentales o cambia frecuentemente de modelo, la flexibilidad de las GPU puede valer el costo adicional.

Tercero, monitorea a los inversores estratégicos. Cuando Jane Street o TSMC invierten en una startup de hardware, no es solo por retorno financiero: es porque ven valor estratégico inmediato. Eso es una señal de validación del mercado que deberías considerar al evaluar proveedores de infraestructura.

Acciones concretas para implementar esta semana:

Audita tus costos de inferencia: Calcula cuánto gastas mensualmente en APIs de IA o infraestructura propia para inferencia. Si supera el 20% de tu burn rate, prioriza evaluar alternativas de hardware especializado.
Prueba proveedores alternativos: Contacta a Groq, Cerebras o Etched (cuando estén disponibles) para benchmarks de rendimiento y costo con tus modelos específicos. No asumas que Nvidia es la única opción.
Negocia con datos: Si usas Nvidia o proveedores cloud, usa las alternativas emergentes como palanca de negociación. Los proveedores establecidos saben que están perdiendo ventaja en inferencia y pueden ofrecer descuentos.

Conclusión

La ronda de US$800 millones de Etched en 2026 no es solo otra noticia de funding: es un indicador de que el mercado de hardware para IA está madurando y especializándose. Para founders hispanohablantes que construyen productos con IA, esto abre oportunidades reales de reducir costos de infraestructura y mejorar la experiencia del usuario.

El ecosistema de inference chips está pasando de ser un nicho experimental a un mercado competitivo con múltiples jugadores validados por inversores estratégicos. Si tu startup depende de inferencia de IA, es momento de evaluar alternativas a las GPU tradicionales y negociar con datos concretos.

La próxima ventaja competitiva en IA no vendrá solo de tener el mejor modelo, sino de ejecutarlo de la manera más eficiente y rentable.