El Ecosistema Startup > Blog > Actualidad Startup > Thinking Machines: IA full-duplex que escucha mientras habla

Thinking Machines: IA full-duplex que escucha mientras habla

¿Qué está construyendo Thinking Machines?

Thinking Machines Lab, la startup de Mira Murati (ex-CTO de OpenAI), está desarrollando una tecnología que rompe con el modelo tradicional de interacción con IA. En lugar del esquema actual donde tú hablas, la IA escucha, luego la IA responde y tú escuchas, están creando un sistema full-duplex que procesa tu entrada y genera respuesta simultáneamente.

El resultado: una experiencia más similar a una llamada telefónica que a un intercambio de mensajes. Esta diferencia aparentemente pequeña tiene implicaciones enormes para la UX de productos que dependen de interacción por voz.

La compañía, fundada en febrero de 2025, ya levantó $2.000 millones en su ronda inicial (julio 2025) con una valoración de $12.000 millones, respaldada por Andreessen Horowitz, Nvidia, AMD y Cisco. El equipo incluye a John Schulman (Chief Scientist, cofundador de OpenAI) y Barret Zoph (CTO, ex-OpenAI), junto a ~30 investigadores de OpenAI, Meta AI, Google DeepMind y Character AI.

👥 ¿Quieres ir más allá de la noticia?

En nuestra comunidad discutimos las tendencias, compartimos oportunidades y nos ayudamos entre emprendedores. Sin humo, solo acción.

👥 Unirme a la comunidad

¿Por qué el full-duplex cambia las reglas del juego?

La tecnología full-duplex en IA conversacional no es nueva conceptualmente, pero su implementación práctica ha sido limitada. Según datos del mercado de IA conversacional en 2025-2026, el full-duplex reduce la latencia en 50% comparado con el modelo turn-taking tradicional.

El mercado de IA conversacional alcanzó $15.000 millones en 2025, con proyecciones de crecimiento del 40% año tras año. El 70% de las empresas ya están adoptando estas soluciones en customer service, según reportes de McKinsey y VentureBeat.

Lo que Thinking Machines aporta es la combinación de full-duplex con metaaprendizaje: la capacidad de que la IA recuerde interacciones pasadas y se adapte como lo haría un humano. Esto permite que el agente no solo responda en tiempo real, sino que mejore su comprensión del usuario específico con cada conversación.

¿Quiénes son los competidores en este espacio?

El ecosistema de IA conversacional full-duplex está altamente competitivo. Los principales actores incluyen:

  • ElevenLabs / Character.AI: Especializados en voz full-duplex nativa, con más de $100M en funding reciente. Curiosamente, algunos ex-empleados de estas compañías ahora están en Thinking Machines.
  • Inflection AI (Pi): Asistentes de voz personalizados con full-duplex en apps móviles, respaldados por Microsoft con $1.500 millones.
  • xAI (Grok): Integración con X/Twitter para conversacional en tiempo real, con $6.000 millones levantados en 2025.
  • Anthropic (Claude): Enfoque en seguridad y multimodalidad, con más de $8.000 millones de Amazon y Goldman Sachs.

La diferenciación de Thinking Machines radica en su enfoque de ciencia abierta y adaptabilidad, en contraste con los modelos cerrados de los gigantes establecidos.

¿Qué significa esto para tu startup?

Si estás construyendo un producto con agentes de voz o considerando implementar IA conversacional, esto es lo que debes saber y hacer:

1. Evalúa si tu caso de uso necesita full-duplex

No todas las interacciones requieren conversación simultánea. El full-duplex tiene sentido cuando:

  • Hay interrupciones frecuentes del usuario (customer service complejo, ventas consultivas)
  • La latencia es crítica para la experiencia (asistentes en tiempo real, emergencias)
  • Buscas una experiencia más natural y humana (companionship, coaching, terapia)

Para consultas simples tipo FAQ, el modelo turn-taking tradicional puede ser más eficiente y económico.

2. Prepara tu infraestructura para baja latencia

El full-duplex requiere procesamiento en tiempo real. Acciones concretas:

  • Edge computing: Considera procesar audio cerca del usuario para reducir latencia de red
  • WebSockets o WebRTC: Implementa protocolos que permitan comunicación bidireccional persistente
  • Buffering inteligente: Diseña sistemas que manejen solapamiento de audio sin perder información

3. Diseña UX que aproveche la simultaneidad

La tecnología no sirve de nada sin una experiencia de usuario que la aproveche:

  • Permite interrupciones naturales: La IA debe poder pausar cuando el usuario habla
  • Implementa feedback visual: Muestra cuando la IA está "escuchando" vs "pensando" vs "hablando"
  • Diseña para multimodalidad: Combina voz con texto, imágenes o video cuando aporte valor

4. Considera el impacto en costos

Según datos del sector, los modelos adaptables como los que propone Thinking Machines pueden reducir 30-50% los costos de fine-tuning comparado con entrenar desde cero. Sin embargo:

  • El procesamiento full-duplex consume más recursos computacionales por minuto de interacción
  • La infraestructura de baja latencia tiene costos de infraestructura más altos
  • El ROI viene de mejor retención y mayor satisfacción, no de reducción de costos operativos

Casos de uso concretos para implementar hoy

Basado en lo que el mercado está validando en 2025-2026, estos son los casos con mejor ROI:

Customer Service en E-commerce: Un agente que puede mostrar productos mientras el usuario describe lo que busca. Startups similares a Shopify han reportado +20% en retención con implementación de voz avanzada.

Educación y Tutoría: Un tutor IA que adapta lecciones en tiempo real según las preguntas del estudiante. El metaaprendizaje permite recordar el progreso y estilo de aprendizaje. Casos como Duolingo han visto reducción de 15% en dropout con tutores adaptativos.

Salud y Telemedicina: Asistentes que recuerdan el historial del paciente y combinan voz con datos de wearables. Startups como Teladoc reportan 25% más eficiencia en consultas con IA colaborativa.

Ventas B2B complejas: Agentes que pueden manejar objeciones en tiempo real y acceder a documentación mientras conversan. Ideal para productos enterprise con ciclos de venta largos.

El contexto del ecosistema hispanohablante

Para founders en LATAM y España, hay consideraciones específicas:

En España: El acceso al mercado europeo requiere cumplir con AI Act de la UE. La tecnología full-duplex que procesa audio en tiempo real debe considerar privacidad de datos y consentimiento explícito. Thinking Machines, al enfocarse en ciencia abierta, podría facilitar auditorías de cumplimiento.

En LATAM: La infraestructura de baja latencia es un desafío en algunas regiones. Considera:

  • Implementar CDNs regionales (AWS, Google Cloud tienen regiones en São Paulo, Santiago, Ciudad de México)
  • Diseñar para conexiones intermitentes: El sistema debe manejar caídas sin perder contexto
  • Soporte multidioma nativo: Español de México, Argentina, España tienen variaciones que la IA debe reconocer

El mercado hispanohablante de IA conversacional está en crecimiento acelerado, con adopción en banking, retail y telecomunicaciones liderando. Hay oportunidad para startups que resuelvan casos de uso específicos de la región.

¿Cuándo estará disponible esta tecnología?

Thinking Machines no ha anunciado una fecha pública de lanzamiento para su tecnología full-duplex. Sin embargo, considerando que:

  • La compañía se fundó en febrero 2025
  • Cerró $2.000 millones en julio 2025
  • Tiene un equipo de ~30 investigadores de primer nivel
  • El artículo de TechCrunch (mayo 2026) indica que están en desarrollo activo

Es razonable esperar un beta privado en los próximos 6-12 meses, con API pública posiblemente en 2027. Mientras tanto, las alternativas de ElevenLabs, Inflection AI y las capacidades de voz de OpenAI (GPT-4o) ofrecen funcionalidades full-duplex limitadas que puedes evaluar.

Conclusión

La apuesta de Thinking Machines por IA full-duplex representa una evolución natural en la UX de IA conversacional. Para founders, la pregunta no es si esta tecnología llegará, sino cuándo tu caso de uso la necesitará.

Si estás construyendo productos donde la naturalidad de la conversación impacta directamente en retención o conversión, vale la pena:

  1. Monitorear los anuncios de Thinking Machines y competidores
  2. Experimentar con APIs de voz full-duplex existentes (ElevenLabs, OpenAI Voice)
  3. Diseñar tu UX asumiendo que la latencia bajará 50% en los próximos 18 meses
  4. Preparar infraestructura que escale con procesamiento en tiempo real

La ventaja competitiva no estará en quien adopte primero la tecnología, sino en quien diseñe la mejor experiencia alrededor de ella.

¿Ya estás experimentando con agentes de voz en tu startup? Únete gratis a la comunidad de Ecosistema Startup para conectar con otros founders que están implementando IA, compartir casos de uso y acceder a recursos exclusivos sobre herramientas de IA para escalar tu negocio. Más de 200.000 founders hispanohablantes ya están construyendo el futuro.

Fuentes

  1. TechCrunch - Thinking Machines full-duplex AI (fuente original)
  2. Ecosistema Startup - Thinking Machines valuation $12B
  3. Thinking Machines Lab - Sitio oficial
  4. Eesel.ai - Thinking Machines Lab perfil 2026

👥 ¿Quieres ir más allá de la noticia?

En nuestra comunidad discutimos las tendencias, compartimos oportunidades y nos ayudamos entre emprendedores. Sin humo, solo acción.

👥 Unirme a la comunidad

Daily Shot: Tu ventaja táctica

Lo que pasó en las últimas 24 horas, resumido para que tú no tengas que filtrarlo.

Suscríbete para recibir cada mañana la curaduría definitiva del ecosistema startup e inversionista. Sin ruido ni rodeos, solo la información estratégica que necesitas para avanzar:

  • Venture Capital & Inversiones: Rondas, fondos y movimientos de capital.
  • IA & Tecnología: Tendencias, Web3 y herramientas de automatización.
  • Modelos de Negocio: Actualidad en SaaS, Fintech y Cripto.
  • Propósito: Erradicar el estancamiento informativo dándote claridad desde tu primer café.

📡 El Daily Shot Startupero

Noticias del ecosistema startup en 2 minutos. Gratis, cada día hábil.


Share to...