Thinking Machines: IA full-duplex que escucha mientras habla

¿Qué está construyendo Thinking Machines?

Thinking Machines Lab, la startup de Mira Murati (ex-CTO de OpenAI), está desarrollando una tecnología que rompe con el modelo tradicional de interacción con IA. En lugar del esquema actual donde tú hablas, la IA escucha, luego la IA responde y tú escuchas, están creando un sistema full-duplex que procesa tu entrada y genera respuesta simultáneamente.

El resultado: una experiencia más similar a una llamada telefónica que a un intercambio de mensajes. Esta diferencia aparentemente pequeña tiene implicaciones enormes para la UX de productos que dependen de interacción por voz.

La compañía, fundada en febrero de 2025, ya levantó $2.000 millones en su ronda inicial (julio 2025) con una valoración de $12.000 millones, respaldada por Andreessen Horowitz, Nvidia, AMD y Cisco. El equipo incluye a John Schulman (Chief Scientist, cofundador de OpenAI) y Barret Zoph (CTO, ex-OpenAI), junto a ~30 investigadores de OpenAI, Meta AI, Google DeepMind y Character AI.

👥 ¿Quieres ir más allá de la noticia?

En nuestra comunidad discutimos las tendencias, compartimos oportunidades y nos ayudamos entre emprendedores. Sin humo, solo acción.

👥 Unirme a la comunidad

¿Por qué el full-duplex cambia las reglas del juego?

La tecnología full-duplex en IA conversacional no es nueva conceptualmente, pero su implementación práctica ha sido limitada. Según datos del mercado de IA conversacional en 2025-2026, el full-duplex reduce la latencia en 50% comparado con el modelo turn-taking tradicional.

El mercado de IA conversacional alcanzó $15.000 millones en 2025, con proyecciones de crecimiento del 40% año tras año. El 70% de las empresas ya están adoptando estas soluciones en customer service, según reportes de McKinsey y VentureBeat.

Lo que Thinking Machines aporta es la combinación de full-duplex con metaaprendizaje: la capacidad de que la IA recuerde interacciones pasadas y se adapte como lo haría un humano. Esto permite que el agente no solo responda en tiempo real, sino que mejore su comprensión del usuario específico con cada conversación.

¿Quiénes son los competidores en este espacio?

El ecosistema de IA conversacional full-duplex está altamente competitivo. Los principales actores incluyen:

ElevenLabs / Character.AI: Especializados en voz full-duplex nativa, con más de $100M en funding reciente. Curiosamente, algunos ex-empleados de estas compañías ahora están en Thinking Machines.
Inflection AI (Pi): Asistentes de voz personalizados con full-duplex en apps móviles, respaldados por Microsoft con $1.500 millones.
xAI (Grok): Integración con X/Twitter para conversacional en tiempo real, con $6.000 millones levantados en 2025.
Anthropic (Claude): Enfoque en seguridad y multimodalidad, con más de $8.000 millones de Amazon y Goldman Sachs.

La diferenciación de Thinking Machines radica en su enfoque de ciencia abierta y adaptabilidad, en contraste con los modelos cerrados de los gigantes establecidos.

¿Qué significa esto para tu startup?

Si estás construyendo un producto con agentes de voz o considerando implementar IA conversacional, esto es lo que debes saber y hacer:

1. Evalúa si tu caso de uso necesita full-duplex

No todas las interacciones requieren conversación simultánea. El full-duplex tiene sentido cuando:

Hay interrupciones frecuentes del usuario (customer service complejo, ventas consultivas)
La latencia es crítica para la experiencia (asistentes en tiempo real, emergencias)
Buscas una experiencia más natural y humana (companionship, coaching, terapia)

Para consultas simples tipo FAQ, el modelo turn-taking tradicional puede ser más eficiente y económico.

2. Prepara tu infraestructura para baja latencia

El full-duplex requiere procesamiento en tiempo real. Acciones concretas:

Edge computing: Considera procesar audio cerca del usuario para reducir latencia de red
WebSockets o WebRTC: Implementa protocolos que permitan comunicación bidireccional persistente
Buffering inteligente: Diseña sistemas que manejen solapamiento de audio sin perder información

3. Diseña UX que aproveche la simultaneidad

La tecnología no sirve de nada sin una experiencia de usuario que la aproveche:

Permite interrupciones naturales: La IA debe poder pausar cuando el usuario habla
Implementa feedback visual: Muestra cuando la IA está "escuchando" vs "pensando" vs "hablando"
Diseña para multimodalidad: Combina voz con texto, imágenes o video cuando aporte valor

4. Considera el impacto en costos

Según datos del sector, los modelos adaptables como los que propone Thinking Machines pueden reducir 30-50% los costos de fine-tuning comparado con entrenar desde cero. Sin embargo:

El procesamiento full-duplex consume más recursos computacionales por minuto de interacción
La infraestructura de baja latencia tiene costos de infraestructura más altos
El ROI viene de mejor retención y mayor satisfacción, no de reducción de costos operativos

Casos de uso concretos para implementar hoy

Basado en lo que el mercado está validando en 2025-2026, estos son los casos con mejor ROI:

Customer Service en E-commerce: Un agente que puede mostrar productos mientras el usuario describe lo que busca. Startups similares a Shopify han reportado +20% en retención con implementación de voz avanzada.

Educación y Tutoría: Un tutor IA que adapta lecciones en tiempo real según las preguntas del estudiante. El metaaprendizaje permite recordar el progreso y estilo de aprendizaje. Casos como Duolingo han visto reducción de 15% en dropout con tutores adaptativos.

Salud y Telemedicina: Asistentes que recuerdan el historial del paciente y combinan voz con datos de wearables. Startups como Teladoc reportan 25% más eficiencia en consultas con IA colaborativa.

Ventas B2B complejas: Agentes que pueden manejar objeciones en tiempo real y acceder a documentación mientras conversan. Ideal para productos enterprise con ciclos de venta largos.

El contexto del ecosistema hispanohablante

Para founders en LATAM y España, hay consideraciones específicas:

En España: El acceso al mercado europeo requiere cumplir con AI Act de la UE. La tecnología full-duplex que procesa audio en tiempo real debe considerar privacidad de datos y consentimiento explícito. Thinking Machines, al enfocarse en ciencia abierta, podría facilitar auditorías de cumplimiento.

En LATAM: La infraestructura de baja latencia es un desafío en algunas regiones. Considera:

Implementar CDNs regionales (AWS, Google Cloud tienen regiones en São Paulo, Santiago, Ciudad de México)
Diseñar para conexiones intermitentes: El sistema debe manejar caídas sin perder contexto
Soporte multidioma nativo: Español de México, Argentina, España tienen variaciones que la IA debe reconocer

El mercado hispanohablante de IA conversacional está en crecimiento acelerado, con adopción en banking, retail y telecomunicaciones liderando. Hay oportunidad para startups que resuelvan casos de uso específicos de la región.

¿Cuándo estará disponible esta tecnología?

Thinking Machines no ha anunciado una fecha pública de lanzamiento para su tecnología full-duplex. Sin embargo, considerando que:

La compañía se fundó en febrero 2025
Cerró $2.000 millones en julio 2025
Tiene un equipo de ~30 investigadores de primer nivel
El artículo de TechCrunch (mayo 2026) indica que están en desarrollo activo

Es razonable esperar un beta privado en los próximos 6-12 meses, con API pública posiblemente en 2027. Mientras tanto, las alternativas de ElevenLabs, Inflection AI y las capacidades de voz de OpenAI (GPT-4o) ofrecen funcionalidades full-duplex limitadas que puedes evaluar.

Conclusión

La apuesta de Thinking Machines por IA full-duplex representa una evolución natural en la UX de IA conversacional. Para founders, la pregunta no es si esta tecnología llegará, sino cuándo tu caso de uso la necesitará.

Si estás construyendo productos donde la naturalidad de la conversación impacta directamente en retención o conversión, vale la pena:

Monitorear los anuncios de Thinking Machines y competidores
Experimentar con APIs de voz full-duplex existentes (ElevenLabs, OpenAI Voice)
Diseñar tu UX asumiendo que la latencia bajará 50% en los próximos 18 meses
Preparar infraestructura que escale con procesamiento en tiempo real

La ventaja competitiva no estará en quien adopte primero la tecnología, sino en quien diseñe la mejor experiencia alrededor de ella.

¿Ya estás experimentando con agentes de voz en tu startup? Únete gratis a la comunidad de Ecosistema Startup para conectar con otros founders que están implementando IA, compartir casos de uso y acceder a recursos exclusivos sobre herramientas de IA para escalar tu negocio. Más de 200.000 founders hispanohablantes ya están construyendo el futuro.

Fuentes

👥 ¿Quieres ir más allá de la noticia?

En nuestra comunidad discutimos las tendencias, compartimos oportunidades y nos ayudamos entre emprendedores. Sin humo, solo acción.

👥 Unirme a la comunidad

Thinking Machines: IA full-duplex que escucha mientras habla

¿Qué está construyendo Thinking Machines?

¿Por qué el full-duplex cambia las reglas del juego?

¿Quiénes son los competidores en este espacio?

¿Qué significa esto para tu startup?

1. Evalúa si tu caso de uso necesita full-duplex

2. Prepara tu infraestructura para baja latencia

3. Diseña UX que aproveche la simultaneidad

4. Considera el impacto en costos

Casos de uso concretos para implementar hoy

El contexto del ecosistema hispanohablante

¿Cuándo estará disponible esta tecnología?

Conclusión

Fuentes

Daily Shot: Tu ventaja táctica

Actualidad Startup, Startup Estados Unidos

California lanza tracker IA: 20% menos empleo dev junior en 2026

Actualidad Startup

Jolla Phone: 10.000 preórdenes y 5M€ en ventas comprometidas

Actualidad Startup

WasteFlow: IA que identifica 66 residuos y mejora eficiencia 50%

Actualidad Startup, Startup Perú

Revolut entra a Perú: US$13.000M para LATAM en 2026

Actualidad Startup

Patronus AI $50M Serie B: testing agentes IA antes de producción

Actualidad Startup, Startup Estados Unidos

OpenAI entra en publicidad con 900M usuarios y 2.000 anunciantes

Actualidad Startup, Startup Estados Unidos

Adobe compra Topaz Labs: tecnología Neurostream llega a Creative Cloud 2026

Actualidad Startup

CVE-2026-LGTM: Riesgos reales de IA en ciberseguridad para startups

Actualidad Startup, Startup Venezuela

Android detecta terremoto 7.5 en Venezuela con tu smartphone

Actualidad Startup, Startup Colombia, Startup Perú

Fintech Colombia y Perú 2026: prioridades regulatorias clave

Categorías

Por País

Audiovisual

Compañía

Nuestras Redes

¿Qué está construyendo Thinking Machines?

¿Por qué el full-duplex cambia las reglas del juego?

¿Quiénes son los competidores en este espacio?

¿Qué significa esto para tu startup?

1. Evalúa si tu caso de uso necesita full-duplex

2. Prepara tu infraestructura para baja latencia

3. Diseña UX que aproveche la simultaneidad

4. Considera el impacto en costos

Casos de uso concretos para implementar hoy

El contexto del ecosistema hispanohablante

¿Cuándo estará disponible esta tecnología?

Conclusión

Fuentes

Artículos relacionados:

Daily Shot: Tu ventaja táctica

Lo Último

Actualidad Startup, Startup Estados Unidos

Actualidad Startup

Actualidad Startup

Actualidad Startup, Startup Perú

Actualidad Startup

Actualidad Startup, Startup Estados Unidos

Actualidad Startup, Startup Estados Unidos

Actualidad Startup

Actualidad Startup, Startup Venezuela

Actualidad Startup, Startup Colombia, Startup Perú

Categorías

Por País

Audiovisual

Compañía

Nuestras Redes

📡 El Daily Shot Startupero