PhantaField PFG-1: chip AI con 330 GB DRAM sin HBM

¿Qué es el PFG-1 Sophon y por qué rompe con la arquitectura tradicional?

PhantaField acaba de presentar el PFG-1 "Sophon", un chip AI ASIC monolítico de 750 mm² con 330 GB de DRAM on-die distribuidos en 32 capas de tecnología 2D-TMD (Transition-Metal Dichalcogenide). Lo revolucionario: elimina completamente la dependencia de HBM (High Bandwidth Memory), el cuello de botella que limita la velocidad y eficiencia energética en los chips de IA actuales.

Para founders que construyen startups de IA en 2026, esto no es solo una curiosidad técnica. El mercado de AI accelerator chips está proyectado a superar los $604 mil millones para 2033, con el segmento de ASICs custom creciendo a un 27% CAGR hasta alcanzar $118 mil millones. La arquitectura del PFG-1 podría reducir drásticamente los costos de infraestructura para entrenamiento e inferencia de modelos de IA.

¿Cómo funciona la tecnología Compute-in-Memory del PFG-1?

El PFG-1 implementa Compute-In-Memory (CIM) digital puro: cada subarray de DRAM de 256×256 celdas integra un amplificador de sentido binario con un árbol sumador de 8 niveles. Esta arquitectura permite que los pesos, gradientes y estados del optimizador residan directamente en la DRAM gain-cell 2T0C dentro del mismo die, eliminando el traslado de datos entre memoria y procesador.

👥 ¿Quieres ir más allá de la noticia?

En nuestra comunidad discutimos las tendencias, compartimos oportunidades y nos ayudamos entre emprendedores. Sin humo, solo acción.

👥 Unirme a la comunidad

Los resultados técnicos son contundentes:

4.200 TFLOPS en FP8 (8-bit floating point)
2.100 TFLOPS en BF16 (Brain Floating Point 16)
500 MHz de frecuencia de broadcast serial de activaciones
131.072 tiles de computo por die
Todo en un footprint de 7.5 cm²

A diferencia de los chips convencionales que separan lógica y memoria (requiriendo interfaces costosas y consumo energético elevado), el PFG-1 ejecuta pases forward/backward de entrenamiento BF16 y sirve inferencia de bajo batch a la tasa limitada por cómputo, no por ancho de banda de memoria.

¿Por qué el HBM es un cuello de botella para las startups de IA?

El HBM bottleneck surge de la separación física entre memoria y cómputo. Aunque el HBM3E ofrece anchos de banda extremos (ej. 144 GB en el Trainium de Amazon), requiere:

Stacking externo de chips de memoria
Interfaces de alta potencia con refrigeración activa
Trayectorias de señal más largas que incrementan latencia

Según análisis del mercado en 2026, Nvidia mantiene el 70-75% del mercado de AI accelerators, pero su dominio se erosiona conforme hyperscalers como Google, Amazon, Meta, Microsoft y OpenAI invierten miles de millones en chips purpose-built. Broadcom controla el 60-80% del mercado de AI ASIC co-design con un backlog de $73 mil millones, mientras que Marvell posee el 20-25% restante.

La arquitectura monolítica 3D (M3D) del PFG-1 apila memoria y lógica verticalmente en un proceso monolítico único, logrando densidad de interconexión ultra-alta que imita los beneficios del CIM sin las restricciones completas de diseño CIM tradicional.

¿Qué ventajas ofrece la DRAM on-die frente al HBM para entrenamiento e inferencia?

Para startups, esta distinción es crítica: el entrenamiento aún depende fuertemente de GPUs equipadas con HBM (donde Nvidia domina), pero la inferencia puede migrar a ASICs con DRAM on-die o CIM, reduciendo costos operativos significativamente.

¿Cuál es el impacto en los costos de infraestructura para startups de IA en 2026?

Los datos del mercado son reveladores. Google reporta que el Total Cost of Ownership (TCO) por chip Ironwood es aproximadamente 44% menor que un servidor GB200 desde su perspectiva de procurement. A escala de producción, los ASICs custom ofrecen hasta un 65% de ventaja en TCO frente a GPUs convencionales para inferencia.

Sin embargo, existe una barrera importante: los hyperscalers están proyectando invertir más de $3.5 billones en capex relacionado con IA hasta 2030. Microsoft lidera con gastos de capital proyectados superiores a $150 mil millones solo en 2026. Esta concentración de capital crea una asimetría: las startups no pueden desarrollar ASICs custom propios (requieren volúmenes y capital que solo hyperscalers poseen), pero pueden beneficiarse si acceden a instancias de ASIC en la nube.

El desafío para founders hispanohablantes en LATAM y España: mientras los costos de inferencia podrían reducirse con la adopción de CIM y DRAM on-die, los costos de entrenamiento permanecen altos en 2026 debido al monopolio de Nvidia en GPUs con HBM. La estrategia óptima depende del caso de uso:

Startups inference-heavy: pueden migrar a instancias de ASIC cloud (Google Ironwood, AWS Trainium) para reducir TCO
Startups training-heavy: aún dependen de GPUs Nvidia, pero deben monitorear la disponibilidad de ASICs custom en cloud providers

¿Qué significa esto para tu startup?

Si estás construyendo una startup de IA en 2026, la arquitectura del PFG-1 Sophon y la tendencia hacia ASICs custom con DRAM on-die tienen implicaciones directas en tu estrategia de infraestructura:

Acción 1: Evalúa tu mix entrenamiento vs. inferencia

Si tu startup es inference-heavy (ej. chatbots, procesamiento de lenguaje en producción, visión por computadora en tiempo real), cotiza instancias de ASIC cloud en Google Cloud (Ironwood), AWS (Trainium) o Azure (Maia). El TCO puede ser 44-65% menor que GPUs tradicionales a escala.
Si eres training-heavy (ej. fine-tuning de modelos grandes, entrenamiento desde cero), aún dependes de GPUs con HBM. Negocia contratos de largo plazo con cloud providers o considera GPUs de segunda generación (H200, B200) cuando estén disponibles en spot instances.

Acción 2: Monitorea la disponibilidad de chips CIM y M3D en cloud

La tecnología Monolithic 3D y Compute-in-Memory está emergiendo. En los próximos 12-18 meses, cloud providers comenzarán a ofrecer instancias basadas en estas arquitecturas.
Suscríbete a los programas preview de Google Cloud TPU, AWS Inferentia, y Azure Maia para acceder temprano a precios preferenciales.
Para startups en LATAM, prioriza regiones cloud con menor latencia (us-east-1, us-west-2, europe-west-1) y evalúa proveedores locales que puedan ofrecer instancias de ASIC a costos competitivos.

Acción 3: Optimiza tu arquitectura de modelo para inferencia eficiente

Independientemente del hardware, reduce la complejidad de tus modelos para inferencia: cuantización a FP8 o INT8, pruning de pesos, y distillation de modelos grandes a versiones más pequeñas.
Esto te permite aprovechar al máximo chips como el PFG-1 cuando estén disponibles comercialmente, reduciendo costos de inferencia por token o por solicitud.

Conclusión

El PFG-1 Sophon de PhantaField representa un cambio de paradigma en la arquitectura de chips para IA: eliminar el HBM y mover toda la memoria al die mediante DRAM on-die y Compute-in-Memory no es solo una innovación técnica, es una respuesta directa al cuello de botella que limita la escalabilidad y eficiencia de las startups de IA en 2026.

Para founders, la lección es clara: el mercado de AI ASICs está creciendo a 27% CAGR porque los hyperscalers ya entendieron que la infraestructura define el margen. Tu startup no necesita desarrollar su propio chip, pero sí necesita una estrategia de infraestructura que aproveche la próxima generación de ASICs custom cuando estén disponibles en cloud.

La ventana de oportunidad: en los próximos 18-24 meses, los primeros chips con arquitectura M3D y CIM llegarán a cloud providers. Las startups que se preparen hoy (evaluando su mix entrenamiento/inferencia, optimizando modelos, y estableciendo relaciones con cloud providers) tendrán una ventaja competitiva en costos cuando estas arquitecturas se masifiquen.