Cerebras 6.7x más rápido: inferencia IA para founders
¿Qué logró Cerebras con Kimi K2.6?981 tokens por segundo. Esa es la cifra que Artificial Analysis verificó al benchmarkear el modelo Kimi K2.6 de un billón de parámetros ejecutado en la arquitectura de Cerebras Systems. No es un improvement marginal: representa un rendimiento 6.7 veces superior al siguiente proveedor de nube basado en GPUs y …









