Flash-MoE: IA Mixture-of-Experts de 397B en Mac con 48GB RAM
Innovación en inferencia local: Flash-MoE como punto de inflexiónEl proyecto Flash-MoE demuestra que es posible ejecutar un modelo Mixture-of-Experts (MoE) Qwen3.5-397B-A17B, con 397 mil millones de parámetros, directamente en un MacBook Pro M3 Max con 48GB de RAM. Al aprovechar la memoria unificada de Apple Silicon y un motor de inferencia escrito en C/Metal, se …









