LamBench: o3 resuelve 85% vs 12% de Llama en IA
¿Qué es LamBench y por qué debería importarte como founder?El modelo o3 de OpenAI resolvió el 85% de las 120 tareas de cálculo lambda puro, mientras que Llama-3.1-405B apenas alcanzó el 12.3%. Esta brecha del 72.7 puntos porcentuales revela algo crítico: los modelos closed-source están años luz ahead en razonamiento algorítmico profundo, y eso tiene …









