Cómo rompieron los benchmarks de IA y qué hacer ahora
El problema que nadie quería admitir: los benchmarks de agentes IA estaban rotosImagina invertir meses en construir un agente de IA tomando como referencia los benchmarks más reconocidos del sector, solo para descubrir que esos resultados eran, en gran parte, una ficción. Eso es exactamente lo que reveló un equipo del RDI (Research, Innovation, and …









