EsoLang-Bench: Benchmark IA en lenguajes esotéricos (LLMs)
¿Qué es EsoLang-Bench?EsoLang-Bench es un benchmark innovador diseñado para evaluar si los modelos de lenguaje grande (LLMs) realmente razonan de manera genuina, o si solo reproducen patrones aprendidos en tareas estándar de generación de código. A diferencia de benchmarks tradicionales, EsoLang-Bench utiliza lenguajes de programación esotéricos como Brainfuck, Befunge-98, Whitespace, Unlambda y Shakespeare, minimizando así …









