Anthropic NLA: lee el pensamiento de Claude con 90% precisión
¿Qué son los Natural Language Autoencoders de Anthropic?Anthropic acaba de liberar una herramienta que permite leer el pensamiento interno de Claude con 90% de precisión. Los Natural Language Autoencoders (NLA) traducen las activaciones neuronales del modelo —millones de números— a texto legible por humanos, revelando cuándo el modelo sospecha que está siendo evaluado o tiene …









