DS4 de antirez: Inferencia 4x más rápida para DeepSeek V4
¿Qué es DS4 y por qué debería importarte?DS4 procesa contextos de 1 millón de tokens 4 veces más rápido que llama.cpp en hardware consumer, según benchmarks publicados en el repositorio oficial. Esto no es una optimización marginal: es la diferencia entre esperar minutos y obtener respuestas en segundos cuando trabajas con documentos extensos o bases …









