Meta y BitTorrent: ¿subir libros piratas es fair use?

El caso que redefine los límites del copyright en la era de la IA

Si construyes o financias startups de inteligencia artificial, el caso Kadrey v. Meta es probablemente el litigio de copyright más relevante que debes seguir hoy. No se trata solo de libros pirateados: se trata de cómo la industria global de la IA accedió masivamente a datos de entrenamiento y qué tan legítimo fue ese proceso. La respuesta que den los tribunales marcará el techo legal —y ético— de toda una generación de modelos de lenguaje.

¿Qué es el caso Kadrey v. Meta y por qué importa ahora?

En 2023, un grupo de autores reconocidos —entre ellos el escritor Richard Kadrey y la comediante Sarah Silverman— presentaron una demanda colectiva contra Meta Platforms, la empresa matriz de Facebook e Instagram. La acusación central: Meta habría utilizado libros protegidos por derechos de autor para entrenar Llama, su familia de modelos de lenguaje de gran escala (LLM), sin obtener permiso ni pagar compensación alguna a los autores.

Lo que hace este caso diferente de otros litigios de copyright en IA es el método de adquisición de los datos. Según la demanda, Meta no simplemente raspó contenido de la web: habría recurrido a BitTorrent para descargar aproximadamente 81,7 terabytes de libros pirateados desde repositorios en la sombra como Library Genesis (LibGen) y Anna’s Archive. Internamente, según documentos revelados durante el proceso, algunos ejecutivos de Meta abrazaban la filosofía de «pedir perdón, no permiso».

El fallo de 2025: el entrenamiento con libros pirateados SÍ es fair use

En junio de 2025, el juez Vince Chhabria del Tribunal de Distrito del Norte de California emitió un fallo que sacudió la industria: concedió la moción de Meta para un juicio sumario parcial, determinando que el uso de libros con copyright para entrenar sus modelos Llama constituía uso justo (fair use) bajo la legislación estadounidense.

El razonamiento giró en torno a los cuatro factores clásicos del fair use:

Propósito y carácter del uso: el entrenamiento de IA fue considerado altamente transformativo respecto al uso original de los libros.
Naturaleza de la obra protegida: las obras literarias tienen alta protección, pero este factor quedó subordinado al carácter transformativo.
Cantidad utilizada: se usaron obras completas, lo que pesó en contra de Meta.
Efecto en el mercado: los autores no pudieron demostrar daño concreto a sus ventas ni a mercados de licencias existentes. Este punto fue determinante.

Sin embargo, el propio juez Chhabria advirtió que el fallo no significa que el uso de materiales con copyright por parte de Meta sea intrínsecamente lícito, y señaló que habría fallado a favor de los autores de haber presentado argumentos más sólidos sobre el impacto en el mercado.

El argumento que aún divide: ¿el «seeding» en BitTorrent también es fair use?

Aquí es donde el caso entra en su capítulo más técnico —y más relevante para el futuro—. Cuando se descarga un archivo mediante BitTorrent, el protocolo no es pasivo: el cliente que descarga también sube simultáneamente fragmentos del archivo a otros nodos de la red, un proceso conocido como seeding. En otras palabras, descargar con BitTorrent implica, por diseño, redistribuir el contenido.

Meta argumenta ahora que este proceso de subida (seeding) debería también calificar como fair use, dado que es una consecuencia técnica inevitable del protocolo, no una decisión editorial consciente de distribuir obras protegidas. La empresa sostiene que esta defensa fue mencionada previamente en el proceso y que los autores no pueden objetarla como argumento tardío.

Los autores demandantes rechazan esta postura. Para ellos, el hecho de que Meta haya redistribuido activamente libros pirateados a terceros a través de la red BitTorrent constituye distribución directa de material infractor, algo que va mucho más allá del uso transformativo para entrenamiento.

Un dato clave emergido en las deposiciones: ninguno de los autores demandantes pudo acreditar que hubiera outputs del modelo Llama que reprodujeran su obra ni pérdidas de ventas atribuibles a Meta. Meta usa este punto para reforzar su argumento de fair use en la dimensión de distribución.

El precedente paralelo: Bartz v. Anthropic

Para entender el contexto completo, es útil comparar este caso con Bartz v. Anthropic, resuelto en 2025 por el mismo tribunal. En ese proceso, el juez estableció una distinción importante: usar libros pirateados para entrenar IA puede ser fair use, pero mantener una biblioteca centralizada de esas obras para usos distintos al entrenamiento sí constituye infracción. En el caso de Meta, la empresa no retuvo esa biblioteca más allá del proceso de entrenamiento, lo que favoreció su posición.

¿Por qué esto es crítico para founders de startups de IA?

Si estás construyendo un producto sobre LLMs propios o evaluando cómo otras empresas construyeron sus modelos base, este caso tiene implicaciones directas:

Los datos de entrenamiento son un activo con riesgo legal latente. No basta con que el uso sea transformativo: el método de adquisición (piratería, scraping sin permiso, redistribución) puede generar responsabilidad independiente.
El fair use no es una carta blanca. El fallo es específico al contexto: ausencia de daño demostrable al mercado, uso transformativo claro, sin retención de biblioteca pirata. Cambiar cualquiera de estos factores puede cambiar el resultado.
La frontera técnica importa. El debate sobre el seeding en BitTorrent muestra que los tribunales están empezando a entender —y a juzgar— los detalles técnicos de cómo se adquieren datos. Los founders deben estar preparados para documentar sus procesos de adquisición de datos.
El ecosistema regulatorio sigue moviéndose. Casos adicionales, como el de Strike 3 Holdings (que en julio de 2025 demandó a Meta por el uso de BitTorrent para descargar contenido adulto con copyright), sugieren que el litigio relacionado con IA y datos de entrenamiento se intensificará en 2026.

El estado actual del caso en 2026

A principios de 2026, la pregunta del seeding —es decir, si Meta distribuyó activamente libros pirateados a terceros durante el proceso de descarga— sigue sin resolverse definitivamente. Ninguna de las partes solicitó juicio sumario sobre la reclamación de distribución, lo que deja abierta esa puerta para juicio o negociación. La presión sobre Meta en este frente podría derivar en acuerdos económicos significativos si el tribunal determina que el seeding constituye distribución infractora.

Este es, en definitiva, el primer gran test de cómo los sistemas legales procesarán el conflicto entre el hambre de datos de la IA y los derechos de los creadores de contenido. El veredicto final importará no solo en Silicon Valley, sino en cada startup de IA en Ciudad de México, Buenos Aires, Bogotá o São Paulo que esté pensando en cómo alimentar sus modelos.

Conclusión

El caso Kadrey v. Meta ya dejó un precedente parcial claro: entrenar LLMs con libros protegidos puede ser fair use si el uso es transformativo y no hay daño de mercado demostrable. Pero la batalla por el seeding en BitTorrent abre un nuevo capítulo que podría revertir parte de esa victoria para Meta. Para el ecosistema de IA en LATAM y el mundo, la lección más urgente es esta: la estrategia de datos de entrenamiento no es solo un problema técnico, es un riesgo legal que debe gestionarse desde el día uno. Los founders que ignoren este debate hoy podrían encontrarse navegándolo en un tribunal mañana.

Conecta con founders que están navegando los desafíos legales y técnicos de construir con IA. Únete gratis a la comunidad de Ecosistema Startup.

Conectar con founders