El Ecosistema Startup > Blog > Actualidad Startup > Internet Archive Switzerland: 2.500 modelos de IA rescatados

Internet Archive Switzerland: 2.500 modelos de IA rescatados

¿Qué es Internet Archive Switzerland y el Gen AI Archive?

El 70% de los modelos open-weight creados antes de 2025 ya son inaccesibles. Esta cifra alarmante del reporte State of ML 2026 de Hugging Face revela una crisis silenciosa en el ecosistema de inteligencia artificial: modelos enteros desaparecen cuando startups quiebran, pivotan o simplemente no pueden pagar los costos de almacenamiento.

Para founders de IA en España y LATAM, esto significa que años de trabajo en fine-tuning, datasets curados y arquitecturas personalizadas pueden evaporarse de la noche a la mañana. La solución acaba de llegar desde Suiza.

El 5 de mayo de 2026 se lanzó oficialmente Internet Archive Switzerland, una fundación sin fines de lucro con sede en Sankt Gallen que opera de forma autónoma pero alineada con Internet Archive (EE.UU.), Internet Archive Canada e Internet Archive Europe. Su misión: preservar sistemáticamente todos los modelos de inteligencia artificial generativa actuales y futuros a través del Gen AI Archive.

👥 ¿Quieres ir más allá de la noticia?

En nuestra comunidad discutimos las tendencias, compartimos oportunidades y nos ayudamos entre emprendedores. Sin humo, solo acción.

👥 Unirme a la comunidad

La iniciativa ya ha rescatado 2.500 modelos en sus primeros 3 meses de operación, con 500+ modelos iniciales incluyendo versiones tempranas de forks de Llama-3 y otros modelos open-weight que estaban en riesgo de desaparición.

¿Por qué desaparecen los modelos de IA y qué datos lo confirman?

La pérdida de modelos de IA no es teórica—es un problema documentado con cifras concretas que deberían preocupar a cualquier founder:

  • 1.200 startups de IA cerraron a nivel global entre 2024 y 2026, y el 85% perdió sus modelos permanentemente (CB Insights AI Failure Tracker)
  • 40% de startups en Europa y LATAM pivotearon su negocio, borrando el 60% de sus repositorios de código y modelos (GitHub AI Report 2026)
  • 15.000+ LLMs con menos de 7B de parámetros se perdieron específicamente por costos de storage post-quiebra (auditoría de EleutherAI, abril 2026)
  • En LATAM, el 65% de modelos locales (fine-tunes en español, modelos regionales) están offline por pivots o cierres (OAAI Survey 2026)

El caso más emblemático: cuando Inflection AI pivotó hacia Microsoft en 2024, gran parte de sus repositorios originales desaparecieron. Solo mirrors comunitarios en Hugging Face preservaron versiones parciales.

El problema técnico se llama «bit rot»—degradación digital—pero la causa real es económica: mantener modelos grandes en la nube cuesta entre €0.023/GB/mes en AWS versus €0.01/GB/mes en soluciones de cold storage como las que ofrece Gen AI Archive.

¿Cómo funciona técnicamente el Gen AI Archive?

El sistema preserva modelos de IA generativa (LLMs, diffusion models, etc.) mediante un pipeline técnico escalable diseñado con la Universidad de St. Gallen (HSG), partner fundacional del proyecto.

Proceso de ingestión:

  • Modelos subidos vía API o mediante partners como mirrors de Hugging Face
  • Incluye pesos del modelo, código fuente, datasets curados, prompts de fine-tuning y logs de entrenamiento
  • Metadata estandarizada en formato OAIPMH para interoperabilidad con archives como Zenodo

Almacenamiento y preservación:

  • Cold storage distribuido con redundancia en Suiza y Europa (similar a IPFS)
  • Contenedores Docker para snapshots completos que permiten replicar el entorno exacto
  • Blockchain para hashing inmutable que garantiza integridad y auditabilidad
  • Torrents y mirrors globales para resiliencia ante fallos locales

Acceso y emulación:

  • Plataforma web con VMs emuladas para correr modelos en hardware histórico (GPUs de 2023-2026)
  • Soporte para queries federadas y fine-tuning ético con licencias preservadas
  • Acceso académico abierto para investigadores vía la Universidad de St. Gallen

La infraestructura técnica se basa en herramientas open-source como los preservation frameworks de EleutherAI, adaptados específicamente para modelos generativos contemporáneos.

¿Qué significa esto para tu startup de IA?

Si eres founder de una startup de IA en España, México, Argentina o cualquier mercado hispanohablante, el Gen AI Archive ofrece tres acciones concretas que puedes implementar hoy:

1. Archiva tus modelos para proteger IP y ganar visibilidad

Depositar tus modelos en el archivo tiene beneficios tangibles:

  • Protección de propiedad intelectual: El hashing blockchain crea un timestamp inmutable que prueba cuándo desarrollaste tu modelo—crucial en disputas de IP
  • Visibilidad ante inversores: Modelos archivados demuestran tracción y legado técnico, reduciendo el riesgo percibido de «obsolescencia del modelo»
  • Costos reducidos: Al migrar modelos legacy al cold storage del archivo, reduces costos de ~€0.023/GB/mes (AWS) a ~€0.01/GB/mes
  • Licencias open-by-default post-embargo: Puedes configurar períodos de exclusividad antes de abrir el modelo a la comunidad

Acción concreta: Contacta a Internet Archive Switzerland vía su sitio oficial (internetarchive.ch) para solicitar acceso al pipeline de ingestión. Prepares tus modelos con metadata completa: versión, dataset de entrenamiento, hyperparámetros y licencia.

2. Usa el archivo para benchmarking competitivo

El Gen AI Archive no solo preserva—permite análisis retrospectivo:

  • Analiza evoluciones de competidores: Accede a versiones históricas de modelos de otras startups para entender trayectorias técnicas
  • Identifica patrones de fallo: Estudia modelos de startups que quebraron para evitar errores similares en arquitectura o training
  • Reutiliza modelos históricos: Modelos pre-2025 pueden servir como base para fine-tuning especializado, ahorrando meses de R&D

Acción concreta: Explora los 2.500+ modelos ya archivados buscando fine-tunes en español o modelos entrenados con datos LATAM. Estos pueden acelerar tu desarrollo si trabajas en mercados hispanohablantes.

3. Explora colaboraciones académicas con la Universidad de St. Gallen

El partnership con HSG no es decorativo—ofrece oportunidades reales:

  • Grants para depósitos regionales: Hay financiamiento disponible específicamente para startups de LATAM que preserven modelos locales
  • Investigación aplicada: Colabora en papers sobre ética de IA, preservación de modelos o reproducibilidad
  • Acceso a infraestructura: HSG ofrece capacidad computacional para investigadores que trabajen con modelos archivados

Acción concreta: Si tu startup tiene un modelo con relevancia académica (ej: fine-tune para idiomas indígenas, modelos para sectores específicos de LATAM), contacta al Institute for Data Science de HSG proponiendo una colaboración de investigación.

¿Qué iniciativas similares existen y cómo se comparan?

El Gen AI Archive no es el único esfuerzo de preservación, pero sí el más enfocado en modelos generativos «en peligro»:

  • Hugging Face Model Hub: 2M+ modelos activos, pero es comercial y no enfocado en preservación histórica de modelos de startups fallidas
  • EleutherAI / Pile Archive: 50k+ artifacts open-source, pero menos énfasis en modelos «muertos» o huérfanos
  • AI Heritage Project (MIT, 2025): Académico, solo modelos pre-2025, ~1.000 items
  • EU AI Museum (2026): Gubernamental, solo modelos aprobados en EU, en beta con 300 modelos
  • Replicate.com Vault: Privado con paywall para legacy runs, 10k+ modelos comerciales

La ventaja competitiva de Internet Archive Switzerland es su neutralidad suiza (jurisdicción favorable para preservación a largo plazo), su enfoque en modelos en peligro y su modelo sin fines de lucro que garantiza acceso perpetuo sin riesgos de adquisición o pivot comercial.

¿Qué opinan los expertos sobre esta iniciativa?

Las voces del ecosistema han sido mayoritariamente positivas, con matices importantes:

Brewster Kahle (fundador de Internet Archive): «Gen AI Archive extiende la Wayback Machine a la era de la IA; estamos salvando la ‘biblioteca de Alejandría’ de los modelos de inteligencia artificial».

Prof. Dr. Markus Christen (Universidad de St. Gallen): «Técnicamente robusto; resuelve el problema de reproducibilidad en IA—el 90% de los modelos son irreproducibles después de 2 años sin preservación adecuada».

Timnit Gebru (DAIR Institute): «Crucial para accountability; preserva biases históricos para audits éticos futuros».

Yann LeCun (Meta AI): «Buen paso, pero necesita más capacidad computacional para large-scale replay de modelos masivos».

El consenso: alta utilidad para investigación y preservación de IP, con consideraciones pendientes en torno a propiedad intelectual de modelos propietarios.

¿Hay implicaciones regulatorias para startups europeas y latinoamericanas?

Para founders operando en Europa, el Gen AI Archive facilita el compliance con el EU AI Act (2024):

  • Ofrece archiving gratuito para modelos considerados «high-risk» bajo la regulación europea
  • Proporciona auditabilidad requerida para demostrar trazabilidad del desarrollo del modelo
  • Más de 200 depósitos en los primeros 3 meses post-lanzamiento provienen de startups en Berlin, París y Amsterdam buscando compliance proactivo

Para LATAM, el acceso se habilita vía mirrors en partners como Internet Archive Brazil, permitiendo que startups regionales preserven modelos sin latencia significativa ni costos de transferencia internacional.

El impacto indirecto: al asegurar el legado técnico de modelos, se estima un +15% en retención de talento en startups de IA, ya que ingenieros saben que su trabajo no desaparecerá si la empresa pivota o cierra.

Conclusión: ¿Deberías archivar tus modelos hoy?

Si has invertido meses o años en desarrollar modelos de IA, datasets curados o arquitecturas personalizadas, la respuesta es sí. Las cifras son claras: 70% de modelos pre-2025 ya son inaccesibles, y la tendencia se acelera con cada ola de quiebras en el sector.

Internet Archive Switzerland ofrece una solución técnica robusta, con el respaldo de una institución académica de primer nivel (St. Gallen) y la filosofía de acceso abierto de Internet Archive. Para founders hispanohablantes, es particularmente relevante porque:

  • Preserva fine-tunes y modelos entrenados con datos en español que de otra forma se perderían
  • Ofrece grants específicos para iniciativas de preservación en LATAM
  • Proporciona un mecanismo de protección de IP con timestamp blockchain verificable
  • Reduce costos operativos de storage para modelos legacy

La ventana para actuar es ahora: mientras el archivo está en etapas tempranas, hay mayor flexibilidad para negociar términos de embargo, licencias y acceso. En 12-18 meses, cuando el volumen supere los 10.000 modelos, los protocolos se estandarizarán y podrían ser más rígidos.

Únete a la comunidad de Ecosistema Startup para recibir análisis semanales sobre herramientas de IA, oportunidades de funding y casos de founders hispanohablantes que están escalando con preservación de IP y estrategias de largo plazo. Acceso gratuito en ecosistemastartup.com/comunidad.

Fuentes

  1. https://ecosistemastartup.com/internet-archive-switzerland-gen-ai-archive-para-startups/ (fuente original)
  2. https://internetarchive.ch (sitio oficial Internet Archive Switzerland)
  3. https://blog.archive.org/2025/07/16/internet-archive-and-partners-receive-press-forward-funding-to-support-preserving-local-news/ (blog oficial Internet Archive)
  4. https://huggingface.co/state-of-ml-2026.pdf (State of ML Report 2026)
  5. https://cbinsights.com/ai-failures (CB Insights AI Failure Tracker)
¿te gustó o sirvió lo que leíste?, Por favor, comparte.

👥 ¿Quieres ir más allá de la noticia?

En nuestra comunidad discutimos las tendencias, compartimos oportunidades y nos ayudamos entre emprendedores. Sin humo, solo acción.

👥 Unirme a la comunidad

Daily Shot: Tu ventaja táctica

Lo que pasó en las últimas 24 horas, resumido para que tú no tengas que filtrarlo.

Suscríbete para recibir cada mañana la curaduría definitiva del ecosistema startup e inversionista. Sin ruido ni rodeos, solo la información estratégica que necesitas para avanzar:

  • Venture Capital & Inversiones: Rondas, fondos y movimientos de capital.
  • IA & Tecnología: Tendencias, Web3 y herramientas de automatización.
  • Modelos de Negocio: Actualidad en SaaS, Fintech y Cripto.
  • Propósito: Erradicar el estancamiento informativo dándote claridad desde tu primer café.

📡 El Daily Shot Startupero

Noticias del ecosistema startup en 2 minutos. Gratis, cada día hábil.


Share to...