El NIH lanza la base de datos genómica más grande del mundo con 747.000 participantes
El National Institutes of Health (NIH) acaba de poner a disposición de la comunidad científica la base de datos de genómica y salud integrada más grande del mundo, con datos de más de 747.000 participantes y más de 500.000 genomas secuenciados pareados con registros clínicos reales. Este hito llega en un momento crítico: el programa All of Us enfrenta recortes presupuestarios profundos mientras expande su alcance de manera sin precedentes.
Para founders de HealthTech y biotech, esto representa una oportunidad transformadora: acceso a un dataset diverso, hipótesis-libre y escalable que puede acelerar el desarrollo de algoritmos de IA aplicada a medicina de precisión, tests genéticos más inclusivos y terapias personalizadas.
¿Qué contiene exactamente esta base de datos?
El programa All of Us, creado en 2015 por el NIH con una inversión inicial de aproximadamente $1.200 millones de dólares a lo largo de 10 años, ha alcanzado un volumen de datos que supera a cualquier iniciativa similar en el mundo. La release de julio de 2026 incluye:
👥 ¿Quieres ir más allá de la noticia?
En nuestra comunidad discutimos las tendencias, compartimos oportunidades y nos ayudamos entre emprendedores. Sin humo, solo acción.
👥 Unirme a la comunidad- Más de 747.000 participantes totales registrados
- Más de 500.000 genomas secuenciados y pareados con registros médicos electrónicos
- Datos de wearables, cuestionarios de salud y mediciones físicas
- Información demográfica diversa que refleja la población estadounidense en su totalidad
El lanzamiento nacional de enrollment se realizó en marzo de 2026, permitiendo que cualquier persona en Estados Unidos se registre en línea (anteriormente solo estaba disponible en centros académicos selectos). La expansión de junio de 2026 representó un aumento del 50% respecto a la versión anterior, que tenía 633.000 participantes.
¿Por qué esto es diferente a otros biobancos globales?
A diferencia de iniciativas como el UK Biobank (~500.000 participantes, enfoque en enfermedades) o deCODE en Islandia (~350.000, población homogénea), All of Us se distingue por tres características clave:
Enfoque hipótesis-libre: No está restringido a patologías específicas. El dataset está diseñado para permitir descubrimientos transversales en genómica y salud sin sesgo inicial hacia enfermedades particulares.
Diversidad extrema: Incluye voluntarios de todas las razas, etnias, edades, regiones geográficas, identidades de género, orientaciones sexuales y estados de salud. Esto corrige el sesgo histórico de los estudios genómicos, que tradicionalmente priorizaban poblaciones de ascendencia europea.
Integración masiva: Es el primer recurso global que combina genomas, registros de salud electrónicos (EHR), datos de wearables y cuestionarios en una escala de más de medio millón de personas, permitiendo estudiar la interacción entre genética, ambiente y estilo de vida.
¿Cuándo podrán acceder las startups a estos datos?
El primer acceso amplio para investigadores está planeado para mediados de 2027, aproximadamente un año después del lanzamiento nacional. Los datos estarán disponibles a través de la Researcher Workbench, una plataforma cloud-based segura que permite a científicos acceder a la información sin riesgo de fuga de datos.
Actualmente, el programa recolecta datos demográficos de todos los participantes, pero solo un subconjunto es invitado a donar biosamples (sangre, saliva, orina) para generar los genomas secuenciados. El Mayo Clinic está construyendo el biobanco más grande jamás intentado para almacenar estas muestras, mientras que el Broad Institute analiza los datos genómicos masivos y Verily (Google Health) contribuye al Centro de Datos de Investigación.
¿Qué significa esto para tu startup de HealthTech?
Este recurso es transformador para el ecosistema de biotech y HealthTech. Las implicaciones concretas para founders son:
Desarrollo de algoritmos de IA más precisos: El acceso a datos masivos, diversos y clínicamente validados permite entrenar modelos de machine learning para diagnóstico, prevención y tratamiento personalizado con una representatividad sin precedentes. Los algoritmos actuales sufren de sesgo poblacional; este dataset lo corrige.
Tests genéticos más inclusivos: Las startups pueden desarrollar pruebas que funcionen con precisión en todas las poblaciones, no solo en personas de ascendencia europea. Esto abre mercados desatendidos y mejora la validez clínica de los productos.
Identificación de dianas terapéuticas: La diversidad del conjunto de datos permite identificar variantes genéticas raras en poblaciones específicas, acelerando el descubrimiento de nuevos objetivos para fármacos y terapias.
Diferencias en respuesta a medicamentos: Puedes estudiar cómo diferentes grupos étnicos o genotipos responden a tratamientos específicos, información crítica para desarrollar terapias personalizadas y optimizar ensayos clínicos.
Acciones concretas que puedes implementar hoy
1. Registra tu startup como institución investigadora: Aunque el acceso amplio comienza en 2027, las instituciones pueden comenzar el proceso de registro y preparación ahora. Visita https://allofus.nih.gov para revisar los requisitos de elegibilidad y los protocolos de acceso a datos. Las startups con equipo científico calificado pueden posicionarse para ser de las primeras en acceder.
2. Desarrolla hipótesis de investigación alineadas con el dataset: Comienza a diseñar estudios que aprovechen la integración de genomas + EHR + wearables. Por ejemplo: "¿Cómo interactúan variantes genéticas específicas con datos de actividad física para predecir riesgo cardiovascular en poblaciones subrepresentadas?". Tener hipótesis claras te permitirá moverte rápido cuando se abra el acceso.
3. Explora colaboraciones con instituciones ya participantes: El programa trabaja con Mayo Clinic, Broad Institute y centros académicos en todo Estados Unidos. Si tu startup tiene relaciones existentes con estas instituciones, puedes explorar acuerdos de colaboración que te den acceso anticipado o conjunto a los datos.
4. Prepara tu infraestructura de análisis de datos: La Researcher Workbench es cloud-based y requiere capacidad técnica para manejar datasets masivos. Invierte ahora en talento de data science, infraestructura cloud escalable y protocolos de seguridad de datos para estar listo cuando se abra el acceso.
Competidores y contexto global
El programa All of Us implementa los GA4GH Data Sharing Standards (Global Alliance for Genomics and Health), lo que garantiza interoperabilidad con iniciativas similares en todo el mundo. Esto significa que las startups pueden combinar datos de All of Us con otros recursos globales, amplificando el valor del dataset.
El objetivo final del programa es alcanzar 1 millón o más de participantes para 2026-2027, lo que duplicaría el tamaño actual. Esta escalabilidad continua hace que la inversión en desarrollar productos basados en estos datos sea estratégica a largo plazo.
Conclusión
El lanzamiento de la base de datos All of Us del NIH marca un punto de inflexión para la medicina de precisión y el ecosistema HealthTech. Con 747.000 participantes, 500.000+ genomas y un enfoque sin precedentes en diversidad, este recurso nivela el campo de juego para startups que buscan desarrollar soluciones innovadoras en genómica, IA aplicada a salud y terapias personalizadas.
La clave está en prepararse ahora: registrar tu institución, desarrollar hipótesis de investigación sólidas y construir la infraestructura técnica necesaria. Cuando el acceso se abra en mediados de 2027, las startups que hayan hecho la tarea estarán en posición de moverse rápido y capturar valor en un mercado de medicina de precisión que se proyecta en cientos de miles de millones de dólares para finales de la década.
Fuentes
- NIH unveils the world's largest genomics-and-health database
- NIH's All of Us Research Program is now the largest integrated genomics-health database in the world
- All of Us Research Program
- About the All of Us Research Program
👥 ¿Quieres ir más allá de la noticia?
En nuestra comunidad discutimos las tendencias, compartimos oportunidades y nos ayudamos entre emprendedores. Sin humo, solo acción.
👥 Unirme a la comunidad













