Un founder usó Claude Code para analizar su propia resonancia magnética: esto es lo que aprendió
El 22% de los casos clínicos analizados con IA presentan potencial de daño grave, según el estudio NOHARM de 2024, y la mayoría de ese riesgo proviene de omisiones (no detectar algo importante) más que de recomendaciones activamente peligrosas. Este dato es crítico para cualquier emprendedor que considere usar herramientas de IA para decisiones de salud personales o para construir productos en el sector healthtech.
Antoine, desarrollador y founder, documentó su experimento utilizando Claude Code con el modelo Opus 4 para obtener una segunda opinión sobre sus resultados de resonancia magnética (MRI) después de recibir un diagnóstico médico que consideraba prematuro. Su proceso técnico revela tanto el potencial como los límites actuales de los agentes de IA en el análisis de imágenes médicas.
¿Qué es Claude Code y cómo difiere de ChatGPT o Claude estándar?
Claude Code no es un modelo conversacional como ChatGPT o Claude estándar. Es un agente de inteligencia artificial autónomo diseñado para operar dentro de tu sistema local, editar archivos, ejecutar comandos y construir proyectos reales sin depender de una ventana de chat limitada.
👥 ¿Quieres ir más allá de la noticia?
En nuestra comunidad discutimos las tendencias, compartimos oportunidades y nos ayudamos entre emprendedores. Sin humo, solo acción.
👥 Unirme a la comunidadMientras que Claude estándar (modelo conversacional) destaca en análisis de documentos largos (hasta 200.000 tokens) y escritura técnica estructurada, y ChatGPT lidera en multimodalidad (voz, imágenes con DALL-E 3) y ecosistema de GPTs, Claude Code trabaja localmente para "construir cosas reales". Su precisión en código alcanza 64.3% en SWE-bench Pro, superando a competidores en tareas de programación intensivas.
La diferencia fundamental: Claude Code puede procesar archivos DICOM (el formato estándar de imágenes médicas), ejecutar scripts de análisis, comparar informes y generar visualizaciones directamente en tu computadora. Un chat de IA estándar solo puede interpretar texto que le copies manualmente, introduciendo errores de transcripción del 2-5% en contextos médicos.
El experimento: análisis técnico de MRI con agentes de IA
El proceso que siguió el autor involucró varios pasos técnicos que cualquier founder de healthtech debería comprender:
Primero, extrajo los archivos DICOM de su resonancia magnética. Estos archivos contienen no solo las imágenes, sino metadatos críticos sobre el estudio (fecha, parámetros de adquisición, información del paciente).
Segundo, utilizó Claude Code para ejecutar scripts de Python que procesaran los archivos DICOM, generando visualizaciones y extrayendo mediciones específicas. A diferencia de un chat estándar, Claude Code puede crear y ejecutar código real en tu entorno local.
Tercero, comparó automáticamente el informe radiológico oficial con hallazgos detectados por el análisis automatizado, identificando discrepancias y áreas que merecían una segunda revisión.
Cuarto, documentó las limitaciones: la IA no reemplaza el juicio clínico, pero puede servir como herramienta de triage asistido para identificar qué aspectos del estudio requieren atención especializada adicional.
¿Qué herramientas de IA médica existen realmente en 2026?
Es crucial distinguir entre IA general (ChatGPT, Claude estándar) e IA médica especializada. Las primeras tienen tasas de alucinación del 15.8-28.6% en contextos médicos y nunca fueron diseñadas para interpretar informes reales. Las segundas están validadas clínicamente y aprobadas por reguladores.
En 2026, estas son las herramientas con aprobación regulatoria para análisis de imágenes:
Lunit INSIGHT: Análisis de radiografías de tórax para neumopatías, aprobado por FDA y UE para detección asistida de anomalías pulmonares.
Zebra Medical View: Procesamiento de MRI para fracturas óseas e hiperplasia prostática, validado en estudios clínicos multicéntricos.
Viz.ai: Análisis de MRI cerebral para detectar hemorragias y accidentes cerebrovasculares, con aprobación FDA como dispositivo médico de Clase II.
Qure.ai: Plataforma de análisis de imágenes de tórax y cerebro, validada en más de 2 millones de estudios clínicos en hospitales de India, Europa y Estados Unidos.
Wizey: IA médica especializada que ofrece interpretación de grado clínico de valores de laboratorio con 99.9% de precisión OCR, aunque su enfoque es laboratorio, no imágenes.
Todas estas herramientas operan bajo el modelo de "Software as a Medical Device" (SaMD) con supervisión humana obligatoria. Ninguna permite diagnóstico autónomo.
Regulaciones actuales: FDA y UE sobre IA en diagnóstico médico
Las regulaciones en 2026 son estrictas y prohíben explícitamente el uso de IA como diagnóstico autónomo sin supervisión humana:
FDA (Estados Unidos): Solo aprueba herramientas de IA como SaMD con supervisión humana. La agencia exige validación con datos estructurados y mecanismos de prevención de errores. Las IA generales no tienen aprobación para interpretación de informes médicos. La guía de 2025 establece que cualquier herramienta de IA médica debe incluir "mecanismos de transparencia" que permitan al médico entender cómo se llegó a una recomendación.
Unión Europea (AI Act): Clasifica la IA médica como "alto riesgo", requiriendo certificación de calidad, transparencia total y supervisión humana obligatoria. Las IA deben tener prevención arquitectónica de alucinaciones mediante grafos de conocimiento, algo que las IA generales no poseen.
Requisito clave: Tanto FDA como UE exigen que las herramientas de IA médica incluyan "human-in-the-loop" (humano en el ciclo). Esto significa que la IA puede sugerir, pero nunca decidir sin validación de un profesional certificado.
Limitaciones y riesgos éticos del autodiagnóstico con IA
El experimento de Antoine ilustra riesgos que todo founder debe considerar, tanto para uso personal como para productos que esté construyendo:
Tasa de alucinación: Las IA generales (GPT-4, Claude estándar) tienen tasas de alucinación del 15.8-28.6% en contextos médicos. Esto significa que aproximadamente 1 de cada 5-7 recomendaciones puede contener información inventada o incorrecta.
Error de transcripción: La entrada manual de datos en IA generales introduce errores del 2-5%. En un informe de MRI con docenas de mediciones, esto puede significar múltiples valores incorrectos que llevan a conclusiones erróneas.
Riesgo de omisión: El estudio NOHARM encontró que el 77% del daño potencial proviene de omisiones (no detectar algo importante) más que de recomendaciones activamente peligrosas. Una IA puede "pasar por alto" una anomalía sutil que un radiólogo entrenado identificaría.
Confidencialidad: Subir archivos médicos reales a plataformas de IA generales viola principios de privacidad. Los términos de servicio de la mayoría de las IA conversacionales no garantizan confidencialidad médica HIPAA-compliant.
Responsabilidad legal: Si un founder construye un producto que permite autodiagnóstico sin supervisión médica, enfrenta riesgos regulatorios severos y responsabilidad por daños. Las startups de healthtech deben navegar aprobaciones FDA/CE antes de lanzar cualquier herramienta de diagnóstico.
¿Qué significa esto para tu startup?
Si estás construyendo en healthtech o considerando usar IA para decisiones médicas personales, estas son las implicaciones prácticas:
Para founders de healthtech:
No construyas herramientas de diagnóstico autónomo. El camino regulatorio es extremadamente costoso (millones de dólares, años de validación clínica). Enfócate en herramientas de triage asistido o segunda opinión con supervisión humana.
Valida con datos estructurados. Las IA generales alucinan porque no tienen acceso a bases de conocimiento médico validadas. Considera integrar grafos de conocimiento médico (como UMLS, SNOMED CT) para reducir alucinaciones.
Diseña con "human-in-the-loop". Tu producto debe requerir validación humana antes de entregar cualquier recomendación clínica. Esto no es solo un requisito regulatorio, es una protección ética y legal.
Documenta tasas de error. Si lanzas un producto, publica transparentemente tus tasas de precisión, sensibilidad y especificidad validadas en estudios clínicos. La transparencia construye confianza con reguladores y usuarios.
Para founders usando IA para decisiones personales:
Usa IA para entender, no para diagnosticar. ChatGPT y Claude son excelentes para explicar términos médicos complejos después de recibir un informe profesional. No los uses para interpretar resultados crudos.
Prioriza herramientas especializadas. Si necesitas análisis de laboratorio, herramientas como Wizey ($2.99 por informe) ofrecen 99.9% de precisión OCR y están diseñadas específicamente para datos médicos. Es más barato y más seguro que experimentar con IA general.
Siempre busca segunda opinión humana. Si un diagnóstico te parece prematuro o incorrecto, consulta con otro especialista. La IA puede ayudarte a preparar preguntas informadas, pero no reemplaza la evaluación clínica.
Protege tu privacidad. No subas archivos médicos reales a plataformas de IA conversacional. Usa herramientas con certificación HIPAA o limita el análisis a datos anonimizados.
Conclusión
El experimento de Antoine demuestra que Claude Code puede procesar archivos DICOM y generar análisis técnicos que un chat estándar no podría producir. Sin embargo, también ilustra los límites actuales: la IA es una herramienta de apoyo, no un reemplazo del juicio clínico.
Para founders, la lección es clara: el opportunity en healthtech no está en reemplazar médicos con IA, sino en aumentar sus capacidades con herramientas validadas, transparentes y diseñadas con supervisión humana integrada. El mercado de IA médica alcanzará $187 mil millones para 2030, pero solo las startups que naveguen correctamente el marco regulatorio y prioricen la seguridad del paciente capturarán valor sostenible.
El autodiagnóstico con IA general es peligroso, no ético y potencialmente ilegal. El diagnóstico asistido con IA especializada y supervisión humana es el futuro — y el presente — de la medicina basada en evidencia.
Fuentes
- I used Claude Code to get a second opinion on my MRI
- ChatGPT, Claude y Gemini vs IA médica Wizey 2026
- ChatGPT, Claude, Gemini, Grok y Perplexity: comparativa para profesionales sanitarios
- FDA: Software as a Medical Device (SaMD)
👥 ¿Quieres ir más allá de la noticia?
En nuestra comunidad discutimos las tendencias, compartimos oportunidades y nos ayudamos entre emprendedores. Sin humo, solo acción.
👥 Unirme a la comunidad














