La iniciativa fue publicada en la revista científica Nature Biotechnology y busca mejorar el diagnóstico y tratamiento del cáncer mediante el análisis automatizado de datos genómicos.
DeepSomatic emplea redes neuronales convolucionales para identificar variantes genéticas somáticas en células tumorales. Estas mutaciones no son heredadas, sino adquiridas a lo largo de la vida, muchas veces por factores ambientales o errores en la replicación del ADN. Detectarlas resulta clave para entender qué impulsa el crecimiento de un tumor y cómo abordarlo clínicamente.
Según Google, uno de los mayores retos en este campo es diferenciar las verdaderas mutaciones de los errores de secuenciación. DeepSomatic analiza tanto las células tumorales como las células normales del paciente, comparando sus secuencias genéticas. A partir de estos datos, genera imágenes que reflejan las diferencias genéticas, que luego son interpretadas por la red neuronal para identificar las variantes somáticas que podrían estar impulsando el cáncer.
Además, la herramienta es capaz de funcionar incluso sin muestras de células normales, una situación frecuente en casos como leucemias. Esta capacidad amplía su aplicabilidad en entornos clínicos donde los datos son limitados o difíciles de obtener.
Conjunto de datos de referencia y resultados
Para entrenar su modelo de IA, Google colaboró con el Instituto de Genómica de UC Santa Cruz y el Instituto Nacional del Cáncer en la creación de un conjunto de datos llamado CASTLE. Este incluye información genética de seis muestras de cáncer (cuatro de mama y dos de pulmón) analizadas con tres plataformas de secuenciación distintas. La fusión de los datos permitió crear un conjunto de referencia más preciso y diverso.
Los resultados muestran que DeepSomatic supera a otros métodos existentes, especialmente en la detección de mutaciones complejas como inserciones y deleciones. En plataformas como Illumina, la herramienta alcanzó una puntuación F1 del 90%, superando significativamente a otras soluciones.
También fue evaluada en condiciones más desafiantes, como el análisis de muestras conservadas en parafina (FFPE) y datos de secuenciación del exoma completo (WES). En ambos casos, mantuvo su superioridad frente a métodos tradicionales, demostrando su utilidad incluso con muestras de baja calidad.
Aplicaciones en distintos tipos de cáncer
DeepSomatic demostró su capacidad de generalización al analizar tipos de cáncer para los que no fue entrenada. En el caso de un glioblastoma, logró identificar las variantes clave de la enfermedad. También fue probado en muestras de leucemia pediátrica, en colaboración con Children’s Mercy en Kansas City, detectando mutaciones conocidas y nuevas, incluso sin contar con muestras de células normales.
Google ha liberado tanto el código de DeepSomatic como el conjunto de datos CASTLE para la comunidad científica, con el objetivo de fomentar la investigación y el desarrollo de nuevas terapias personalizadas. Según la compañía, esta herramienta puede convertirse en un recurso valioso para laboratorios y profesionales de la salud, contribuyendo a una mejor comprensión de los tumores y a la medicina de precisión.





















































































