Los cánceres comienzan con cambios anormales en células individuales, y la capacidad de rastrear la acumulación de mutaciones a nivel unicelular puede arrojar nueva luz sobre las primeras fases de la enfermedad.
Este conocimiento podría permitir una detección precoz más eficaz y opciones de tratamiento para los pacientes, así como predicciones más precisas de la progresión de la enfermedad.
Según un artículo publicado en Nature Communications, un equipo de investigadores de la Universidad Rice dirigido por Luay Nakhleh ha desarrollado una plataforma para integrar datos de ADN y ARN procedentes de la secuenciación unicelular con mayor velocidad y precisión que las tecnologías más recientes y avanzadas.
El método, mapping cross domain nucleic acid o MaCroDNA, se basa en un algoritmo clásico para identificar pares de datos coincidentes de ADN ⎯ el plano genético de una célula ⎯ y ARN ⎯ el manual de instrucciones de una célula para el ensamblaje de proteínas.
"Imagina que te dan dos grandes conjuntos de fotos de coches con las matrículas y otros rasgos identificativos borrosos", explica Mohammadamin Edrisi, estudiante de doctorado en informática de Rice y autor principal del estudio.
"Un conjunto contiene fotos de los coches tomadas de frente, mientras que el otro conjunto tiene fotos de la parte trasera de los coches, y alguien te pide que encuentres los pares de fotos que pertenecen al mismo coche. Es una metáfora del problema que hemos intentado resolver. Los coches son células cancerosas, y los dos conjuntos de fotos son mediciones de datos de ADN y ARN".
De hecho, el escenario para el que se ha diseñado MaCroDNA es más complejo.
"En un experimento típico de secuenciación unicelular del cáncer, los conjuntos de datos de ADN y ARN se obtienen de distintas células de la muestra tumoral", explica Nakhleh, autor principal del estudio.
"Por lo tanto, el emparejamiento se produce entre células que sabemos que no son las mismas.
"Para continuar con la analogía, piense que cada foto está tomada de la parte delantera o trasera de un coche Toyota diferente, y queremos emparejar pares de fotos que pertenezcan a un coche del mismo modelo: la parte delantera y trasera de un Toyota Camry, de un Toyota Corolla, etc. En este caso, los distintos modelos de coche son análogos a los distintos clones de un tumor heterogéneo, donde se espera que cada clon tenga firmas de ADN y ARN muy similares, aunque no completamente idénticas, en todas las células del clon".
La secuenciación unicelular se ha desarrollado considerablemente en la última década, impulsando descubrimientos en diversos campos de la biología.
Esta técnica de secuenciación es una herramienta eficaz para estudiar cómo los cambios a nivel del código genético afectan a la composición o el funcionamiento de las células, lo que facilita el seguimiento de los tipos de transformaciones que convierten una población de células sanas en tejido maligno.
"Las células cancerosas muestran patrones anormales de ARN, y una de las razones de ello son las mutaciones del ADN", explica Edrisi.
En su afán por identificar la mejor herramienta para la tarea, los investigadores probaron diversos métodos con un conjunto de datos biológicos reales con pares de ADN-ARN coincidentes conocidos.
"Pusimos a prueba el método más avanzado ⎯ llamado clonealign ⎯ y los demás métodos ampliamente utilizados utilizando un conjunto de datos real con información de la verdad sobre el terreno para medir la precisión", explicó Edrisi. "Curiosamente, utilizar este conjunto de datos fue una de las novedades de nuestro trabajo. Los estudios anteriores se basaban en datos simulados para medir la precisión, aunque no hay consenso científico sobre cómo simular esos datos."
De las distintas tecnologías de aprendizaje automático que probaron, los investigadores descubrieron que el uso de un coeficiente de correlación clásico y el algoritmo de correspondencia bipartita ponderada máxima arrojaban los resultados más precisos.
En otras palabras, MaCroDNA superó a clonealign por un margen significativo.
"Lo sorprendente de nuestro trabajo fue que utilizar la correlación clásica en lugar de la complicada fórmula de clonealign e incorporarla a un algoritmo de los años 50 condujo a la mejor precisión que hemos presenciado nunca", afirma Edrisi.
"La lección es que nunca debemos juzgar un algoritmo basándonos en su complejidad. Hay que darle una oportunidad y asegurarse de que se compara con los demás en un entorno justo".
El método está disponible para su uso en la investigación oncológica sobre el papel de la dinámica ADN-ARN en la aparición del cáncer.
Nakhleh es Decano William y Stephanie Sick de la Facultad de Ingeniería George R. Brown de Rice y profesor de Informática y Biociencias.
La investigación ha sido financiada en parte por la National Science Foundation.
Fuente: Universidad Rice