CIENCIA

800 bioinformáticos analizan en Madrid lo aprendido sobre el 'libro de la vida'

El genoma humano tiene unos tres mil millones de letras, con las que se escriben los genes. Esa ingente cantidad de información no hace sino crecer y no podría gestionarse sin la ayuda de potentes computadores.

06 oct 2005 - 00:00CEST

Unos 800 expertos de todo el mundo en biología computacional se reunieron la semana pasada en Madrid para analizar cuánto se ha avanzado en la tarea de extraer información del libro de la vida de los organismos, el genoma. En lo que respecta al humano, la conclusión de momento podría expresarse como 'genoma 1, biólogos 0,5': a pesar de lo mucho que se ha avanzado, la información contenida en el ADN humano está demostrando ser mucho más compleja de analizar de lo que se esperaba.

En febrero de 2001, cuando los científicos acabaron -y publicaron- la secuencia casi completa del genoma humano, la revista científica Nature preguntó a todos los biólogos en el titular de un reportaje: "¿Estáis preparados para la revolución?". Hacía referencia a la bioinformática, al hecho de que, a medida que se secuenciaban los genomas de más y más organismos, las computadoras se convertían en una herramienta absolutamente indispensable para entender la información almacenada en ellos.

La biología iniciaba una estrecha dependencia con los ordenadores, y para los investigadores el mensaje era claro: subirse al nuevo carro de la bioinformática, o... morir -al menos en lo que a investigación de élite se refiere-. "O bien usas los nuevos métodos en todos los aspectos de tu trabajo, o sigues a tu ritmo habitual y te quedas atrás", declaró a Nature el director del Centro para el Análisis de Secuencias Biológicas en Dinamarca.

Los resultados de Conferencia Europea de Biología Computacional la pasada semana en Madrid confirman que la profecía no andaba descaminada. Ahí fuera hay un montón de grupos de investigación secuenciando genomas a toda velocidad, descodificando las moléculas de ADN de un montón de organismos, de forma que queden convertidos en larguísimas listas de cuatro letras (A, T, C, G) llamadas bases.

Miles de millones de letras

A modo de referencia, el genoma humano tiene unas tres mil millones de estas letras -con las que se escriben los genes, que a su vez ordenan la síntesis de las proteínas de que estamos hechos-. Esa ingente cantidad de información no hace sino crecer, y no podría gestionarse sin la ayuda de potentes computadores.

El pasado agosto, coincidiendo con la publicación del genoma del chimpancé, las tres principales bases de datos de secuencias, interconectadas entre sí, superaron las 100.000 millones de letras almacenadas. Es información perteneciente a al menos 200.000 genomas de organismos distintos, de los que 1.500 han sido secuenciados completamente, o casi. Hay millares de virus; varios cientos de bacterias; los genomas de los organismos más usados en los laboratorios, como la planta Arabidopsis thaliana, el gusano Caenorhabditis elegans, la mosca Drosophila melanogaster o el ratón; y por supuesto el humano, el del chimpancé, el del pollo e incluso el del perro.

Pero el papel de la bioinformática no acaba en las bases de datos. La secuenciación de un genoma es sólo el principio del trabajo. Una vez completada la secuencia hay que tratar de entender la información que contiene: buscar los genes, saber de qué proteínas ordenan la síntesis, averiguar qué función tienen estas proteínas en el organismo. Tareas que serían imposibles sin los computadores.

La actual era de la genómica, por tanto, sería impensable sin la bioinformática. Pero es que además lo mostrado en el congreso indica que, incluso con la ayuda de los ordenadores, los biólogos del siglo XXI están un tanto desbordados. Los hallazgos de los últimos años "han cambiado tanto el panorama de la biología que ahora el problema real es entenderla", señala Alfonso Valencia, director del Instituto Nacional de Bioinformática. "Hay conceptos que estaban muy claros que ahora nos estamos replanteando. La sensación de desafío es enorme".

Parte del problema es cuantitativo. Por ejemplo, hay secuenciados fragmentos enteros de genomas que han sido colocados en las bases de datos -a los que se accede por Red- a la espera de que algún grupo tenga tiempo de ensamblarlos (para secuenciar un genoma es más rápido hacerlo por pedazos y después unir las piezas, como en un rompecabezas). "El ritmo al que se produce la información es más alto que nuestra capacidad para trabajar con ella", dice Valencia.

Otro aspecto crucial, que trae a los biólogos de cabeza, es lo difícil que resulta interpretar la información escrita en los genomas. Por ejemplo, como explica Roderic Guigó, del Instituto Municipal de Investigación Médica (IMIM), de Barcelona, "Aún no sabemos exactamente cuántos genes tiene el genoma humano". Además los nuevos datos revelan que cada gen puede ordenar la síntesis de numerosas proteínas diferentes, y que la función de cada proteína está además influenciada por otras proteínas. "Estamos viendo niveles de complejidad muy superiores a los previstos", dice Guigó.

Una muestra de esa mayor complejidad es la gran similitud hallada entre las secuencias de humano y de chimpancé. Este gran parecido entre el número de genes y los genes en sí indica que "hay algo más; en el genoma están pasando muchas más cosas de las que sabemos leer ahora mismo", explicó en el congreso Ewan Birney, del Laboratorio Europeo de Biología Molecular.

En esa necesidad de bases de datos, una ayuda crucial es el ordenador MareNostrum, del barcelonés Centro de Supercomputación. MareNostrum, de IBM, empezó a funcionar en abril y es el supercomputador más potente de Europa.

Se buscan bioinformáticos

Una de las conclusiones que se derivan del congreso madrileño es que la bioinformática es un área en expansión, llena de misterios por resolver y aún relativamente escasa, por joven, de investigadores. Debería ser tenida en cuenta como área potencialmente atractiva para cualquier joven biólogo, informático, físico o ingeniero español preocupado por su futuro. "En España hay grupos buenos en bioinformática, pero nos estamos quedando un poco atrás. Falta gente, especialmente de fuera de la biología", opina Guigó. "Uno de los problemas es la formación. Al contrario que en otros países, el sistema académico ha sido aquí demasiado rígido. Aquí no hay una manera estándar de hacerse bioinformático".

Otra cuestión se refiere a las máquinas en sí: ¿Son los ordenadores actuales suficientemente potentes para afrontar los desafíos que les está planteando la biología? "A corto plazo no hay falta de capacidad de cálculo", dice Valencia. "No es como el problema de la factorización de números primos". Pero este experto sí prevé la necesidad de un nuevo tipo de computador diseñado especialmente para los nuevos retos biológicos. "Los ordenadores hasta ahora han sido pensados y desarrollados para resolver problemas físicos, problemas donde se pide por ejemplo gran capacidad de cálculo y que son divisibles, se puede repartir la tarea entre varias computadoras. Nuestros problemas son un poco distintos. No se trata tanto de hacer correr modelos, de hacer simulaciones, como de buscar información en enormes bases de datos y compararla".