_
_
_
_
_
Reportaje:CIENCIA

El laberinto del genoma

Hace diez años se completaba el primer genoma, el de una bacteria. Surgió la euforia. Se completaron los de un gusano, el ratón, el ser humano. En agosto, el del chimpancé, extraordinariamente parecido al nuestro. Hacemos balance: cuanto más sabemos, vemos que más ignoramos.

Madrid, Palacio de Congresos. Finales de septiembre de 2005. Tres investigadores -dos británicos y un español- toman asiento en un rincón tranquilo, lejos del barullo propio de un congreso que reúne a más de 800 científicos de todo el mundo. Su intención es explicar a un periodista, en términos sencillos, el asunto de la reunión: ¿qué se ha aprendido sobre el genoma humano en estos últimos cuatro años, desde que en 2001 se publicó su primer borrador casi completo? Pero, pese al esfuerzo de los tres investigadores, la conversación es todo menos sencilla. Imposible que lo sea: en cuanto uno empieza a explicar algo, otro le pisa discrepando y el tercero se mete tomando partido, y ya la tenemos montada. Pasamos a una jerga con expresiones como "selección positiva", "transcripción neutral", "tasa de vida-muerte"… Ewan Birney, del Laboratorio Europeo de Biología Molecular, reconocerá más tarde: "Uf, a ver cómo transmite esto a sus lectores". Mejor ni intentarlo. Pero el mensaje de fondo ha quedado clarísimo: entender la información comprimida en la molécula de ADN humano, descodificar ese libro de la vida con las instrucciones para construir y hacer funcionar un individuo Homo sapiens, se ha convertido en un reto mucho más difícil de lo esperado. Y ahora el problema está en plena fase servilleta, esa en que los investigadores en primera línea de batalla no pueden dejar de darle vueltas y, cuando les viene una idea, la apuntan donde pillan. Lo que sigue es una crónica de la aventura de tratar de entender cómo estamos hechos, en el sentido más fundamental de la expresión.

Se han secuenciado los genomas de 1.500 especies, del arroz al perro y al humano. La vaca está a punto
Hay muchos menos genes de lo esperado. ¿Cómo es posible que un humano tenga casi los mismos que un gusano?
El resultado es desconcertante y obliga a replantear hasta el concepto de gen. Ahora las claves están en las proteínas

"Tenemos el libro, y en el libro, efectivamente, está toda la información, pero es que está en ruso. Ahora estamos aprendiendo ruso de forma autodidacta. Tenemos que aprender la gramática, las reglas", dice Birney. "Sí, pero el ruso está resultando más complicado de lo que creíamos", interviene Roderic Guigó, del Instituto Municipal de Investigación Médica (IMIM), en Barcelona. No es que no se haya avanzado, ni mucho menos. De hecho, Birney prefiere ver "el vaso medio lleno", y describe su emoción "al ver cómo poco a poco se van clarificando palabras enteras en el genoma". Pero cada paso adelante revela aspectos nuevos, algunos tan inesperados que obligan a replantear conceptos básicos, como la definición de gen. "Hay muchas cosas que creíamos que entendíamos, y estamos viendo que no es así", afirma el interlocutor de Birney y Guigó, Tom Gingeras, de la compañía Affimetrix. Alfonso Valencia, director del Instituto Nacional de Bioinformática (INB) y uno de los organizadores del reciente congreso de Madrid -la Conferencia Europea de Biología Computacional-, transmite la misma idea: "Estamos cambiando mucho el panorama de la biología molecular. Ahora, la sensación de desafío es enorme".

Lo primero que ha cambiado es que, por primera vez en la historia de la biología, empieza a estar disponible una enorme cantidad de datos sobre los elementos que intervienen a la hora de construir un organismo. Es una situación más propia, o lo ha sido hasta ahora, de las ciencias físicas: en su afán por describir el mundo, por ejemplo, el clima, los físicos toman cuantos más datos mejor sobre todos los elementos que intervienen en ese sistema, y elaboran modelos que simulan y en cierto modo predicen su comportamiento. Pero nunca hasta ahora los biólogos habían soñado con modelizar una célula, y no digamos un organismo. Ahora sí es un objetivo al menos planteable, y la razón es ésa, que empieza a haber muchos datos sobre los componentes más básicos del sistema y sus interacciones.

Esa acumulación de información es un hecho palpable. Toma la forma de los ordenadores donde se guardan las tres principales colecciones de información genética en el mundo, los tres interconectados y accesibles por Internet. En esos grandes bancos digitales hay ya almacenados más de 100.000 millones de bases, que son las letras químicas con que se escribe la información genética. Son letras de cuatro tipos, representadas con las siglas A, C, G y T. Los genomas son series de hasta miles de millones de estas letras -el humano tiene 3.000 millones-; hallar el orden en que se disponen las bases es lo que se entiende por secuenciar un genoma, y una secuencia es una determinada sucesión de bases. Hoy, cuando un biólogo quiere saber algo de una secuencia cualquiera, sea perteneciente a una bacteria, una planta o cualquier organismo viviente, no tiene más que consultar las grandes colecciones: le dirán si hay otras parecidas en otros organismos o qué funciones se le atribuyen, por ejemplo.

Y eso gracias a que hoy, además de la secuencia completa del genoma humano, se conoce la de otros muchos seres. Los 100.000 millones de bases almacenadas en las colecciones proceden de los genomas de unas 200.000 especies, y de ellos, 1.500 han sido secuenciados completamente, o casi. Hay millares de virus, varios cientos de bacterias, insectos como el mosquito de la malaria o la mosca del vinagre, el pequeño gusano C. elegans, la modesta plantita Arabidopsis thaliana, el arroz… Y en cuanto a mamíferos, estamos nosotros; nuestro pariente evolutivo más cercano, el chimpancé -recién llegado a la lista de genomas completos, a finales de agosto-; el perro, el ratón, la rata y el pollo. El de la vaca está casi a punto.

Parecen muchos y, sí, lo son, sobre todo teniendo en cuenta que el primer genoma completo de un organismo vivo, la bacteria Haemophilus influenzae, se publicó hace sólo diez años. El volumen de datos que está produciendo el estudio de los genomas es ingente, hasta el punto de que los bioinformáticos creen que harán falta ordenadores especialmente diseñados para gestionar y analizar la información biológica. Y sin embargo, 1.500 genomas secuenciados no son nada comparado con lo que hay en la naturaleza.

Las letras A, C, G y T han ido combinándose de infinidad de maneras distintas desde que existe la vida. Y a veces con las nuevas combinaciones surgen nuevas instrucciones para construir organismos distintos, como si se generara una pieza diferente de Lego. Después, el ambiente -la famosa selección natural- se encarga de decidir si la nueva pieza se diseminará o no en la naturaleza: si confiere a quien la posee alguna ventaja, tal vez ese afortunado tenga más hijos, que heredarán la nueva característica, que se mantendrá por tanto en el acervo de piezas de Lego disponibles para construir seres vivos distintos. Como dijo Birney en el congreso de bioinformática, "la evolución es un experimento de genética a escala enorme". O un conjunto de piezas de Lego en permanente cambio a escala planetaria.

Craig Venter, apodado a finales del siglo pasado Zar de la genética por sus ideas rompedoras -y exitosas-, afirmaba recientemente en una entrevista a EL PAÍS: "Ya tenemos una lista de 40.000 o 50.000 grandes familias distintas [de genes], y sólo 5.000 de ellas están presentes en el genoma humano y en el de los demás mamíferos. Esto es extraordinario: significa que no sabemos nada sobre nuestro propio planeta". Venter, que en su día desarrolló una técnica para secuenciar genomas mucho más rápida de la que se venía usando y que es la más extendida hoy, se dedica ahora, tal como contaba EPS el domingo pasado en un amplio reportaje, a secuenciar genomas de microorganismos hallados en muestras de agua del mar, y dice haber encontrado ya ocho millones de genes nuevos.

¿Se llegará algún día a tener todas las piezas de Lego creadas por la evolución archivadas en las colecciones de datos genéticos?

Ahora bien, la posibilidad de ir acumulando más y más información no es lo único que ha cambiado en biología en los últimos tiempos. Ese cambio ha traído otros fundamentales. Cambios en lo que se sabe sobre cómo está codificada la información en los genomas.

En los años cincuenta y sesenta se descubrió la estructura del ADN y el código genético. Se supo entonces que en el núcleo de todas y cada una de las células del organismo el genoma se está traduciendo en proteínas. Pero no todas las bases, todas las letras del genoma, se traducen; sólo algunas que están diseminadas a lo largo de toda la secuencia y que tienen un significado, como si en medio de la sopa de letras ACGTTGGAC… hubiera palabras escondidas. Esas palabras son los genes. Hasta ahora se ha considerado que los genes son realmente la auténtica información con sentido del genoma, aunque constituyan apenas poco más del 1% de todo el genoma. Al resto del genoma, que parece no tener sentido alguno, se le llamó "ADN chatarra" o incluso "ADN basura". "Si a un ratón se le elimina del genoma una parte importante de su ADN chatarra, aparentemente vive bien, al menos en condiciones de laboratorio", explica Birney.

Con estos conceptos de partida, muchos investigadores que en torno al año 2000 se afanaban por secuenciar el genoma humano creían que después bastaría con encontrar los genes, entender la función de las proteínas en que éstos se traducen y… ¡ya está! El libro de la vida, el manual de instrucciones de los humanos, ya estaría leído y comprendido. Iba a ser un trabajo arduo, porque se estimaba que habría entre 100.000 y 150.000 genes, pero era cosa de ponerse.

Sin embargo, ya desde febrero de 2001, cuando se publicó el primer borrador, se vio que no iba a ser tan fácil. En primer lugar, porque parecía haber muchos menos genes de lo esperado, tal vez unos 30.000. ¿Cómo era posible que un humano, tan complejo, tuviera casi los mismos genes que un gusano? Además se vio que no era cierto que cada gen ordenara la síntesis de sólo una proteína. Un gen puede dar lugar a muchas más proteínas.

Lo cierto es que hoy, cuatro años más tarde, el panorama no se ha aclarado, sino todo lo contrario. No sólo la escasez de genes y el hecho de que sean tan polifacéticos siguen sin respuesta. Además empieza a verse que la información encriptada en el genoma tiene varios planos de lectura, como un juego de videoconsola. En el más bajo está la, digamos, traducción directa de las letras químicas del genoma. Luego se pasa el segundo piso, definido por la relación de los genes entre sí: los genes forman redes de interacciones que afectan al resultado de la traducción. En un tercer nivel aparecen las proteínas -el producto generado en las etapas anteriores- y sus funciones en las células. Como ocurrió con los genes, hoy se sabe que cada proteína no tiene una única función; también ellas son polifacéticas. Y como no podía ser menos, están las interacciones entre proteínas. O sea, un laberinto de varias plantas con túneles, trampas y ogro incluido.

"Pongamos que hay unas cinco veces más proteínas que genes", explica Valencia. "Y las proteínas pueden sufrir decenas de modificaciones. Y en una célula hay entre 150.000 y 500.000 proteínas, que interaccionan formando redes. Las combinaciones se multiplican".

Ya sólo el primer piso del laberinto del genoma está patas arriba con los resultados más recientes. "A mí lo que más me sorprende es que haya tan pocos genes", dice Birney. "Gente como Roderic los ha buscado realmente a fondo, usando técnicas que nadie usa por lo tediosas, y apenas han encontrado algunos más de los que teníamos". Hoy, aunque sigue sin saberse con precisión el número de genes humanos, está claro que ronda los 20.000. Eso demuestra, por si quedaba alguna duda, que la clave de la cacareada complejidad humana no está en el número de genes.

A Guigó, por su parte, le maravilla el hecho de que un solo gen dé lugar a muchas proteínas. "Era un dogma en biología: un gen codifica para una proteína. Y en cambio vemos en el genoma de la mosca que un gen puede traducirse en más proteínas que todo el genoma junto, unas 60.000". ¡60.000 proteínas! "Sí, bueno, es un caso extremo", tranquiliza Birney. "Ya da bastante miedo que codifiquen para 50".

Pero lo último de lo último lo aporta el trabajo de Gingeras. Su grupo ha descubierto que no sólo son los genes lo que se traduce del genoma. Los experimentos revelan que al menos dos veces más letras que las que componen los genes son leídas por la maquinaria de traducción del genoma. Ahora bien, no son traducidas a proteínas. Y entonces, ¿a qué? "No lo sabemos", responde Gingeras. Ni siquiera se sabe si esta información que al menos se lee sirve para algo o no. "Tal vez las verdaderas unidades con sentido, los átomos del genoma, por así decir, son estos fragmentos, y no los genes. Tal vez estos fragmentos tienen tanta importancia como los genes, y, por tanto, en realidad tenemos cientos de miles de genes".

Es un resultado desconcertante que obliga a replantear el concepto de gen -y el que más animó la conversación entre Gingeras, Birney y Guigó-. Y tiene otra consecuencia más: que el famoso ADN chatarra, que es como hasta hoy se han considerado los fragmentos descubiertos por Gingeras, es probablemente más importante de lo que se creía. Es algo que muchos sospechaban, y de hecho está la idea de que el ADN chatarra es en realidad un banco de pruebas del genoma, un área en la que pueden aparecer combinaciones nuevas sin demasiado riesgo, ya que lo más probable es que no vayan a ser traducidas. "Lo que está claro", dice Birney, "es que aquí está pasando algo que no estamos viendo".

No hay que desesperar. En el laberinto del genoma humano hay guías que ayudan mucho a orientarse. Son nada menos que los genomas secuenciados de otros organismos. Y es que la evolución, en su proceso de crear, reciclar, eliminar nuevos genes -o lo que sean las unidades funcionales del genoma, las piezas de Lego-, ha ido dejando pistas. Pistas que los biólogos encuentran comparando entre sí los genomas de distintos organismos. Los detalles del trabajo no son fáciles, pero hay principios generales que sí. Por ejemplo, si una determinada secuencia se conserva en muchos genomas, se puede pensar que su papel es importante: la evolución ha eliminado los cambios que hayan podido aparecer en ella -tal vez las mutaciones han resultado letales para quienes las tuvieron.

Esa comparación es posible por algo muy sorprendente para los no especialistas: los genomas de organismos muy distintos se parecen mucho entre sí. "Para un genetista de ratón, nosotros somos ratones sin rabo", dice Birney. El 99% de los genes del ratón tienen un equivalente en el genoma humano, a pesar de que el genoma de ratón es un 14% más pequeño. Y eso por no hablar del parecido con nuestro hermano el chimpancé. "Yo me parezco más a un chimpancé macho que a una mujer", dice Guigó. Y no hay connotaciones extrañas, sino un cromosoma Y. Dejando de lado la cuestión del sexo, la diferencia entre el genoma de un chimpancé macho y un hombre es diez veces superior a la que hay entre dos hombres.

Los chimpancés y nosotros llevamos seis millones de años evolucionando por separado, y a pesar de eso compartimos casi el 99% de la secuencia básica del ADN. También es cierto que se han identificado regiones en las que la tasa de cambios es distinta: mientras que en el humano muestran huellas de una evolución acelerada -muchos cambios recientes-, en los chimpancés parecen estar inactivas o fragmentadas. Tal vez ahí residan las diferencias principales. Pero, para muchos, lo más probable es que aún no sepamos ver lo importante. "Puede que la respuesta a qué nos hace humanos no esté en la secuencia del genoma, sino en la manera en que la usamos", dice Gingeras. "Tal vez nosotros escogimos un conjunto diferente de las proteínas que pueden generar los mismos genes".

La conclusión es que aún queda trabajo para rato. Y puede que lo más duro sea constatar que ni siquiera el genoma determina lo que somos, porque está el papel del ambiente: la dieta, que a los padres les guste leer, el hábito de fumar…

Al laberinto genómico hay que añadir una planta más, tan difícil como las otras. Es la mezcla de todos esos niveles de información lo que acaba determinando si tendremos cáncer, si veremos la vida con optimismo o si nos gustará el color rojo o preferiremos el azul.

En los años cincuenta y sesenta se descubrió la estructura del ADN, la famosa doble hélice, mostrada arriba en una imagen por ordenador.
En los años cincuenta y sesenta se descubrió la estructura del ADN, la famosa doble hélice, mostrada arriba en una imagen por ordenador.

Regístrate gratis para seguir leyendo

Si tienes cuenta en EL PAÍS, puedes utilizarla para identificarte
_

Archivado En

Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
_
_