Esta semana hemos asistido al primer gran descubrimiento científico del siglo XXI. Ha sido llamativo, pero, desde luego, no sorprendente. Como ya dijimos en una entrada anterior, la basura es tremendamente informativa, lo cuenta todo acerca de nosotros. Y eso, a nivel molecular, es lo que acaba de hacer público el llamado Proyecto Encode. Para entender de qué estamos hablando, hay que contextualizar el hallazgo. Hay por ahí un gusanito, llamado Caenorabditis elegans, que, de tan elengante, contiene 19.000 genes en su DNA. Por otra parte, hay un sabroso (y venenoso) pez globo japonés, cuyo DNA está constituido, en más de un 95% por genes (tiene alrededor de 30.000). Bien, si ahora añadimos el dato de que una cadena de DNA humana, es ocho veces más grande que la del pez globo, ¿cuántos genes hacen falta para crear un ser humano? Piénselo bien, en nuestro cerebro hay 100.000 millones de neuronas con sus 1.000 billones de conexiones. El Caenorabditis elegans tiene 302 neuronas. Si Ud. repasa la literatura científica sobre el tema, encontrará que las primeras estimaciones no bajaban de los 400.000 genes. Poco a poco la cifra se fue reduciendo, 300.000, 100.000, 40.000... La transcripción del mapa genético humano a cargo del Proyecto Genoma dejó la cifra en torno a 23.000. Sí, sí, 23.000, un poco más que el gusanito elegante de las narices.
Pero, ¿y toda esa cantidad enorme de DNA que nos constituye? 23.000 genes son menos del 2% de nuestro DNA. El 98% restante es basura, secuencias que no dan información acerca de ninguna estructura significativa de nuestro organismo. Dicho de otro modo, un pececito que nos zampamos tiene un 95% de DNA significativo, nosotros un 1,5%. Tomemos el DNA humano, eliminemos todo esa basura y compactémoslo, ¿saldrá de ahí un ser humano? La apasionante respuesta es, no.
¿Cómo puede salir nuestro cerebro de 23.000 genes? Obviamente, nuestros genes tienen que estar pluriempleados. Muchos, la mayoría quizás, tienen que codificar más de una proteína, dependiendo de a partir de qué punto sean leídos, incluso, en qué dirección sean leídos. Y aquí viene la gran pregunta: ¿cómo sabe nuestro organismo en qué dirección y a partir de qué punto hay que leer en cada momento un gen concreto?
Veamos, si estamos constituidos por 23.000 genes y de ellos salen el millón de proteínas que nos constituyen, péptidos aparte, las instrucciones para el desarrollo humano, las correspondientes a la especialización que debe sufrir cada célula para formar parte de un organismo y los 1.000 billones de conexiones neuronales, ¿cómo demonios puede haber un gen para la agresividad, un gen de la homosexualidad y un gen del talento? ¿De dónde han salido esos genes tan especializados que copan, con frecuencia, espacio en los medios de comunicación de masas y en las revistas de difusión científica? ¿No será que todo esto es pura ideología carente de la más mínima base científica? Si Ud. le pregunta a un especialista medianamente serio le dirá que un gen por sí mismo no es nada. Todo gen tiene un mecanismo regulador, que indica cuándo tiene que expresarse y cuándo tiene que dejar de hacerlo. Sin ese interruptor, el gen no sirve para nada. Y ese mecanismo regulador no puede funcionar si no es en interacción con la expresión de otros genes y con el medio ambiente. Ningún gen determina nada por sí mismo sin un mecanismo que lo lleve a expresarse y ese mecanismo es extremadamente sensible al contexto. Dicho de otro modo, sólo somos uno de los resultados posibles de la interacción de los genes que nos constituyen.
Como pueden imaginarse, los mecanismos reguladores de los genes, la clave de todo, son de una complejidad extrema. Aquí se ha abierto paso la biocomputación con el uso de modelos matemáticos, topología avanzada y, por supuesto, supercomputadores de procesamiento en paralelo. Con todo, sólo se conocen las formas más simples y aplicadas a organismos elementales... Hasta ahora. Lo que el Proyecto Encode ha puesto de manifiesto es, precisamente, que el 98% de nuestro DNA codifica mecanismos reguladores de nuestros genes. El DNA "basura", dice cómo y, lo que es todavía más importante, cuándo, se tienen que expresar los diferentes genes. La sucesión física de pares de base del DNA, lleva implícita una red abstracta, en la que cada instrucción es un nodo. Cada secuencia de DNA ocupa un lugar, guardando relaciones de vecindad con otras secuencias, pero también una posición en una red, en la que sus vecinos ya no tienen por qué estar próximos físicamente. Dos nodos son adyacentes si uno ejerce influencia directa sobre el funcionamiento del otro. Y toda esa red de interacciones entre fragmentos de DNA es muy sensible a la situación en la que se encuentra el organismo. La cartografía de esa red nos permitirá entender cómo saben las diferentes células del embrión a qué órgano tienen que dar lugar, qué mecanismo llevan al organismo adolescente a secretar hormonas y de qué modo el malfuncionamiento de un gen afecta a todos los demás, entre otras muchas cosas. Ciertamente estamos más cerca de curar enfermedades con cuya curación jamás se soñó. La verdad es que, contrariamente a lo que dicen los medios de comunicación, no mucho más cerca. Queremos alcanzar la Luna y nos hemos subido en una escalera. Pero, al menos, hemos avanzado algo. Si el Proyecto Genoma Humano permitió asomarse al ojo de la cerradura de la vida, el Proyecto Encode ha entornado esa puerta. Aún queda un proyecto más ambicioso, la proteómica, la secuenciación de cada una de las proteínas que nos constituyen. Entonces, entonces sí, la puerta estará abierta definitivamente.