Ciencia Contemporanea 3II TM: ciencia Genoma Humano

GENOMA HUMANO:

El genoma es la totalidad de la información genética que posee un organismo en particular. Por lo general, al hablar de genoma en los seres eucarióticos nos referimos sólo al ADN contenido en el núcleo, organizado en cromosomas.

Cromosomas

El genoma humano (como el de cualquier organismo eucariota) está formado por cromosomas, que son largas secuencias continuas de ADN altamente organizadas espacialmente (con ayuda de proteínas histónicas y no histónicas) para adoptar una forma ultracondensada en metafase. Son observables con microscopía óptica convencional o de fluorescencia mediante técnicas de citogenética y se ordenan formando un cariotipo.

El cariotipo humano contiene un total de 24 cromosomas distintos: 22 pares de autosomas más 2 cromosomas sexuales que determinan el sexo del individuo. Los cromosomas 1-22 fueron numerados en orden decreciente de tamaño en base al cariotipo. Sin embargo, posteriormente pudo comprobarse que el cromosoma 22 es en realidad mayor que el 21.

Representación gráfica del cariotipo humano normal.(Imagen 1).

Las células somáticas de un organismo poseen en su núcleo un total de 46 cromosomas (23 pares): una dotación de 22 autosomas procedentes de cada progenitor y un par de cromosomas sexuales, un cromosoma X de la madre y un X o un Y del padre. (Ver imagen 1). Los gametos -óvulos y espermatozoides- poseen una dotación haploide de 23 cromosomas.

ADN intragénico

Genes

Un gen es la unidad básica de la herencia, y porta la información genética necesaria para la síntesis de una proteína (genes codificantes) o de un ARN no codificante (genes de ARN). Está formado por una secuencia promotora, que regula su expresión, y una secuencia que se transcribe, compuesta a su vez por: secuencias UTR (regiones flanqueantes no traducidas), necesarias para la traducción y la estabilidad del ARNm, exones (codificantes) e intrones, que son secuencias de ADN no traducidas situadas entre dos exones que serán eliminadas en el procesamiento del ARNm (ayuste).

Este diagrama esquemático muestra un gen en relación a su estructura física (doble hélice de ADN) y a un cromosoma (derecha). Los intrones son regiones frecuentemente encontradas en los genes de eucariotas, que se transcriben, pero son eliminadas en el procesamiento del ARN (ayuste) para producir un ARNm formado sólo por exones, encargados de traducir una proteína. Este diagrama es en exceso simplificado ya que muestra un gen compuesto por unos 40 pares de bases cuando en realidad su tamaño medio es de 20.000-30.000 pares de bases).

Actualmente se estima que el genoma humano contiene entre 20.000 y 25.000 genes codificantes de proteínas, estimación muy inferior a las predicciones iniciales que hablaban de unos 100.000 genes o más. Esto implica que el genoma humano tiene menos del doble de genes que organismos eucariotas mucho más simples, como la mosca de la fruta o el nematodo Caenorhabditis elegans. Sin embargo, las células humanas recurren ampliamente al splicing (ayuste) alternativo para producir varias proteínas distintas a partir de un mismo gen, como consecuencia de lo cual el proteoma humano es más amplio que el de otros organismos mucho más simples. En la práctica, el genoma tan sólo porta la información necesaria para una expresión perfectamente coordinada y regulada del conjunto de proteínas que conforman el proteoma, siendo éste el encargado de ejecutar la mayor parte de las funciones celulares.

Con base en los resultados iniciales arrojados por el proyecto ENCODE4 (acrónimo de ENCyclopedia Of DNA Elements), algunos autores han propuesto redefinir el concepto actual de gen. Las observaciones más recientes hacen difícilmente sostenible la visión tradicional de un gen, como una secuencia formada por las regiones UTRs, los exones y los intrones. Estudios detallados han hallado un número de secuencias de inicio de transcripción por gen muy superior a las estimaciones iniciales, y algunas de estas secuencias se sitúan en regiones muy alejadas de la traducida, por lo que los UTR 5' pueden abarcar secuencias largas dificultando la delimitación del gen. Por otro lado, un mismo transcrito puede dar lugar a ARN maduros totalmente diferentes (ausencia total de solapamiento), debido a una gran utilización del splicing alternativo. De este modo, un mismo transcrito primario puede dar lugar a proteínas de secuencia y funcionalidad muy dispar. En consecuencia, algunos autores han propuesto una nueva definición de gen,:5 6 la unión de secuencias genómicas que codifican un conjunto coherente de productos funcionales, potencialmente solapantes. De este modo, se identifican como genes los genes ARN y los conjuntos de secuencias traducidas parcialmente solapantes (se excluyen, así, las secuencias UTR y los intrones, que pasan a ser considerados como "regiones asociadas a genes", junto con los promotores). De acuerdo con esta definición, un mismo transcrito primario que da lugar a dos transcritos secundarios (y dos proteínas) no solapantes debe considerarse en realidad dos genes diferentes, independientemente de que estos presenten un solapamiento total o parcial de sus transcritos primarios.

Las nuevas evidencias aportadas por ENCODE, según las cuales las regiones UTR no son fácilmente delimitables y se extienden largas distancias, obligarían a reidentificar nuevamente los genes que en realidad componen el genoma humano. De acuerdo con la definición tradicional (actualmente vigente), sería necesario identificar como un mismo gen a todos aquellos que muestren un solapamiento parcial (incluyendo las regiones UTR y los intrones), con lo que a la luz de las nuevas observaciones, los genes incluirían múltiples proteínas de secuencia y funcionalidad muy diversa. Colateralmente se reduciría el número de genes que componen el genoma humano. La definición propuesta, en cambio, se fundamenta en el producto funcional del gen, por lo que se mantiene una relación más coherente entre un gen y una función biológica. Como consecuencia, con la adopción de esta nueva definición, el número de genes del genoma humano aumentará significativamente.

Genes de ARN

Además de los genes codificantes de proteínas, el genoma humano contiene varios miles de genes ARN, cuya transcripción reproduce ARN de transferencia (ARNt), ARN ribosómico (ARNr), microARN (miARN), u otros genes ARN no codificantes. Los ARN ribosómico y de transferencia son esenciales en la constitución de los ribosomas y en la traducción de las proteínas. Por su parte, los microADN tienen gran importancia en la regulación de la expresión génica, estimándose que hasta un 20-30% de los genes del genoma humano puede estar regulado por el mecanismo de interferencia por miARN. Hasta el momento se han identificado más de 300 genes de miARN y se estima que pueden existir unos 500.

Distribución de genes

A continuación se muestran algunos valores promedio del genoma humano. Cabe advertir, sin embargo, que la enorme heterogeneidad que presentan estas variables hace poco representativos a los valores promedio, aunque tienen valor orientativo.

La densidad media de genes es de 1 gen cada 100 kb, con un tamaño medio de 20-30 kb, y un número de exones promedio de 7-8 por cada gen, con un tamaño medio de 150 nucleótidos. El tamaño medio de un ARNm es de 1,8-2,2 kb, incluyendo las regiones UTR (regiones no traducidas flanqueantes), siendo la longitud media de la región codificante de 1,4 kb.

Isocoros. Frecuencia y riqueza en G+C y genes, en el genoma humano.

El genoma humano se caracteriza por presentar una gran heterogeneidad en su secuencia. En particular, la riqueza en bases de guanina (G) y citosina (C) frente a las de adenina (A) y timina (T) se distribuye heterogéneamente, con regiones muy ricas en G+C flanqueadas por regiones muy pobres, siendo el contenido medio de G+C del 41%, menor al teóricamente esperado (50%). Dicha heterogeneidad esta correlacionada con la riqueza en genes, de manera que los genes tienden a concentrarse en las regiones más ricas en G+C. Este hecho era conocido ya desde hace años gracias a la separación mediante centrifugación en gradiente de densidad de regiones ricas en G+C (que recibieron el nombre de isócoros H; del inglés High) y regiones ricas en A+T (isócoros L; del inglés Low).

ADN intergénico

Como se ha dicho, las regiones intergénicas o extragénicas comprenden la mayor parte de la secuencia del genoma humano, y su función es generalmente desconocida. Buena parte de estas regiones está compuesta por elementos repetitivos, clasificables como repeticiones en tándem o repeticiones dispersas, aunque el resto de la secuencia no responde a un patrón definido y clasificable. Gran parte del ADN intergénico puede ser un artefacto evolutivo sin una función determinada en el genoma actual, por lo que tradicionalmente estas regiones han sido denominadas ADN "basura" (Junk DNA), denominación que incluye también las secuencias intrónicas y pseudogenes. No obstante, esta denominación no es la más acertada dado el papel regulador conocido de muchas de estas secuencias. Además el notable grado de conservación evolutiva de algunas de estas secuencias parece indicar que poseen otras funciones esenciales aún desconocidas o poco conocidas. Por lo tanto, algunos prefieren denominarlo "ADN no codificante" (aunque el llamado "ADN basura" incluye también transposones codificantes) o "ADN repetitivo". Algunas de estas regiones constituyen en realidad genes precursores para la síntesis te microARN (reguladores de la expresión génica y del silenciamiento génico).

Frecuencia de las diversas regiones intergénicas e intragénicas del cromosoma 22. Adaptado de: Dunham, I., et al., 1999. The DNA sequence of human chromosome 22, Nature 402(6761):489–495.

Estudios recientes enmarcados en el proyecto ENCODE han obtenido resultados sorprendentes, que exigen la reformulación de nuestra visión de la organización y la dinámica del genoma humano. Según estos estudios, el 15% de la secuencia del genoma humano se transcribe a ARN maduros, y hasta el 90% se transcribe al menos a transcritos inmaduros en algún tejido:6 Así, una gran parte del genoma humano codifica genes de ARN funcionales. Esto es coherente con la tendencia de la literatura científica reciente a asignar una importancia creciente al ARN en la regulación génica. Asimismo, estudios detallados han identificado un número mucho mayor de secuencias de inicio de transcripción por gen, algunas muy alejadas de la región próxima a la traducida. Como consecuencia, actualmente resulta más complicado definir una región del genoma como génica o intergénica, dado que los genes y las secuencias relacionadas con los genes se extienden en las regiones habitualmente consideradas intergénicas.

La alteración de la secuencia de ADN que constituye el genoma humano puede causar la expresión anormal de uno o más genes, originando un fenotipo patológico. Las enfermedades genéticas pueden estar causadas por mutación de la secuencia de ADN, con afectación de la secuencia codificante (produciendo proteínas incorrectas) o de secuencias reguladoras (alterando el nivel de expresión de un gen), o por alteraciones cromosómicas, numéricas o estructurales. La alteración del genoma de las células germinales de un individuo se transmite frecuentemente a su descendencia. Actualmente el número de enfermedades genéticas conocidas es aproximadamente de 4.000, siendo la más común la fibrosis quística.

El estudio de las enfermedades genéticas frecuentemente se ha englobado dentro de la genética de poblaciones. Los resultados del Proyecto Genoma Humano son de gran importancia para la identificación de nuevas enfermedades genéticas y para el desarrollo de nuevos y mejores sistemas de diagnóstico genético, así como para la investigación en nuevos tratamientos, incluida la terapia génica.

Mutaciones

Las mutaciones génicas pueden ser:

• Sustituciones (cambios de un nucleótido por otro): Las sustituciones se denominan transiciones si suponen un cambio entre bases del mismo tipo químico, o transversiones si son un cambio purina (A, G)→pirimidina (C, T) o pirimidina→purina.

• Deleciones o inserciones: son respectivamente la eliminación o adición de una determinada secuencia de nucleótidos, de longitud variable. Las grandes deleciones pueden afectar incluso a varios genes, hasta el punto de ser apreciables a nivel cromosómico con técnicas de citogenética. Inserciones o deleciones de unas pocas pares de bases en una secuencia codificante pueden provocar desplazamiento del marco de lectura (frameshift), de modo que la secuencia de nucleótidos del ARNm se lee de manera incorrecta.

Las mutaciones génica pueden afectar a:

• ADN codificante: Si el cambio en un nucleótido provoca en cambio de un aminoácido de la proteína la mutación se denomina no sinónima. En caso contrario se denominan sinónimas o silenciosas (posible porque el código genético es degenerado). Las mutaciones no sinónimas asimismo se clasifican en mutaciones con cambio de sentido (missense) si provocan el cambio de un aminoácido por otro, mutaciones sin sentido (non-sense) si cambian un codón codificante por un codón de parada (TAA, TAG, TGA) o con ganacia de sentido si sucede a la inversa.

• ADN no codificante: Pueden afectar a secuencias reguladoras, promotoras o implicadas en el ayuste (splicing). Estas últimas pueden causar un erróneo procesamiento del ARNm, con consecuencias diversas en la expresión de la proteína codificada por ese gen.

Trastornos de un sólo gen

Son enfermedades genéticas causadas por mutación en un sólo gen, que presentan una herencia de tipo mendeliano, fácilmente predecible. En la tabla se resumen los principales patrones de herencia que pueden mostrar, sus características y algunos ejemplos.

Patrón hereditario Descripción Ejemplos

Autosómico dominante

Enfermedades que se manifiestan en individuos heterocigóticos. Es suficiente con una mutación en una de las dos copias (recuérdese que cada individuo posee un par de cada cromosoma) de un gen para que se manifieste la enfermedad. Los individuos enfermos generalmente tienen uno de sus dos progenitores enfermos. La probabilidad de tener descendencia afectada es del 50% dado que cada progenitor aporta uno de los cromosomas de cada par. Frecuentemente corresponden a mutaciones con ganancia de función (de modo que el alelo mutado no es inactivo sino que posee una nueva función que provoca el desarrollo de la enfermedad) o por pérdida de función del alelo mutado con efecto de dosis génica también conocido como haploinsuficiencia. Frecuentemente son enfermedades con baja penetrancia, es decir, sólo una parte de los individuos que portan la mutación desarrollan la enfermedad. Enfermedad de Huntington, Neurofibromatosis 1, Síndrome de Marfan, Cáncer colorrectal hereditario no polipósico

Autosómico recesivo

La enfermedad sólo se manifiesta en individuos homocigóticos recesivos, es decir, aquellos en los que ambas copias de un gen están mutadas. Son mutaciones que causan pérdida de función, de modo que la causa de la enfermedad es la ausencia de la acción de un gen. La mutación sólo en una de las dos copias es compensada por la existencia de la otra (cuando una sola copia no es suficiente se origina haploinsuficiencia, con herencia autosómica dominante). Habitualmente un individuo enfermo tiene ambos progenitores sanos pero portadores de la mutación (genotipo heterocigótico: Aa). En tal caso un 25% de la descendencia estará afectada. Fibrosis quística, Anemia falciforme, Enfermedad de Tay-Sachs, Atrofia muscular espinal

Dominante ligado al X

Las enfermedades dominantes ligadas al cromosoma X están causadas por mutaciones en dicho cromosoma, y presentan un patrón hereditario especial. Sólo unas pocas enfermedades hereditarias presentan este patrón. Las mujeres tienen mayor prevalencia de la enfermedad que los hombres, dado que reciben un cromosoma X de su madre y otro de su padre, cualquiera de los cuales puede portar la mutación. Los varones en cambio siempre reciben el cromosoma Y de su padre. Así, un varón enfermo (xY) tendrá todos sus hijos varones sanos (XY) y todas las hijas enfermas (Xx), mientras que una mujer enferma (Xx) tendrá un 50% de su descendencia enferma, independientemente del sexo. Algunas de estas enfermedades son letales en varones (xY), de modo que sólo existen mujeres enfermas (y varones con Síndrome de Klinefelter, XxY).

Hipofosfatemia, Síndrome de Aicardi

Recesivo ligado al X

Las enfermedades recesivas ligadas al X también están causadas por mutaciones en el cromosoma X. Los varones están más frecuentemente afectados. Un varón portador siempre será enfermo (xY) dado que sólo posee un cromosoma X, que está mutado. Su descendencia serán varones sanos (XY) e hijas portadoras (Xx). Una mujer portadora, tendrá una descendencia compuesta por un 50% de hijas portadoras y un 50% de varones enfermos. Hemofilia A, Distrofia Muscular de Duchenne, Daltonismo, Distrofia muscular Alopecia androgénica

Ligado a Y

Son enfermedades causadas por mutación en el cromosoma Y. En consecuencia, sólo puede manifestarse en varones, cuya descendencia será del 100% de hijas sanas y el 100% de hijos varones enfermos. Dadas las funciones del cromosoma Y, frecuentemente estas enfermedades sólo causan infertilidad, que a menudo puede ser superada terapéuticamente. Infertilidad masculina hereditaria

Mitocondrial

Enfermedades causadas por mutación en genes del genoma mitocondrial. Dadas la particularidades de dicho genoma, su transmisión es matrilineal (el genoma mitocondrial se transfiere de madres a hijos). La gravedad de una mutación depende del porcentaje de genomas afectados en la población de mitocondrias, fenómeno denominado heteroplasmia (en contraste con heterocigosis), que varía por segregación mitótica asimétrica. Neuropatía óptica hereditaria de Leber (LHON)

Trastornos poligénicos y multifactoriales

Otras alteraciones genéticas pueden ser mucho más complejas en su asociación con un fenotipo patológico. Son las enfermedades multifactoriales o poligénicas, es decir, aquellas que están causadas por la combinación de múltiples alelos genotípicos y de factores exógenos, tales como el ambiente o el estilo de vida. En consecuencia no presentan un patrón hereditario claro, y la diversidad de factores etiológicos y de riesgo dificulta la estimación del riesgo, el diagnóstico y el tratamiento.

Algunos ejemplos de enfermedades multifactoriales con etiología parcialmente genética son:

• autismo

• enfermedad cardiovascular

• hipertensión

• diabetes

• obesidad

• cáncer

Alteraciones cromosómicas

Las alteraciones genéticas pueden producirse también a escala cromosómica (cromosomopatías), causando severos trastornos que afectan a múltiples genes y que en muchas ocasiones son letales provocando abortos prematuros. Frecuentemente están provocadas por un error durante la división celular, que sin embargo no impide su conclusión. Las alteraciones cromosómicas reflejan una anormalidad en el número o en la estructura de los cromosomas, por lo que se clasifican en numéricas y estructurales. Provocan fenotipos muy diversos, pero frecuentemente presentan unos rasgos comunes:

• Retraso mental y retraso del desarrollo.

• Alteraciones faciales y anomalías en cabeza y cuello.

• Malformaciones congénitas, con afectación preferente de extremidades, corazón, etc.

Ciencia Contemporanea 3II TM

miércoles, 5 de enero de 2011

ciencia Genoma Humano

No hay comentarios:

Publicar un comentario