Il mistero del materiale genetico non codificante

Da quando è stato scoperto nel 1953, il DNA è sempre rimasto uno dei più grandi e affascinanti misteri riguardo l’organismo umano. La prima fotografia dei nostri cromosomi risale al 1956, quando gli scienziati Tijo e Levan sono riusciti a far separare le molecole e si è definito il patrimonio genetico umano in 46 cromosomi organizzati a coppie. Intorno agli anni Novanta è stato introdotto il metodo Sanger, che ha permesso il sequenziamento completo del primo genoma umano. Una fondamentale svolta si è verificata poi nel 2005 con l’invenzione del Next Generation Sequencing, tecnologia molto più innovativa, con cui si possono analizzare milioni di sequenze contemporaneamente con un solo macchinario nell’arco di circa 12-24 ore: al giorno d’oggi, si può sequenziare un intero genoma in 2 o 3 giorni di lavoro.

Per rendersi conto dell’ingente sviluppo tecnologico, è sufficiente pensare al fatto che per sequenziare il primo genoma ci vollero 10 anni di tempo (dal 1993 al 2003), poi nei successivi 7 anni ne sono stati sequenziati 13. Il Progetto Genoma Umano mirava al sequenziamento di 1000 genomi di persone presumibilmente sane, ma nel 2014 sono stati pubblicati i risultati con ben 2500 genomi completi. Nel 2019, i genomi sequenziati erano 71 mila. Al giorno d’oggi, dunque, il problema non è più sequenziare il genoma: si fa, anche in modo relativamente semplice e poco costoso. Il problema che la comunità scientifica sta fronteggiando al momento è l’interpretazione di tali sequenze ottenute.

Il DNA umano è costituito da circa 3,2 coppie di basi. Di queste, il 50% consiste in DNA ripetitivo non codificante e soltanto il 27% corrisponde a geni codificanti proteine. All’interno questi ultimi, inoltre, sono presenti alcune regioni che non vengono trascritte e altre che racchiudono le vere e proprie istruzioni per la sintesi di proteine: ebbene, le parti veramente tradotte sono soltanto l’1-2% di tutto il genoma. La comunità scientifica si è dunque chiesta: che significato ha tutto questo materiale genetico non codificante?

Negli anni Sessanta ha avuto una certa diffusione il concetto di Junk DNA, cioè DNA spazzatura, che sottintendeva che tali regioni sono soltanto immondizia accumulata all’interno del nostro genoma, senza alcun significato. Successivamente, però, si è messa fortemente in discussione questa ipotesi: perché continuare a tramandare tutta questa informazione genetica se essa è inutile?

Un dato particolarmente interessante è che, confrontando il genoma dell’uomo con quello del topo, della totalità di DNA conservato tra le due specie, il 20% fa parte di geni veri e propri, mentre il restante 80% è proprio nelle regioni non codificanti. Si sono, inoltre, scoperte regioni di DNA altamente conservate da una specie all’altra per centinaia di milioni di anni, di conseguenza esso deve avere una pressione evolutiva molto forte ed esercitare una notevole selezione positiva. Come può essere stato trasmesso in modo così conservato per puro caso?

Per quanto riguarda una parte di tali sequenze non codificanti, si è visto che esse possono svolgere compiti di regolazione dell’espressione genica oppure essere fondamentali in quanto introni per la trascrizione del DNA in RNA, o costituire i telomeri, cioè le parti finali dei cromosomi. Altri ancora sono pseudogeni, cioè copie di geni codificanti che sono molto simili a essi ma non funzionano più a causa di mutazioni accumulate. La grande sfida della genetica moderna è svelare questo affascinante mistero. La tecnica con cui si spera di arrivare a comprendere qualcosa in più è tramite la genetica comparativa, in cui si confrontano genomi di molte specie e individui diversi alla ricerca di variazioni; possono essere utili anche alcune malattie genetiche che, come è stato recentemente scoperto, sono dovute a mutazioni nelle regioni non codificanti.