MILANO – La struttura tridimensionale del DNA è determinata da una serie di regole spaziali basate sulla presenza di particolari sequenze proteiche e sul loro ordine: è il risultato di uno studio recentemente pubblicato su Genome Biology da Luca Nanni, dottorando in Computer Science and Engineering al Politecnico di Milano, congiuntamente ai Professori Stefano Ceri dello stesso Ateneo e Colin Logie dell’Università di Nijmegen.
L’autore dello studio
“La maggior innovazione portata dal nostro studio risiede nell’aver per la prima volta identificato delle precise regole di disposizione di alcune particolari proteine chiamate CTCF. La bellezza e la semplicità della grammatica di CTCF ci dimostrano come la natura e l’evoluzione producano regolarità e sistemi incredibilmente ingegnosi e funzionali” spiega Luca Nanni, primo autore dello studio. “La conoscenza di queste regole ci potrà permettere in futuro di ingegnerizzare le sequenze di CTCF in modo da ottenere la desiderata struttura tridimensionale del DNA, ad esempio per far interagire due geni che altrimenti non sarebbero in contatto. Plasmare la struttura del DNA aprirà porte ancora sconosciute alla creazione di farmaci per il trattamento di malattie come il cancro”.
La molecola del DNA, che sarebbe lunga circa due metri se completamente srotolata, per risiedere nel nucleo delle nostre cellule deve avvilupparsi secondo un complesso sistema che ne mantenga l’accessibilità e la corretta lettura. Di particolare importanza nello studio della struttura tridimensionale del genoma sono i cosiddetti domini topologici, che si pensa abbiano una funzione di aggregazione di zone di DNA con ruoli e comportamento simili. Ad esempio, geni con funzione analoga hanno alta probabilità di risiedere nello stesso dominio topologico. “Ci siamo concentrati su alcune specifiche sequenze di DNA che codificano per la proteina chiamata CTCF” prosegue Nanni. “Questa proteina ha la funzione di isolare porzioni di DNA e quindi creare le barriere fra i vari domini topologici. Tramite l’ausilio di simulazioni al computer e l’ideazione di un modello di classificazione di queste proteine in base alla loro orientazione, siamo riusciti a individuare una regolarità sorprendente nella loro disposizione lungo la sequenza del DNA”. Lo studio ha evidenziato che l’orientazione e l’ordine di queste sequenze di DNA consente di ricostruire i domini topologici. Il genoma umano quindi si compatta seguendo una logica dettata da una “grammatica” i cui elementi sono le sequenze di CTCF, il loro orientamento e la distanza fra di loro.
Le proteine CTCF hanno la funzione di isolare i vari domini topologici del DNA. Lo studio ha evidenziato che i domini topologici possono essere suddivisi in due sezioni aventi sequenze grammaticali speculari, delimitate da due “barriere” e con al centro un “punto di inversione” che separa le sequenze di CTCF orientate verso destra (in blu), e quelle orientate verso sinistra (in rosso). Il genoma umano quindi si compatta seguendo una logica dettata da una “grammatica” i cui elementi sono le sequenze di CTCF, il loro orientamento e la distanza fra di loro.