INDICE PARTE 1 L’informazione genetica negli eucarioti INTRODUZIONE ALLA CELLULA ■ ■ CAPITOLO 1 Cellule e genomi 2 Le caratteristiche universali delle cellule sulla Terra 2 ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ La diversità dei genomi e l’albero della vita ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Tutte le cellule conservano la loro informazione ereditaria nello stesso codice chimico lineare: il DNA 3 Tutte le cellule replicano la loro informazione ereditaria mediante polimerizzazione su stampo 4 Tutte le cellule trascrivono porzioni della loro informazione ereditaria nella stessa forma intermedia: l’RNA 5 Tutte le cellule usano proteine come catalizzatori 6 Tutte le cellule traducono RNA in proteine allo stesso modo 7 Ogni proteina è codificata da un gene specifico 8 La vita richiede energia libera 9 Tutte le cellule funzionano come fabbriche biochimiche che utilizzano le stesse unità molecolari di base 9 Tutte le cellule sono racchiuse da una membrana plasmatica attraverso la quale devono passare i nutrienti e i materiali di rifiuto 10 Ci può essere una cellula vivente con meno di 500 geni 10 SOMMARIO ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ 11 ■ 11 ■ ■ Le cellule eucariotiche possono avere avuto origine come predatori Le cellule eucariotiche attuali si sono evolute da una simbiosi Gli eucarioti hanno genomi ibridi I genomi eucariotici sono grandi I genomi eucariotici sono ricchi di DNA regolatore Il genoma definisce il programma dello sviluppo pluricellulare Molti eucarioti vivono come cellule solitarie Un lievito serve da modello eucariotico minimo I livelli di espressione di tutti i geni di un organismo possono essere monitorati simultaneamente L’Arabidopsis è stata scelta fra 300 000 specie come modello di vegetale Il mondo delle cellule animali è rappresentato da un verme, da un moscerino, da un topo e da un essere umano Lo studio della Drosophila fornisce una chiave per lo sviluppo dei vertebrati Il genoma dei vertebrati è un prodotto di duplicazioni ripetute La rana e il pesce zebra forniscono modelli per lo sviluppo dei vertebrati Il topo è il principale organismo modello per i mammiferi Gli esseri umani manifestano le proprie peculiarità Nei dettagli siamo tutti diversi Per capire le cellule e gli organismi abbiamo bisogno della matematica, di computer e di informazioni quantitative Le cellule possono essere alimentate da varie fonti di energia libera Alcune cellule fissano azoto e anidride carbonica per le altre La diversità biochimica maggiore si osserva fra le cellule procariotiche L’albero della vita ha tre ramificazioni principali: i batteri, gli archei e gli eucarioti Alcuni geni evolvono rapidamente, altri sono altamente conservati La maggior parte dei batteri e degli archei ha 1000-6000 geni Nuovi geni sono generati da geni preesistenti Duplicazioni geniche danno origine a famiglie di geni correlati all’interno di una singola cellula I geni possono essere trasferiti fra organismi, sia in laboratorio che in natura Il sesso porta a scambi orizzontali di informazione genetica all’interno di una specie La funzione di un gene può spesso essere dedotta dalla sua sequenza Più di 200 famiglie di geni sono comuni a tutti e tre i rami principali dell’albero della vita Le mutazioni rivelano le funzioni dei geni I biologi molecolari si sono concentrati su E. coli 21 22 23 La catalisi e l’uso di energia da parte delle cellule SOMMARIO 24 ■ 12 12 14 15 16 25 25 25 29 29 30 31 31 32 33 33 34 35 36 36 36 38 39 39 SOMMARIO 40 PROBLEMI 40 BIBLIOGRAFIA 42 CAPITOLO 2 Chimica e bioenergetica della cellula 44 I componenti chimici di una cellula 44 17 18 ■ 19 ■ ■ ■ 19 ■ 21 ■ 21 ■ L’acqua è tenuta insieme da legami idrogeno Quattro tipi di interazioni non covalenti aiutano a riunire tra loro le molecole nelle cellule Alcune molecole polari in acqua formano acidi e basi Una cellula è formata da composti del carbonio Le cellule contengono quattro famiglie principali di piccole molecole organiche La chimica delle cellule è dominata da macromolecole con proprietà notevoli Legami non covalenti specificano sia la forma precisa di una macromolecola che il suo legame con altre molecole SOMMARIO Il metabolismo cellulare è organizzato da enzimi 45 45 46 48 48 49 50 51 52 52 INDICE XVI ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ L’ordine biologico è reso possibile dal rilascio di energia sotto forma di calore dalle cellule Le cellule ottengono energia dall’ossidazione di molecole organiche Ossidazione e riduzione comportano trasferimenti di elettroni Gli enzimi abbassano le barriere che bloccano le reazioni chimiche Gli enzimi possono dirigere le molecole di substrato lungo vie specifiche di reazione Il modo in cui gli enzimi trovano i loro substrati: l’enorme rapidità dei movimenti molecolari Il cambiamento in energia libera di una reazione, DG, determina se essa può avvenire spontaneamente La concentrazione dei reagenti influenza il cambiamento di energia libera e la direzione di una reazione Il cambiamento di energia libera standard, DG°, rende possibile la comparazione delle proprietà energetiche di reazioni differenti La costante di equilibrio e il DG° si ottengono facilmente l’uno dall’altro I cambiamenti di energia libera delle reazioni accoppiate sono additivi Le molecole trasportatrici attivate sono essenziali per la biosintesi La formazione di un trasportatore attivato è accoppiata a una reazione energeticamente favorevole L’ATP è la molecola trasportatrice attivata più usata L’energia conservata nell’ATP è spesso imbrigliata per unire due molecole NADH e NADPH sono importanti trasportatori di elettroni Nelle cellule ci sono molte altre molecole trasportatrici attivate La sintesi dei polimeri biologici richiede idrolisi di ATP SOMMARIO © 978-88-08-62126-9 53 56 56 58 59 60 61 62 62 QUADRO 2.1 Legami e gruppi chimici incontrati comunemente nelle molecole biologiche QUADRO 2.2 L’acqua e la sua influenza sul comportamento delle molecole biologiche QUADRO 2.3 I tipi principali di legami non covalenti deboli che tengono insieme le macromolecole QUADRO 2.4 Alcuni tipi di zuccheri comunemente presenti nelle cellule QUADRO 2.5 Acidi grassi e altri lipidi QUADRO 2.6 Una rassegna dei nucleotidi QUADRO 2.7 Energia libera e reazioni biologiche QUADRO 2.8 Dettagli dei 10 passaggi della glicolisi QUADRO 2.9 Il ciclo completo dell’acido citrico ■ ■ ■ ■ ■ ■ ■ ■ ■ La glicolisi è una via centrale che produce ATP Le fermentazioni producono ATP in assenza di ossigeno La glicolisi illustra il modo in cui gli enzimi accoppiano l’ossidazione alla conservazione dell’energia Gli organismi conservano le molecole di cibo in speciali depositi Durante il digiuno la maggior parte delle cellule animali trae l’energia dagli acidi grassi Zuccheri e grassi sono entrambi degradati ad acetil CoA nei mitocondri Il ciclo dell’acido citrico genera NADH ossidando gruppi acetilici a CO2 Il trasporto degli elettroni spinge la sintesi della maggior parte dell’ATP in quasi tutte le cellule Gli amminoacidi e i nucleotidi sono parte del ciclo dell’azoto Il metabolismo è altamente organizzato e regolato 96 98 100 102 104 106 108 110 63 CAPITOLO 3 64 65 Le proteine 112 La forma e la struttura delle proteine 112 ■ 65 66 67 ■ ■ 68 ■ 70 72 75 76 ■ ■ ■ 77 ■ 78 ■ 80 ■ 83 ■ 84 ■ 85 ■ 87 88 89 SOMMARIO 90 PROBLEMI 91 BIBLIOGRAFIA 92 La forma di una proteina è specificata dalla sua sequenza di amminoacidi Le proteine si ripiegano nella conformazione con l’energia più bassa QUADRO 3.1 I 20 amminoacidi che si trovano nelle proteine Il modo in cui le cellule ottengono energia dal cibo 75 ■ 94 ■ ■ ■ L’a elica e il foglietto b sono schemi comuni di ripiegamento I domini proteici sono unità modulari che costituiscono le proteine più grandi Poche delle molte catene polipeptidiche possibili sono utili per le cellule Le proteine possono essere classificate in molte famiglie Alcuni domini proteici formano parti di molte proteine diverse Certe coppie di domini si trovano insieme in molte proteine Il genoma umano codifica una serie complessa di proteine, la funzione di molte delle quali è sconosciuta Le molecole proteiche più grandi spesso contengono più di una catena polipeptidica Alcune proteine globulari formano lunghi filamenti elicoidali Molte molecole proteiche hanno una forma allungata fibrosa Molte proteine contengono quantità sorprendentemente grandi di catene polipeptidiche non strutturate Le proteine extracellulari spesso sono stabilizzate da legami crociati covalenti Le molecole proteiche spesso servono da subunità per l’assemblaggio di grandi strutture Molte strutture nelle cellule sono capaci di autoassemblaggio 112 115 116 118 120 122 122 124 126 126 126 127 128 129 131 131 132 INDICE XVII © 978-88-08-62126-9 ■ ■ ■ ■ La formazione di complesse strutture biologiche è spesso aiutata da fattori di assemblaggio Molte proteine possono formare fibrille amiloidi Le strutture amiloidi possono svolgere funzioni utili nelle cellule Molte proteine contengono domini a bassa complessità che possono formare strutture amiloidi reversibili SOMMARIO Funzione delle proteine ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Tutte le proteine si legano ad altre molecole La conformazione della superficie di una proteina ne determina la chimica Il confronto delle sequenze fra membri di una famiglia proteica evidenzia siti di legame cruciali Le proteine si legano ad altre proteine tramite diversi tipi di interfaccia I siti di legame degli anticorpi sono particolarmente versatili La forza di legame è misurata dalla costante di equilibrio Gli enzimi sono catalizzatori potenti e altamente specifici Il legame del substrato è il primo passaggio della catalisi enzimatica Gli enzimi accelerano le reazioni stabilizzando selettivamente gli stati di transizione Gli enzimi possono usare simultaneamente catalisi acida e basica QUADRO 3.2 Alcuni dei metodi usati per studiare gli enzimi ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Il lisozima illustra il modo in cui funziona un enzima Piccole molecole strettamente legate aggiungono ulteriori funzioni alle proteine Complessi multienzimatici aiutano ad aumentare la velocità del metabolismo cellulare La cellula regola le attività catalitiche dei suoi enzimi Gli enzimi allosterici hanno due o più siti di legame che interagiscono Due ligandi i cui siti di legame sono accoppiati devono influenzare reciprocamente il loro attacco Complessi simmetrici di proteine producono transizioni allosteriche cooperative Molti cambiamenti delle proteine sono indotti da fosforilazione proteica Una cellula eucariotica contiene numerose proteina chinasi e proteina fosfatasi La regolazione della proteina chinasi Src mostra come una proteina possa funzionare da microchip Proteine che legano e idrolizzano GTP sono regolatori cellulari ubiquitari Le proteine regolatrici GAP e GEF controllano l’attività di proteine che legano GTP determinando se è legato GTP o GDP Le proteine possono essere regolate da un’aggiunta covalente di altre proteine Per contrassegnare le proteine viene usato un elaborato sistema che coniuga molecole di ubiquitina Complessi proteici con parti intercambiabili fanno un uso efficiente dell’informazione genetica ■ 134 134 136 ■ ■ ■ 136 138 ■ 138 139 140 ■ ■ 141 142 Una proteina che lega GTP mostra come possano generarsi grandi movimenti di proteine Motori proteici producono grandi movimenti nelle cellule Trasportatori legati a membrane imbrigliano energia per pompare molecole attraverso le membrane Le proteine spesso formano grandi complessi che funzionano come macchine proteiche Impalcature proteiche concentrano gruppi di proteine che interagiscono tra loro Molte proteine sono controllate da modificazioni covalenti che le indirizzano in siti specifici all’interno della cellula Una rete complessa di interazioni fra proteine è alla base del funzionamento della cellula 167 168 170 171 171 172 173 SOMMARIO 176 PROBLEMI 177 BIBLIOGRAFIA 179 142 143 PARTE 2 MECCANISMI GENETICI DI BASE 145 146 146 CAPITOLO 4 DNA, cromosomi e genomi 182 La struttura e la funzione del DNA 184 ■ 147 ■ 148 150 ■ 152 153 155 SOMMARIO Il DNA cromosomico e il suo compattamento nella fibra di cromatina ■ 156 ■ 157 158 ■ ■ 159 ■ 160 161 162 ■ ■ ■ 163 163 Una molecola di DNA consiste di due catene complementari di nucleotidi La struttura del DNA fornisce un meccanismo per l’ereditarietà Negli eucarioti il DNA è racchiuso in un nucleo cellulare ■ Il DNA eucariotico è compattato in una serie di cromosomi I cromosomi contengono lunghe stringhe di geni La sequenza nucleotidica del genoma umano mostra come sono disposti i geni Ogni molecola di DNA che forma un cromosoma lineare deve contenere un centromero, due telomeri e origini di replicazione Le molecole di DNA sono altamente condensate nei cromosomi I nucleosomi sono l’unità base della struttura dei cromosomi eucariotici La struttura della particella centrale del nucleosoma rivela il modo in cui il DNA è compattato I nucleosomi hanno una struttura dinamica e sono spesso soggetti a cambiamenti catalizzati da complessi di rimodellamento della cromatina dipendenti da ATP I nucleosomi sono in genere impacchettati in una fibra compatta di cromatina SOMMARIO 165 La struttura e la funzione della cromatina ■ 166 L’eterocromatina è altamente organizzata e limita l’espressione genica 184 186 188 188 188 189 190 192 194 196 197 198 200 201 203 203 204 INDICE XVIII ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Lo stato eterocromatico si autopropaga Gli istoni del nucleo sono modificati covalentemente a livello di molti siti diversi La cromatina acquisisce un’ulteriore variabilità tramite l’inserzione sito-specifica di una piccola serie di varianti istoniche Le modificazioni covalenti e le varianti istoniche agiscono in maniera concertata per controllare le funzioni cromosomiche Un complesso di proteine di lettura e di scrittura del codice può diffondere modificazioni specifiche della cromatina a grande distanza lungo un cromosoma Sequenze barriera di DNA bloccano la diffusione dei complessi di lettura-scrittura separando così domini adiacenti di cromatina La cromatina dei centromeri rivela il modo in cui le varianti istoniche possono creare strutture speciali Alcune strutture della cromatina possono essere ereditate direttamente Esperimenti con embrioni di rana suggeriscono che sia le strutture di cromatina attivanti che quelle inattivanti possano essere ereditate epigeneticamente Le strutture della cromatina sono importanti per la funzione dei cromosomi eucariotici SOMMARIO La struttura globale dei cromosomi ■ ■ ■ ■ ■ ■ ■ Il modo in cui evolvono i genomi ■ ■ ■ ■ ■ 204 ■ 206 ■ 207 ■ 208 ■ ■ 211 ■ ■ 212 212 ■ 215 ■ 216 ■ Il confronto fra i genomi rivela sequenze funzionali di DNA conservate durante l’evoluzione Le alterazioni del genoma sono causate da errori dei normali meccanismi di copiatura e di mantenimento del DNA, nonché da elementi di DNA trasponibili Le sequenze dei genomi di due specie differiscono in proporzione al tempo durante il quale si sono evolute separatamente Gli alberi filogenetici costruiti in base al confronto di sequenze di DNA tracciano le relazioni fra tutti gli organismi Un confronto fra i cromosomi umani e quelli di topo mostra come divergono le strutture dei genomi Le dimensioni del genoma di un vertebrato riflettono il ritmo relativo di aggiunta e perdita di DNA in una linea evolutiva È possibile ricostruire la sequenza di alcuni genomi antichi I confronti di sequenze fra specie multiple identificano sequenze importanti di DNA a funzione sconosciuta Cambiamenti in sequenze precedentemente conservate possono aiutare a decifrare passaggi cruciali dell’evoluzione Mutazioni nelle sequenze di DNA che controllano l’espressione genica hanno determinato molti dei cambiamenti evolutivi nei vertebrati La duplicazione genica fornisce una fonte importante di novità genetica durante l’evoluzione I geni duplicati divergono L’evoluzione della famiglia dei geni delle globine mostra come duplicazioni del DNA contribuiscano all’evoluzione degli organismi Geni che codificano nuove proteine possono essere creati dalla ricombinazione di esoni Le mutazioni neutrali spesso si diffondono per fissarsi in una popolazione, con una probabilità che dipende dalle dimensioni della popolazione Dall’analisi della variazione fra gli esseri umani si possono imparare molte cose 234 235 236 237 238 239 240 241 241 243 216 SOMMARIO 245 217 PROBLEMI 245 218 BIBLIOGRAFIA 147 I cromosomi sono ripiegati in grandi anse di cromatina 218 I cromosomi politenici sono utili in quanto permettono di visualizzare le strutture della cromatina 219 Esistono molteplici forme di cromatina 221 Le anse di cromatina si decondensano quando i geni al loro interno vengono espressi 221 La cromatina si può spostare in siti specifici all’interno del nucleo per alterare l’espressione dei geni 222 Reti di macromolecole formano una serie di ambienti biochimici distinti all’interno del nucleo 223 I cromosomi mitotici sono formati da cromatina nel suo stato più condensato 225 SOMMARIO ■ © 978-88-08-62126-9 CAPITOLO 5 Replicazione, riparazione e ricombinazione del DNA 249 Il mantenimento delle sequenze di DNA 249 ■ ■ SOMMARIO Meccanismi di replicazione del DNA ■ 226 ■ 226 ■ 227 ■ ■ 228 ■ 229 ■ ■ 229 ■ 231 ■ 233 Le frequenze di mutazione sono estremamente basse Basse frequenze di mutazione sono necessarie per la vita così come la conosciamo L’appaiamento delle basi è il fondamento della replicazione e della riparazione del DNA La forcella di replicazione del DNA è asimmetrica L’alta fedeltà della replicazione del DNA richiede parecchi meccanismi di correzione delle bozze Soltanto la replicazione nella direzione 5’-3’ permette una correzione efficiente degli errori Uno speciale enzima che polimerizza nucleotidi sintetizza brevi molecole di RNA primer sul filamento ritardato Proteine speciali aiutano ad aprire la doppia elica del DNA davanti alla forcella di replicazione Un anello scorrevole trattiene una molecola in movimento di DNA polimerasi sul DNA Le proteine a livello di una forcella di replicazione cooperano per formare una macchina di replicazione Un sistema di riparazione delle basi male appaiate diretto dal filamento rimuove gli errori di replicazione che sfuggono alla macchina di replicazione Le DNA topoisomerasi impediscono al DNA di aggrovigliarsi durante la replicazione 249 250 251 251 251 253 254 256 257 258 259 261 262 263 INDICE XIX © 978-88-08-62126-9 ■ La replicazione del DNA è fondamentalmente simile negli eucarioti e nei batteri 264 SOMMARIO 266 L’inizio e il completamento della replicazione del DNA nei cromosomi ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ La sintesi del DNA inizia a livello delle origini di replicazione I cromosomi batterici hanno in genere una singola origine di replicazione del DNA I cromosomi eucariotici contengono origini multiple di replicazione Negli eucarioti la replicazione del DNA avviene soltanto durante una parte del ciclo cellulare Regioni diverse dello stesso cromosoma si replicano in momenti distinti della fase S Un grande complesso multisubunità si lega alle origini di replicazione degli eucarioti Le caratteristiche del genoma umano che specificano le origini di replicazione sono ancora da identificare Nuovi nucleosomi sono assemblati dietro la forcella di replicazione La telomerasi replica le estremità dei cromosomi Le telomerasi sono compattate in strutture specializzate che proteggono le estremità dei cromosomi La lunghezza dei telomeri è regolata da cellule e organismi SOMMARIO La riparazione del DNA ■ ■ ■ ■ ■ ■ ■ ■ Senza la riparazione del DNA il danno spontaneo al DNA cambierebbe rapidamente le sequenze La doppia elica del DNA viene prontamente riparata Il danno al DNA può essere rimosso mediante più di una via L’accoppiamento della riparazione per escissione dei nucleotidi alla trascrizione assicura che il DNA più importante per la cellula venga riparato in modo efficiente La chimica delle basi del DNA facilita il riconoscimento del danno Speciali DNA polimerasi translesione sono usate per riparare il DNA in situazioni di emergenza Le rotture a doppio filamento sono riparate in modo efficiente Il danno al DNA ritarda la progressione del ciclo cellulare SOMMARIO La ricombinazione omologa ■ ■ ■ ■ ■ La ricombinazione omologa ha caratteristiche comuni in tutte le cellule La ricombinazione omologa è guidata dall’appaiamento delle basi del DNA La ricombinazione omologa può riparare perfettamente le rotture a doppio filamento nel DNA Lo scambio di filamento è effettuato dalla proteina RecA/Rad51 La ricombinazione omologa può ripristinare forcelle di replicazione con DNA spezzato ■ ■ ■ 267 ■ 267 ■ 268 ■ 269 272 ■ ■ 272 ■ 273 ■ ■ 276 278 ■ ■ 279 280 ■ 280 283 283 ■ ■ 285 286 286 289 298 300 SOMMARIO 302 Trasposizione e ricombinazione sitospecifica conservativa 272 274 276 Le cellule regolano attentamente l’uso della ricombinazione omologa nella riparazione del DNA La ricombinazione omologa è cruciale per la meiosi La ricombinazione meiotica inizia con una rottura a doppio filamento programmabile Le giunzioni di Holliday si formano durante la meiosi La ricombinazione omologa durante la meiosi produce sia crossing over che non crossing over La ricombinazione omologa spesso porta a conversione genica Tramite la trasposizione gli elementi genetici mobili si possono inserire in qualunque sequenza di DNA I trasposoni a solo DNA si possono muovere mediante un meccanismo di taglia e cuci Alcuni virus usano un meccanismo di trasposizione per spostarsi nei cromosomi della cellula ospite I retrotrasposoni similretrovirali assomigliano ai retrovirus, ma sono privi di un rivestimento proteico Una grande frazione del genoma umano è composta da retrotrasposoni non retrovirali Elementi trasponibili diversi predominano in organismi diversi Le sequenze dei genomi rivelano i tempi approssimativi in cui gli elementi trasponibili si sono mossi La ricombinazione sito-specifica conservativa può riarrangiare reversibilmente il DNA La ricombinazione sito-specifica conservativa può essere usata per accendere e spegnere i geni Ricombinasi batteriche conservative sito-specifiche sono diventate uno strumento potente per i biologi che studiano le cellule e lo sviluppo 300 302 303 304 304 306 307 307 308 308 308 309 310 SOMMARIO 310 PROBLEMI 311 BIBLIOGRAFIA 314 CAPITOLO 6 Il modo in cui le cellule leggono il genoma: dal DNA alle proteine Da DNA a RNA 290 ■ 291 ■ 291 ■ ■ 292 ■ 292 ■ ■ 293 ■ 293 ■ 295 295 297 Le molecole di RNA sono a singolo filamento La trascrizione produce RNA complementare a un filamento di DNA La trascrizione è eseguita dalle RNA polimerasi Le cellule producono parecchi tipi di RNA Segnali codificati nel DNA indicano alla RNA polimerasi dove iniziare e dove fermarsi I segnali di inizio e di terminazione della trascrizione hanno sequenze nucleotidiche eterogenee L’inizio della trascrizione negli eucarioti richiede molte proteine L’RNA polimerasi II richiede i fattori generali di trascrizione La polimerasi II richiede anche proteine attivatrici, mediatrici e di modificazione della cromatina 315 317 317 320 320 321 322 324 326 327 329 INDICE XX ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ L’allungamento della trascrizione negli eucarioti richiede proteine accessorie La trascrizione genera tensione di superavvolgimento L’allungamento della trascrizione negli eucarioti è strettamente accoppiato alla maturazione dell’RNA L’aggiunta del cappuccio all’RNA è la prima modificazione dei pre-mRNA eucariotici Lo splicing dell’RNA rimuove sequenze introniche dai pre-mRNA appena trascritti Sequenze nucleotidiche segnalano dove deve avvenire lo splicing Lo splicing dell’RNA è eseguito dallo spliceosoma Lo spliceosoma usa l’idrolisi di ATP per produrre una serie complessa di riarrangiamenti RNA-RNA Altre proprietà del pre-mRNA e della sua sintesi aiutano a spiegare come sono scelti i siti corretti di splicing La struttura della cromatina influisce sullo splicing dell’RNA Lo splicing dell’RNA mostra una notevole plasticità Lo splicing dell’RNA catalizzato dallo spliceosoma si è probabilmente evoluto da meccanismi di autosplicing Enzimi di modificazione dell’RNA generano l’estremità 3’ degli mRNA eucariotici Gli mRNA eucariotici maturi sono esportati selettivamente dal nucleo Anche gli RNA non codificanti sono sintetizzati e modificati nel nucleo Il nucleolo è una fabbrica che produce ribosomi Il nucleo contiene vari aggregati subnucleari SOMMARIO Da RNA a proteine ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Una sequenza di mRNA viene decodificata in serie di tre nucleotidi Molecole di tRNA appaiano gli amminoacidi ai codoni dell’mRNA I tRNA sono modificati covalentemente prima di uscire dal nucleo Enzimi specifici accoppiano ciascun amminoacido alla molecola appropriata di tRNA Un controllo da parte delle tRNA sintetasi assicura accuratezza Gli amminoacidi sono aggiunti all’estremità C-terminale di una catena polipeptidica in crescita Il messaggio dell’RNA è decodificato nei ribosomi I fattori di allungamento spingono in avanti la traduzione e ne migliorano l’accuratezza Molti processi biologici risolvono le limitazioni intrinseche dell’appaiamento di basi complementari L’accuratezza della traduzione richiede il consumo di energia libera Il ribosoma è un ribozima Sequenze nucleotidiche nell’mRNA segnalano dove iniziare la sintesi proteica I codoni di stop segnano la fine della traduzione Le proteine sono prodotte su poliribosomi Nel codice genetico standard esistono piccole variazioni © 978-88-08-62126-9 ■ 330 ■ 330 ■ 331 ■ 334 ■ 334 335 336 ■ ■ ■ 338 ■ 338 340 340 SOMMARIO Il mondo a RNA e le origini della vita ■ ■ 341 ■ ■ 342 343 345 347 348 Gli inibitori della sintesi proteica procariotica sono utili come antibiotici Meccanismi di controllo di qualità operano per impedire la traduzione di mRNA danneggiati Alcune proteine iniziano a ripiegarsi mentre vengono sintetizzate Chaperoni molecolari aiutano a guidare il ripiegamento di molte proteine Le cellule utilizzano diversi tipi di chaperoni Regioni idrofobiche esposte forniscono segnali cruciali per il controllo di qualità delle proteine Il proteasoma è una proteasi compartimentata con siti attivi sequestrati Molte proteine sono controllate mediante distruzione regolata Ci sono molti passaggi da DNA a proteine Le molecole di RNA a singolo filamento possono ripiegarsi in strutture altamente elaborate L’RNA può sia conservare informazioni che catalizzare reazioni chimiche In che modo si è evoluta la sintesi proteica? Tutte le cellule attuali usano DNA come materiale ereditario 370 370 372 374 374 376 377 379 380 381 382 383 384 385 385 SOMMARIO 386 PROBLEMI 386 BIBLIOGRAFIA 388 CAPITOLO 7 350 Controllo dell’espressione genica 389 351 Una visione d’insieme del controllo dei geni 389 ■ 351 ■ 352 ■ 354 ■ 354 I diversi tipi cellulari di un organismo pluricellulare contengono lo stesso DNA Tipi cellulari diversi sintetizzano gruppi diversi di RNA e proteine Una cellula può cambiare l’espressione dei suoi geni in risposta a segnali esterni L’espressione genica può essere regolata a livello di molti passaggi della via DNA-RNA-proteine SOMMARIO 356 357 358 361 363 364 364 366 367 368 368 Il controllo della trascrizione mediante proteine che legano il DNA su sequenze specifiche ■ ■ La sequenza di nucleotidi della doppia elica del DNA può essere letta da proteine I regolatori trascrizionali contengono motivi strutturali che possono leggere sequenze di DNA QUADRO 7.1 Motivi strutturali comuni nei regolatori trascrizionali ■ ■ ■ 389 391 392 392 393 393 394 394 396 La dimerizzazione dei regolatori trascrizionali 398 aumenta la loro affinità e specificità per il DNA I regolatori trascrizionali si legano cooperativamente 398 al DNA La struttura basata sui nucleosomi favorisce il legame 399 cooperativo dei regolatori trascrizionali SOMMARIO 400 INDICE XXI © 978-88-08-62126-9 I regolatori trascrizionali accendono e spengono i geni ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Il repressore del triptofano spegne alcuni geni I repressori spengono i geni e gli attivatori li accendono Un attivatore e un repressore controllano l’operone Lac Durante la regolazione genica nei batteri possono formarsi anse di DNA Interruttori complessi controllano la trascrizione dei geni negli eucarioti Una regione regolatrice eucariotica consiste di un promotore e di varie sequenze cis-regolatrici I regolatori trascrizionali eucariotici agiscono in gruppi Le proteine attivatrici promuovono l’assemblaggio dell’RNA polimerasi in corrispondenza del punto di inizio della trascrizione Gli attivatori trascrizionali eucariotici dirigono la modificazione della struttura locale della cromatina Gli attivatori trascrizionali possono promuovere la trascrizione rilasciando l’RNA polimerasi dai promotori Gli attivatori della trascrizione agiscono sinergicamente I repressori trascrizionali eucariotici possono inibire la trascrizione in vari modi Gli isolatori sono sequenze di DNA che impediscono ai regolatori trascrizionali eucariotici di influenzare geni distanti SOMMARIO I meccanismi genetici molecolari che creano e mantengono tipi cellulari specializzati ■ ■ ■ ■ ■ ■ ■ ■ ■ Interruttori genetici complessi che regolano lo sviluppo di Drosophila sono costruiti a partire da moduli più piccoli Il gene Eve di Drosophila è regolato da controlli combinatori I regolatori trascrizionali sono messi in moto da segnali extracellulari Il controllo combinatorio dei geni crea molti tipi cellulari diversi negli eucarioti Tipi cellulari specializzati possono essere sperimentalmente riprogrammati per diventare delle cellule staminali pluripotenti Le combinazioni di regolatori trascrizionali master specificano i tipi cellulari controllando l’espressione di molti geni Le cellule specializzate devono rapidamente accendere e spegnere gruppi di geni Le cellule differenziate mantengono la loro identità Circuiti di trascrizione permettono alla cellula di eseguire operazioni logiche SOMMARIO I meccanismi che rinforzano la memoria cellulare nelle piante e negli animali ■ ■ ■ Lo schema di metilazione del DNA può essere ereditato quando le cellule dei vertebrati si dividono Isole ricche di CG sono associate a molti geni nei mammiferi L’imprinting genomico si basa sulla metilazione del DNA ■ 401 401 ■ 402 Alterazioni su scala cromosomica della struttura 431 della cromatina possono essere ereditate Meccanismi epigenetici assicurano che schemi stabili di espressione genica possano essere trasmessi 433 alle cellule figlie SOMMARIO 403 Controlli post-trascrizionali ■ 404 404 405 406 ■ ■ ■ 407 ■ 407 ■ 409 410 410 ■ ■ ■ ■ 412 413 413 ■ ■ ■ 413 ■ 415 L’attenuazione della trascrizione provoca la terminazione prematura di alcune molecole di RNA I ribointerruttori potrebbero rappresentare forme antiche di controllo dei geni Lo splicing alternativo dell’RNA può produrre forme diverse di una proteina dallo stesso gene La definizione di gene è stata modificata in seguito alla scoperta dello splicing alternativo dell’RNA Un cambiamento nel sito di taglio del trascritto di RNA e di aggiunta del poli-A può modificare il C-terminale di una proteina L’editing dell’RNA può cambiare il significato del messaggio dell’RNA Il trasporto dell’RNA dal nucleo può essere regolato Alcuni mRNA sono localizzati in regioni specifiche del citosol Le regioni non tradotte 5’ e 3’ degli mRNA ne controllano la traduzione La fosforilazione di un fattore di inizio regola in modo globale la sintesi proteica L’inizio a livello dei codoni AUG a monte dell’inizio della traduzione può regolare l’inizio della traduzione negli eucarioti Siti interni di ingresso dei ribosomi forniscono opportunità per il controllo della traduzione L’espressione dei geni può essere controllata da un cambiamento nella stabilità dell’mRNA La regolazione della stabilità dell’mRNA coinvolge P-body e granuli da stress SOMMARIO 416 417 Regolazione dell’espressione genica con RNA non codificanti ■ 419 ■ 420 ■ 421 421 ■ ■ 423 424 425 ■ ■ ■ 425 427 429 Piccoli trascritti di RNA non codificante regolano molti geni degli animali e delle piante attraverso il processo di interferenza da RNA (RNA interference) I miRNA regolano la traduzione e la stabilità dell’mRNA L’interferenza da RNA è utilizzata anche come meccanismo di difesa cellulare L’interferenza da RNA può dirigere la formazione di eterocromatina I piRNA proteggono la linea germinale dagli elementi trasponibili L’interferenza da RNA è diventata un potente strumento sperimentale I batteri utilizzano dei piccoli RNA non codificanti per proteggersi dai virus I lunghi RNA non codificanti hanno varie funzioni nella cellula 435 435 435 436 437 439 439 440 442 443 445 445 446 448 448 450 451 452 452 452 454 455 455 457 457 458 SOMMARIO 460 PROBLEMI 460 BIBLIOGRAFIA 462 INDICE XXII © 978-88-08-62126-9 PARTE 3 ■ METODI DI LAVORO CON LE CELLULE ■ CAPITOLO 8 Analisi di cellule, molecole e sistemi Isolamento delle cellule e loro crescita in coltura ■ ■ ■ ■ ■ ■ ■ ■ ■ 467 467 SOMMARIO 472 Le cellule possono essere separate nelle frazioni che le compongono Gli estratti cellulari forniscono sistemi accessibili per studiare le funzioni della cellula Le proteine possono essere separate mediante cromatografia L’immunoprecipitazione è un metodo rapido di purificazione per affinità Etichette ingegnerizzate geneticamente rappresentano un modo facile di purificare le proteine Sistemi acellulari purificati sono necessari per l’analisi precisa delle funzioni molecolari SOMMARIO Analisi delle proteine ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Le proteine possono essere separate mediante elettroforesi su gel di poliacrilammide in SDS L’elettroforesi bidimensionale su gel permette una separazione maggiore delle proteine Proteine specifiche possono essere rivelate mediante blot con anticorpi specifici Misurazioni idrodinamiche rivelano le dimensioni e la forma di un complesso proteico La spettrometria di massa è un metodo altamente sensibile per identificare proteine sconosciute Alcune serie di proteine interagenti possono essere identificate con metodi biochimici Le interazioni fra proteine possono essere monitorate con metodi ottici La funzione delle proteine può essere inibita selettivamente con piccole molecole La diffrazione ai raggi X può rivelare la struttura di una proteina La NMR può essere usata per determinare la struttura delle proteine in soluzione La sequenza e la struttura di una proteina forniscono indizi sulla sua funzione SOMMARIO Analisi e manipolazione del DNA ■ ■ 466 Le cellule possono essere isolate da tessuti intatti Le cellule possono essere fatte crescere in coltura Le linee cellulari eucariotiche sono una fonte molto usata di cellule omogenee Le linee cellulari di ibridoma sono fabbriche che producono anticorpi monoclonali Purificazione delle proteine ■ 466 Le nucleasi di restrizione tagliano in frammenti specifici grosse molecole di DNA L’elettroforesi su gel separa molecole di DNA di dimensioni diverse 469 471 472 472 475 475 ■ ■ ■ ■ ■ ■ QUADRO 8.1 Metodi di sequenziamento del DNA ■ ■ 479 480 ■ 482 ■ 483 ■ 483 ■ 485 ■ 486 ■ 487 ■ 488 ■ 489 ■ ■ 491 493 501 503 504 506 513 514 QUADRO 8.2 Ripasso di genetica classica ■ 492 500 La genetica classica inizia interrompendo un processo cellulare mediante mutagenesi casuale ■ 479 491 498 514 ■ 490 498 Studio dell’espressione e della funzione dei geni 479 479 495 496 Per essere utili le sequenze genomiche devono essere annotate 510 Il clonaggio del DNA permette di produrre in grande quantità qualunque proteina 511 SOMMARIO 478 478 Molecole purificate di DNA possono essere marcate specificamente con radioisotopi o marcatori chimici in vitro I geni possono essere clonati utilizzando i batteri Un intero genoma può essere rappresentato in una libreria di DNA Librerie genomiche e di cDNA hanno vantaggi e svantaggi differenti L’ibridazione rappresenta un modo potente ma semplice per rintracciare specifiche sequenze nucleotidiche I geni possono essere clonati in vitro utilizzando la PCR La PCR è utilizzata anche per applicazioni diagnostiche e forensi Sia il DNA sia l’RNA possono essere sequenziati rapidamente ■ Screening genetici identificano mutanti con anomalie specifiche Le mutazioni possono provocare perdita o guadagno della funzione della proteina Un test di complementazione rivela se due mutazioni sono nello stesso gene o in geni diversi I prodotti genici possono essere ordinati in vie mediante analisi dell’epistasi Le mutazioni responsabili di un fenotipo possono essere identificate mediante l’analisi del DNA Il sequenziamento rapido ed economico del DNA ha rivoluzionato gli studi genetici sull’uomo Blocchi collegati di polimorfismi ci sono stati trasmessi dai nostri antenati I polimorfismi possono servire nella ricerca delle mutazioni associate alle malattie La genomica sta accelerando la scoperta di mutazioni rare che ci predispongono a malattie gravi La genetica inversa inizia con un gene noto e determina quali processi cellulari richiedono la sua funzione Animali e piante possono essere alterati geneticamente Il sistema batterico CRISPR è stato adattato per modificare i genomi in un’ampia varietà di specie Ampie serie di mutazioni ingegnerizzate forniscono uno strumento per esaminare la funzione di ciascun gene in un organismo 515 517 518 519 519 520 521 521 522 523 523 525 526 527 INDICE XXIII © 978-88-08-62126-9 ■ ■ ■ ■ ■ ■ ■ ■ ■ L’interferenza da RNA è un sistema semplice e rapido per saggiare la funzione di un gene I geni reporter rivelano quando e dove un gene è espresso L’ibridazione in situ può rivelare la localizzazione di mRNA e di RNA non codificanti L’espressione di singoli geni può essere misurata usando la RT-PCR quantitativa L’analisi degli mRNA con i microarray o con l’RNA-seq fornisce un’istantanea dell’espressione genica L’immunoprecipitazione della cromatina su scala genomica identifica i siti del genoma occupati da regolatori trascrizionali La determinazione del profilo ribosomiale rivela quali mRNA vengono tradotti nella cellula I metodi del DNA ricombinante hanno rivoluzionato il modo di curare le malattie Le piante transgeniche sono importanti per l’agricoltura SOMMARIO Analisi matematica delle funzioni cellulari ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Le reti regolatrici dipendono da interazioni molecolari Le equazioni differenziali ci aiutano a prevedere comportamenti transitori Sia l’attività del promotore, sia la degradazione della proteina influenzano la velocità di cambiamento della concentrazione proteica Il tempo necessario per raggiungere lo stato stazionario dipende dalla vita media della proteina I metodi quantitativi sono simili per i repressori e per gli attivatori della trascrizione Il feedback negativo è una strategia potente nella regolazione cellulare Un feedback negativo ritardato può indurre delle oscillazioni Il legame al DNA a opera di un repressore o di un attivatore può essere cooperativo Il feedback positivo è importante per le risposte a interruttore e per la bistabilità La robustezza è un’importante caratteristica delle reti biologiche Due regolatori trascrizionali che si legano al promotore dello stesso gene possono esercitare un controllo combinatorio Un’interazione a feed-forward incoerente genera impulsi Un’interazione a feed-forward coerente permette di rilevare segnali di ingresso persistenti La stessa rete di vie biochimiche può comportarsi in modo differente in cellule diverse a causa di effetti stocastici Molti approcci computazionali possono essere utilizzati per creare modelli delle reazioni in una cellula I metodi statistici sono cruciali per l’analisi dei dati biologici CAPITOLO 9 529 530 Visualizzazione delle cellule Osservazione delle cellule al microscopio ottico 562 ■ 532 ■ 532 ■ 533 534 536 536 537 538 ■ ■ ■ ■ ■ ■ 539 ■ 540 ■ 542 ■ 543 ■ 545 545 ■ 545 ■ 547 ■ Il microscopio ottico può risolvere dettagli separati da 0,2 mm Quando i livelli di luce sono bassi il rumore dei fotoni crea ulteriori limiti alla risoluzione Le cellule viventi si vedono chiaramente con un microscopio a contrasto di fase o a contrasto di interferenza differenziale Le immagini possono essere migliorate e analizzate con tecniche digitali I tessuti intatti vengono fissati e sezionati per la microscopia Molecole specifiche possono essere localizzate nelle cellule con la microscopia a fluorescenza Gli anticorpi possono essere usati per rivelare molecole specifiche La visualizzazione di oggetti tridimensionali complessi è possibile con il microscopio ottico Il microscopio confocale produce sezioni ottiche escludendo la luce fuori fuoco Singole proteine possono essere etichettate con composti fluorescenti in cellule e organismi viventi La dinamica delle proteine può essere seguita in cellule viventi Concentrazioni ioniche intracellulari che cambiano rapidamente possono essere misurate con indicatori che emettono luce Singole molecole possono essere visualizzate usando la microscopia a fluorescenza a riflessione interna totale Singole molecole possono essere toccate, visualizzate e spostate con il microscopio a forza atomica Tecniche di fluorescenza a super-risoluzione possono superare i limiti dovuti alla diffrazione La super-risoluzione può essere ottenuta anche usando metodi di localizzazione a singola molecola SOMMARIO 548 549 562 Osservazione di cellule e molecole al microscopio elettronico 563 565 566 567 568 569 572 573 573 575 576 579 581 581 583 585 586 587 556 Il microscopio elettronico risolve la struttura fine della cellula I campioni biologici richiedono una preparazione speciale per il microscopio elettronico Macromolecole specifiche possono essere localizzate mediante microscopia elettronica immunogold Immagini differenti di un singolo oggetto possono essere combinate per ottenere una ricostruzione tridimensionale Immagini di superfici possono essere ottenute mediante microscopia elettronica a scansione La colorazione negativa e la microscopia crioelettronica permettono di visualizzare macromolecole ad alta risoluzione Più immagini possono essere combinate per aumentare la risoluzione 557 SOMMARIO 597 PROBLEMI 557 PROBLEMI 597 BIBLIOGRAFIA 560 BIBLIOGRAFIA 598 SOMMARIO ■ 551 ■ 552 ■ 553 ■ 554 ■ 555 ■ 556 ■ 587 589 590 591 592 595 596 INDICE XXIV © 978-88-08-62126-9 PARTE 4 ■ L’ORGANIZZAZIONE INTERNA DELLA CELLULA ■ CAPITOLO 10 La struttura della membrana 602 Il doppio strato lipidico 603 ■ ■ ■ ■ ■ ■ ■ ■ Fosfogliceridi, sfingolipidi e steroli sono i lipidi principali delle membrane cellulari I fosfolipidi formano spontaneamente doppi strati Il doppio strato lipidico è un fluido bidimensionale La fluidità di un doppio strato lipidico dipende dalla sua composizione Nonostante la loro fluidità, i doppi strati lipidici possono formare domini con composizione diversa Le goccioline lipidiche sono circondate da un monostrato fosfolipidico L’asimmetria del doppio strato lipidico è importante dal punto di vista funzionale I glicolipidi si trovano sulla superficie di tutte le membrane plasmatiche eucariotiche SOMMARIO Le proteine di membrana ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Le proteine di membrana possono essere associate al doppio strato lipidico in vari modi Le ancore lipidiche controllano la localizzazione di membrana di alcune proteine di segnalazione Nella maggior parte delle proteine transmembrana la catena polipeptidica attraversa il doppio strato lipidico in una conformazione ad a elica Le a eliche transmembrana spesso interagiscono fra loro Alcuni barili b formano grossi canali transmembrana Molte proteine di membrana sono glicosilate Le proteine di membrana possono essere solubilizzate e purificate in detergenti La batteriorodopsina è una pompa protonica (H+) alimentata dalla luce che attraversa il doppio strato lipidico con sette a eliche Le proteine di membrana spesso esercitano la loro funzione sotto forma di grossi complessi Molte proteine di membrana diffondono nel piano della membrana Le cellule possono confinare proteine e lipidi in domini specifici all’interno di una membrana Il citoscheletro corticale conferisce forza meccanica alle membrane e limita la diffusione delle proteine di membrana Le proteine che piegano la membrana deformano il doppio strato 614 Il trasporto attivo può essere spinto da gradienti ionici I trasportatori nella membrana plasmatica regolano il pH citosolico Una distribuzione asimmetrica di trasportatori nelle cellule epiteliali è alla base del trasporto transcellulare di soluti Ci sono tre classi di pompe spinte da ATP Una pompa ATPasi di tipo P pompa Ca2+ nel reticolo sarcoplasmatico delle cellule muscolari La pompa Na+-K+ di tipo P della membrana plasmatica stabilisce il gradiente di Na+ attraverso la membrana plasmatica I trasportatori ABC costituiscono la più grande famiglia di proteine di trasporto di membrana 614 SOMMARIO 608 610 ■ ■ 610 ■ 611 612 614 615 ■ I canali ionici e le proprietà elettriche delle membrane ■ ■ 617 618 619 620 621 ■ ■ 625 627 627 628 630 632 PROBLEMI 634 635 ■ ■ ■ ■ ■ ■ ■ Il trasporto di membrana di piccole molecole e le proprietà elettriche delle membrane 637 I principi del trasporto di membrana 638 ■ 638 Le acquaporine sono permeabili all’acqua ma impermeabili agli ioni I canali ionici sono selettivi per gli ioni e oscillano fra stati aperti e chiusi Il potenziale di membrana nelle cellule animali dipende soprattutto dai canali che perdono K+ (K+ leak channel) e dal gradiente di K+ attraverso la membrana plasmatica QUADRO 11.1 La derivazione dell’equazione di Nernst ■ 633 I doppi strati lipidici privi di proteine sono altamente impermeabili agli ioni ■ ■ CAPITOLO 11 ■ SOMMARIO Trasportatori e trasporto attivo di membrana ■ 603 605 607 SOMMARIO BIBLIOGRAFIA Ci sono due classi principali di proteine di trasporto di membrana: trasportatori e canali Il trasporto attivo è mediato da trasportatori accoppiati a una fonte di energia ■ Il potenziale a riposo decade lentamente soltanto quando si ferma la pompa Na+-K+ La struttura tridimensionale di un canale per il K+ batterico mostra come può funzionare un canale ionico Canali sensibili a forze meccaniche proteggono le cellule batteriche da pressioni osmotiche estreme La funzione di una cellula nervosa dipende dalla sua struttura allungata I canali cationici regolati da voltaggio generano potenziali d’azione nelle cellule eccitabili elettricamente L’utilizzo delle canalrodopsine ha rivoluzionato lo studio dei circuiti neuronali La mielinizzazione aumenta la velocità e l’efficienza della propagazione del potenziale d’azione nelle cellule nervose Le registrazioni a patch-clamp indicano che singoli canali ionici si aprono in una modalità tutto o nulla I canali cationici regolati da voltaggio sono correlati evolutivamente e strutturalmente Tipi diversi di neuroni mostrano caratteristiche proprietà stabili nella generazione di potenziali d’azione I canali ionici regolati da trasmettitore convertono segnali chimici in segnali elettrici a livello delle sinapsi chimiche 638 639 640 641 642 645 645 646 647 649 649 652 652 653 654 656 657 658 659 661 661 663 664 667 667 669 669 670 INDICE XXV © 978-88-08-62126-9 ■ ■ ■ ■ ■ ■ ■ ■ Le sinapsi chimiche possono essere eccitatorie o inibitorie I recettori dell’acetilcolina a livello della giunzione neuromuscolare sono canali cationici eccitatori regolati da trasmettitori I neuroni contengono molti tipi di canali regolati da trasmettitori Molti farmaci psicoattivi agiscono a livello delle sinapsi La trasmissione neuromuscolare comporta l’attivazione sequenziale di cinque serie diverse di canali ionici I singoli neuroni sono complessi dispositivi di elaborazione dei dati L’elaborazione neuronale richiede una combinazione di almeno tre tipi di canali del K+ Il potenziamento a lungo termine (LTP) nell’ippocampo dei mammiferi dipende dall’ingresso di Ca2+ attraverso i canali dei recettori NMDA ■ 671 ■ 672 ■ 674 674 ■ 675 676 677 ■ 679 PROBLEMI 682 ■ BIBLIOGRAFIA 683 ■ ■ 685 685 ■ 685 ■ ■ ■ SOMMARIO Il trasporto di molecole fra il nucleo e il citosol ■ ■ ■ ■ ■ ■ ■ I complessi dei pori nucleari attraversano l’involucro nucleare I segnali di localizzazione nucleare dirigono le proteine nucleari nel nucleo I recettori di importazione nucleare legano sia segnali di localizzazione che proteine dell’NPC L’esportazione dal nucleo funziona come l’importazione nucleare, ma alla rovescia La GTPasi Ran conferisce direzionalità al trasporto attraverso gli NPC Il trasporto attraverso gli NPC può essere regolato controllando l’accesso al macchinario di trasporto L’involucro nucleare si disassembla durante la mitosi SOMMARIO Il trasporto di proteine nei mitocondri e nei cloroplasti ■ ■ I perossisomi usano ossigeno molecolare e acqua ossigenata per svolgere reazioni ossidative Una breve sequenza segnale dirige l’importazione di proteine nei perossisomi SOMMARIO La compartimentazione delle cellule ■ 687 ■ 689 691 ■ 692 693 ■ 693 ■ 694 ■ 694 696 ■ 697 ■ 698 ■ 699 701 ■ 702 703 La traslocazione nei mitocondri dipende da sequenze segnale e da proteine traslocatrici 704 I precursori delle proteine mitocondriali sono importati come catene polipeptidiche non ripiegate 705 710 712 Compartimenti intracellulari e smistamento delle proteine ■ 708 I perossisomi Il reticolo endoplasmatico Tutte le cellule eucariotiche hanno la stessa serie di base di organelli racchiusi da membrane Le origini evolutive spiegano le relazioni topologiche degli organelli racchiusi da membrana Le proteine si possono muovere fra i compartimenti in modi diversi Sequenze segnale e recettori di smistamento dirigono le proteine verso il corretto indirizzo cellulare La maggior parte degli organelli non può essere costruita dal nulla: sono necessarie informazioni presenti nell’organello preesistente 707 711 ■ CAPITOLO 12 706 SOMMARIO 681 SOMMARIO ■ L’idrolisi di ATP e un potenziale di membrana sono usati per spingere l’importazione delle proteine nei mitocondri I batteri e i mitocondri usano meccanismi simili per inserire porine nella loro membrana esterna Il trasporto di proteine nella membrana mitocondriale interna e nello spazio intermembrana avviene tramite diverse vie Due sequenze segnale dirigono le proteine alla membrana tilacoidale dei cloroplasti ■ Il reticolo endoplasmatico è strutturalmente e funzionalmente diversificato Le sequenze segnale sono state scoperte per la prima volta in proteine importate nel RE ruvido Una particella di riconoscimento del segnale (SRP) dirige le sequenze segnale del RE a un recettore specifico nella membrana del RE ruvido La catena polipeptidica passa attraverso un poro acquoso nel traslocatore La traslocazione attraverso la membrana del RE non richiede sempre che la catena polipeptidica si stia allungando Nelle proteine transmembrana a singolo passaggio, una singola sequenza segnale interna del RE rimane nel doppio strato lipidico come a elica che attraversa la membrana Combinazioni di segnali di inizio e di stop del trasferimento determinano la topologia delle proteine transmembrana a passaggi multipli Le proteine ancorate al reticolo endoplasmatico mediante la coda sono integrate nella membrana del RE da un meccanismo speciale Le catene polipeptidiche traslocate si ripiegano e si assemblano nel lume del RE ruvido La maggior parte delle proteine sintetizzate nel RE ruvido viene glicosilata per aggiunta di un oligosaccaride comune legato al gruppo NH2 della catena laterale di un’asparagina Gli oligosaccaridi sono usati come etichette per indicare lo stato di ripiegamento delle proteine Le proteine ripiegate in modo inappropriato sono esportate dal RE e degradate nel citosol Le proteine ripiegate male nel RE attivano una risposta alle proteine non ripiegate Alcune proteine di membrana acquisiscono un’àncora di glicosilfosfatidilinositolo (GPI) attaccata covalentemente La maggior parte dei doppi strati lipidici è assemblata nel RE 712 713 714 715 715 718 719 721 723 723 725 728 729 729 731 732 733 735 735 SOMMARIO 738 PROBLEMI 738 BIBLIOGRAFIA 740 INDICE XXVI © 978-88-08-62126-9 CAPITOLO 13 Traffico intracellulare di membrana I meccanismi molecolari del trasporto di membrana e il mantenimento della diversità dei compartimenti ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Esistono vari tipi di vescicole rivestite L’assemblaggio di un rivestimento di clatrina determina la formazione della vescicola Le proteine adattatrici selezionano il cargo dentro le vescicole rivestite di clatrina I fosfoinositidi agiscono come marcatori di organelli e domini di membrana Le proteine che piegano la membrana contribuiscono a deformare la membrana durante la formazione della vescicola Sia il distacco che la perdita del rivestimento delle vescicole rivestite sono regolati da proteine citoplasmatiche GTPasi monomeriche controllano l’assemblaggio del rivestimento Non tutte le vescicole di trasporto sono sferiche Le proteine Rab guidano le vescicole di trasporto verso la loro membrana bersaglio Le cascate di Rab possono cambiare l’identità di un organello Le SNARE mediano la fusione delle membrane Le SNARE che interagiscono devono essere separate prima di poter funzionare di nuovo SOMMARIO Il trasporto dal RE attraverso l’apparato del Golgi ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Le proteine lasciano il RE in vescicole di trasporto rivestite di COPII Soltanto le proteine che sono ripiegate e assemblate correttamente possono lasciare il RE Il trasporto dal RE all’apparato del Golgi è mediato da gruppi vescicolari tubulari La via di recupero verso il RE usa segnali di smistamento Molte proteine sono trattenute selettivamente nei compartimenti in cui agiscono L’apparato del Golgi è costituito da una serie ordinata di compartimenti Le catene degli oligosaccaridi sono processate nell’apparato del Golgi I proteoglicani sono assemblati nell’apparato del Golgi Qual è lo scopo della glicosilazione? Il trasporto attraverso l’apparato del Golgi può avvenire per maturazione delle cisterne Le proteine della matrice del Golgi aiutano a organizzare la pila SOMMARIO Il trasporto dal reticolo del trans-Golgi ai lisosomi ■ ■ ■ ■ 742 ■ ■ 744 ■ 744 745 ■ SOMMARIO 746 747 Il trasporto nella cellula dalla membrana plasmatica: endocitosi ■ 748 749 749 752 ■ ■ ■ ■ 753 ■ 755 755 ■ ■ 757 758 ■ 760 760 762 Il trasporto dal reticolo del trans-Golgi all’esterno della cellula: esocitosi ■ ■ ■ 763 ■ 763 765 ■ 766 768 ■ 769 ■ 770 771 771 I lisosomi sono i siti principali di digestione 771 intracellulare I lisosomi sono eterogenei 772 I vacuoli dei vegetali e dei funghi sono lisosomi molto 773 versatili Le vescicole pinocitiche si formano da fosse rivestite nella membrana plasmatica Non tutte le vescicole pinocitiche sono rivestite di clatrina Le cellule importano macromolecole extracellulari selezionate tramite endocitosi mediata da recettore Proteine specifiche sono rimosse dagli endosomi precoci e riportate alla membrana plasmatica I recettori della segnalazione sulla membrana plasmatica sono sotto-regolati dalla degradazione nei lisosomi Gli endosomi precoci maturano in endosomi tardivi I complessi proteici ESCRT mediano la formazione delle vescicole intraluminali nei corpi multivescicolari Gli endosomi di recupero regolano la composizione della membrana plasmatica Cellule fagocitiche specializzate possono ingerire grosse particelle SOMMARIO 758 759 Vie multiple portano materiali ai lisosomi L’autofagia degrada proteine e organelli indesiderati Un recettore del mannosio 6-fosfato smista le idrolasi lisosomiali nel reticolo del trans-Golgi Negli esseri umani i difetti nella GlcNAc fosfotrasferasi causano una malattia da deposito lisosomiale Alcuni lisosomi e alcuni corpi multivescicolari possono subire esocitosi ■ ■ Molte proteine e molti lipidi sono trasportati automaticamente dal reticolo del trans-Golgi (TGN) alla superficie della cellula Le vescicole secretorie gemmano dal reticolo del trans-Golgi I precursori delle proteine secretorie sono spesso processati proteoliticamente durante la formazione delle vescicole secretorie Le vescicole secretorie restano in attesa vicino alla membrana plasmatica fino a che non ricevono il segnale per rilasciare il loro contenuto Per l’esocitosi rapida le vescicole sinaptiche sono pronte a livello della membrana plasmatica presinaptica Le vescicole sinaptiche si possono formare direttamente dalle vescicole endocitiche I componenti della membrana della vescicola secretoria sono rimossi rapidamente dalla membrana plasmatica Alcuni eventi di esocitosi regolata servono a ingrandire la membrana plasmatica Le cellule polarizzate dirigono le proteine dal reticolo del trans-Golgi al dominio appropriato della membrana plasmatica 774 774 776 777 778 779 779 780 780 782 783 784 785 786 787 788 790 791 791 792 794 794 795 795 796 797 799 SOMMARIO 800 PROBLEMI 801 BIBLIOGRAFIA 802 INDICE XXVII © 978-88-08-62126-9 CAPITOLO 14 ■ Conversione dell’energia: mitocondri e cloroplasti 804 Il mitocondrio 806 ■ ■ ■ ■ ■ ■ Il mitocondrio ha una membrana esterna e una membrana interna Le creste della membrana interna contengono il macchinario per il trasporto degli elettroni e per la sintesi dell’ATP Il ciclo dell’acido citrico nella matrice produce NADH Il mitocondrio ha molti ruoli essenziali nel metabolismo cellulare Un processo chemiosmotico accoppia l’energia di ossidazione alla produzione di ATP L’energia derivata dall’ossidazione è conservata come gradiente elettrochimico SOMMARIO Le pompe protoniche della catena di trasporto degli elettroni ■ ■ Il potenziale redox è una misura dell’affinità per gli elettroni I trasferimenti di elettroni rilasciano grandi quantità di energia QUADRO 14.1 Potenziali redox ■ ■ ■ ■ ■ ■ ■ Gli ioni dei metalli di transizione e i chinoni accettano e rilasciano facilmente gli elettroni NADH trasferisce i suoi elettroni all’ossigeno attraverso tre grandi complessi enzimatici immersi nella membrana interna Il complesso della NADH deidrogenasi contiene dei moduli separati per il trasporto degli elettroni e per pompare i protoni La citocromo c reduttasi prende i protoni e li rilascia sul lato opposto della membrana della cresta, pompando così i protoni Il complesso della citocromo c ossidasi pompa i protoni e riduce O2 utilizzando un centro catalitico ferro-zolfo La catena respiratoria forma un supercomplesso nella membrana della cresta I protoni si possono muovere rapidamente attraverso le proteine lungo vie predefinite SOMMARIO La produzione di ATP nei mitocondri ■ ■ ■ ■ ■ ■ Un alto valore negativo di DG per l’idrolisi di ATP rende l’ATP utile alla cellula L’ATP sintasi è una nanomacchina che produce ATP attraverso una catalisi rotatoria Le turbine spinte dai protoni hanno un’origine antica Le creste mitocondriali aiutano a rendere efficiente la sintesi di ATP Speciali proteine di trasporto scambiano ATP e ADP attraverso la membrana interna I meccanismi chemiosmotici sono comparsi per la prima volta nei batteri SOMMARIO Cloroplasti e fotosintesi ■ I cloroplasti assomigliano ai mitocondri ma hanno un compartimento tilacoidale separato ■ ■ 808 ■ 809 809 810 812 812 814 ■ ■ ■ ■ ■ 814 ■ 814 ■ 815 816 ■ 817 ■ 818 820 821 ■ ■ ■ SOMMARIO 821 824 I sistemi genetici dei mitocondri e dei cloroplasti ■ 825 826 ■ 826 826 828 829 ■ ■ ■ 830 831 832 834 ■ ■ ■ 834 ■ 834 I cloroplasti catturano energia dalla luce solare e la usano per fissare il carbonio La fissazione del carbonio utilizza ATP e NADPH per convertire CO2 in zuccheri Gli zuccheri generati dalla fissazione del carbonio sono immagazzinati come amido o sono consumati per produrre ATP Le membrane tilacoidali dei cloroplasti contengono i complessi proteici necessari per la fotosintesi e per la produzione di ATP I complessi clorofilla-proteina possono trasferire sia l’energia di eccitazione sia gli elettroni Un fotosistema è formato da un complesso antenna e da un centro di reazione La membrana del tilacoide contiene due diversi fotosistemi che operano in serie Il fotosistema II usa un gruppo manganese per rimuovere gli elettroni dall’acqua Il complesso del citocromo b6-f collega il fotosistema II al fotosistema I Il fotosistema I effettua il secondo passaggio di separazione della carica nello schema Z L’ATP sintasi del cloroplasto usa il gradiente protonico formato dalle reazioni fotosintetiche della luce per produrre ATP Tutti i centri di reazione fotosintetici si sono evoluti da un antenato comune La forza motrice protonica per la produzione di ATP nei mitocondri e nei cloroplasti è sostanzialmente la stessa I meccanismi chemiosmotici si sono evoluti per fasi I batteri fotosintetici, fornendo una fonte inesauribile di potere riducente, superarono uno degli ostacoli principali dell’evoluzione Le catene fotosintetiche di trasporto degli elettroni dei cianobatteri producevano ossigeno atmosferico permettendo nuove forme di vita I sistemi genetici dei mitocondri e dei cloroplasti assomigliano a quelli dei procarioti Con il tempo i mitocondri e i cloroplasti hanno esportato la maggior parte dei loro geni nel nucleo attraverso il trasferimento genico La scissione e la fusione dei mitocondri sono processi topologicamente complessi I mitocondri animali contengono i sistemi genetici noti più semplici I mitocondri presentano un uso leggermente ridondante dei codoni e possono mostrare lievi differenze del codice genetico Tra i cloroplasti e i batteri esistono molte somiglianze impressionanti I geni degli organelli sono ereditati per via materna negli animali e nelle piante Mutazioni nel DNA mitocondriale possono causare gravi malattie ereditarie L’accumulo di mutazioni nel DNA mitocondriale contribuisce all’invecchiamento 835 836 837 838 839 840 841 843 844 845 845 846 846 847 849 849 850 852 853 853 854 856 857 859 860 861 861 INDICE XXVIII ■ © 978-88-08-62126-9 Perché i mitocondri e i cloroplasti mantengono un dispendioso sistema separato per la trascrizione del DNA e per la traduzione? 862 SOMMARIO 862 PROBLEMI 862 BIBLIOGRAFIA ■ 864 CAPITOLO 15 866 Principi della segnalazione cellulare 866 ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ I segnali extracellulari possono agire su distanze brevi e lunghe Le molecole di segnalazione extracellulari si legano a recettori specifici Ciascuna cellula è programmata per rispondere a combinazioni specifiche di segnali extracellulari Ci sono tre classi principali di recettori proteici di superficie I recettori di superficie trasmettono segnali tramite molecole di segnalazione intracellulari I segnali intracellulari devono essere specifici e precisi in un citoplasma con molto rumore di fondo A livello dei recettori attivati si formano dei complessi di segnalazione intracellulare Le interazioni fra proteine di segnalazione intracellulare sono mediate da domini di legame modulari Il rapporto tra segnale e risposta varia nelle diverse vie di segnalazione La velocità di una risposta dipende dal turnover delle molecole di segnalazione Le cellule possono rispondere in modo brusco a un segnale che aumenta gradualmente I feedback positivi possono generare risposte “tutto o nulla” Il feedback negativo è comune nei sistemi di segnalazione Le cellule possono regolare la loro sensibilità a un segnale SOMMARIO Segnalazione tramite recettori accoppiati a proteine G ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Le proteine G trimeriche trasmettono segnali derivanti dai GPCR Alcune proteine G regolano la produzione di AMP ciclico La proteina chinasi dipendente da AMP ciclico (PKA) media la maggior parte degli effetti dell’AMP ciclico Alcune proteine G comunicano attraverso i fosfolipidi Il Ca2+ ha la funzione di mediatore intracellulare ubiquitario Il feedback genera onde e oscillazioni del Ca2+ Proteine chinasi dipendenti da Ca2+/calmodulina mediano molte delle risposte ai segnali del Ca2+ Alcune proteine G regolano direttamente canali ionici Olfatto e vista dipendono da GPCR che regolano canali ionici L’ossido nitrico è un mediatore gassoso della segnalazione che passa tra le cellule SOMMARIO Segnalazione tramite recettori accoppiati a enzimi ■ Segnalazione cellulare ■ ■ 868 869 869 871 872 I segnali sono amplificati da secondi messaggeri e da cascate enzimatiche La desensibilizzazione dei GPCR dipende dalla fosforilazione del recettore ■ ■ ■ ■ ■ ■ 874 ■ 875 ■ 875 ■ 877 ■ 879 ■ 880 ■ 882 ■ 883 I recettori tirosina chinasi (RTK) attivati fosforilano se stessi Le tirosine fosforilate sugli RTK fungono da siti di attracco per le proteine di segnalazione intracellulari Le proteine con domini SH2 si legano a tirosine fosforilate La GTPasi Ras media la segnalazione proveniente dalla maggior parte degli RTK Ras attiva un modulo di segnalazione della MAP chinasi Proteine impalcatura aiutano a impedire interferenze tra moduli paralleli di MAP chinasi I recettori presenti sulla superficie cellulare sono collegati funzionalmente al citoscheletro da GTPasi della famiglia Rho La PI 3-chinasi produce siti di attracco per lipidi nella membrana plasmatica La via di segnalazione PI 3-chinasi-Akt stimola le cellule animali a sopravvivere e a crescere RTK e GPCR attivano vie di segnalazione che si sovrappongono Alcuni recettori accoppiati a enzimi sono associati a tirosina chinasi citoplasmatiche I recettori delle citochine attivano la via di segnalazione JAK-STAT Proteine tirosina fosfatasi specifiche eliminano le fosforilazioni in tirosina Le proteine segnale della superfamiglia del TGFb agiscono tramite recettori serina/treonina chinasi e Smad SOMMARIO 884 885 Vie di segnalazione alternative nella regolazione genica ■ 886 ■ 886 ■ 888 ■ 889 890 892 893 ■ ■ ■ 894 896 Il recettore Notch è una proteina latente che regola la trascrizione Le proteine Wnt si legano a recettori Frizzled e inibiscono la degradazione della b-catenina Le proteine Hedgehog si legano a Patched, rimuovendo la sua inibizione su Smoothened Molti stimoli infiammatori e di stress agiscono tramite una via di segnalazione dipendente da NFkB I recettori nucleari sono regolatori trascrizionali modulati da ligando Gli orologi circadiani contengono circuiti a feedback negativo che controllano l’espressione genica Tre proteine in una provetta possono ricostituire l’orologio circadiano di un cianobatterio SOMMARIO Segnalazione nei vegetali 898 901 ■ Pluricellularità e comunicazione cellulare si sono evolute in modo indipendente nei vegetali e negli animali 902 903 904 904 905 907 907 909 910 912 913 913 915 916 917 918 920 920 922 923 923 925 927 929 930 933 934 935 936 936 INDICE XXIX © 978-88-08-62126-9 ■ ■ ■ ■ I recettori serina/treonina chinasi sono la classe più grande di recettori di superficie nei vegetali L’etilene blocca la degradazione di specifiche proteine che regolano la trascrizione nel nucleo Il posizionamento regolato dei trasportatori di auxina modella la crescita vegetale I fitocromi rilevano la luce rossa e i criptocromi la luce blu 940 SOMMARIO 941 PROBLEMI 942 BIBLIOGRAFIA ■ 937 SOMMARIO 937 938 944 CAPITOLO 16 946 Funzione e origine del citoscheletro 946 I filamenti citoscheletrici si adattano per formare strutture dinamiche o stabili QUADRO 16.1 I tre tipi principali di filamenti proteici che formano il citoscheletro ■ ■ ■ ■ Il citoscheletro determina l’organizzazione e la polarità cellulari I filamenti si assemblano a partire da subunità proteiche che conferiscono specifiche proprietà fisiche e dinamiche I filamenti del citoscheletro sono regolati da proteine accessorie e da proteine motrici L’organizzazione e la divisione delle cellule batteriche dipendono da proteine omologhe a quelle che costituiscono il citoscheletro degli eucarioti SOMMARIO LÕactina e le proteine che legano lÕactina ■ ■ Le subunità di actina si assemblano testa-coda, creando filamenti flessibili e polari La nucleazione è il passaggio limitante nella formazione dei filamenti di actina QUADRO 16.2 La polimerizzazione di actina e tubulina ■ ■ ■ ■ ■ I filamenti di actina hanno due estremità distinte e crescono a velocità diverse L’idrolisi dell’ATP nei filamenti di actina porta il treadmilling allo stato stazionario Le funzioni dei filamenti di actina sono inibite sia dalle sostanze chimiche che stabilizzano il polimero sia da quelle che lo destabilizzano Le proteine che legano l’actina influenzano le dinamiche e l’organizzazione del filamento La disponibilità dei monomeri controlla l’assemblaggio del filamento di actina QUADRO 16.3 I filamenti di actina ■ ■ ■ ■ I fattori che nucleano l’actina accelerano la polimerizzazione e formano filamenti ramificati o diritti Le proteine che legano il filamento di actina alterano le dinamiche del filamento Proteine che tagliano i filamenti regolano la depolimerizzazione dei filamenti di actina Complessi di ordine superiore di filamenti di actina influenzano le proprietà meccaniche cellulari e la segnalazione Miosina e actina ■ ■ ■ ■ ■ Il citoscheletro ■ I batteri possono sequestrare il citoscheletro di actina dell’ospite 971 947 ■ ■ 950 ■ 952 ■ ■ 953 958 960 ■ ■ ■ ■ ■ ■ ■ 962 962 978 981 981 I filamenti intermedi e le septine ■ 964 ■ 966 ■ 967 ■ 985 985 986 988 989 990 991 Le proteine che legano le estremità più dei microtubuli ne regolano la dinamica e la stabilità 992 Le proteine che sequestrano la tubulina e che tagliano i microtubuli destabilizzano i microtubuli 994 Ci sono due tipi di proteine motrici che si muovono lungo i microtubuli 994 I microtubuli e i motori muovono gli organelli e le vescicole 997 La costruzione di assemblaggi complessi di microtubuli richiede la dinamica dei microtubuli e le proteine motrici 999 Ciglia e flagelli mobili sono costituiti da microtubuli e dineine 1000 Le ciglia primarie svolgono importanti funzioni di segnalazione nelle cellule animali 1002 SOMMARIO 963 968 I microtubuli sono tubi cavi formati da protofilamenti I microtubuli sono sottoposti a instabilità dinamica Le funzioni dei microtubuli sono inibite sia da farmaci che stabilizzano il polimero sia da farmaci che lo destabilizzano I microtubuli sono nucleati da un complesso proteico che contiene g-tubulina Nelle cellule animali i microtubuli si estendono dal centrosoma Le proteine che legano i microtubuli regolano l’organizzazione e la dinamica dei filamenti QUADRO 16.4 I microtubuli 960 961 974 984 949 957 973 I microtubuli ■ 956 972 983 948 955 972 SOMMARIO ■ 955 Le proteine motrici basate su actina sono membri della superfamiglia della miosina La miosina genera forza accoppiando l’idrolisi di ATP a cambiamenti conformazionali Lo scivolamento della miosina II lungo i filamenti di actina causa la contrazione muscolare La contrazione muscolare inizia con un improvviso aumento della concentrazione citosolica di Ca2+ Il muscolo cardiaco è una macchina di alta ingegneria Actina e miosina svolgono molte funzioni nelle cellule non muscolari 971 La struttura dei filamenti intermedi dipende dalla formazione di fasci laterali e dall’avvolgimento a spirale I filamenti intermedi conferiscono stabilità meccanica alle cellule animali Le proteine linker connettono i filamenti del citoscheletro e costituiscono un ponte con l’involucro nucleare Le septine formano filamenti che regolano la polarità cellulare SOMMARIO 1003 1003 1004 1005 1008 1009 1010 INDICE XXX La polarizzazione cellulare e la migrazione ■ ■ ■ ■ ■ ■ ■ ■ Molte cellule possono strisciare su un substrato solido La protrusione della membrana plasmatica è spinta dalla polimerizzazione dell’actina I lamellipodi contengono tutto il macchinario necessario per la motilità cellulare La contrazione della miosina e l’adesione cellulare permettono alle cellule di spingersi in avanti La polarizzazione cellulare è controllata da membri della famiglia di proteine Rho Segnali extracellulari possono attivare i tre membri della famiglia di proteine Rho Segnali esterni possono determinare la direzione della migrazione cellulare La comunicazione tra gli elementi del citoscheletro coordina la polarizzazione e la locomozione dell’intera cellula © 978-88-08-62126-9 La mitosi 1010 1010 1011 ■ 1012 ■ ■ 1014 ■ 1016 ■ 1018 ■ 1018 ■ ■ 1019 SOMMARIO 1020 PROBLEMI 1020 BIBLIOGRAFIA 1022 Una panoramica sul ciclo cellulare ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ 1025 ■ 1028 La fase S ■ ■ SOMMARIO SOMMARIO ■ ■ 1025 Il sistema di controllo del ciclo cellulare innesca gli eventi principali del ciclo cellulare Il sistema di controllo del ciclo cellulare dipende da proteina chinasi dipendenti da ciclina (Cdk) attivate ciclicamente L’attività della Cdk può essere soppressa sia dalla fosforilazione inibitrice che da proteine Cdk inibitrici (CKI) La proteolisi regolata attiva la transizione da metafase ad anafase Il controllo del ciclo cellulare dipende anche dalla regolazione trascrizionale Il sistema di controllo del ciclo cellulare funziona come una rete di interruttori biochimici S-Cdk inizia la replicazione del DNA una volta per ciclo La duplicazione dei cromosomi richiede la duplicazione della struttura della cromatina Le coesine aiutano a mantenere uniti i cromatidi fratelli SOMMARIO ■ 1024 Il ciclo cellulare eucariotico si divide in quattro fasi Il controllo del ciclo cellulare è simile in tutti gli eucarioti La progressione del ciclo cellulare può essere studiata in vari modi Il sistema di controllo del ciclo cellulare ■ ■ CAPITOLO 17 Il ciclo cellulare ■ 1027 1027 ■ ■ 1028 La defosforilazione attiva M-Cdk all’inizio della mitosi Le condensine aiutano a configurare i cromosomi duplicati in vista della separazione Il fuso mitotico è una macchina basata su microtubuli Motori proteici dipendenti dai microtubuli governano l’assemblaggio e la funzione del fuso Molteplici meccanismi collaborano all’assemblaggio di un fuso mitotico bipolare La duplicazione dei centrosomi avviene precocemente durante il ciclo cellulare M-Cdk inizia l’assemblaggio del fuso nella profase Nelle cellule animali il completamento dell’assemblaggio del fuso richiede la demolizione dell’involucro nucleare L’instabilità dei microtubuli aumenta molto durante la mitosi I cromosomi mitotici promuovono l’assemblaggio di fusi bipolari I cinetocori attaccano i cromatidi fratelli al fuso Il biorientamento si ottiene per tentativi ed errori Varie forze spostano i cromosomi sul fuso APC/C determina la separazione dei cromatidi fratelli e il completamento della mitosi I cromosomi non attaccati bloccano la separazione dei cromatidi fratelli: il punto di controllo dell’assemblaggio del fuso I cromosomi segregano nell’anafase A e B I cromosomi segregati sono introdotti nei nuclei figli in telofase SOMMARIO La citochinesi 1028 1030 ■ ■ ■ 1031 1032 1033 1034 1035 ■ ■ ■ ■ ■ 1035 Actina e miosina II nell’anello contrattile generano la forza per la citochinesi L’attivazione locale di RhoA innesca l’assemblaggio e la contrazione dell’anello contrattile I microtubuli del fuso mitotico determinano il piano della divisione delle cellule animali Il fragmoplasto guida la citochinesi nelle piante superiori Gli organelli racchiusi da membrana devono essere distribuiti alle cellule figlie durante la citochinesi Alcune cellule riposizionano il loro fuso per dividersi asimmetricamente La mitosi può avvenire senza citochinesi La fase G1 è uno stato stabile di inattività di Cdk SOMMARIO La meiosi 1036 1038 1038 1039 1039 QUADRO 17.1 Gli stadi principali della fase M (mitosi e citochinesi) in una cellula animale 1040 ■ M-Cdk induce l’ingresso in mitosi 1042 ■ ■ ■ La meiosi comprende due cicli di segregazione dei cromosomi Gli omologhi duplicati si appaiano durante la profase meiotica L’appaiamento degli omologhi termina con la formazione di un complesso sinaptonemale 1042 1043 1044 1045 1046 1046 1047 1047 1048 1048 1049 1051 1053 1054 1056 1056 1057 1058 1058 1059 1060 1061 1063 1063 1064 1064 1065 1067 1067 1067 1069 1069 INDICE XXXI © 978-88-08-62126-9 ■ ■ ■ La segregazione degli omologhi dipende da molte caratteristiche peculiari della meiosi I Il crossing over è strettamente regolato La meiosi spesso non ha successo 1070 1072 1073 SOMMARIO 1073 Il controllo della divisione cellulare e della crescita cellulare ■ ■ ■ ■ ■ ■ ■ ■ I mitogeni stimolano la divisione cellulare Le cellule possono entrare in uno stato specializzato di non divisione I mitogeni stimolano le attività di G1-Cdk e G1/S-Cdk Il danno al DNA blocca la divisione cellulare: la risposta al danneggiamento del DNA In molte cellule umane c’è un limite innato al numero delle volte che si possono dividere Nelle cellule non cancerose segnali anormali di proliferazione causano l’arresto del ciclo cellulare o la morte per apoptosi La proliferazione cellulare è accompagnata dalla crescita della cellula Le cellule proliferanti di solito coordinano crescita e divisione ■ 1073 1074 ■ ■ ■ ■ ■ ■ ■ ■ ■ 1079 ■ 1079 ■ 1080 ■ 1081 ■ 1082 1082 BIBLIOGRAFIA 1083 ■ ■ ■ 1085 ■ 1086 1087 1088 1089 1091 1092 1094 1095 1095 1097 PROBLEMI 1097 1099 SOMMARIO ■ ■ ■ ■ ■ ■ ■ PARTE 5 ■ LE CELLULE NEL LORO CONTESTO SOCIALE ■ ■ CAPITOLO 19 Giunzioni cellulari e matrice extracellulare 1102 Le giunzioni cellula-cellula 1104 ■ Le caderine costituiscono una famiglia diversa di molecole di adesione 1105 Le caderine mediano l’adesione omofilica L’adesione cellula-cellula dipendente dalle caderine guida l’organizzazione dei tessuti in via di sviluppo Le transizioni epiteliali-mesenchimali dipendono dal controllo delle caderine Le catenine collegano le caderine classiche al citoscheletro di actina Le giunzioni aderenti rispondono alle forze generate dall’actina citoscheletrica Il rimodellamento tissutale dipende dalla coordinazione della contrazione mediata dall’actina con l’adesione cellula-cellula I desmosomi conferiscono resistenza meccanica agli epiteli Le giunzioni strette formano un sigillo tra le cellule e una barriera tra i domini delle membrane plasmatiche Le giunzioni strette contengono filamenti di proteine di adesione transmembrana Proteine impalcatura organizzano i complessi delle proteine giunzionali Le giunzioni gap accoppiano le cellule sia elettricamente che metabolicamente Un connessone di giunzione gap è composto da sei subunità transmembrana di connessine Nei vegetali i plasmodesmi svolgono molte funzioni analoghe a quelle delle giunzioni gap Le selectine mediano le adesioni transitorie cellula-cellula nel torrente circolatorio Membri della superfamiglia delle immunoglobuline mediano l’adesione cellula-cellula indipendente da Ca2+ La matrice extracellulare dei tessuti connettivi animali ■ SOMMARIO BIBLIOGRAFIA ■ 1077 PROBLEMI La morte cellulare programmata elimina cellule indesiderate L’apoptosi dipende da una cascata proteolitica intracellulare mediata da caspasi Recettori di morte della superficie cellulare attivano la via estrinseca dell’apoptosi La via intrinseca dell’apoptosi dipende dai mitocondri Le proteine Bcl2 regolano la via intrinseca dell’apoptosi Gli IAP sono coinvolti nel controllo delle caspasi I fattori di sopravvivenza extracellulari inibiscono l’apoptosi in vari modi I fagociti rimuovono la cellula apoptotica Un’eccessiva o una insufficiente apoptosi possono contribuire a determinare malattie ■ ■ CAPITOLO 18 ■ ■ 1075 1075 SOMMARIO La morte cellulare ■ ■ ■ ■ La matrice extracellulare è prodotta e orientata dalle cellule al suo interno Catene di glicosamminoglicano (GAG) occupano grandi quantità di spazio e formano gel idratati Lo ialuronano svolge la funzione di riempitivo durante la morfogenesi e la riparazione dei tessuti I proteoglicani sono composti da catene di GAG unite covalentemente a un nucleo proteico I collageni sono le proteine principali della matrice extracellulare Collageni associati alle fibrille secrete aiutano a organizzarle Le cellule aiutano a organizzare le fibrille di collagene che secernono, esercitando tensione sulla matrice L’elastina conferisce ai tessuti la loro elasticità La fibronectina e altre glicoproteine multidominio aiutano a organizzare la matrice La fibronectina si lega alle integrine La tensione esercitata dalle cellule regola l’assemblaggio delle fibrille di fibronectina La lamina basale è una forma specializzata di matrice extracellulare La laminina e il collagene di tipo IV sono i componenti principali della lamina basale Le lamine basali hanno funzioni diverse 1106 1106 1108 1109 1109 1111 1112 1114 1115 1117 1118 1119 1120 1121 1123 1124 1124 1125 1125 1126 1127 1129 1131 1132 1133 1134 1135 1136 1137 1138 1139 INDICE XXXII ■ ■ Le cellule devono essere capaci di degradare e di produrre la matrice I proteoglicani della matrice e le glicoproteine regolano le attività delle proteine secrete 1142 SOMMARIO 1143 Le giunzioni cellula-matrice ■ ■ ■ ■ ■ ■ ■ Le integrine sono eterodimeri transmembrana che legano la matrice extracellulare al citoscheletro Difetti delle integrine sono responsabili di molte malattie genetiche Le integrine possono passare da una conformazione attiva a una inattiva Le integrine si raggruppano per formare adesioni forti I punti di attacco alla matrice extracellulare agiscono tramite le integrine per controllare la proliferazione e la sopravvivenza cellulari Le integrine reclutano proteine di segnalazione intracellulare a livello dei siti di adesione cellulamatrice Le adesioni cellula-matrice rispondono alle forze meccaniche SOMMARIO La parete cellulare vegetale ■ ■ ■ ■ ■ © 978-88-08-62126-9 La composizione della parete cellulare dipende dal tipo di cellule La resistenza elastica della parete cellulare permette alle cellule vegetali di sviluppare la pressione di turgore La parete cellulare primaria è costituita da microfibrille di cellulosa intessute con un reticolo di polisaccaridi di pectina La deposizione orientata della parete controlla la crescita della cellula vegetale I microtubuli orientano la deposizione della parete cellulare ■ 1141 ■ ■ 1143 ■ 1144 1145 ■ ■ 1146 1147 SOMMARIO ■ ■ 1149 ■ 1150 ■ 1151 ■ 1151 ■ 1153 1153 1154 1155 SOMMARIO 1157 PROBLEMI 1157 BIBLIOGRAFIA 1159 ■ ■ ■ ■ ■ ■ CAPITOLO 20 ■ Il cancro Il cancro come processo microevolutivo ■ ■ ■ ■ ■ ■ ■ ■ 1161 Le cellule cancerose aggirano i controlli della 1162 proliferazione normale e colonizzano altri tessuti La maggior parte delle forme di cancro deriva da una 1163 sola cellula anormale Le cellule cancerose contengono mutazioni somatiche 1164 Una singola mutazione non è sufficiente a trasformare una cellula normale in una cancerosa 1164 Il cancro si sviluppa gradualmente da cellule sempre più aberranti 1165 La progressione tumorale coinvolge cicli successivi di modificazioni casuali ereditate seguiti da selezione 1166 naturale Le cellule tumorali umane sono geneticamente 1167 instabili Le cellule tumorali mostrano un controllo della 1168 crescita alterato 1174 I geni cruciali per il cancro: come si scoprono e che cosa fanno 1174 1148 1151 Le cellule tumorali hanno un metabolismo dello zucchero alterato 1168 Le cellule tumorali hanno un’anomala capacità di sopravvivere allo stress e ai danni del DNA 1169 Le cellule cancerose umane sfuggono a un limite intrinseco alla proliferazione cellulare 1171 Il microambiente tumorale influenza lo sviluppo del cancro 1171 Le cellule tumorali devono sopravvivere e proliferare in un ambiente estraneo 1172 Molte proprietà contribuiscono in genere alla crescita cancerosa 1173 ■ ■ ■ ■ ■ ■ ■ ■ L’identificazione di mutazioni con guadagno di funzione e con perdita di funzione ha tradizionalmente richiesto metodi differenti 1175 I retrovirus servono da vettori di oncogeni che alterano il comportamento cellulare 1176 Diverse linee di ricerca di oncogeni hanno portato allo stesso gene: Ras 1176 I geni mutati nel cancro possono essere resi iperattivi in molti modi 1177 Studi di rare sindromi cancerose ereditarie hanno identificato per la prima volta geni soppressori dei tumori 1178 Meccanismi genetici ed epigenetici possono inattivare i geni soppressori dei tumori 1179 Il sequenziamento sistematico dei genomi di cellule cancerose ha trasformato le nostre conoscenze della malattia 1180 Molti cancri hanno un genoma estremamente danneggiato 1182 Molte mutazioni nelle cellule cancerose sono solamente trainate 1183 I geni cruciali per il cancro rappresentano circa l’1% del genoma umano 1184 Il danneggiamento di poche vie chiave è comune a molti cancri 1184 Mutazioni nella via di PI3K/Akt/mTOR inducono le cellule tumorali a crescere 1185 Mutazioni della via di p53 permettono alle cellule tumorali di sopravvivere e proliferare nonostante lo stress e i danni al DNA 1186 L’instabilità genomica prende forme diverse in tumori differenti 1188 I cancri di tessuti specializzati utilizzano varie strade per colpire le vie cruciali comuni del cancro 1188 Gli studi sui topi aiutano a definire le funzioni dei geni cruciali per il cancro 1189 Mentre progrediscono i tumori diventano sempre più eterogenei 1189 Le modificazioni delle cellule tumorali che portano a metastasi sono ancora in gran parte un mistero 1190 Una piccola popolazione di cellule staminali del cancro può essere alla base del sostentamento di molti tumori 1192 Il fenomeno delle cellule staminali del cancro determina ulteriori difficoltà nella cura dei tumori 1193 I cancri colorettali si evolvono lentamente attraverso una successione di cambiamenti visibili 1194 INDICE XXXIII © 978-88-08-62126-9 ■ ■ ■ Poche lesioni genetiche cruciali sono comuni a una grande percentuale di cancri colorettali Alcuni cancri colorettali hanno difetti nella riparazione delle basi male appaiate nel DNA I passaggi della progressione tumorale possono essere spesso correlati a mutazioni specifiche SOMMARIO Prevenzione e trattamento del cancro: presente e futuro ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ L’epidemiologia rivela che molti casi di cancro possono essere evitati Saggi sensibili possono rilevare quegli agenti che causano il cancro e che danneggiano il DNA Il 50% dei tumori potrebbe essere prevenuto da cambiamenti nello stile di vita I virus e altre infezioni contribuiscono a una percentuale significativa di cancri umani I tumori della cervice uterina possono essere evitati con la vaccinazione contro il papillomavirus umano Agenti infettivi possono causare il cancro in vari modi La ricerca di cure per il cancro è difficile ma non è senza speranza Le terapie tradizionali sfruttano l’instabilità genetica e la perdita delle risposte ai punti di controllo del ciclo cellulare nelle cellule cancerose Nuovi farmaci possono uccidere le cellule tumorali selettivamente colpendo mutazioni specifiche Gli inibitori di PARP uccidono le cellule tumorali che hanno difetti nei geni Brca1 e Brca2 Si possono progettare piccole molecole che inibiscono proteine oncogeniche specifiche Molti tipi di cancro possono essere trattabili amplificando la risposta immunitaria contro lo specifico tumore Il cancro sviluppa resistenza alle terapie La combinazione di terapie può avere successo quando falliscono i trattamenti con un farmaco alla volta Oggi possediamo strumenti per individuare combinazioni di terapie su misura per un singolo paziente ■ 1195 ■ 1196 ■ 1197 1198 ■ 1199 1199 ■ 1201 ■ 1202 1203 1204 ■ 1205 ■ 1205 ■ 1207 ■ 1210 1212 1212 1213 1214 PROBLEMI 1214 BIBLIOGRAFIA 1216 ■ ■ ■ ■ 1220 ■ ■ ■ Una panoramica sullo sviluppo ■ Meccanismi di formazione degli schemi 1204 1218 ■ SOMMARIO ■ Lo sviluppo degli organismi pluricellulari ■ ■ 1204 SOMMARIO Meccanismi conservati stabiliscono il piano corporeo di base di un animale Le potenzialità di sviluppo di una cellula diventano progressivamente più limitate La memoria cellulare è alla base delle decisioni della cellula Molti organismi modello sono stati importantissimi per comprendere lo sviluppo I geni coinvolti nella comunicazione cellula-cellula e nel controllo trascrizionale sono particolarmente importanti per lo sviluppo animale ■ 1200 CAPITOLO 21 ■ ■ ■ ■ 1220 1221 ■ 1221 ■ ■ 1221 ■ 1222 Il DNA regolatore sembra il maggior responsabile delle differenze fra le specie animali Un ridotto numero di vie di segnalazione cellulacellula conservate coordina lo schema spaziale Segnali semplici possono generare degli schemi complessi attraverso il controllo combinatorio e la memoria cellulare I morfogeni sono segnali induttivi a lungo raggio che esercitano effetti graduati L’inibizione laterale può generare schemi di tipi cellulari differenti L’attivazione a corto raggio e l’inibizione a lungo raggio possono generare degli schemi cellulari complessi Anche la divisione asimmetrica delle cellule può generare diversità Gli schemi iniziali vengono stabiliti in piccoli gruppi di cellule e vengono rifiniti dall’induzione sequenziale durante la crescita dell’embrione La biologia dello sviluppo fornisce indicazioni sulle malattie e sul mantenimento dei tessuti 1222 1223 1223 1224 1225 1226 1226 1226 1227 1228 1229 Animali differenti utilizzano meccanismi differenti 1229 per stabilire i loro assi primari di polarizzazione Studi su Drosophila hanno rivelato i meccanismi di 1230 controllo genetico alla base dello sviluppo I geni di polarità dell’uovo codificano macromolecole che si depositano nell’uovo per organizzare gli assi 1231 dell’embrione precoce di Drosophila Tre gruppi di geni controllano la segmentazione di 1232 Drosophila lungo l’asse A-P Una gerarchia di interazioni di regolazione genica 1234 suddivide l’embrione di Drosophila I geni di polarità dell’uovo, i gap e i pair-rule generano uno schema transitorio che viene ricordato dai geni di polarità segmentale e dai 1235 geni Hox I geni Hox stabiliscono uno schema permanente 1236 dell’asse A-P Le proteine Hox conferiscono a ciascun segmento 1237 la sua individualità I geni Hox sono espressi secondo il loro ordine nel 1237 complesso Hox I gruppi di proteine Trithorax e Polycomb rendono i complessi Hox capaci di mantenere una memoria 1238 permanente dell’informazione posizionale I geni di segnalazione dorso-ventrale generano un 1239 gradiente del regolatore trascrizionale Dorsal Una gerarchia di interazioni induttive suddivide 1241 l’embrione dei vertebrati Una competizione fra proteine di segnalazione secrete determina il patterning dell’embrione di 1242 vertebrato L’asse dorso-ventrale degli insetti corrisponde 1243 all’asse ventro-dorsale dei vertebrati I geni Hox controllano l’asse A-P dei vertebrati 1244 Alcuni regolatori trascrizionali possono attivare un programma che definisce un tipo cellulare 1245 o crea un intero organo L’inibizione laterale mediata da Notch rifinisce gli 1246 schemi spaziali delle cellule INDICE XXXIV ■ ■ La divisione cellulare asimmetrica rende differenti cellule sorelle Le differenze nel DNA regolatore spiegano le differenze morfologiche SOMMARIO La successione temporale dello sviluppo ■ ■ ■ ■ ■ ■ ■ La vita media delle molecole ha un ruolo cruciale nella successione temporale dello sviluppo Un oscillatore di espressione genica agisce come un orologio per controllare la segmentazione dei vertebrati Programmi di sviluppo intracellulari possono contribuire a determinare la successione temporale dello sviluppo di una cellula È raro che le cellule si basino sul conteggio delle divisioni cellulari per scandire il tempo del loro sviluppo Le transizioni durante lo sviluppo sono spesso regolate da microRNA Segnali ormonali coordinano i tempi delle transizioni nello sviluppo Segnali ambientali determinano il tempo della fioritura © 978-88-08-62126-9 ■ 1248 ■ 1248 1250 1251 1252 1255 1255 ■ ■ ■ ■ ■ SOMMARIO La crescita ■ ■ ■ La proliferazione, la morte e la dimensione delle cellule determinano le dimensioni dell’organismo Gli animali e gli organi possono misurare e regolare la massa cellulare totale Segnali extracellulari stimolano o inibiscono la crescita SOMMARIO Lo sviluppo neurale ■ ■ ■ Ai neuroni sono assegnate caratteristiche differenti in base al tempo e al luogo in cui nascono Il cono di crescita guida gli assoni lungo vie specifiche verso i loro bersagli Vari segnali extracellulari guidano gli assoni verso i loro bersagli 1284 1285 1286 1287 1289 SOMMARIO 1290 PROBLEMI 1290 BIBLIOGRAFIA 1292 CAPITOLO 22 Cellule staminali e rinnovamento tissutale 1295 1258 Le cellule staminali e il rinnovamento nei tessuti epiteliali 1295 1260 ■ 1281 1257 La morfogenesi ■ ■ 1254 1259 La migrazione cellulare è guidata da segnali dell’ambiente in cui si trova la cellula La distribuzione delle cellule migranti dipende da fattori di sopravvivenza Il cambiamento dei pattern delle molecole di adesione cellulare costringe le cellule ad assumere nuove disposizioni Interazioni repulsive aiutano a mantenere i confini fra tessuti Gruppi di cellule simili possono effettuare dei riarrangiamenti collettivi radicali La polarità cellulare planare aiuta a orientare le strutture cellulari e i movimenti negli epiteli in via di sviluppo Le interazioni fra epitelio e mesenchima generano strutture tubolari ramificate Un epitelio può ripiegarsi durante lo sviluppo per formare un tubo o una vescicola ■ ■ SOMMARIO ■ ■ 1251 La specificità neuronale guida la formazione di mappe neurali ordinate I rami dei dendriti e degli assoni dello stesso neurone si evitano l’un l’altro I tessuti bersaglio rilasciano fattori neurotrofici che controllano la crescita e la sopravvivenza delle cellule nervose La formazione delle sinapsi dipende dalla comunicazione bidirezionale tra i neuroni e le loro cellule bersaglio Il rimodellamento delle sinapsi dipende dall’attività elettrica e dalla segnalazione sinaptica I neuroni che emettono scariche insieme si legano insieme 1260 1262 1263 1264 1264 1265 1266 1268 1269 ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ 1269 ■ 1270 1271 ■ 1272 1274 ■ 1274 1275 Il rivestimento dell’intestino tenue viene rinnovato continuamente grazie alla proliferazione cellulare nelle cripte Le cellule staminali dell’intestino tenue si trovano vicino alla base delle cripte Le due cellule figlie di una cellula staminale devono prendere una decisione La segnalazione di Wnt mantiene i compartimenti staminali dell’intestino Le cellule staminali alla base della cripta sono multipotenti e generano la gamma completa dei tipi cellulari differenziati dell’intestino Le due cellule figlie di una cellula staminale non sempre devono diventare diverse Le cellule di Paneth creano la nicchia delle cellule staminali Una singola cellula che esprime Lgr5 in coltura può generare un intero sistema organizzato cripta-villo La segnalazione efrina-Eph controlla la segregazione dei diversi tipi cellulari dell’intestino La segnalazione di Notch controlla la diversificazione delle cellule intestinali e aiuta a mantenere la staminalità Il sistema delle cellule staminali dell’epidermide garantisce il mantenimento di una barriera impermeabile che si autorinnova Quando il rinnovamento del tessuto non dipende dalle cellule staminali: le cellule che secernono insulina nel pancreas e gli epatociti nel fegato Alcuni tessuti non possiedono cellule staminali e non si rinnovano SOMMARIO 1296 1297 1298 1298 1299 1301 1302 1302 1303 1303 1303 1304 1306 1306 I fibroblasti e le loro trasformazioni: la famiglia delle cellule del tessuto connettivo 1307 I fibroblasti cambiano i propri caratteri in risposta a segnali chimici e fisici Gli osteoblasti producono la matrice dell’osso 1307 1308 1278 ■ 1279 ■ INDICE XXXV © 978-88-08-62126-9 ■ ■ L’osso viene continuamente rimodellato dalle cellule 1310 al suo interno Gli osteoclasti sono controllati da segnali provenienti 1310 dagli osteoblasti SOMMARIO 1311 Riprogrammazione cellulare e cellule staminali 1331 pluripotenti ■ ■ Genesi e rigenerazione del muscolo scheletrico 1312 ■ ■ I mioblasti si fondono per formare nuove fibre del 1313 muscolo scheletrico Alcuni mioblasti permangono come cellule staminali 1313 quiescenti nell’adulto SOMMARIO Vasi sanguigni, vasi linfatici e cellule endoteliali ■ ■ ■ ■ Le cellule endoteliali rivestono tutti i vasi sanguigni e linfatici Le cellule endoteliali dell’apice aprono la strada per l’angiogenesi I tessuti che richiedono un apporto sanguigno rilasciano VEGF Segnali provenienti dalle cellule endoteliali controllano il reclutamento dei periciti e delle cellule del muscolo liscio per formare la parete del vaso SOMMARIO Un sistema gerarchico di cellule staminali: la formazione delle cellule del sangue ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ SOMMARIO ■ ■ ■ 1314 ■ ■ ■ 1315 ■ 1316 ■ 1317 ■ 1318 1318 1327 1331 SOMMARIO 1340 PROBLEMI 1341 BIBLIOGRAFIA 1342 CAPITOLO 23 Patogeni e infezione 1344 Introduzione agli agenti patogeni e al microbiota umano 1344 ■ ■ ■ ■ ■ ■ ■ 1327 Il verme planaria ha cellule staminali in grado di 1328 rigenerare un intero nuovo corpo Alcuni vertebrati possono rigenerare interi organi 1329 Le cellule staminali possono essere utilizzate artificialmente per sostituire le cellule malate o perse: 1330 una terapia per il sangue e l’epidermide Le cellule staminali neurali possono essere manipolate in coltura e usate per ripopolare il sistema nervoso 1330 centrale SOMMARIO ■ 1314 I globuli rossi sono tutti uguali; i globuli bianchi si 1318 dividono in tre categorie principali La produzione di ogni tipo di cellula del sangue nel 1320 midollo osseo è controllata singolarmente Il midollo osseo contiene cellule staminali emopoietiche multipotenti capaci di generare tutte le 1321 categorie di cellule del sangue La determinazione è un processo a più stadi 1322 Le divisioni delle cellule progenitrici determinate amplificano il numero di cellule specializzate del 1322 sangue Le cellule staminali dipendono da segnali di contatto 1323 provenienti dalle cellule stromali I fattori che regolano l’emopoiesi possono essere 1324 analizzati in coltura L’eritropoiesi dipende dall’ormone eritropoietina 1324 Molteplici CSF influenzano la produzione dei 1325 neutrofili e dei macrofagi Il comportamento di una cellula emopoietica in parte 1325 dipende dal caso La regolazione della sopravvivenza cellulare è importante quanto la regolazione della proliferazione 1326 cellulare Rigenerazione e riparazione ■ 1314 ■ I nuclei possono essere riprogrammati trapiantandoli 1332 in un citoplasma estraneo La riprogrammazione di un nucleo trapiantato 1332 comporta drastiche modifiche epigenetiche Le cellule staminali embrionali (ES) possono produrre 1333 qualsiasi parte del corpo Una combinazione essenziale di regolatori della trascrizione definisce e mantiene lo stato di cellula ES 1334 I fibroblasti possono essere riprogrammati per creare 1334 cellule staminali pluripotenti indotte (cellule iPS) La riprogrammazione richiede un grande 1335 sconvolgimento del sistema di controllo genico Una manipolazione sperimentale dei fattori che modificano la cromatina può aumentare l’efficienza 1336 di riprogrammazione Le cellule ES e iPS possono essere indotte a generare 1337 specifici tipi di cellule adulte e anche interi organi Cellule di un tipo specializzato possono essere indotte a transdifferenziare direttamente in un altro 1338 tipo cellulare Le cellule ES e iPS sono strumenti utili per la scoperta 1339 di nuovi farmaci e per l’analisi delle malattie ■ ■ Il microbiota umano è un sistema ecologico complesso importante per il nostro sviluppo e per la nostra salute Gli agenti patogeni interagiscono in diversi modi con il loro ospite Gli agenti patogeni possono contribuire all’insorgenza del cancro, delle malattie cardiovascolari e di altre malattie croniche Gli agenti patogeni possono essere virus, batteri o eucarioti I batteri sono caratterizzati da un’ampia diversità e occupano una notevole varietà di nicchie ecologiche Gli agenti patogeni batterici portano geni della virulenza specializzati I geni della virulenza batterici codificano proteine effettrici e sistemi di secrezione per introdurre le proteine effettrici nelle cellule ospiti I parassiti fungini e protozoici hanno cicli vitali complessi con molteplici forme Tutti gli aspetti della diffusione virale dipendono dal macchinario delle cellule ospiti SOMMARIO Biologia cellulare dell’infezione ■ ■ 1345 1346 1346 1347 1348 1349 1350 1352 1354 1357 1357 Gli agenti patogeni attraversano le barriere epiteliali 1357 per infettare l’ospite Gli agenti patogeni che colonizzano gli epiteli devono 1358 eludere i meccanismi difensivi dell’ospite INDICE XXXVI ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Gli agenti patogeni extracellulari interferiscono con le cellule dell’ospite senza penetrarvi Gli agenti patogeni intracellulari hanno meccanismi sia per entrare che per uscire dalle cellule ospiti Le particelle virali si legano a recettori virali esposti sulla superficie della cellula ospite I virus entrano nelle cellule ospiti tramite fusione di membrane, formazione di pori o rottura della membrana I batteri entrano nelle cellule ospiti mediante fagocitosi I parassiti eucariotici intracellulari invadono attivamente le cellule ospiti Alcuni agenti patogeni intracellulari passano dal fagosoma nel citosol Molti agenti patogeni per sopravvivere e replicarsi alterano il traffico delle membrane della cellula ospite I virus e i batteri sfruttano il citoscheletro della cellula ospite per il movimento intracellulare I virus prendono il controllo del metabolismo della cellula ospite I patogeni possono evolvere rapidamente mediante variazione antigenica Nell’evoluzione virale domina la replicazione incline all’errore I patogeni resistenti ai farmaci rappresentano un problema crescente © 978-88-08-62126-9 1359 Una visione d’insieme del sistema immunitario 1393 adattativo ■ 1360 ■ 1360 ■ 1361 ■ 1363 SOMMARIO 1364 1365 1366 1369 1371 1372 1374 Le cellule B e le immunoglobuline ■ ■ ■ ■ ■ ■ 1376 SOMMARIO 1378 PROBLEMI 1378 BIBLIOGRAFIA 1380 CAPITOLO 24 Le cellule T e le proteine MHC ■ ■ Il sistema immunitario innato e adattativo 1382 Il sistema immunitario innato 1383 ■ ■ ■ ■ ■ ■ ■ ■ Le superfici epiteliali svolgono la funzione di barriera nei confronti delle infezioni I recettori di riconoscimento di schemi (PRR) riconoscono caratteristiche conservate degli agenti patogeni Ci sono molteplici classi di PRR I PRR attivati innescano una risposta infiammatoria nei siti di infezione Le cellule fagocitiche cercano, inglobano e distruggono i patogeni L’attivazione del complemento indirizza i patogeni alla fagocitosi o alla lisi Le cellule infettate da virus prendono misure drastiche per impedire la replicazione virale Le cellule natural killer inducono le cellule infettate da virus a suicidarsi Le cellule dendritiche forniscono il collegamento tra il sistema immunitario adattativo e quello innato SOMMARIO ■ ■ 1383 ■ 1384 1384 1385 1387 1387 1389 1390 Le cellule B producono immunoglobuline (Ig) sia come recettori di superficie per l’antigene sia come anticorpi secreti I mammiferi producono cinque classi di immunoglobuline Le catene pesanti e leggere delle immunoglobuline sono costituite da regioni variabili e costanti I geni delle immunoglobuline sono assemblati da segmenti genici separati durante lo sviluppo dei linfociti B L’ipermutazione somatica stimolata dall’antigene regola finemente le risposte anticorpali Le cellule B possono cambiare la classe degli anticorpi che producono SOMMARIO ■ ■ I linfociti B si sviluppano nel midollo osseo, 1394 i linfociti T nel timo La memoria immunologica dipende sia dall’espansione 1396 clonale sia dal differenziamento dei linfociti I linfociti ricircolano continuamente attraverso gli 1398 organi linfoidi secondari La tolleranza immunologica al self assicura che i linfociti B e T non attacchino le cellule 1399 e le molecole normali dell’ospite ■ ■ ■ ■ ■ I recettori delle cellule T (TCR) sono eterodimeri simili alle Immunoglobuline Cellule dendritiche attivate possono attivare linfociti T naïve I linfociti T riconoscono peptidi estranei legati alle proteine MHC Le proteine MHC sono le proteine umane più polimorfiche conosciute I corecettori CD4 e CD8 dei linfociti T si legano a parti invarianti delle proteine MHC I timociti in via di sviluppo vanno incontro a selezione negativa e positiva Le cellule T citotossiche inducono le cellule bersaglio infettate a suicidarsi I linfociti T helper effettori aiutano ad attivare altre cellule dei sistemi immunitari innato e adattativo I linfociti T helper naïve possono differenziarsi in tipi diversi di cellule T effettrici Sia i linfociti T che i linfociti B hanno bisogno di molteplici segnali extracellulari per essere attivati Molte proteine presenti sulla superficie cellulare appartengono alla superfamiglia delle Ig 1401 1402 1402 1402 1405 1406 1408 1409 1410 1411 1412 1413 1414 1418 1419 1420 1421 1423 1423 1424 1426 SOMMARIO 1427 PROBLEMI 1428 BIBLIOGRAFIA 1431 INDICE ANALITICO 1432 1391 1391 PREFAZIONE D a quando è apparsa l’ultima edizione di questo volume fino a oggi sono stati pubblicati più di cinque milioni di articoli scientifici. Al tempo stesso c’è stato anche un aumento della quantità di informazioni digitali: nuovi elementi riguardanti sequenze genomiche, interazioni tra proteine, strutture molecolari ed espressione genica sono stati raccolti in grandi banche dati. La sfida, sia per gli scienziati che per coloro che scrivono libri di testo, è convertire questa enorme quantità di dati in un’esposizione comprensibile e aggiornata del funzionamento della cellula. Un valido aiuto viene dal grande aumento del numero di articoli che si propongono di rendere più comprensibile il nuovo materiale, sebbene la maggior parte di essi sia ancora piuttosto specifica. Al tempo stesso, la crescente mole di risorse in rete può indurre a credere che per padroneggiare la materia siano sufficienti pochi “click” del mouse. In alcuni ambiti questo cambiamento del modo di accedere alle conoscenze ha avuto molto successo, per esempio per essere informati sulle ultime novità riguardanti un nostro specifico problema di salute. Ma per capire qualcosa della bellezza e della complessità caratteristiche del modo di lavorare delle cellule viventi abbiamo bisogno di molto più di questa o quella semplice definizione di wikipedia; è estremamente difficile identificare ciò che è davvero importante in un simile groviglio di informazioni. È molto più efficace un’esposizione che progressivamente e con logica guidi i lettori attraverso le idee, i componenti e gli esperimenti, facendo sì che possano costruire il loro personale quadro concettuale della biologia della cellula. Questo consentirà loro di valutare criticamente tutti i nuovi concetti scientifici e, cosa ancor più importante, di capirli. Ciò è quanto abbiamo cercato di fare in Biologia molecolare della cellula. Preparando questa edizione abbiamo dovuto inevitabilmente prendere alcune decisioni difficili. Per poter inserire nuove e interessanti scoperte, mantenendo allo stesso tempo la facilità di consultazione del volume, abbiamo dovuto eliminare parti di testo dell’edizione precedente. Abbiamo aggiunto nuove sezioni, come quelle sulle funzioni dell’RNA, sugli avanzamenti nella biologia delle cellule staminali, sui nuovi metodi per studiare le proteine e i geni e per visualizzare le cellule, sulle nuove conoscenze nel campo della genetica e del trattamento del cancro, sulle tempistiche e sul controllo della crescita e sulla morfogenesi nello sviluppo. La chimica delle cellule è estremamente complessa e qualsiasi elenco delle parti della cellula e delle loro interazioni, indipendentemente da quanto completo, lascia enormi lacune nella comprensione. Abbiamo capito che spiegare in modo esauriente il comportamento cellulare richiede informazioni quantitative sulle cellule che dovrebbero essere accompagnate da modelli matematici e approcci bioinformatici sofisticati, alcuni dei quali non sono stati ancora ideati. Di conseguenza un obiettivo prioritario per i biologi cellulari è quello di indirizzare gli studi verso descrizioni quantitative e deduzioni matematiche. Abbiamo messo in evidenza questo approccio e alcuni dei suoi metodi nella nuova sezione alla fine del Capitolo 8. Messo di fronte alla vastità delle scoperte della biologia della cellula, uno studente potrebbe essere erroneamente portato a immaginare che non ci sia più nulla da scoprire. Di fatto, più scopriamo riguardo alle cellule più emergono nuovi quesiti. Per sottolineare che la nostra conoscenza della biologia della cellula è incompleta abbiamo messo in evidenza alcune delle maggiori lacune attuali inserendo la rubrica Quello che non sappiamo al termine di ogni capitolo, con l’intenzione di fornire solo un esempio dei quesiti cruciali ancora privi di risposta e delle sfide per la prossima generazione di scienziati. Ci è di stimolo sapere che alcuni dei nostri lettori saranno coloro che forniranno le risposte future. PREFAZIONE IV © 978-88-08-62126-9 Più di 1500 illustrazioni sono state realizzate in modo da fornire un’esposizione parallela, strettamente collegata al testo. Abbiamo migliorato la loro coerenza, in particolare attraverso l’uso di colori e di icone comuni; le pompe di membrana e i canali costituiscono un ottimo esempio. Per evitare interruzioni della lettura, una parte del materiale è stata inserita in nuovi quadri facilmente consultabili. La maggior parte delle strutture proteiche raffigurate è stata ridisegnata e colorata coerentemente. In ogni caso, viene fornito il codice della proteina relativo alla Banca dati di proteine (PDB) che può essere utilizzato per accedere agli strumenti disponibili in rete, come per esempio quelle del sito web RCSB PDB (www.rcsb.org). Queste connessioni permetteranno ai lettori di studiare in modo approfondito le proteine alla base della biologia cellulare. John Wilson e Tim Hunt hanno contribuito ancora una volta alla stesura, creativa e mai banale, dei problemi in modo da consentire agli studenti una comprensione più attiva del testo. I problemi, presenti alla fine di ogni capitolo, sottolineano gli approcci quantitativi e incoraggiano il pensiero critico esaminando gli esperimenti pubblicati. Viviamo in un mondo che ci pone di fronte a molte questioni complesse che interessano la biologia della cellula: la biodiversità, il cambiamento climatico, la sicurezza alimentare, il degrado ambientale, l’esaurimento delle risorse e le malattie umane. Speriamo che il nostro volume aiuti il lettore a capire meglio e, se possibile, ad affrontare queste sfide. Solo conoscenza e comprensione consentono di intervenire. Siamo in debito con un gran numero di scienziati il cui generoso aiuto verrà menzionato separatamente nei ringraziamenti. Qui vogliamo invece ricordare alcuni collaboratori particolarmente importanti. Per il Capitolo 8 Hana El-Samadche ha fornito il nucleo centrale della sezione Analisi matematica delle funzioni cellulari; Karen Hopkin ha validamente contribuito alla sezione Studio dell’espressione e della funzione dei geni.Werner Kuhlbrandt ci ha aiutato a riorganizzare e riscrivere il Capitolo 14 (Conversione dell’energia: mitocondri e cloroplasti). Rebecca Heald ha fatto lo stesso per il Capitolo 16 (Il citoscheletro), così come Alexander Schier per il Capitolo 21 (Lo sviluppo degli organismi pluricellulari) e Matt Welch per il Capitolo 23 (Patogeni e infezione). Lewis Lanier ha collaborato alla stesura del Capitolo 24 (Il sistema immunitario innato e adattativo). Prima di iniziare la revisione di questa edizione abbiamo chiesto ad alcuni scienziati che avevano utilizzato la quinta edizione come manuale per gli studenti di biologia cellulare di incontrarci per suggerirci miglioramenti. Ci hanno fornito dei commenti utili che hanno contribuito alla stesura della sesta edizione. Abbiamo anche fatto buon uso dei validi suggerimenti di gruppi di studenti che hanno letto la maggior parte dei capitoli in bozze. Sono necessarie molte persone e molto lavoro per trasformare un lungo manoscritto e una tale quantità di materiale illustrativo in un libro di testo finito. La squadra di Garland Science che ha gestito questo lavoro è stata eccezionale. Denise Schanck, dirigendo le operazioni, ha mostrato pazienza, intuito ed energia durante tutto il percorso; ha guidato tutti noi in maniera efficace, assistita abilmente da Allie Bochicchio e Janette Scobie. Nigel Orme ha rivisto e controllato le modifiche alle illustrazioni e ha dato la veste grafica finale. Tiago Barros ci ha aiutato a rinnovare la presentazione delle strutture proteiche. Michael Morales, assistito da Leah Christians, ha prodotto e assemblato il complesso apparato di video, animazioni e altro materiale che costituisce il nucleo centrale delle risorse internet che accompagnano il libro. Adam Sendroff ha raccolto i preziosi giudizi di chi ha utilizzato il libro in ogni parte del mondo. Elizabeth Zayatz e Sherry Granum Lewis hanno messo a disposizione la loro esperienza di redattrici per organizzare le varie fasi di lavorazione del volume, insieme a Jo Clayton come revisore di testi e a Sally Huish come correttrice di bozze. Da Londra, Emily Preece e la squadra di professionisti di Garland ci hanno fornito competenze, energia e amicizia, seguendo ogni fase della revisione e rendendo l’intero processo molto piacevole. Gli autori sono estremamente fortunati a essere stati sostenuti così generosamente. Ringraziamo i nostri coniugi, le nostre famiglie, gli amici e i colleghi per il loro continuo sostegno che ancora una volta ha reso possibile la stesura di questo volume. PREFAZIONE © 978-88-08-62126-9 Mentre stavamo completando questa edizione, Julian Lewis, nostro coautore, amico e collega è stato sconfitto da un cancro con il quale ha combattuto eroicamente per dieci anni. Fin dal 1979 Julian ha dato contributi fondamentali a tutte le sei edizioni e, essendo una delle nostre penne più eleganti, ha elevato e migliorato sia lo stile che il tono espositivo di tutti i capitoli a cui ha lavorato. Apprezzato per il suo approccio accademico accurato, la chiarezza e la semplicità sono sempre state alla base del suo modo di scrivere. Julian è insostituibile e tutti noi sentiremo la mancanza della sua amicizia e della sua collaborazione. Dedichiamo questa sesta edizione alla sua memoria. V NOTE PER IL LETTORE ■ Struttura del libro Sebbene i capitoli di questo libro possano essere letti in maniera indipendente l’uno dall’altro, essi sono ordinati in una sequenza logica divisa in cinque parti. I primi tre capitoli della Parte I coprono i principi fondamentali e la biochimica di base e possono servire da introduzione per coloro che non hanno studiato biochimica o come corso di ripasso che coloro che invece già la conoscono. La Parte II tratta l’immagazzinamento, l’espressione e la trasmissione dell’informazione genetica. La Parte III presenta i fondamenti dei principali metodi sperimentali per studiare e analizzare le cellule e una nuova sezione intitolata Analisi matematica delle funzioni cellulari contenuta nel Capitolo 8, arricchisce ulteriormente la nostra comprensione della regolazione e della funzione della cellula. La Parte IV descrive l’organizzazione interna della cellula. La Parte V segue il comportamento delle cellule nei sistemi pluricellulari: comprende lo sviluppo di organismi pluricellulari e il capitolo sui patogeni e sulle infezioni e quello sul sistema immunitario innato e adattativo. ■ Problemi di fine capitolo Una lista selezionata di problemi, scritti da John Wilson e Tim Hunt, compare alla fine di ogni capitolo. In questa edizione sono stati aggiunti nuovi problemi relativi agli ultimi quattro capitoli sugli organismi pluricellulari. Le soluzioni complete di tutti i problemi si possono trovare in Molecular Biology of the Cell, Sixth Edition:The Problems Book. ■ Bibliografia Un conciso elenco di referenze bibliografiche selezionate si trova al termine di ogni capitolo. Tali referenze sono organizzate in ordine alfabetico sotto i titoli delle sezioni principali del capitolo e comprendono talvolta gli articoli originali nei quali importanti scoperte sono state riportate per la prima volta. ■ Termini del glossario In tutto il volume è stato usato il grassetto per mettere in evidenza i termini chiave nel punto del capitolo in cui vengono principalmente discussi. Il corsivo è stato utilizzato per evidenziare termini importanti con un grado minore di enfasi. Un ampio glossario disponibile all’indirizzo online.universita.zanichelli.it/alberts6e include i termini tecnici che sono di uso comune nel linguaggio della biologia cellulare; questo dovrebbe essere la prima risorsa per il lettore che incontra un termine non familiare. ■ Nomenclatura di geni e proteine Ogni specie ha la sua convenzione per denominare i geni; l’unica caratteristica comune è che essi sono sempre scritti in corsivo. In alcune specie (come quella umana) i nomi dei geni sono scritti in maiuscolo; in altre specie (come il pesce zebra) sono scritti in minuscolo; in altre ancora (come la maggioranza dei geni del topo) con la prima lettera maiuscola e le altre minuscole o (come in Drosophila) con combinazioni di lettere maiuscole e minuscole diverse a seconda che il primo allele mutante scoperto produca un fenotipo dominante o recessivo. Anche le convenzioni per denominare le proteine variano in modo simile. Questo caos tipografico fa diventare tutti matti. Non è solo fastidioso e assurdo ma è anche insostenibile. Non possiamo stabilire in maniera indipendente una nuova convenzione per ciascuna delle nuove specie fra i milioni di cui desidereremo in futuro studiare i geni. Inoltre, ci sono molte occasioni, specialmente in un testo come questo, in cui abbiamo bisogno di riferirci genericamente a un gene, senza dover specificare la versione del topo, quella umana, del pollo o dell’ippopotamo, perché sono tutte equivalenti per gli scopi della nostra discussione. Quindi, quale convenzione dovremmo usare? In questo volume abbiamo deciso di mettere da parte le diverse convenzioni utilizzate per specie individuali e di seguire una regola comune: abbiamo scritto tutti i nomi dei geni, come i nomi di persona e dei luoghi, con la prima lettera maiuscola e le altre minuscole, ma tutte in corsivo, per esempio Apc, Bazooka, Cdc2, Dishevelled, Egl1. La proteina corrispondente a ognuno di essi, quando prende il nome dal gene, è scritta nello stesso modo in caratteri normali anziché in corsivo, per esempio, Apc, Bazooka, Cdc2, Dishevelled, Egl1. Quando è necessario specificare l’organismo, ciò può essere fatto anteponendo un prefisso al nome del gene. Per completezza, elenchiamo alcuni ulteriori dettagli delle regole di nomenclatura che abbiamo seguito. In alcuni casi una lettera aggiunta al nome del gene viene tradizionalmente utilizzata per distinguere geni che sono tra loro in relazione funzionale o evolutiva: per tali geni abbiamo messo quella lettera in maiuscolo solo se è consuetudine fare così (Lacz, RecA, HoxA4). Non abbiamo usato trattini per separare dal resto del nome le lettere o i numeri aggiunti. Le proteine sono un problema più difficile. Molte di esse hanno nomi che seguono regole proprie, assegnati prima che venisse denominato il gene. Questi nomi di proteine hanno varie forme benché la maggioranza di essi inizi tradizionalmente con una lettera minuscola (actina, emoglobina, catalasi), come i nomi di sostanze ordinarie (formaggio, nylon) a meno che non siano acronimi (come GFP per Green Fluorescent Protein, proteina fluorescente verde, o BMP4 per Bone Morphogenetic Protein 4, proteina morfogenica dell’osso numero 4). Uniformare forzatamente tutti questi nomi sarebbe stata NOTE PER IL LETTORE VII © 978-88-08-62126-9 una violenza eccessiva nei confronti degli usi consolidati e quindi li abbiamo semplicemente scritti nel modo tradizionale (actina, GFP, e così via).Tuttavia, per i nomi dei geni corrispondenti a tutti questi casi abbiamo utilizzato la nostra regola standard: Actina, Emoglobina, Catalasi, Bmp4, Gfp. Quando è stato necessario mettere in evidenza il nome di una proteina scrivendolo in corsi- vo al fine di metterlo in risalto, tale intenzione risulterà generalmente chiara nel contesto. Per coloro che desiderano conoscere questi nomi la tabella riportata sotto mostra alcune delle convenzioni ufficiali per le singole specie, convenzioni che perlopiù abbiamo violato in questo testo, nel modo che abbiamo spiegato. Convenzione specie-specifica Convenzione unificata usata in questo libro Organismo Gene Proteina Gene Proteina Topo Hoxa4 Bmp4 integrina α-1, Itgα1 HOXA4 cyclops, cyc unc-6 sevenless, sev (così chiamato dal fenotipo mutante recessivo) Deformed, Dfd (così chiamato dal fenotipo mutante dominante) Hoxa4 BMP4 integrina α1 HOXA4 Cyclops, Cyc UNC-6 Sevenless, SEV HoxA4 Bmp4 Integrina α1, Itgα1 HoxA4 Cyclops, Cyc Unc6 Sevenless, Sev HoxA4 BMP4 integrina α1 HoxA4 Cyclops, Cyc Unc6 Sevenless, Sev Deformed, DFD Deformed, Dfd Deformed, Dfd CDC28 Cdc28, Cdc28p Cdc28 Cdc28 Cdc2 Cdc2, Cdc2p Cdc2 Cdc2 GAI uvrA GAI UvrA Gai UvrA GAI UvrA Uomo Pesce zebra Caenorhabditis Drosophila Lievito Saccharomyces cerevisiae (lievito gemmante) Schizosaccharomyces pombe (lievito a fissione) Arabidopsis E. coli Le risorse multimediali All’indirizzo online.universita.zanichelli.it/alberts6e sono disponibili: il glossario, le tecniche animate, i test interattivi a scelta multipla e (in lingua inglese) le animazioni, i filmati, le micrografie interattive. I filmati sono espressamente richiamati nel testo. Chi acquista il libro può inoltre scaricare gratuitamente l’ebook, seguendo le istruzioni presenti nel sito sopra indicato. L’ebook si legge con l’applicazione Booktab, che si scarica gratis da App Store (sistemi operativi Apple) o da Google Play (sistemi operativi Android). Per accedere alle risorse protette è necessario registrarsi su myzanichelli.it inserendo la chiave di attivazione personale contenuta nel libro. RINGRAZIAMENTI Nella stesura di questo volume abbiamo tratto grande aiuto dai consigli di molti biologi e biochimici.Vogliamo ringraziare i seguenti per i loro suggerimenti nella realizzazione di questa edizione (elencati per primi), come pure coloro che hanno contribuito alle edizioni precedenti. Generale: Steven Cook (Imperial College London), Jose A. Costoya (Universidade de Santiago de Compostela), Arshad Desai (University of California, San Diego), Susan K. Dutcher (Washington University, St. Louis), Michael Elowitz (California Institute of Technology), Benjamin S. Glick (University of Chicago), Gregory Hannon (Cold Spring Harbor Laboratories), Rebecca Heald (University of California, Berkeley), Stefan Kanzok (Loyola University Chicago), Doug Kellogg (University of California, Santa Cruz), David Kimelman (University of Washington, Seattle), Maria Krasilnikova (Pennsylvania State University),Werner Kühlbrandt (Max Planck Institute of Biophysics), Lewis Lanier (University of California, San Francisco), Annette Müller-Taubenberger (Ludwig Maximilians University), Sandra Schmid (University of Texas Southwestern), Ronald D.Vale (University of California, San Francisco), D. Eric Walters (Chicago Medical School), Karsten Weis (Swiss Federal Institute of Technology) Capitolo 2: H. Lill (VU University) Capitolo 3: David S. Eisenberg (University of California, Los Angeles), F. Ulrich Hartl (Max Planck Institute of Biochemistry), Louise Johnson (University of Oxford), H. Lill (VU University), Jonathan Weissman (University of California, San Francisco) Capitolo 4: Bradley E. Bernstein (Harvard Medical School),Wendy Bickmore (MRC Human Genetics Unit, Edinburgh), Jason Brickner (Northwestern University), Gary Felsenfeld (NIH), Susan M. Gasser (University of Basel), Shiv Grewal (National Cancer Institute), Gary Karpen (University of California, Berkeley), Eugene V. Koonin, (NCBI, NLM, NIH), Hiten Madhani (University of California, San Francisco), Tom Misteli (National Cancer Institute), Geeta Narlikar (University of California, San Francisco), Maynard Olson (University of Washington, Seattle), Stephen Scherer (University of Toronto), Rolf Sternglanz (Stony Brook University), Chris L.Woodcock (University of Massachusetts, Amherst), Johanna Wysocka and lab members (Stanford School of Medicine) Capitolo 5: Oscar Aparicio (University of Southern California), Julie P. Cooper (National Cancer Institute), Neil Hunter (Howard Hughes Medical Institute), Karim Labib (University of Manchester), Joachim Li (University of California, San Francisco), Stephen West (Cancer Research UK), Richard D.Wood (University of Pittsburgh Cancer Institute) Capitolo 6: Briana Burton (Harvard University), Richard H. Ebright (Rutgers University), Daniel Finley (Harvard Medical School), Michael R. Green (University of Massachusetts Medical School), Christine Guthrie (University of California, San Francisco), Art Horwich (Yale School of Medicine), Harry Noller (University of California, Santa Cruz), David Tollervey (University of Edinburgh), Alexander J.Varshavsky (California Institute of Technology) Capitolo 7: Adrian Bird (The Wellcome Trust Centre, UK), Neil Brockdorff (University of Oxford), Christine Guthrie (University of California, San Francisco), Jeannie Lee (Harvard Medical School), Michael Levine (University of California, Berkeley), Hiten Madhani (University of California, San Francisco), Duncan Odom (Cancer Research UK), Kevin Struhl (Harvard Medical School), Jesper Svejstrup (Cancer Research UK) Capitolo 8: Hana El-Samad [contributo principale] (University of California, San Francisco), Karen Hopkin [contributo principale], Donita Brady (Duke University), David Kashatus (University of Virginia), Melanie McGill (University of Toronto), Alex Mogilner (University of California, Davis), Richard Morris (John Innes Centre, UK), Prasanth Potluri (The Children’s Hospital of Philadelphia Research Institute), Danielle Vidaurre (University of Toronto), Carmen Warren (University of California, Los Angeles), Ian Woods (Ithaca College) Capitolo 9: Douglas J. Briant (University of Victoria), Werner Kühlbrandt (Max Planck Institute of Biophysics), Jeffrey Lichtman (Harvard University), Jennifer Lippincott-Schwartz (NIH), Albert Pan (Georgia Regents University), Peter Shaw (John Innes Centre, UK), Robert H. Singer (Albert Einstein School of Medicine), Kurt Thorn (University of California, San Francisco) Capitolo 10: Ari Helenius (Swiss Federal Institute of Technology),Werner Kühlbrandt (Max Planck Institute of Biophysics), H. Lill (VU University), Satyajit Mayor (National Centre for Biological Sciences, India), Kai Simons (Max Planck Institute of Molecular Cell Biology and Genetics), Gunnar von Heijne (Stockholm University),Tobias Walther (Harvard University) Capitolo 11: Graeme Davis (University of California, San Francisco), Robert Edwards (University of California, San Francisco), Bertil Hille (University of Washington, Seattle), Lindsay Hinck (University of California, Santa Cruz),Werner Kühlbrandt (Max Planck RINGRAZIAMENTI IX © 978-88-08-62126-9 Institute of Biophysics), H. Lill (VU University), Roger Nicoll (University of California, San Francisco), Poul Nissen (Aarhus University), Robert Stroud (University of California, San Francisco), Karel Svoboda (Howard Hughes Medical Institute), Robert Tampé (GoetheUniversity Frankfurt) Capitolo 12: John Aitchison (Institute for System Biology, Seattle), Amber English (University of Colorado at Boulder), Ralf Erdmann (Ruhr University of Bochum), Larry Gerace (The Scripps Research Institute, La Jolla), Ramanujan Hegde (MRC Laboratory of Molecular Biology, Cambridge, UK), Martin W. Hetzer (The Salk Institute), Lindsay Hinck (University of California, Santa Cruz), James A. McNew (Rice University), Nikolaus Pfanner (University of Freiberg), Peter Rehling (University of Göttingen), Michael Rout (The Rockefeller University), Danny J. Schnell (University of Massachusetts, Amherst), Sebastian Schuck (University of Heidelberg), Suresh Subramani (University of California, San Diego), Gia Voeltz (University of Colorado, Boulder), Susan R.Wente (Vanderbilt University School of Medicine) Capitolo 13: Douglas J. Briant (University of Victoria, Canada), Scott D. Emr (Cornell University), Susan Ferro-Novick (University of California, San Diego), Benjamin S. Glick (University of Chicago), Ari Helenius (Swiss Federal Institute of Technology), Lindsay Hinck (University of California, Santa Cruz), Reinhard Jahn (Max Planck Institute for Biophysical Chemistry), Ira Mellman (Genentech), Peter Novick (University of California, San Diego), Hugh Pelham (MRC Laboratory of Molecular Biology, Cambridge, UK), Graham Warren (Max F. Perutz Laboratories,Vienna), Marino Zerial (Max Planck Institute of Molecular Cell Biology and Genetics) Capitolo 14: Werner Kühlbrandt [contributo principale] (Max Planck Institute of Biophysics),Thomas D. Fox (Cornell University), Cynthia Kenyon (University of California, San Francisco), Nils-Göran Larsson (Max Planck Institute for Biology of Aging), Jodi Nunnari (University of California, Davis), Patrick O’Farrell (University of California, San Francisco), Alastair Stewart (The Victor Chang Cardiac Research Institute, Australia), Daniela Stock (The Victor Chang Cardiac Research Institute, Australia), Michael P.Yaffe (California Institute for Regenerative Medicine) Capitolo 15: Henry R. Bourne (University of California, San Francisco), Dennis Bray (University of Cambridge), Douglas J. Briant (University of Victoria, Canada), James Briscoe (MRC National Institute for Medical Research, UK), James Ferrell (Stanford University), Matthew Freeman (MRC Laboratory of Molecular Biology, Cambridge, UK), Alan Hall (Memorial Sloan Kettering Cancer Center), CarlHenrik Heldin (Uppsala University), James A. McNew (Rice University), Roel Nusse (Stanford University), Julie Pitcher (University College London) Capitolo 16: Rebecca Heald [contributo principale] (University of California, Berkeley), Anna Akhmanova (Utrecht University), Arshad Desai (University of California, San Diego),Velia Fowler (The Scripps Research Institute, La Jolla),Vladimir Gelfand (Northwestern University), Robert Goldman (Northwestern University), Alan Rick Horwitz (University of Virginia),Wallace Marshall (University of California, San Francisco), J. Richard McIntosh (University of Colorado, Boulder), Maxence Nachury (Stanford School of Medicine), Eva Nogales (University of California, Berkeley), Samara Reck-Peterson (Harvard Medical School), Ronald D.Vale (University of California, San Francisco), Richard B.Vallee (Columbia University), Michael Way (Cancer Research UK), Orion Weiner (University of California, San Francisco), Matthew Welch (University of California, Berkeley) Capitolo 17: Douglas J. Briant (University of Victoria, Canada), Lindsay Hinck (University of California, Santa Cruz), James A. McNew (Rice University) Capitolo 18: Emily D. Crawford (University of California, San Francisco), James A. McNew (Rice University), Shigekazu Nagata (Kyoto University), Jim Wells (University of California, San Francisco) Capitolo 19: Jeffrey Axelrod (Stanford University School of Medicine), John Couchman (University of Copenhagen), Johan de Rooij (The Hubrecht Institute, Utrecht), Benjamin Geiger (Weizmann Institute of Science, Israel), Andrew P. Gilmore (University of Manchester),Tony Harris (University of Toronto), Martin Humphries (University of Manchester), Andreas Prokop (University of Manchester), Charles Streuli (University of Manchester), Masatoshi Takeichi (RIKEN Center for Developmental Biology, Japan), Barry Thompson (Cancer Research UK), Kenneth M.Yamada (NIH), Alpha Yap (The University of Queensland, Australia) Capitolo 20: Anton Berns (Netherlands Cancer Institute), J. Michael Bishop (University of California, San Francisco),Trever Bivona (University of California, San Francisco), Fred Bunz (Johns Hopkins University), Paul Edwards (University of Cambridge), Ira Mellman (Genentech), Caetano Reis e Sousa (Cancer Research UK), Marc Shuman (University of California, San Francisco), Mike Stratton (Wellcome Trust Sanger Institute, UK), Ian Tomlinson (Cancer Research UK) Capitolo 21: Alex Schier [contributo principale] (Harvard University), Markus Affolter (University of Basel),Victor Ambros (University of Massachusetts, Worcester), James Briscoe (MRC National Institute for Medical Research, UK), Donald Brown (Carnegie Institution for Science, Baltimore), Steven Burden (New York University School of Medicine), Moses Chao (New York University School of Medicine), Caroline Dean (John Innes Centre, UK), Chris Doe (University of Oregon, Eugene), Uwe Drescher (King’s College London), Gordon Fishell (New York University School of Medicine), Brigid Hogan (Duke University), Phil Ingham (Institute of Molecular and Cell Biology, Singapore), Laura Johnston (Columbia University), David Kingsley (Stanford University),Tom Kornberg (University of California, San Francisco), Richard Mann (Columbia University), Andy McMahon (University of Southern California), Marek Mlodzik (Mount Sinai Hospital, New York), Patrick O’Farrell (University of California, San Francisco), Duojia Pan (Johns Hopkins RINGRAZIAMENTI X Medical School), Olivier Pourquie (Harvard Medical School), Erez Raz (University of Muenster), Chris Rushlow (New York University), Stephen Small (New York University), Marc Tessier-Lavigne (Rockefeller University) Capitolo 22: Simon Hughes (King’s College London), Rudolf Jaenisch (Massachusetts Institute of Technology), Arnold Kriegstein (University of California, San Francisco), Doug Melton (Harvard University), Stuart Orkin (Harvard University),Thomas A. Reh (University of Washington, Seattle), Amy Wagers (Harvard University), Fiona M.Watt (Wellcome Trust Centre for Stem Cell Research, UK), Douglas J.Winton (Cancer Research UK), Shinya Yamanaka (Kyoto University) Capitolo 23: Matthew Welch [contributo principale] (University of California, Berkeley), Ari Helenius (Swiss Federal Institute of Technology), Dan Portnoy (University of California, Berkeley), David Sibley (Washington University, St. Louis), Michael Way (Cancer Research UK) Capitolo 24: Lewis Lanier (University of California, San Francisco). Lettori: Najla Arshad (Indian Institute of Science), Venice Chiueh (University of California, Berkeley), Quyen Huynh (University of Toronto), Rachel Kooistra (Loyola University, Chicago),Wes Lewis (University of Alabama), Eric Nam (University of Toronto),Vladislav Ryvkin (Stony Brook University), Laasya Samhita (Indian Institute of Science), John Senderak (Jefferson Medical College), Phillipa Simons (Imperial College, UK), Anna Constance Vind (University of Copenhagen), Steve Wellard (Pennsylvania State University), Evan Whitehead (University of California, Berkeley), Carrie Wilczewski (Loyola University, Chicago), Anna Wing (Pennsylvania State University), John Wright (University of Alabama) Prima, seconda, terza, quarta e quinta edizione: Jerry Adams (The Walter and Eliza Hall Institute of Medical Research, Australia), Ralf Adams (London Research Institute), David Agard (University of California, San Francisco), Julie Ahringer (The Gurdon Institute, UK), Michael Akam (University of Cambridge), David Allis (The Rockefeller University), Wolfhard Almers (Oregon Health and Science University), Fred Alt (CBR Institute for Biomedical Research, Boston), Linda Amos (MRC Laboratory of Molecular Biology, Cambridge), Raul Andino (University of California, San Francisco), Clay Armstrong (University of Pennsylvania), Martha Arnaud (University of California, San Francisco), Spyros Artavanis-Tsakonas (Harvard Medical School), Michael Ashburner (University of Cambridge), Jonathan Ashmore (University College London), Laura Attardi (Stanford University),Tayna Awabdy (University of California, San Francisco), Jeffrey Axelrod (Stanford University Medical Center), Peter Baker (deceduto), David Baldwin (Stanford University), Michael Banda (University of California, San Francisco), Cornelia Bargmann (The Rockefeller University), Ben Barres (Stanford University), David Bartel (Massachusetts Institute of Technology), Konrad Basler (University of © 978-88-08-62126-9 Zurich),Wolfgang Baumeister (Max Planck Institute of Biochemistry), Michael Bennett (Albert Einstein College of Medicine), Darwin Berg (University of California, San Diego), Anton Berns (Netherlands Cancer Institute), Merton Bernfield (Harvard Medical School), Michael Berridge (The Babraham Institute, Cambridge, UK),Walter Birchmeier (Max Delbrück Center for Molecular Medicine, Germany), Adrian Bird (Wellcome Trust Centre, UK), David Birk (UMDNJ— Robert Wood Johnson Medical School), Michael Bishop (University of California, San Francisco), Elizabeth Blackburn (University of California, San Francisco),Tim Bliss (National Institute for Medical Research, London), Hans Bode (University of California, Irvine), Piet Borst (Jan Swammerdam Institute, University of Amsterdam), Henry Bourne (University of California, San Francisco), Alan Boyde (University College London), Martin Brand (University of Cambridge), Carl Branden (deceduto), Andre Brandli (Swiss Federal Institute of Technology, Zurich), Dennis Bray (University of Cambridge), Mark Bretscher (MRC Laboratory of Molecular Biology, Cambridge), James Briscoe (National Institute for Medical Research, UK), Marianne Bronner-Fraser (California Institute of Technology), Robert Brooks (King’s College London), Barry Brown (King’s College London), Michael Brown (University of Oxford), Michael Bulger (University of Rochester Medical Center), Fred Bunz (Johns Hopkins University), Steve Burden (New York University of Medicine), Max Burger (University of Basel), Stephen Burley (SGX Pharmaceuticals), Keith Burridge (University of North Carolina, Chapel Hill), John Cairns (Radcliffe Infirmary, Oxford), Patricia Calarco (University of California, San Francisco), Zacheus Cande (University of California, Berkeley), Lewis Cantley (Harvard Medical School), Charles Cantor (Columbia University), Roderick Capaldi (University of Oregon), Mario Capecchi (University of Utah), Michael Carey (University of California, Los Angeles), Adelaide Carpenter (University of California, San Diego), John Carroll (University College London),Tom Cavalier-Smith (King’s College London), Pierre Chambon (University of Strasbourg), Hans Clevers (Hubrecht Institute,The Netherlands), Enrico Coen (John Innes Institute, Norwich, UK), Philip Cohen (University of Dundee, Scotland), Robert Cohen (University of California, San Francisco), Stephen Cohen (EMBL Heidelberg, Germany), Roger Cooke (University of California, San Francisco), John Cooper (Washington University School of Medicine, St. Louis), Michael Cox (University of Wisconsin, Madison), Nancy Craig (Johns Hopkins University), James Crow (University of Wisconsin, Madison), Stuart Cull-Candy (University College London), Leslie Dale (University College London), Caroline Damsky (University of California, San Francisco), Johann De Bono (The Institute of Cancer Research, UK), Anthony DeFranco (University of California, San Francisco), Abby Dernburg (University of California, Berkeley), Arshad Desai (University of California, San Diego), Michael Dexter (The Wellcome Trust, UK), John Dick (University of Toronto, Canada), Christopher Dobson (University of Cambridge), Russell Doolittle (University of California, San Diego),W. Ford Doolittle (Dalhousie University, Canada), Julian Downward (Cancer Research UK), Keith Dudley (King’s College London), Graham Dunn (MRC Cell Biophysics Unit, London), Jim RINGRAZIAMENTI XI © 978-88-08-62126-9 Dunwell (John Innes Institute, Norwich, UK), Bruce Edgar (Fred Hutchinson Cancer Research Center, Seattle), Paul Edwards (University of Cambridge), Robert Edwards (University of California, San Francisco), David Eisenberg (University of California, Los Angeles), Sarah Elgin (Washington University, St. Louis), Ruth Ellman (Institute of Cancer Research, Sutton, UK), Beverly Emerson (The Salk Institute), Charles Emerson (University of Virginia), Scott D. Emr (Cornell University), Sharyn Endow (Duke University), Lynn Enquist (Princeton University),Tariq Enver (Institute of Cancer Research, London), David Epel (Stanford University), Gerard Evan (University of California, Comprehensive Cancer Center), Ray Evert (University of Wisconsin, Madison), Matthias Falk (Lehigh University), Stanley Falkow (Stanford University), Douglas Fearon (University of Cambridge), Gary Felsenfeld (NIH), Stuart Ferguson (University of Oxford), James Ferrell (Stanford University), Christine Field (Harvard Medical School), Daniel Finley (Harvard University), Gary Firestone (University of California, Berkeley), Gerald Fischbach (Columbia University), Robert Fletterick (University of California, San Francisco), Harvey Florman (Tufts University), Judah Folkman (Harvard Medical School), Larry Fowke (University of Saskatchewan, Canada), Jennifer Frazier (Exploratorium¨, San Francisco), Matthew Freeman (Laboratory of Molecular Biology, UK), Daniel Friend (University of California, San Francisco), Elaine Fuchs (University of Chicago), Joseph Gall (Carnegie Institution of Washington), Richard Gardner (University of Oxford), Anthony Gardner-Medwin (University College London), Peter Garland (Institute of Cancer Research, London), David Garrod (University of Manchester, UK), Susan M. Gasser (University of Basel), Walter Gehring (Biozentrum, University of Basel), Benny Geiger (Weizmann Institute of Science, Rehovot, Israel), Larry Gerace (The Scripps Research Institute), Holger Gerhardt (London Research Institute), John Gerhart (University of California, Berkeley), Günther Gerisch (Max Planck Institute of Biochemistry), Frank Gertler (Massachusetts Institute of Technology), Sankar Ghosh (Yale University School of Medicine), Alfred Gilman (The University of Texas Southwestern Medical Center), Reid Gilmore (University of Massachusetts, Amherst), Bernie Gilula (deceduto), Charles Gilvarg (Princeton University), Benjamin S. Glick (University of Chicago), Michael Glotzer (University of Chicago), Larry Goldstein (University of California, San Diego), Bastien Gomperts (University College Hospital Medical School, London), Daniel Goodenough (Harvard Medical School), Jim Goodrich (University of Colorado, Boulder), Jeffrey Gordon (Washington University, St. Louis), Peter Gould (Middlesex Hospital Medical School, London), Alan Grafen (University of Oxford), Walter Gratzer (King’s College London), Michael Gray (Dalhousie University), Douglas Green (St. Jude Children’s Hospital), Howard Green (Harvard University), Michael Green (University of Massachusetts, Amherst), Leslie Grivell (University of Amsterdam), Carol Gross (University of California, San Francisco), Frank Grosveld (Erasmus Universiteit,The Netherlands), Michael Grunstein (University of California, Los Angeles), Barry Gumbiner (Memorial Sloan Kettering Cancer Center), Brian Gunning (Australian National University, Canberra), Christine Guthrie (University of California, San Francisco), James Haber (Brandeis University), Ernst Hafen (Universitat Zurich), David Haig (Harvard University), Andrew Halestrap (University of Bristol, UK), Alan Hall (Memorial Sloan Kettering Cancer Center), Jeffrey Hall (Brandeis University), John Hall (University of Southampton, UK), Zach Hall (University of California, San Francisco), Douglas Hanahan (University of California, San Francisco), David Hanke (University of Cambridge), Nicholas Harberd (University of Oxford), Graham Hardie (University of Dundee, Scotland), Richard Harland (University of California, Berkeley), Adrian Harris (Cancer Research UK), John Harris (University of Otago, New Zealand), Stephen Harrison (Harvard University), Leland Hartwell (University of Washington, Seattle), Adrian Harwood (MRC Laboratory for Molecular Cell Biology and Cell Biology Unit, London), Scott Hawley (Stowers Institute for Medical Research, Kansas City), Rebecca Heald (University of California, Berkeley), John Heath (University of Birmingham, UK), Ramanujan Hegde (NIH), Carl-Henrik Heldin (Uppsala University), Ari Helenius (Swiss Federal Institute of Technology), Richard Henderson (MRC Laboratory of Molecular Biology, Cambridge, UK), Glenn Herrick (University of Utah), Ira Herskowitz (deceduto), Bertil Hille (University of Washington, Seattle), Alan Hinnebusch (NIH, Bethesda), Brigid Hogan (Duke University), Nancy Hollingsworth (State University of New York, Stony Brook), Frank Holstege (University Medical Center,The Netherlands), Leroy Hood (Institute for Systems Biology, Seattle), John Hopfield (Princeton University), Robert Horvitz (Massachusetts Institute of Technology), Art Horwich (Yale University School of Medicine), David Housman (Massachusetts Institute of Technology), Joe Howard (Max Planck Institute of Molecular Cell Biology and Genetics), Jonathan Howard (University of Washington, Seattle), James Hudspeth (The Rockefeller University), Simon Hughes (King’s College London), Martin Humphries (University of Manchester, UK),Tim Hunt (Cancer Research UK), Neil Hunter (University of California, Davis), Laurence Hurst (University of Bath, UK), Jeremy Hyams (University College London),Tony Hyman (Max Planck Institute of Molecular Cell Biology and Genetics), Richard Hynes (Massachusetts Institute of Technology), Philip Ingham (University of Sheffield, UK), Kenneth Irvine (Rutgers University), Robin Irvine (University of Cambridge), Norman Iscove (Ontario Cancer Institute,Toronto), David Ish-Horowicz (Cancer Research UK), Lily Jan (University of California, San Francisco), Charles Janeway (deceduto),Tom Jessell (Columbia University), Arthur Johnson (Texas A&M University), Louise Johnson (deceduto), Andy Johnston (John Innes Institute, Norwich, UK), E.G. Jordan (Queen Elizabeth College, London), Ron Kaback (University of California, Los Angeles), Michael Karin (University of California, San Diego), Eric Karsenti (European Molecular Biology Laboratory, Germany), Ken Keegstra (Michigan State University), Ray Keller (University of California, Berkeley), Douglas Kellogg (University of California, Santa Cruz), Regis Kelly (University of California, San Francisco), John Kendrick-Jones (MRC Laboratory of Molecular Biology, Cambridge), Cynthia Kenyon (University of California, San Francisco), Roger Keynes (University of Cambridge), Judith Kimble (University of Wisconsin, RINGRAZIAMENTI XII Madison), Robert Kingston (Massachusetts General Hospital), Marc Kirschner (Harvard University), Richard Klausner (NIH), Nancy Kleckner (Harvard University), Mike Klymkowsky (University of Colorado, Boulder), Kelly Komachi (University of California, San Francisco), Eugene Koonin (NIH), Juan Korenbrot (University of California, San Francisco), Roger Kornberg (Stanford University),Tom Kornberg (University of California, San Francisco), Stuart Kornfeld (Washington University, St. Louis), Daniel Koshland (University of California, Berkeley), Douglas Koshland (Carnegie Institution of Washington, Baltimore), Marilyn Kozak (University of Pittsburgh), Mark Krasnow (Stanford University), Werner Kühlbrandt (Max Planck Institute for Biophysics), John Kuriyan (University of California, Berkeley), Robert Kypta (MRC Laboratory for Molecular Cell Biology, London), Peter Lachmann (MRC Centre, Cambridge), Ulrich Laemmli (University of Geneva, Switzerland),Trevor Lamb (University of Cambridge), Hartmut Land (Cancer Research UK), David Lane (University of Dundee, Scotland), Jane Langdale (University of Oxford), Lewis Lanier (University of California, San Francisco), Jay Lash (University of Pennsylvania), Peter Lawrence (MRC Laboratory of Molecular Biology, Cambridge), Paul Lazarow (Mount Sinai School of Medicine), Robert J. Lefkowitz (Duke University), Michael Levine (University of California, Berkeley),Warren Levinson (University of California, San Francisco), Alex Levitzki (Hebrew University, Israel), Ottoline Leyser (University of York, UK), Joachim Li (University of California, San Francisco),Tomas Lindahl (Cancer Research UK),Vishu Lingappa (University of California, San Francisco), Jennifer Lippincott-Schwartz (NIH), Joseph Lipsick (Stanford University School of Medicine), Dan Littman (New York University School of Medicine), Clive Lloyd (John Innes Institute, Norwich, UK), Richard Locksley (University of California, San Francisco), Richard Losick (Harvard University), Daniel Louvard (Institut Curie, France), Robin Lovell-Badge (National Institute for Medical Research, London), Scott Lowe (Cold Spring Harbor Laboratory), Shirley Lowe (University of California, San Francisco), Reinhard Lührman (Max Planck Institute of Biophysical Chemistry), Michael Lynch (Indiana University), Laura Machesky (University of Birmingham, UK), Hiten Madhani (University of California, San Francisco), James Maller (University of Colorado Medical School),Tom Maniatis (Harvard University), Colin Manoil (Harvard Medical School), Elliott Margulies (NIH), Philippa Marrack (National Jewish Medical and Research Center, Denver), Mark Marsh (Institute of Cancer Research, London),Wallace Marshall (University of California, San Francisco), Gail Martin (University of California, San Francisco), Paul Martin (University College London), Joan Massagué (Memorial Sloan Kettering Cancer Center), Christopher Mathews (Oregon State University), Brian McCarthy (University of California, Irvine), Richard McCarty (Cornell University),William McGinnis (University of California, San Diego), Anne McLaren (Wellcome/ Cancer Research Campaign Institute, Cambridge), Frank McNally (University of California, Davis), Freiderick Meins (Freiderich Miescher Institut, Basel), Stephanie Mel (University of California, San Diego), Ira Mellman (Genentech), Barbara Meyer (University of California, Berkeley), Elliot Meyerowitz (California © 978-88-08-62126-9 Institute of Technology), Chris Miller (Brandeis University), Robert Mishell (University of Birmingham, UK), Avrion Mitchison (University College London), N.A. Mitchison (University College London),Timothy Mitchison (Harvard Medical School), Quinn Mitrovich (University of California, San Francisco), Peter Mombaerts (The Rockefeller University), Mark Mooseker (Yale University), David Morgan (University of California, San Francisco), Michelle Moritz (University of California, San Francisco), Montrose Moses (Duke University), Keith Mostov (University of California, San Francisco), Anne Mudge (University College London), Hans Müller-Eberhard (Scripps Clinic and Research Institute), Alan Munro (University of Cambridge), J. Murdoch Mitchison (Harvard University), Richard Myers (Stanford University), Diana Myles (University of California, Davis), Andrew Murray (Harvard University), Shigekazu Nagata (Kyoto University, Japan), Geeta Narlikar (University of California, San Francisco), Kim Nasmyth (University of Oxford), Mark E. Nelson (University of Illinois, UrbanaChampaign), Michael Neuberger (deceduto),Walter Neupert (University of Munich, Germany), David Nicholls (University of Dundee, Scotland), Roger Nicoll (University of California, San Francisco), Suzanne Noble (University of California, San Francisco), Harry Noller (University of California, Santa Cruz), Jodi Nunnari (University of California, Davis), Paul Nurse (Francis Crick Institute), Roel Nusse (Stanford University), Michael Nussenzweig (Rockefeller University), Duncan O’Dell (deceduto), Patrick O’Farrell (University of California, San Francisco), Bjorn Olsen (Harvard Medical School), Maynard Olson (University of Washington, Seattle), Stuart Orkin (Harvard University), Terry Orr-Weaver (Massachusetts Institute of Technology), Erin O’Shea (Harvard University), Dieter Osterhelt (Max Planck Institute of Biochemistry), William Otto (Cancer Research UK), John Owen (University of Birmingham, UK), Dale Oxender (University of Michigan), George Palade (deceduto), Barbara Panning (University of California, San Francisco), Roy Parker (University of Arizona,Tucson), William W. Parson (University of Washington, Seattle), Terence Partridge (MRC Clinical Sciences Centre, London),William E. Paul (NIH),Tony Pawson (deceduto), Hugh Pelham (MRC, UK), Robert Perry (Institute of Cancer Research, Philadelphia), Gordon Peters (Cancer Research UK), Greg Petsko (Brandeis University), Nikolaus Pfanner (University of Freiburg, Germany), David Phillips (The Rockefeller University), Jeremy Pickett-Heaps (The University of Melbourne, Australia), Jonathan Pines (Gurdon Institute, Cambridge), Julie Pitcher (University College London), Jeffrey Pollard (Albert Einstein College of Medicine), Tom Pollard (Yale University), Bruce Ponder (University of Cambridge), Daniel Portnoy (University of California, Berkeley), James Priess (University of Washington, Seattle), Darwin Prockop (Tulane University), Mark Ptashne (Memorial Sloan Kettering Cancer Center), Dale Purves (Duke University), Efraim Racker (Cornell University), Jordan Raff (University of Oxford), Klaus Rajewsky (Max Delbrück Center for Molecular Medicine, Germany), George Ratcliffe (University of Oxford), Elio Raviola (Harvard Medical School), Martin Rechsteiner (University of Utah, Salt Lake City), David Rees (National Institute for Medical Research, London), RINGRAZIAMENTI © 978-88-08-62126-9 Thomas A. Reh (University of Washington, Seattle), Louis Reichardt (University of California, San Francisco), Renee Reijo (University of California, San Francisco), Caetano Reis e Sousa (Cancer Research UK), Fred Richards (Yale University), Conly Rieder (Wadsworth Center, Albany), Phillips Robbins (Massachusetts Institute of Technology), Elizabeth Robertson (The Wellcome Trust Centre for Human Genetics, UK), Elaine Robson (University of Reading, UK), Robert Roeder (The Rockefeller University), Joel Rosenbaum (Yale University), Janet Rossant (Mount Sinai Hospital,Toronto), Jesse Roth (NIH), Jim Rothman (Memorial Sloan Kettering Cancer Center), Rodney Rothstein (Columbia University), Erkki Ruoslahti (La Jolla Cancer Research Foundation), Gary Ruvkun (Massachusetts General Hospital), David Sabatini (New York University), Alan Sachs (University of California, Berkeley), Edward Salmon (University of North Carolina, Chapel Hill), Aziz Sancar (University of North Carolina, Chapel Hill), Joshua Sanes (Harvard University), Peter Sarnow (Stanford University), Lisa Satterwhite (Duke University Medical School), Robert Sauer (Massachusetts Institute of Technology), Ken Sawin (The Wellcome Trust Centre for Cell Biology, UK), Howard Schachman (University of California, Berkeley), Gerald Schatten (Pittsburgh Development Center), Gottfried Schatz (Biozentrum, University of Basel), Randy Schekman (University of California, Berkeley), Richard Scheller (Stanford University), Giampietro Schiavo (Cancer Research UK), Ueli Schibler (University of Geneva, Switzerland), Joseph Schlessinger (New York University Medical Center), Danny J. Schnell (University of Massachusetts, Amherst), Michael Schramm (Hebrew University, Israel), Robert Schreiber (Washington University School of Medicine), James Schwartz (Columbia University), Ronald Schwartz (NIH), François Schweisguth (Institut Pasteur, France), John Scott (University of Manchester, UK), John Sedat (University of California, San Francisco), Peter Selby (Cancer Research UK), Zvi Sellinger (Hebrew University, Israel), Gregg Semenza (Johns Hopkins University), Philippe Sengel (University of Grenoble, France), Peter Shaw (John Innes Institute, Norwich, UK), Michael Sheetz (Columbia University), Morgan Sheng (Massachusetts Institute of Technology), Charles Sherr (St. Jude Children’s Hospital), David Shima (Cancer Research UK), Samuel Silverstein (Columbia University), Melvin I. Simon (California Institute of Technology), Kai Simons (Max Planck Institute of Molecular Cell Biology and Genetics), Jonathan Slack (Cancer Research UK), Alison Smith (John Innes Institute, Norfolk, UK), Austin Smith (University of Edinburgh, UK), Jim Smith (The Gurdon Institute, UK), John Maynard Smith (University of Sussex, UK), Mitchell Sogin (Woods Hole Institute), Frank Solomon (Massachusetts Institute of Technology), Michael Solursh (University of Iowa), Bruce Spiegelman (Harvard Medical School),Timothy Springer (Harvard Medical School), Mathias Sprinzl (University of Bayreuth, Germany), Scott Stachel (University of California, Berkeley), Andrew Staehelin (University of Colorado, Boulder), David Standring (University of California, San Francisco), Margaret Stanley (University of Cambridge), Martha Stark (University of California, San Francisco),Wilfred Stein (Hebrew University, Israel), Malcolm Steinberg (Princeton University), Ralph XIII Steinman (deceduto), Len Stephens (The Babraham Institute, UK), Paul Sternberg (California Institute of Technology), Chuck Stevens (The Salk Institute), Murray Stewart (MRC Laboratory of Molecular Biology, Cambridge), Bruce Stillman (Cold Spring Harbor Laboratory), Charles Streuli (University of Manchester, UK), Monroe Strickberger (University of Missouri, St. Louis), Robert Stroud (University of California, San Francisco), Michael Stryker (University of California, San Francisco),William Sullivan (University of California, Santa Cruz), Azim Surani (The Gurdon Institute, University of Cambridge), Daniel Szollosi (Institut National de la Recherche Agronomique, France), Jack Szostak (Harvard Medical School), Clifford Tabin (Harvard Medical School), Masatoshi Takeichi (RIKEN Center for Developmental Biology, Japan), Nicolas Tapon (London Research Institute), Diethard Tautz (University of Cologne, Germany), Julie Theriot (Stanford University), Roger Thomas (University of Bristol, UK), Craig Thompson (Memorial Sloan Kettering Cancer Center), Janet Thornton (European Bioinformatics Institute, UK), Vernon Thornton (King’s College London), Cheryll Tickle (University of Dundee, Scotland), Jim Till (Ontario Cancer Institute,Toronto), Lewis Tilney (University of Pennsylvania), David Tollervey (University of Edinburgh, UK), Ian Tomlinson (Cancer Research UK), Nick Tonks (Cold Spring Harbor Laboratory), Alain Townsend (Institute of Molecular Medicine, John Radcliffe Hospital, Oxford), Paul Travers (Scottish Institute for Regeneration Medicine), Robert Trelstad (UMDNJ—Robert Wood Johnson Medical School), Anthony Trewavas (Edinburgh University, Scotland), Nigel Unwin (MRC Laboratory of Molecular Biology, Cambridge),Victor Vacquier (University of California, San Diego), Ronald D.Vale (University of California, San Francisco),Tom Vanaman (University of Kentucky), Harry van der Westen (Wageningen,The Netherlands), Harold Varmus (National Cancer Institute, United States), Alexander J.Varshavsky (California Institute of Technology), Donald Voet (University of Pennsylvania), Harald von Boehmer (Harvard Medical School), Madhu Wahi (University of California, San Francisco),Virginia Walbot (Stanford University), Frank Walsh (GlaxoSmithKline, UK),Trevor Wang (John Innes Institute, Norwich, UK), Xiaodong Wang (The University of Texas Southwestern Medical School),YuLie Wang (Worcester Foundation for Biomedical Research, MA), Gary Ward (University of Vermont), Anne Warner (University College London), Graham Warren (Yale University School of Medicine), Paul Wassarman (Mount Sinai School of Medicine), Clare Waterman-Storer (The Scripps Research Institute), Fiona Watt (Cancer Research UK), John Watts (John Innes Institute, Norwich, UK), Klaus Weber (Max Planck Institute for Biophysical Chemistry), Martin Weigert (Institute of Cancer Research, Philadelphia), Robert Weinberg (Massachusetts Institute of Technology), Harold Weintraub (deceduto), Karsten Weis (Swiss Federal Institute of Technology), Irving Weissman (Stanford University), Jonathan Weissman (University of California, San Francisco), Susan R.Wente (Vanderbilt University School of Medicine), Norman Wessells (University of Oregon, Eugene), Stephen West (Cancer Research UK), Judy White (University of Virginia), William Wickner (Dartmouth College), Michael Wilcox RINGRAZIAMENTI XIV (deceduto), Lewis T.Williams (Chiron Corporation), Patrick Williamson (University of Massachusetts, Amherst), Keith Willison (Chester Beatty Laboratories, London), John Wilson (Baylor University), Alan Wolffe (deceduto), Richard Wolfenden (University of North Carolina, Chapel Hill), Sandra Wolin (Yale University School of Medicine), Lewis Wolpert (University College London), Richard D.Wood (University of Pittsburgh Cancer Institute), Abraham Worcel (University of Rochester), Nick Wright (Cancer Research UK), John © 978-88-08-62126-9 Wyke (Beatson Institute for Cancer Research, Glasgow), Michael P.Yaffe (California Institute for Regenerative Medicine), Kenneth M.Yamada (NIH), Keith Yamamoto (University of California, San Francisco), Charles Yocum (University of Michigan, Ann Arbor), Peter Yurchenco (UMDNJ – Robert Wood Johnson Medical School), Rosalind Zalin (University College London), Patricia Zambryski (University of California, Berkeley), Marino Zerial (Max Planck Institute of Molecular Cell Biology and Genetics). PARTE 1 INTRODUZIONE ALLA CELLULA 1 Cellule e genomi 2 Chimica e bioenergetica della cellula 3 Le proteine CAPITOLO 1 • Le caratteristiche universali delle cellule sulla Terra • La diversità dei genomi e l’albero della vita • L’informazione genetica negli eucarioti Cellule e genomi L a superficie del nostro pianeta è popolata da esseri viventi, fabbriche chimiche organizzate in modo complesso che assumono materia dall’ambiente circostante e usano questo materiale grezzo per generare copie di se stesse. Gli organismi viventi appaiono straordinariamente diversi. Che cosa potrebbe esserci di più diverso di una tigre e un’alga, o di un batterio e un albero? Tuttavia, i nostri antenati, senza sapere nulla di cellule o di DNA, notarono che tutti questi organismi avevano qualcosa in comune. Essi chiamarono questo qualcosa “vita”, ne rimasero meravigliati, lottarono per definirla e disperarono di poter spiegare che cosa fosse o come funzionasse in relazione alla materia inanimata. Le scoperte del secolo scorso non hanno diminuito la meraviglia, piuttosto il contrario. Ma hanno svelato il mistero che circonda la natura della vita. Oggi possiamo vedere che tutti gli esseri viventi sono costituiti da cellule: piccole unità circondate da una membrana e piene di una soluzione acquosa concentrata di sostanze chimiche, e con la straordinaria capacità di produrre copie di se stesse crescendo e poi dividendosi in due. Poiché le cellule sono le unità fondamentali della vita, dobbiamo rivolgerci alla biologia cellulare – lo studio della struttura, della funzione e del comportamento delle cellule – per poter rispondere alle domande che cos’è la vita e come funziona. Con una conoscenza più profonda delle cellule e della loro evoluzione, possiamo affrontare gli enormi problemi che tradizionalmente riguardano la vita sulla Terra: le sue origini misteriose, la sua incredibile diversità e la sua invasione di ogni habitat possibile. Come ha sottolineato tempo fa il pioniere della biologia cellulare E. B.Wilson, “la chiave di ogni problema biologico deve essere ricercata nella cellula, dal momento che ogni essere vivente è, o in qualche momento della sua storia è stato, una cellula”. Gli esseri viventi, sebbene infinitamente diversi se osservati dall’esterno, sono fondamentalmente simili all’interno. L’intera biologia è un contrappunto fra due temi: stupefacente varietà nei singoli particolari; stupefacente costanza nei meccanismi fondamentali. In questo primo capitolo iniziamo esaminando gli aspetti che sono universali in tutti gli esseri viventi del nostro pianeta. Quindi passiamo brevemente in rassegna la diversità delle cellule.Vediamo come, grazie al codice comune in cui sono scritte le specifiche per tutti gli organismi viventi, sia possibile leggere, misurare e decifrare queste specifiche per ottenere una comprensione coerente di tutte le forme di vita, dalla più piccola alla più grande. Le caratteristiche universali delle cellule sulla Terra Si stima che vi siano più di 10 milioni – forse addirittura 100 milioni – di specie viventi oggi sulla Terra. Ciascuna specie è diversa e ciascuna si riproduce fedelmente, generando una progenie che appartiene alla stessa specie: l’organismo genitore trasmette l’informazione che specifica le caratteristiche della prole in modo straordinariamente dettagliato. Questo fenomeno dell’ereditarietà è parte centrale della definizione di vita: distingue la vita da altri processi, come la crescita di un cristallo, o una candela che brucia, o la formazione di onde sull’acqua, in cui si generano strutture ordinate ma senza lo stesso tipo di legame fra le peculiarità dei genitori e quelle della progenie. Come la fiamma di una candela, l’organismo vivente consuma energia libera per creare e mantenere la sua organizzazione; ma la vita utilizza l’energia libera per far CAPITOLO 1 Cellule e genomi 3 © 978-88-08-62126-9 avanzare un sistema estremamente complesso di processi chimici che è specificato dall’informazione ereditaria. La maggior parte degli organismi viventi è costituita da cellule singole; altri, come noi, sono vaste “città” pluricellulari in cui gruppi di cellule svolgono funzioni specializzate e sono collegati da sistemi complessi di comunicazione. Ma anche l’aggregato di più di 1013 cellule che forma un corpo umano è stato generato da divisioni cellulari a partire da una singola cellula (Figura 1.1). Questa cellula comprende il macchinario necessario a raccogliere materiali grezzi dall’ambiente e a costruire da essi una nuova cellula a sua immagine, completa di una nuova copia dell’informazione ereditaria. Ogni singola cellula è assolutamente sorprendente. ■ Tutte le cellule conservano la loro informazione ereditaria nello stesso codice chimico lineare: il DNA I computer ci hanno reso familiare il concetto di informazione come quantità misurabile: un milione di byte che corrispondono a qualche centinaio di pagine di testo o a un’immagine di una macchina fotografica digitale, 600 milioni per la musica su un CD, e così via. Essi ci hanno anche reso coscienti del fatto che la stessa informazione può essere registrata in molte forme fisiche diverse: i dischi e i nastri che usavamo venti anni fa per i nostri archivi elettronici sono diventati illeggibili sulle macchine di oggi. Le cellule viventi, come i computer, hanno a che fare con l’informazione e si stima che abbiano continuato a evolversi e a diversificarsi per più di 3,5 miliardi di anni. È difficile aspettarsi che debbano tutte conservare le loro informazioni nella stessa forma o che gli archivi di un tipo di cellula debbano essere leggibili dal macchinario che gestisce le informazioni di un’altra. Eppure è così. Tutte le cellule viventi sulla Terra conservano la loro informazione ereditaria sotto forma di molecole a doppio filamento di DNA – lunghe catene polimeriche accoppiate senza ramificazioni, formate sempre dagli stessi quattro tipi di monomeri. Questi monomeri hanno nomi derivati da un alfabeto a quattro lettere – A,T, C, G – e sono attaccati insieme in una lunga sequenza lineare che codifica l’informazione genetica, proprio come la sequenza di 1 e 0 codifica l’informazione in un file di computer. Possiamo prendere un tratto di DNA da una cellula umana e inserirlo in un batterio, o un pezzo di DNA batterico e inserirlo in una cellula umana, e l’informazione verrà letta, interpretata e copiata con successo. Usando metodi chimici, i ricercatori possono leggere (A) (B) (C) 100 µm (D) Figura 1.1 L’informazione ereditaria nella cellula uovo fecondata determina la natura dell’intero organismo pluricellulare. Sebbene le loro cellule di partenza sembrino esteriormente simili, un uovo di riccio di mare dà origine a un riccio di mare (A e B). Un uovo di topo dà origine a un topo (C e D). Un uovo dell’alga Fucus dà origine a un’alga Fucus (E ed F). (A, per gentile concessione di David McClay; B, per gentile concessione di M. Gibbs, Oxford Scientific Films; C, per gentile concessione di Patricia Calarco, da G. Martin, Science 209: 768776, 1980. © AAAS; D, per gentile concessione di O. Newman, Oxford Scientific Films; E ed F, per gentile concessione di Colin Brownlee.) (E) 50 µm (F) 50 µm CAPITOLO 1 Cellule e genomi 4 © 978-88-08-62126-9 la sequenza completa di monomeri in qualunque molecola di DNA – che si estende per milioni di nucleotidi – e così decifrare l’informazione ereditaria contenuta in ciascun organismo. ■ Tutte le cellule replicano la loro informazione ereditaria mediante polimerizzazione su stampo I meccanismi che rendono possibile la vita dipendono dalla struttura della molecola di DNA a doppio filamento. Ciascun monomero in un singolo filamento di DNA – cioè, ciascun nucleotide – consiste di due parti: uno zucchero (deossiribosio) con un gruppo fosfato attaccato, e una base, che può essere adenina (A), guanina (G), citosina (C) o timina (T) (Figura 1.2). Ciascuno zucchero è legato al successivo tramite il gruppo fosfato, creando una catena polimerica composta da un’ossatura ripetitiva zucchero-fosfato con una serie di basi che sporgono da un lato. Il polimero di DNA viene esteso aggiungendo monomeri a una estremità. I monomeri possono, in linea di principio, essere aggiunti in qualunque ordine a un filamento singolo isolato, perché ciascuno si lega al successivo nello stesso modo, tramite la parte della molecola che è uguale per tutti. Nella cellula vivente però il DNA non è sintetizzato come un filamento libero isolato, ma su uno stampo formato da un filamento (A) componenti del DNA (D) DNA a doppio filamento fosfato zucchero + zucchero fosfato (B) G G base nucleotide A T T G C C A G T G T A A C G G T C A filamento di DNA G T A A C G G T ossatura di zucchero-fosfato A C (E) (C) C coppie di basi unite da legami idrogeno doppia elica di DNA polimerizzazione su stampo del nuovo filamento monomeri di nucleotidi C C A A C T T A G C G G T T G T T A G G G G A C A A G C T C A Figura 1.2 Il DNA e le unità che lo compongono. (A) Il DNA è composto da subunità semplici, chiamate nucleotidi, ciascuna consistente di una molecola di zuccherofosfato con attaccato un gruppo laterale contenente azoto, o base. Le basi sono di quattro tipi (adenina, guanina, citosina e timina), che corrispondono a quattro distinti nucleotidi, indicati come A, G, C e T. (B) Un singolo filamento di DNA è costituito da nucleotidi uniti da legami zuccherofosfato. Si noti che le singole unità di zucchero-fosfato sono asimmetriche e danno all’ossatura del filamento una direzionalità definita, o polarità. Questa direzionalità guida i processi molecolari tramite i quali l’informazione nel DNA viene interpretata e copiata nelle cellule: l’informazione è sempre “letta” in un ordine definito, proprio come il testo scritto in italiano viene letto da sinistra a destra. (C) Tramite polimerizzazione su stampo la sequenza di nucleotidi di C G A C C A un filamento esistente di DNA controlla la sequenza in cui i nucleotidi vengono uniti in un nuovo filamento di DNA; T su un filamento si accoppia con A nell’altro, e G in un filamento si accoppia con C nell’altro. Il nuovo filamento ha una sequenza nucleotidica complementare a quella del vecchio filamento e un’ossatura con direzionalità opposta: in corrispondenza con il GTAA... del filamento originale esso ha ...TTAC. (D) Una normale molecola di DNA consiste di due filamenti complementari di questo tipo. I nucleotidi all’interno di ciascun filamento sono uniti da legami chimici forti (covalenti); i nucleotidi complementari su filamenti opposti sono tenuti insieme più debolmente da legami idrogeno. (E) I due filamenti si avvolgono l’uno sull’altro formando una doppia elica, una struttura robusta che può contenere qualunque sequenza di nucleotidi senza alterare la propria struttura di base (Vedi Filmato 4.1). CAPITOLO 1 Cellule e genomi 5 © 978-88-08-62126-9 filamento stampo nuovo filamento Figura 1.3 La duplicazione dell’informazione genetica mediante replicazione del DNA. In questo processo i due filamenti di una doppia elica di DNA sono separati e ciascuno di essi serve da stampo per la sintesi di un nuovo filamento complementare. nuovo filamento doppia elica parentale di DNA filamento stampo preesistente di DNA. Le basi che sporgono dal filamento esistente si legano a basi del filamento che viene sintetizzato, secondo una regola rigida definita da strutture complementari delle basi: A si lega a T e C si lega a G. Questi appaiamenti delle basi mantengono i nuovi monomeri in posizione e quindi controllano la scelta di quale dei quattro monomeri verrà aggiunto al filamento in crescita. In questo modo si crea una struttura a doppio filamento, che consiste di due sequenze esattamente complementari di A, C,T e G. I due filamenti si avvolgono l’uno intorno all’altro, formando una doppia elica (Figura 1.2E). I legami fra le coppie di basi sono deboli in confronto ai legami zucchero-fosfato e ciò permette ai due filamenti di DNA di separarsi senza che l’ossatura si rompa. Ciascun filamento può quindi servire da stampo, nel modo appena descritto, per la sintesi di un nuovo filamento di DNA complementare a se stesso, cioè una nuova copia dell’informazione ereditaria (Figura 1.3). In tipi diversi di cellule questo processo di replicazione del DNA avviene a velocità differenti, con controlli diversi per iniziarlo o fermarlo, e con molecole ausiliarie differenti. Ma le basi sono universali: il DNA è il depositario dell’informazione e la polimerizzazione su stampo è il modo in cui questa informazione è copiata in tutto il mondo vivente. ■ Tutte le cellule trascrivono porzioni della loro informazione ereditaria nella stessa forma intermedia: l’RNA Per svolgere la sua funzione di deposito dell’informazione il DNA deve fare ben più che copiare se stesso. Deve anche esprimere la sua informazione, usandola per guidare la sintesi di altre molecole nella cellula. Anche questo processo avviene tramite un meccanismo che è lo stesso in tutti gli organismi viventi e che porta soprattutto alla produzione di due altre classi chiave di polimeri: RNA e proteine. Il processo (discusso in dettaglio nei Capitoli 6 e 7) inizia con una polimerizzazione su stampo chiamata trascrizione, in cui segmenti della sequenza del DNA sono usati come stampo per guidare la sintesi di molecole più corte del polimero, strettamente correlato, acido ribonucleico, o RNA. In seguito, nel processo più complesso della traduzione, molte di queste molecole di RNA dirigono la sintesi di polimeri di una classe chimica radicalmente diversa, le proteine (Figura 1.4). Nell’RNA l’ossatura è formata da uno zucchero leggermente diverso da quello del DNA – ribosio invece di deossiribosio – e una delle quattro basi è leggermente diversa: uracile (U) al posto di timina (T); ma le altre tre basi – A, C e G – sono le stesse, e tutte e quattro le basi si accoppiano con le loro controparti complementari nel DNA: A, U, C e G dell’RNA con T, A, G e C del DNA. Durante la trascrizione, i monomeri dell’RNA sono allineati e scelti per la polimerizzazione su un filamento stampo di DNA nello stesso modo in cui i monomeri del DNA sono selezionati durante la replicazione. Il risultato è perciò un polimero la cui sequenza di nucleotidi rappresenta fedelmente una parte dell’informazione genetica della cellula, anche se scritta in un alfabeto leggermente diverso, che consiste di monomeri di RNA invece che di monomeri di DNA. Lo stesso segmento di DNA può essere usato ripetutamente per guidare la sintesi di molti trascritti identici di RNA. Quindi, mentre l’archivio dell’infor- DNA sintesi del DNA REPLICAZIONE nucleotidi DNA sintesi dell’RNA TRASCRIZIONE RNA sintesi proteica TRADUZIONE PROTEINA amminoacidi Figura 1.4 Da DNA a proteina. L’informazione genetica viene letta e utilizzata mediante un processo in due passaggi. Per prima cosa, nella trascrizione, segmenti della sequenza del DNA sono usati per dirigere la sintesi di molecole di RNA. Quindi, nella traduzione, le molecole di RNA sono usate per dirigere la sintesi di molecole proteiche. CAPITOLO 1 Cellule e genomi 6 © 978-88-08-62126-9 MOLECOLE DI RNA COME TRASPORTATORI DI INFORMAZIONI DNA A DOPPIO FILAMENTO COME ARCHIVIO DI INFORMAZIONI TRASCRIZIONE filamento usato come stampo per dirigere la sintesi di RNA molti trascritti identici di RNA Figura 1.5 Il modo in cui l’informazione genetica è trasmessa per essere usata all’interno della cellula. Ciascuna cellula contiene una serie fissa di molecole di DNA, il suo archivio di informazione genetica. Un dato segmento di questo DNA ha la funzione di guidare la sintesi di molti trascritti identici di RNA, che servono da copie di lavoro dell’informazione conservata nell’archivio. Si possono produrre molte serie diverse di molecole di RNA trascrivendo parti selezionate di una lunga sequenza di DNA, permettendo così a ciascuna cellula di usare il suo deposito di informazioni in modo diverso. mazione genetica della cellula sotto forma di DNA è fisso e sacrosanto, i trascritti di RNA sono prodotti in massa e sono monouso (Figura 1.5). Come vedremo, questi trascritti agiscono da intermedi nel trasferimento dell’informazione genetica: servono soprattutto da RNA messaggero (mRNA) che guida la sintesi di proteine secondo le istruzioni genetiche conservate nel DNA. Le molecole di RNA hanno strutture caratteristiche che possono anche conferire loro altre capacità chimiche specializzate. Essendo a singolo filamento, la loro ossatura è flessibile, così che la catena polimerica può ripiegarsi all’indietro su se stessa per permettere a una parte della molecola di formare deboli legami con un’altra parte della stessa molecola. Ciò avviene quando segmenti della sequenza sono localmente complementari: un segmento ...GGGG..., per esempio, tenderà ad associarsi a un segmento ...CCCC... Questi tipi di associazioni interne possono causare il ripiegamento di una catena di RNA in una forma specifica che è dettata dalla sua sequenza (Figura 1.6). La forma della molecola di RNA, a sua volta, può permetterle di riconoscere altre molecole a cui si lega selettivamente (e anche, in certi casi, di catalizzare modificazioni chimiche nelle molecole legate). Come vedremo nel Capitolo 6, alcune reazioni chimiche catalizzate da molecole di RNA sono cruciali per parecchi dei più antichi e fondamentali processi delle cellule viventi, ed è stato ipotizzato che una catalisi più estesa da parte dell’RNA abbia avuto un ruolo centrale nelle prime fasi dell’evoluzione della vita. ■ Tutte le cellule usano proteine come catalizzatori Le proteine, come le molecole di DNA e di RNA, sono lunghe catene polimeriche non ramificate, formate dall’unione in serie di unità monomeriche derivate da un repertorio standard che è lo stesso in tutte le cellule viventi. Come il DNA e l’RNA, portano l’informazione sotto forma di una sequenza lineare di simboli, proprio come un messaggio umano scritto usando un alfa- G U A U C A U A Figura 1.6 La conformazione di una molecola di RNA. (A) L’appaiamento di nucleotidi fra regioni diverse della stessa catena polimerica di RNA fa adottare alla molecola una forma caratteristica. (B) La struttura tridimensionale di una reale molecola di RNA, dal virus dell’epatite delta, che catalizza la rottura del filamento di RNA. Il nastro blu rappresenta l’ossatura di zuccherofosfato; le barre rappresentano coppie di basi. (vedi Filmato 6.1) (B, basata su A.R. Ferré D’Amaré, K. Zhou e J.A. Doudna, Nature 395:567574, 1998. Per gentile concessione di MacMillan Publishers Ltd.) G C C A G U U A G C C G C CC U G GG (A) A A G C U U A A A U C G A A U U U A U G C A U U A C G U A AAA UU U (B) CAPITOLO 1 Cellule e genomi 7 © 978-88-08-62126-9 beto. In ogni cellula ci sono molte proteine diverse, che – se non consideriamo l’acqua – costituiscono la maggior parte della massa cellulare. I monomeri delle proteine, gli amminoacidi, sono molto diversi da quelli del DNA e dell’RNA, e ce ne sono 20 tipi invece di 4. Ciascun amminoacido è costruito intorno alla stessa struttura centrale attraverso la quale può essere legato in un modo standard a qualunque altro amminoacido della serie; attaccato a questo nucleo si trova un gruppo laterale che conferisce a ciascun amminoacido un carattere chimico specifico. Ciascuna molecola proteica è un polipeptide, creato unendo amminoacidi in una sequenza particolare. Attraverso miliardi di anni di evoluzione, questa sequenza è stata selezionata in modo da dare alla proteina una funzione utile. Quindi, ripiegandosi in una forma tridimensionale precisa con siti reattivi sulla sua superficie (Figura 1.7A), questi polimeri di amminoacidi possono legare con alta specificità altre molecole e possono agire da enzimi che catalizzano reazioni in cui si formano o si spezzano legami covalenti. In questo modo dirigono la grande maggioranza dei processi chimici nella cellula (Figura 1.7B). Le proteine hanno anche una quantità di altre funzioni – mantenere strutture, generare movimenti, rilevare segnali, e così via – e ciascuna molecola proteica svolge una funzione peculiare secondo la propria sequenza di amminoacidi specificata geneticamente. Le proteine sono soprattutto le molecole che mettono in opera l’informazione genetica della cellula. Quindi i polinucleotidi specificano le sequenze amminoacidiche delle proteine. Le proteine, a loro volta, catalizzano molte reazioni chimiche, comprese quelle che portano alla sintesi di nuove molecole di DNA. Da un punto di vista di base, una cellula vivente è un insieme di catalizzatori in grado di autoreplicarsi che catturano cibo, elaborano questo cibo per derivarne sia le unità molecolari da costruzione che l’energia necessari per formare altri catalizzatori e scartare il materiale non utilizzato come rifiuto (Figura 1.8A). Un circuito a feedback che collega proteine e polinucleotidi costituisce la base di questo comportamento autocatalitico e capace di autoriprodursi degli organismi viventi (Figura 1.8B). ■ Tutte le cellule traducono RNA in proteine allo stesso modo Negli anni ’50 era ancora un mistero il modo in cui l’informazione codificata nel DNA specifichi la produzione di proteine, quando si scoprì che la struttura a doppia elica del DNA era alla base dell’ereditarietà; ma negli anni successivi gli scienziati hanno dipanato l’elegante meccanismo che ne è responsabile. La traduzione dell’informazione genetica dall’alfabeto a 4 lettere dei polinucleotidi nell’alfabeto a 20 lettere delle proteine è un processo complesso. Le regole di questa traduzione sembrano per alcuni aspetti chiare e razionali, ma per altri aspetti stranamente arbitrarie, dato che sono (con piccole eccezioni) catena di polisaccaride + + sito catalitico (B) molecola di lisozima Figura 1.7 Il modo in cui una molecola proteica agisce da catalizzatore per una (A) lisozima reazione chimica. (A) In una molecola proteica la catena polimerica si ripiega in una forma specifica definita dalla sua sequenza di amminoacidi. Una fessura sulla superficie di questa particolare molecola ripiegata, l’enzima lisozima, forma un sito catalitico. (B) Una molecola di polisaccaride (rosso) – una catena polimerica di monomeri di zuccheri – si lega al sito catalitico del lisozima e viene spezzata, come risultato di una reazione di rottura di un legame covalente catalizzata dagli amminoacidi che rivestono la fessura (vedi Filmato 3.9) (Codice PDB: 1LYD). CAPITOLO 1 Cellule e genomi 8 © 978-88-08-62126-9 (A) CIBO IN ENTRATA RIFIUTI IN USCITA (B) amminoacidi nucleotidi unità molecolari fondamentali energia funzione catalitica insieme di catalizzatori della cellula proteine informazione di sequenza polinucleotidi I CATALIZZATORI DELLA CELLULA COLLABORANO TRA DI LORO PER RIPRODURRE L’INTERO INSIEME DI CATALIZZATORI PRIMA DELLA DIVISIONE CELLULARE Figura 1.8 La vita come processo autocatalitico. (A) La cellula come una collezione di catalizzatori che si autoreplicano. (B) Polinucleotidi (gli acidi nucleici DNA e RNA, che sono polimeri di nucleotidi) forniscono l’informazione della sequenza mentre le proteine (polimeri di amminoacidi) forniscono la maggior parte delle funzioni catalitiche che servono – attraverso una serie complessa di reazioni chimiche – a eseguire la sintesi di ulteriori polinucleotidi e proteine degli stessi tipi. identiche in tutti gli esseri viventi. Si ritiene che questi aspetti arbitrari riflettano incidenti “congelati” nella storia precoce della vita: proprietà casuali dei primi organismi che sono state trasmesse come eredità e sono diventate così profondamente inglobate nella costituzione di tutte le cellule viventi da non potere essere cambiate senza effetti disastrosi. L’informazione nella sequenza di una molecola di RNA messaggero è letta in gruppi di tre nucleotidi alla volta: ciascuna tripletta di nucleotidi, o codone, specifica (codifica) un singolo amminoacido in una proteina corrispondente. Poiché il numero di triplette diverse che può formarsi a partire da 4 nucleotidi è 43, vi sono 64 codoni possibili, tutti esistenti in natura.Tuttavia, ci sono soltanto 20 amminoacidi presenti in natura. Questo significa che devono per forza esserci molti casi in cui diversi codoni corrispondono allo stesso amminoacido. Questo codice genetico è letto da una classe speciale di piccole molecole di RNA, gli RNA transfer (tRNA). Ciascun tipo di tRNA ha attaccato a una estremità un amminoacido specifico e porta all’altra estremità una sequenza specifica di tre nucleotidi – un anticodone – che gli permette, tramite appaiamento di basi, di riconoscere un codone particolare o un gruppo di codoni nell’mRNA. La chimica intricata che consente a questi tRNA di tradurre una specifica sequenza di nucleotidi A, C, G e U presenti in una molecola di mRNA nella specifica sequenza di amminoacidi che forma una molecola proteica è possibile grazie al ribosoma, una gigantesca macchina multimolecolare formata sia da proteine sia da RNA ribosomiale. Tutti questi processi sono descritti in dettaglio nel Capitolo 6. ■ Ogni proteina • codificata da un gene specifico Le molecole di DNA di regola sono molto grandi e contengono le specifiche di migliaia di proteine. Sequenze speciali nel DNA fungono da punteggiatura, definendo dove inizia e dove finisce l’informazione per ciascuna proteina. Singoli segmenti dell’intera sequenza di DNA sono trascritti in molecole di mRNA separate e ciascun segmento codifica una proteina diversa. Ciascuno di questi segmenti di DNA rappresenta un gene. Una complicazione è rappresentata dal fatto che le molecole di RNA trascritte dallo stesso segmento di DNA possono essere spesso modificate in più di un modo, dando origine a una serie di versioni alternative di una proteina, specialmente nelle cellule più complesse come quelle dei vegetali e degli animali. Inoltre, alcuni segmenti di DNA – un numero più piccolo – sono trascritti in molecole di RNA che non vengono tradotte ma che hanno funzioni catalitiche, regolatorie o strutturali; tali segmenti di DNA sono considerati geni. Un gene è perciò definito come il segmento di sequenza di DNA che corrisponde a una singola proteina o a una serie di varianti alternative di una proteina o a una singola molecola catalitica, regolatrice o strutturale di RNA. In tutte le cellule l’espressione dei singoli geni è regolata: invece di produrre continuamente l’intero repertorio di proteine possibili a gran velocità, la cellula regola il tasso di trascrizione e di traduzione di geni diversi in modo indipendente, secondo le necessità.Tratti di DNA regolatore sono sparsi fra i seg- CAPITOLO 1 Cellule e genomi © 978-88-08-62126-9 menti che codificano proteine e queste regioni non codificanti legano speciali molecole proteiche che controllano la velocità locale di trascrizione. La quantità e l’organizzazione del DNA regolatore e dell’altro DNA non codificante variano moltissimo da una classe di organismi a un’altra, ma la strategia di base è universale. In questo modo il genoma della cellula – cioè il totale della sua informazione genetica contenuta nella sua sequenza completa di DNA – detta non solo la natura delle proteine della cellula, ma anche quando e dove queste devono essere prodotte. ■ La vita richiede energia libera Una cellula vivente è un sistema chimico dinamico, che funziona ben lungi dall’equilibrio chimico. Affinché la cellula cresca o produca una nuova cellula a sua immagine, essa deve assumere energia libera dall’ambiente, oltre a materiali grezzi, per spingere le necessarie reazioni di sintesi. Questo consumo di energia libera è fondamentale per la vita. Quando si arresta, una cellula decade verso l’equilibrio chimico e rapidamente muore. Anche l’informazione genetica è fondamentale per la vita ed è necessaria energia libera per propagare questa informazione. Per esempio, specificare un bit di informazione – cioè una scelta sì/no fra due alternative egualmente probabili – costa una quantità definita di energia libera che può essere calcolata. La relazione quantitativa richiede dei ragionamenti complessi e dipende dalla definizione precisa del termine “energia libera”, che sarà discussa nel Capitolo 2. L’idea fondamentale, tuttavia, non è difficile da comprendere intuitivamente. Immaginate le molecole presenti in una cellula come uno sciame di oggetti dotati di energia termica, che si muovono violentemente a caso, urtandosi in continuazione. Per specificare l’informazione genetica – sotto forma di una sequenza di DNA, per esempio – le molecole devono essere catturate da questa “folla selvaggia”, disposte in un ordine specifico definito da qualche stampo preesistente, e unite in una relazione fissa. I legami che trattengono le molecole nei punti appropriati sullo stampo e le uniscono tra loro devono essere abbastanza forti da resistere all’effetto che crea disordine del movimento termico. Il processo è spinto in avanti dal consumo di energia libera, necessario per assicurare che si formino i legami corretti e che questi siano robusti. Nel caso più semplice le molecole possono essere paragonate a trappole a molla, pronte a scattare in uno stato più stabile, legato con minore energia quando incontrano i partner appropriati; nel momento in cui scattano insieme nella disposizione legata, l’energia immagazzinata disponibile – l’energia libera – come l’energia della molla della trappola, viene rilasciata e dissipata sotto forma di calore. In una cellula i processi chimici sottostanti al trasferimento dell’informazione sono più complessi, ma si applica lo stesso principio di base: si deve spendere energia libera per creare ordine. Per replicare fedelmente la sua informazione genetica e di fatto per produrre tutte le sue molecole complesse secondo le specificazioni corrette la cellula richiede perciò energia libera, che deve essere importata in qualche modo dall’ambiente circostante. Come vedremo nel Capitolo 2 l’energia libera necessaria alle cellule animali deriva dai legami chimici presenti nelle molecole costituenti il cibo che l’animale mangia, mentre le piante ottengono la loro energia libera dalla luce solare. ■ Tutte le cellule funzionano come fabbriche biochimiche che utilizzano le stesse unitˆ molecolari di base Poiché tutte le cellule producono DNA, RNA e proteine e queste macromolecole sono composte dalla stessa serie di subunità in tutti i casi, tutte le cellule devono contenere e manipolare un insieme simile di piccole molecole, fra cui zuccheri semplici, nucleotidi e amminoacidi, oltre ad altre sostanze che sono richieste universalmente.Tutte le cellule, per esempio, necessitano del nucleotide fosforilato ATP (adenosina trifosfato) come unità da costruzione per la sintesi di DNA e RNA; e tutte le cellule producono e consumano questa molecola anche come trasportatore di energia libera e gruppi fosfato per spingere un enorme numero di reazioni chimiche nella cellula. 9 CAPITOLO 1 Cellule e genomi 10 © 978-88-08-62126-9 Sebbene tutte le cellule funzionino come fabbriche biochimiche sotto molti aspetti di tipo simile, molti dettagli delle loro transazioni di piccole molecole differiscono. Alcuni organismi, come i vegetali, richiedono soltanto i nutrienti più semplici e imbrigliano l’energia della luce solare per produrre quasi tutte le loro piccole molecole organiche; altri organismi, come gli animali, si nutrono di esseri viventi e ottengono molte delle loro molecole organiche già pronte.Torneremo su questo punto più avanti. ■ Tutte le cellule sono racchiuse da una membrana plasmatica attraverso la quale devono passare i nutrienti e i materiali di rifiuto monostrato fosfolipidico OLIO doppio strato fosfolipidico ACQUA Figura 1.9 Formazione di una membrana da parte di molecole anfipatiche di fosfolipidi. I fosfolipidi hanno un gruppo di testa idrofilico (che ama l’acqua, fosfato) e una coda idrofobica (che evita l’acqua, idrocarburo). All’interfaccia fra olio e acqua essi si dispongono come un singolo foglio con i gruppi di testa verso l’acqua e i gruppi di coda verso l’olio. Quando sono immersi in acqua si aggregano formando doppi strati che racchiudono compartimenti acquosi, come indicato nella figura. Un’altra caratteristica universale è la seguente: ogni cellula è circondata da una membrana, la membrana plasmatica. Questo contenitore agisce da barriera selettiva che permette alla cellula di concentrare i nutrienti raccolti dall’ambiente e di trattenere i prodotti che sintetizza per il proprio uso, mentre espelle i suoi prodotti di rifiuto. Senza una membrana plasmatica la cellula non potrebbe mantenere la sua integrità come sistema chimico coordinato. Le molecole che formano questa membrana hanno la semplice proprietà fisico-chimica di essere anfipatiche, cioè consistono di una parte che è idrofobica (insolubile in acqua) e di un’altra parte che è idrofilica (solubile in acqua). Quando molecole di questo tipo sono poste in acqua si aggregano spontaneamente, disponendo le loro porzioni idrofobiche il più possibile in contatto fra loro per allontanarle dall’acqua e tenendo esposte le loro porzioni idrofiliche. Molecole anfipatiche di forma appropriata, come i fosfolipidi che compongono la maggior parte della membrana plasmatica, si aggregano spontaneamente in acqua formando un doppio strato che crea piccole vescicole chiuse (Figura 1.9). Il fenomeno può essere dimostrato in una provetta semplicemente mescolando insieme fosfolipidi e acqua; in condizioni appropriate si formano piccole vescicole il cui contenuto acquoso è isolato dal mezzo esterno. Sebbene i dettagli chimici varino, le code idrofobiche delle molecole predominanti delle membrane di tutte le cellule sono polimeri idrocarburici (–CH2–CH2–CH2–) e il loro assemblaggio spontaneo in una vescicola a doppio strato non è che uno dei molti esempi di un importante principio generale: le cellule producono molecole le cui proprietà chimiche ne provocano l’autoassemblaggio nelle strutture di cui la cellula ha bisogno. Il confine della cellula non può essere totalmente impermeabile. Se una cellula deve crescere e riprodursi, essa deve essere capace di importare materiali grezzi ed esportare i rifiuti attraverso la sua membrana plasmatica.Tutte le cellule perciò hanno proteine specializzate immerse nella loro membrana che servono a trasportare molecole specifiche da un lato all’altro. Alcune di queste proteine di trasporto di membrana, come alcune delle proteine che catalizzano le reazioni fondamentali delle piccole molecole all’interno della cellula, si sono conservate così bene nel corso dell’evoluzione che è possibile riconoscere le somiglianze di famiglia fra di esse anche confrontando i gruppi più distanti di organismi viventi. Le proteine di trasporto di membrana determinano in gran parte quali molecole entrano nella cellula e le proteine catalitiche all’interno della cellula determinano le reazioni che queste molecole subiscono. Quindi, specificando la serie di proteine che la cellula deve produrre, l’informazione genetica registrata nella sequenza del DNA detta l’intera chimica della cellula; e non solo la sua chimica, ma anche la sua forma e il suo comportamento, poiché anche questi sono costruiti e controllati principalmente dalle proteine della cellula. ■ Ci pu˜ essere una cellula vivente con meno di 500 geni I principi di base del trasferimento dell’informazione biologica sono abbastanza semplici, ma quanto sono complesse le vere cellule viventi? In particolare, quali sono i requisiti minimi? Possiamo ottenere un’indicazione approssimativa considerando la specie che ha il genoma più piccolo conosciuto, il batterio Mycoplasma genitalium (Figura 1.10). Questo organismo vive come parassita nei mammiferi e il suo ambiente gli fornisce molte delle sue piccole moleco- CAPITOLO 1 Cellule e genomi 11 © 978-88-08-62126-9 le già pronte. Nonostante ciò, deve ancora produrre tutte le grosse molecole – DNA, RNA e proteine – necessarie per i processi base dell’eredità. Esso ha circa 530 geni di cui circa 400 sono essenziali. Il suo genoma di 580 070 coppie di nucleotidi rappresenta 145 018 byte di informazione, circa quanto ci vuole per registrare il testo di un capitolo di questo libro. La biologia cellulare può essere complicata, ma non in modo impossibile. Il numero minimo di geni per una cellula vitale nell’ambiente attuale è probabilmente non inferiore a 300, sebbene il nucleo di geni condiviso da tutte le specie viventi contenga soltanto circa 60 geni. SOMMARIO La singola cellula è l’unità minima della materia vivente che si autoriproduce e consiste di un insieme di catalizzatori che si possono autoriprodurre. Di importanza centrale per la riproduzione è la trasmissione dell’informazione genetica alle cellule figlie. Ogni cellula sul nostro pianeta conserva la sua informazione genetica nella stessa forma chimica, un DNA a doppio filamento. La cellula replica la sua informazione separando i filamenti appaiati di DNA e usando ciascuno di essi come stampo per la polimerizzazione al fine di produrre un nuovo filamento di DNA con una sequenza complementare di nucleotidi. La stessa strategia di polimerizzazione su stampo è usata per trascrivere porzioni dell’informazione da DNA in molecole del polimero strettamente correlato, RNA. Queste molecole di RNA a loro volta guidano la sintesi di molecole proteiche grazie al meccanismo più complesso della traduzione, che coinvolge una grande macchina multimolecolare, il ribosoma. Le proteine sono i principali catalizzatori per quasi tutte le reazioni chimiche nella cellula; altre loro funzioni comprendono l’importazione e l’esportazione selettiva di piccole molecole attraverso la membrana plasmatica che forma il confine della cellula. La funzione peculiare di ciascuna proteina dipende dalla sua sequenza di amminoacidi, che è specificata dalla sequenza nucleotidica di un segmento corrispondente del DNA, il gene che codifica quella proteina. In questo modo il genoma della cellula ne determina la chimica; e la chimica di ogni cellula vivente è fondamentalmente simile, poiché deve provvedere alla sintesi di DNA, RNA e proteine. Le cellule più semplici note possono sopravvivere con circa 400 geni. ● La diversità dei genomi e l’albero della vita Il successo degli organismi viventi basati su DNA, RNA e proteine è stato spettacolare. La vita ha popolato gli oceani, coperto il suolo, infiltrato la crosta terrestre e modellato la superficie del nostro pianeta. La nostra atmosfera ricca di ossigeno, i depositi di carbone e di petrolio, gli strati di minerali ferrosi, le rupi di gesso, di arenaria e di marmo – tutti questi sono prodotti, direttamente o indirettamente, della passata attività biologica sulla Terra. Gli esseri viventi non sono confinati nel familiare reame temperato di terra, acqua e luce solare abitato da vegetali e da animali che mangiano vegetali. Essi si possono trovare nelle più buie profondità dell’oceano, nei fanghi bollenti dei vulcani, in laghi sotto la superficie congelata dell’Antartide e sepolti a chilometri di profondità nella crosta terrestre. Le creature che vivono in questi ambienti estremi sono generalmente poco familiari, non solo perché sono inaccessibili ma anche perché sono perlopiù microscopiche. Anche negli habitat più favorevoli la maggior parte degli organismi è troppo piccola per essere visibile senza un equipaggiamento speciale: essi tendono a passare inosservati, a meno che non provochino una malattia o facciano marcire il legno delle nostre case. Eppure i microrganismi compongono la maggior parte della massa totale della materia vivente sul nostro pianeta. Solo di recente, con nuovi metodi di analisi molecolare e in modo specifico tramite l’analisi delle sequenze del DNA, abbiamo cominciato a ottenere un quadro della vita sulla Terra che non sia grossolanamente distorto dalla nostra prospettiva falsata che ci porta a vederla dal punto di vista di grandi animali che vivono sulla terraferma. In questa sezione consideriamo la diversità degli organismi e le relazioni fra di essi. Poiché l’informazione genetica per ogni organismo è scritta nel linguaggio universale di sequenze di DNA e la sequenza del DNA di ogni dato organismo può essere ottenuta per mezzo di tecniche biochimiche standard, è ora possibile caratterizzare, catalogare e confrontare qualunque serie (A) (B) 5 µm 0,2 µm Figura 1.10 Mycoplasma genitalium. (A) Micrografia elettronica a scansione che mostra la forma irregolare di questo piccolo batterio, che riflette la mancanza di una parete rigida. (B) Sezione trasversale (micrografia elettronica a trasmissione) di una cellula di Mycoplasma. Dei 530 geni del Mycoplasma genitalium, 43 codificano RNA transfer, ribosomiale e altri RNA non messaggeri. Si conoscono, o si possono supporre, le funzioni di 339 geni che codificano proteine: di questi, 154 sono coinvolti nella replicazione, trascrizione e traduzione del DNA e in processi correlati che coinvolgono DNA, RNA e proteine; 98 sono coinvolti nella membrana e nelle strutture di superficie della cellula; 46 nel trasporto di nutrienti e di altre molecole attraverso la membrana; 71 nella conversione dell’energia e nella sintesi e degradazione di piccole molecole e 12 nella regolazione della divisione cellulare e in altri processi. (A, da S. Razin, M. Banai, H. Gamliel, A. Pollack, W. Bredt e I. Kahane, Infect. Immun. 30:538-546, 1980, per gentile concessione della American Society for Microbiology; B, per gentile concessione di Roger Cole, in Medical Microbiology, 4a ed., a cura di S. Baron. Galveston: University of Texas Medical Branch, 1996.) CAPITOLO 1 Cellule e genomi 12 © 978-88-08-62126-9 di organismi viventi riferendosi a queste sequenze. Da questi confronti possiamo stimare la posizione di ciascun organismo nell’albero genealogico delle specie viventi, l’“albero della vita”. Ma prima di descrivere ciò che questo approccio rivela, dobbiamo considerare le vie tramite le quali cellule in ambienti diversi ottengono la materia e l’energia indispensabili per sopravvivere e proliferare e i modi in cui alcune classi di organismi dipendono da altri per le loro necessità chimiche di base. ■ Le cellule possono essere alimentate da varie fonti di energia libera Gli organismi viventi ottengono la loro energia libera in modi diversi. Alcuni, come animali, funghi e batteri che vivono nell’intestino umano, la ottengono nutrendosi di altri esseri viventi o dei prodotti chimici organici che essi producono; questi organismi sono detti organotrofici (dalla parola greca trophé, che significa “nutrimento”). Altri derivano la loro energia direttamente dal mondo inanimato. Questi si dividono in due classi: quelli che ottengono l’energia dalla luce solare e quelli che catturano la loro energia da sistemi ricchi di energia di sostanze chimiche inorganiche presenti nell’ambiente (sistemi chimici lontani dall’equilibrio chimico). Gli organismi della prima classe si chiamano fototrofici (che si nutrono di luce); quelli della seconda si chiamano litotrofici (che si nutrono di roccia). Gli organismi organotrofici non potrebbero esistere senza questi convertitori primari di energia, che costituiscono la massa maggiore della materia vivente sulla Terra. Gli organismi fototrofici comprendono molti tipi di batteri, oltre ad alghe e vegetali, dai quali noi – e praticamente tutti gli esseri viventi che vediamo comunemente intorno a noi – dipendiamo. Gli organismi fototrofici hanno modificato l’intera chimica del nostro ambiente: l’ossigeno nell’atmosfera terrestre è un sottoprodotto delle loro attività biosintetiche. Gli organismi litotrofici non sono un aspetto così evidente del nostro mondo, perché sono microscopici e vivono per la maggior parte in habitat non popolati dagli esseri umani, per esempio nelle profondità dell’oceano, sepolti nella crosta terrestre o in vari altri ambienti inospitali. Ma costituiscono una delle componenti principali del mondo vivente e sono particolarmente importanti in qualunque considerazione della storia della vita sulla Terra. Alcuni litotrofi ottengono energia da reazioni aerobiche, che usano ossigeno molecolare dell’ambiente; poiché l’O2 atmosferico è alla fine il prodotto di organismi viventi, questi litotrofi aerobici si nutrono, in un certo senso, dei prodotti della vita passata. Ci sono tuttavia altri litotrofi che vivono anaerobicamente, in luoghi in cui l’ossigeno molecolare è scarsamente presente o è assente, in circostanze simili a quelle che devono essere esistite nei primi momenti di vita sulla Terra, prima che si accumulasse ossigeno. I più estremi di questi siti sono i camini idrotermali bollenti che si trovano sul fondo dell’oceano Pacifico e dell’oceano Atlantico, in regioni in cui il fondo dell’oceano si allarga man mano che nuove porzioni della crosta terrestre si formano per un graduale sollevamento di materiale dall’interno della Terra (Figura 1.11). Acqua di mare che percola verso il basso è riscaldata e spinta di nuovo in alto come un geyser sottomarino, trasportando con sé una corrente di sostanze chimiche dalle rocce bollenti sottostanti. Un tipico cocktail potrebbe comprendere H2S, H2, CO, Mn2+, Fe2+, Ni2+, CH2, NH4+ e composti contenenti fosforo. Una densa popolazione di batteri vive nelle vicinanze del camino, crescendo con questa dieta austera e raccogliendo energia libera da reazioni fra i composti chimici disponibili. Altri organismi – conchiglie, muscoli e vermi marini giganti – a loro volta vivono dei batteri presenti presso il camino, formando un intero ecosistema analogo al sistema di vegetali e animali a cui apparteniamo, ma alimentato dall’energia geochimica invece che dalla luce (Figura 1.12). ■ Alcune cellule fissano azoto e anidride carbonica per le altre Costruire una cellula vivente richiede materia, oltre a energia libera. DNA, RNA e proteine sono composti da appena sei elementi: idrogeno, carbonio, azoto, ossigeno, zolfo e fosforo. Questi sono abbondanti nell’ambiente inani- CAPITOLO 1 Cellule e genomi 13 © 978-88-08-62126-9 Figura 1.11 La geologia di un MARE nube scura di acqua calda ricca di minerali bocca del camino idrotermale batteri litotrofici anaerobici comunità di animali invertebrati camino costituito da solfuri metallici precipitati 2–3 °C fondo del mare camino idrotermale bollente nel fondo dell’oceano. L’acqua percola verso la roccia fusa calda che sale dall’interno della Terra e viene scaldata e spinta verso l’alto, trasportando minerali rilasciati dalla roccia calda. Si stabilisce un gradiente di temperatura, da più di 350 °C vicino al nucleo del camino a 2-3 °C nell’oceano circostante. I minerali precipitano dall’acqua quando questa si raffredda, formando un camino. Classi diverse di organismi, che prosperano a temperature diverse, vivono a distanze diverse dal camino. Un tipico camino può essere alto alcuni metri, con un flusso di 1-2 m/sec. contorno dei 350 °C percolazione di acqua di mare soluzione calda di minerali basalto caldo mato, nelle rocce, nell’acqua e nell’atmosfera, ma non in forme chimiche che ne permettano una facile incorporazione in molecole biologiche. In particolare, l’N2 e la CO2 atmosferici sono estremamente non reattivi e una grande quantità di energia libera è necessaria per spingere le reazioni che usano queste molecole inorganiche per dare origine ai prodotti organici necessari per ulteriori biosintesi, cioè per fissare azoto e anidride carbonica, in modo da rendere N e C disponibili per gli organismi viventi. Molti tipi di cellule viventi sono privi del macchinario biochimico per eseguire questa fissazione e si basano su altre classi di cellule che eseguono questo lavoro per loro. Noi energia geochimica e materiali grezzi inorganici Figura 1.12 Organismi viventi a batteri animali multicellulari, ad es. vermi tubolari 1m 2500 metri di profondità vicino a un camino idrotermale. Vicino al camino, a temperature fino a circa 120 °C, vivono varie specie litotrofiche di batteri e di archei (archebatteri), alimentati direttamente dall’energia geochimica. Poco più lontano, dove la temperatura è minore, vivono vari animali invertebrati che si nutrono di questi microrganismi. I più notevoli sono i vermi tubolari giganti (2 metri) Riftia pachyptila che, invece di nutrirsi delle cellule litotrofiche, vivono in simbiosi con esse: organi specializzati nei vermi ospitano enormi quantità di batteri simbionti che ossidano lo zolfo. Questi batteri imbrigliano l’energia geochimica e forniscono nutrimento ai loro ospiti, che non hanno bocca, intestino o ano. Si pensa che i vermi tubolari si siano evoluti da animali più convenzionali e che si siano adattati alla vita nei camini idrotermali in un secondo momento. (Per gentile concessione di Monika Bright, Università di Vienna, Austria) CAPITOLO 1 Cellule e genomi 14 © 978-88-08-62126-9 animali dipendiamo dai vegetali per il rifornimento di composti organici del carbonio e dell’azoto. I vegetali invece, anche se possono fissare anidride carbonica dall’atmosfera, sono privi della capacità di fissare l’azoto atmosferico e dipendono in parte da batteri fissatori di azoto per soddisfare le loro necessità di composti dell’azoto. I vegetali della famiglia del pisello, per esempio, ospitano batteri simbionti fissatori di azoto in noduli delle loro radici. Le cellule viventi differiscono perciò ampiamente in alcuni degli aspetti più basilari della loro biochimica. Non sorprende che cellule con necessità e capacità complementari abbiano sviluppato associazioni strette. Alcune di queste associazioni, come vedremo più avanti, si sono evolute fino al punto in cui i partner hanno perso del tutto le loro identità separate: hanno unito le forze per formare una singola cellula composita. ■ La diversità biochimica maggiore si osserva fra le cellule procariotiche Figura 1.13 Forme e dimensioni di alcuni batteri. Sebbene la maggior parte sia piccola, come mostrato, e siano lunghi pochi micrometri, esistono anche specie giganti. Un esempio estremo (non mostrato) è il batterio a forma di sigaro Epulopiscium fishelsoni, che vive nello stomaco del pesce chirurgo e può essere lungo fino a 600 mm. Dalla semplice osservazione al microscopio è chiaro da molto tempo che gli organismi viventi possono essere classificati in base alla struttura cellulare in due gruppi: gli eucarioti e i procarioti. Negli eucarioti il DNA si trova in un compartimento intracellulare distinto circondato da una membrana, chiamato nucleo. (Il termine eucariote deriva dal greco e significa “veramente nucleato”, dalle parole eu, “bene” o “veramente”, e karyon, “nocciolo” o “nucleo”.) I procarioti non hanno un compartimento nucleare distinto per accogliere il loro DNA. Vegetali, funghi e animali sono eucarioti; i batteri sono procarioti, come gli archei, una classe separata di cellule procariotiche, di cui parleremo più avanti. Per la maggior parte le cellule procariotiche sono piccole e semplici nell’aspetto esterno (Figura 1.13) e vivono soprattutto come individui indipendenti o comunità poco organizzate anziché come organismi pluricellulari. Sono di norma sferiche o a bastoncino e misurano pochi micrometri in dimensione lineare. Spesso hanno un rivestimento protettivo robusto, chiamato parete cellulare, al di sotto del quale una membrana plasmatica racchiude un singolo compartimento citoplasmatico che contiene DNA, RNA, proteine e le molte piccole molecole necessarie per la vita. Al microscopio elettronico l’interno della cellula appare come una matrice di consistenza variabile senza alcuna struttura organizzata interna discernibile (Figura 1.14). Le cellule procariotiche vivono in un’enorme varietà di nicchie ecologiche e hanno capacità biochimiche diversificate in modo stupefacente, molto più delle cellule eucariotiche. Le specie organotrofiche possono utilizzare praticamente qualunque tipo di molecola organica come cibo, dagli zuccheri e gli amminoacidi agli idrocarburi e al gas metano. Le specie fototrofiche (Figura 1.15) ricavano l’energia dalla luce in vari modi, alcuni dei quali generano ossigeno come sottoprodotto, altri no. Le specie litotrofiche si possono nutrire di una dieta composta soltanto da nutrienti inorganici, ottenendo il carbonio da CO2 e basandosi su H2S per alimentare le necessità energetiche (Figura 1.16), o su H2, o su Fe2+, o su zolfo elementare, o su uno qualunque di una vasta gamma di altri composti chimici che si trovano nell’ambiente. Molte parti di questo mondo di organismi microscopici sono di fatto inesplorate. I metodi tradizionali della batteriologia ci hanno fornito una buona 2 µm cellule sferiche, ad es. Streptococcus cellule a bastoncino, ad es. Escherichia coli, Vibrio cholerae le cellule più piccole, ad es. Mycoplasma, Spiroplasma cellule spirali, ad es. Treponema pallidum CAPITOLO 1 Cellule e genomi 15 © 978-88-08-62126-9 Figura 1.14 La struttura di un batterio. (A) Il batterio Vibrio cholerae, con la sua semplice organizzazione interna. Come molte altre specie, il Vibrio ha un’appendice elicoidale a una estremità – un flagello – che ruota come un’elica per spingere la cellula in avanti. Può infettare l’intestino tenue umano causando il colera; la grave diarrea provocata da questa malattia uccide più di 100 000 persone all’anno. (B) Una micrografia elettronica di una sezione longitudinale del batterio, molto studiato, Escherichia coli (E. coli). Il DNA della cellula è concentrato nella regione in grigio chiaro. Pur facendo parte della nostra flora intestinale, E. coli è correlato al Vibrio ma ha molti flagelli distribuiti sulla superficie che non sono visibili in questa sezione. (B, per gentile concessione di E. Kellenberger.) membrana plasmatica DNA parete cellulare flagello 1 µm ribosomi (A) (B) 1 µm Figura 1.15 Il batterio fototrofico H S V 10 µm Anabaena cylindrica visto al microscopio ottico. Le cellule di questa specie formano lunghi filamenti pluricellulari. La maggior parte delle cellule (marcate V) svolge la fotosintesi, mentre altre sono specializzate per la fissazione dell’azoto (marcate H) o si sviluppano in spore resistenti (marcate S). (Per gentile concessione di Dave G. Adams.) conoscenza di quelle specie che si possono isolare e coltivare in laboratorio. Ma l’analisi della sequenza del DNA delle popolazioni di batteri in campioni derivati da habitat naturali – come terreno o acqua di mare, o anche la bocca umana – ci ha fatto capire che la maggior parte delle specie non può essere coltivata con le tecniche standard di laboratorio. Secondo una stima, almeno il 99% delle specie procariotiche resta da caratterizzare. Identificate solo dal loro DNA, non è stato ancora possibile far crescere la maggioranza di esse in laboratorio. ■ L’albero della vita ha tre ramificazioni principali: i batteri, gli archei e gli eucarioti La classificazione degli esseri viventi è dipesa tradizionalmente dal confronto del loro aspetto esteriore: possiamo vedere che un pesce ha occhi, mascelle, scheletro, cervello e così via, proprio come noi, mentre un verme non ha nulla del genere; che un cespuglio di rose è cugino di un melo, ma è meno simile a un’erba. Come ha dimostrato Darwin, possiamo facilmente interpretare somiglianze strette di questo tipo in termini di evoluzione da progenitori comuni e possiamo trovare ciò che rimane di molti di questi progenitori conservato nei fossili. In questo modo è stato possibile iniziare a disegnare un albero genealogico degli organismi viventi, che mostra le varie linee di discendenza, oltre a punti di ramificazione evolutiva, in cui i progenitori di un gruppo di specie sono diventati diversi da quelli di un altro. Quando le diversità fra organismi diventano molto grandi, però, questi metodi iniziano a fallire. In che modo possiamo decidere se un fungo è parente più stretto di un vegetale o di un animale? Quando si tratta dei procarioti, il compito diventa ancora più difficile: bastoncini e sfere microscopiche sembrano tutti 6 µm Figura 1.16 Un batterio litotrofico. Beggiatoa, che vive in ambienti sulfurei, ottiene la sua energia ossidando H2S e può fissare il carbonio anche al buio. Si notino i depositi gialli di zolfo all’interno delle cellule. (Per gentile concessione di Ralph W. Wolfe.) CAPITOLO 1 Cellule e genomi 16 © 978-88-08-62126-9 uomo Sulfolobus Haloferax Aeropyrum Methanothermobacter mais lievito EU C Paramecium AR I I BAT TER I (E I) ER T T BA cianobatteri OT U EI (ARCHEBATTERI) ARCH Bacillus Methanococcus Dictyostelium Euglena E. coli primo eucariote Thermotoga Aquifex Figura 1.17 Le tre divisioni principali (domini) del mondo vivente. Si noti che tradizionalmente la parola batteri è stata usata per riferirsi ai procarioti in generale, ma più recentemente è stata ridefinita per riferirsi specificamente agli eubatteri. L’albero qui rappresentato si basa su confronti della sequenza nucleotidica di una subunità di RNA ribosomiale nelle diverse specie. La lunghezza delle linee rappresenta una stima del numero di cambiamenti evolutivi che si sono verificati in questa molecola in ciascuna linea (vedi Figura 1.18). Le parti dell’albero coperte da un’ombreggiatura grigia rappresentano incertezze riguardo ai dettagli del vero schema di divergenza delle specie nel corso dell’evoluzione: il confronto delle sequenze nucleotidiche o degli amminoacidi di molecole diverse dall’rRNA, oltre ad altri argomenti, porta ad alberi in parte diversi. Come indicato, oggi si pensa che il nucleo delle cellule eucariotiche sia emerso da un sottoramo all’interno degli archei, cosicché l’inizio dell’albero ha solamente due rami: batteri e archei. cellula progenitrice comune Trypanosoma Giardia Trichomonas 1 cambiamento/10 nucleotidi uguali. I microbiologi hanno perciò tentato di classificare i procarioti in termini della loro biochimica e delle loro necessità nutrizionali. Ma questo approccio ha anch’esso i suoi inconvenienti. Nella sconcertante varietà di comportamenti biochimici è difficile sapere quali diversità riflettono veramente differenze nella storia evolutiva. L’analisi del genoma ci ha dato un mezzo più semplice, più diretto e più potente per determinare relazioni evolutive. La sequenza completa del DNA di un organismo definisce la specie con precisione quasi perfetta e con un dettaglio esauriente. Inoltre questa specificazione è in forma digitale – una stringa di lettere – che può essere immessa direttamente in un computer e confrontata con l’informazione corrispondente di qualunque altro essere vivente. Poiché il DNA è soggetto a cambiamenti casuali che si accumulano in lunghi periodi di tempo (come vedremo fra breve), il numero di differenze fra le sequenze di DNA di due organismi può fornire un’indicazione diretta, oggettiva e quantitativa della distanza evolutiva fra di essi. Questo approccio ha dimostrato che alcuni degli organismi che erano tradizionalmente classificati insieme come “batteri” possono essere tanto largamente separati nella loro origine evolutiva quanto lo è un qualunque procariote da un eucariote. Oggi sappiamo che i procarioti comprendono due gruppi distinti che si sono separati precocemente nella storia della vita sulla Terra, prima che i progenitori degli eucarioti si separassero in un gruppo a parte. I due gruppi di procarioti sono chiamati batteri (o eubatteri) e archei (o archebatteri). Analisi dettagliate del genoma hanno recentemente mostrato che la prima cellula eucariotica si è formata dopo che un particolare tipo di cellula appartenente agli archei ha inglobato un antico batterio (vedi Figura 12.3). Quindi oggi si ritiene che il mondo vivente consista di tre divisioni principali o domini: batteri, archei ed eucarioti (Figura 1.17). Gli archei si trovano spesso in ambienti che gli esseri umani evitano, come paludi, impianti di trattamento di fognature, profondità oceaniche, salamoie e sorgenti bollenti acide, anche se oggi si sa che sono ben rappresentati anche in ambienti meno estremi e più favorevoli, da terreni e laghi agli stomaci del bestiame. Come aspetto esterno non sono facilmente distinguibili dai batteri. A livello molecolare gli archei sembrano assomigliare agli eucarioti in modo più diretto nel macchinario che gestisce l’informazione genetica (replicazione, trascrizione e traduzione), ma più strettamente ai batteri nell’apparato per il metabolismo e la conversione dell’energia. Discuteremo più avanti in che modo ciò può essere spiegato. ■ Alcuni geni evolvono rapidamente, altri sono altamente conservati Sia nella conservazione che nella copiatura dell’informazione genetica si verificano incidenti ed errori casuali che alterano la sequenza nucleotidica, cioè creano mutazioni. Perciò, quando una cellula si divide, le due cellule figlie CAPITOLO 1 Cellule e genomi 17 © 978-88-08-62126-9 uomo Methanococcus E. coli uomo spesso non sono identiche né fra loro né alla cellula progenitrice. In rare occasioni l’errore può rappresentare un cambiamento per il meglio; più probabilmente non provocherà una differenza significativa nella prospettiva della cellula ma in molti casi l’errore causerà un danno serio, per esempio, distruggendo la sequenza che codifica una proteina chiave. I cambiamenti dovuti a errori del primo tipo tenderanno a essere perpetuati, poiché la cellula alterata ha una maggiore probabilità di riprodursi. Cambiamenti dovuti a errori del secondo tipo – cambiamenti selettivamente neutri – possono essere perpetuati o no: nella competizione per risorse limitate, se sopravviverà la cellula alterata o l’altra è una questione lasciata al caso. Ma cambiamenti che provocano un danno serio non portano da nessuna parte: la cellula che li subisce muore, senza lasciare progenie. Attraverso infinite ripetizioni di questo ciclo di errore e prova – di mutazione e selezione naturale – gli organismi evolvono: le loro specifiche genetiche cambiano, dando loro nuovi modi di sfruttare più efficacemente l’ambiente, di sopravvivere in competizione con altri e di riprodursi con successo. Alcune parti del genoma cambiano più facilmente di altre nel corso dell’evoluzione. Un segmento di DNA che non codifica proteine e non ha un ruolo regolatore significativo è libero di cambiare a una velocità limitata soltanto dalla frequenza degli errori casuali. Invece un gene che codifica una proteina o una molecola di RNA essenziale altamente ottimizzata non può alterarsi così facilmente: quando avvengono degli errori le cellule difettose vengono quasi sempre eliminate. I geni di questo secondo tipo sono perciò altamente conservati. Nel corso di 3,5 miliardi di anni o più di storia evolutiva molti aspetti del genoma sono cambiati in modo da diventare irriconoscibili; ma i geni più conservati rimangono perfettamente riconoscibili in tutte le specie viventi. Questi ultimi geni sono quelli che devono essere esaminati se vogliamo tracciare relazioni familiari fra gli organismi imparentati più alla lontana nell’albero della vita. Gli studi che hanno portato alla classificazione del mondo vivente nei tre domini dei batteri, degli archei e degli eucarioti si sono basati principalmente sull’analisi di uno degli rRNA che compongono il ribosoma. Poiché il processo di traduzione è essenziale per tutte le cellule viventi, questo componente del ribosoma si è ben conservato fin dall’inizio della storia della vita sulla Terra (Figura 1.18). ■ La maggior parte dei batteri e degli archei ha 1000-6000 geni La selezione naturale ha generalmente favorito quelle cellule procariotiche che si riproducono più velocemente assumendo materiali grezzi dall’ambiente e replicando se stesse in modo più efficiente, alla massima velocità permessa dalla disponibilità di cibo. Piccole dimensioni implicano un grande rapporto fra area di superficie e volume, aiutando così a massimizzare l’assunzione di nutrienti attraverso la membrana plasmatica e aumentando la velocità riproduttiva di una cellula. Presumibilmente per queste ragioni la maggior parte delle cellule procariotiche ha un bagaglio superfluo molto ridotto; i loro genomi sono piccoli, con i geni compattati strettamente insieme e minime quantità di DNA regolatore fra di essi. Le piccole dimensioni del genoma hanno reso facile l’utilizzo delle moderne tecniche di sequenziamento del DNA per determinare la sequenza completa dei genomi. Oggi abbiamo queste informazioni per migliaia di specie di batteri e di archei e per centinaia di specie di eucarioti. La maggior parte dei genomi dei batteri e degli archei contiene fra 106 e 107 coppie di nucleotidi, che codificano 1000-6000 geni. Una sequenza completa del DNA rivela sia i geni che un organismo possiede sia quelli di cui è privo. Quando confrontiamo i tre domini del mondo Figura 1.18 Informazione genetica dell’ultimo antenato comune di tutti gli esseri viventi attualmente conservata. È mostrata una parte del gene per il più piccolo dei due RNA principali che compongono il ribosoma. (La molecola completa è lunga circa 1500-1900 nucleotidi, secondo la specie.) Segmenti corrispondenti di sequenza nucleotidica di un archeo (Methanococcus jannaschii), di un eubatterio (Escherichia coli) e di un eucariote (Homo sapiens) sono allineati in parallelo. I siti in cui i nucleotidi sono identici fra specie sono indicati da un trattino rosso; la sequenza umana è ripetuta in basso in modo da poter osservare tutti gli allineamenti fra due sequenze. Un punto a metà della sequenza di E. coli indica un sito in cui una base è stata deleta dalla linea degli eubatteri nel corso dell’evoluzione o inserita nelle altre due linee. Si noti che le sequenze di questi tre organismi, rappresentativi dei tre domini del mondo vivente, differiscono l’una dall’altra in grado abbastanza simile, mentre mantengono ancora somiglianze indiscutibili. CAPITOLO 1 Cellule e genomi 18 © 978-88-08-62126-9 vivente, possiamo iniziare a vedere quali geni sono comuni a tutti – e devono perciò essere stati presenti nella cellula progenitrice di tutti gli esseri viventi odierni – e quali geni sono peculiari di un singolo ramo dell’albero della vita. Per spiegare le scoperte, però, dobbiamo considerare un po’ più da vicino il modo in cui si formano nuovi geni ed evolvono i genomi. ■ Nuovi geni sono generati da geni preesistenti Il materiale grezzo dell’evoluzione è la sequenza di DNA preesistente: non c’è un meccanismo naturale per creare lunghi tratti di nuova sequenza casuale. In questo senso nessun gene è interamente nuovo. L’innovazione può, tuttavia, verificarsi in parecchi modi (Figura 1.19). 1. Mutazione intragenica: un gene esistente può essere modificato in seguito a cambiamenti nella sequenza di DNA, tramite vari tipi di errori che si verificano soprattutto durante il processo di replicazione del DNA. 2. Duplicazione genica: un gene esistente può essere duplicato in modo da creare inizialmente una coppia di geni identici all’interno di una singola cellula; questi due geni possono quindi divergere nel corso dell’evoluzione. 3. Rimescolamento di segmenti di DNA: due o più geni esistenti possono essere spezzati e riuniti per produrre un gene ibrido che consiste di segmenti di DNA che originariamente appartenevano a geni separati. 4. Trasferimento orizzontale (intercellulare): un tratto di DNA può essere trasferito dal genoma di una cellula a quello di un’altra (anche a una cellula di un’altra specie). Questo processo si differenzia dal solito trasferimento verticale dell’informazione genetica da genitore a progenie. Ciascuno di questi tipi di cambiamento lascia una traccia caratteristica nella sequenza del DNA dell’organismo, fornendo una prova chiara che tutti e quattro i processi si sono verificati. Nei capitoli successivi parleremo dei meccanismi sottesi, ma per il momento ci concentreremo sulle conseguenze. GENOMA ORIGINALE INNOVAZIONE GENETICA MUTAZIONE INTRAGENICA mutazione 1 gene DUPLICAZIONE GENICA + 2 gene A RIMESCOLAMENTO DI SEGMENTI DI DNA + 3 + gene B organismo A Figura 1.19 Quattro modalità di innovazione genetica e i loro effetti sulla sequenza del DNA di un organismo. Una forma speciale di trasferimento orizzontale si verifica quando due tipi diversi di cellule entrano in un’associazione simbiotica permanente. I geni di una delle cellule possono essere trasferiti nel genoma dell’altra, come vedremo più avanti quando parleremo di mitocondri e cloroplasti. 4 + TRASFERIMENTO ORIZZONTALE organismo B organismo B con un nuovo gene CAPITOLO 1 Cellule e genomi 19 © 978-88-08-62126-9 ■ Duplicazioni geniche danno origine a famiglie di geni correlati all’interno di una singola cellula Una cellula duplica il suo intero genoma ogni volta che si divide in due cellule figlie.Tuttavia, degli incidenti portano occasionalmente alla duplicazione inappropriata soltanto di una parte del genoma, con mantenimento dei segmenti originali duplicati in una singola cellula. Una volta che un gene è stato duplicato in questo modo, una delle due copie del gene è libera di mutare e di specializzarsi per svolgere una funzione diversa nella stessa cellula. Cicli ripetuti di questo processo di duplicazione e di divergenza, nel corso di molti milioni di anni, hanno permesso a un gene di dare origine a un’intera famiglia di geni che si trovano tutti all’interno di un singolo genoma. L’analisi della sequenza del DNA dei genomi procariotici rivela molti esempi di queste famiglie di geni: nel Bacillus subtilis, per esempio, il 47% dei geni ha uno o più parenti evidenti (Figura 1.20). Quando i geni si duplicano e divergono in questo modo, gli individui di una specie si trovano dotati di varianti multiple di un gene primordiale. Questo processo evolutivo deve essere distinto dalla divergenza genetica che si verifica quando una specie di organismo si divide in due linee di discendenza separate a un punto di ramificazione dell’albero genealogico, per esempio quando la linea di discendenza umana si separò da quella degli scimpanzé. In questo caso i geni gradualmente si diversificano nel corso dell’evoluzione, ma è probabile che continuino ad avere funzioni corrispondenti nelle due specie sorelle. Geni che sono correlati per discendenza in questo modo – cioè geni in due specie separate che derivano dallo stesso gene ancestrale nell’ultimo progenitore comune di queste due specie – sono detti ortologhi. Geni correlati che sono derivati da un evento di duplicazione genica all’interno di un singolo genoma – ed è probabile che abbiano funzioni diverse – sono detti paraloghi. Geni che sono correlati per discendenza in uno di questi modi sono chiamati omologhi, un termine generale usato per riferirsi a entrambi i tipi di relazione (Figura 1.21). ■ I geni possono essere trasferiti fra organismi, sia in laboratorio che in natura I procarioti forniscono validi esempi di trasferimento orizzontale di geni da una specie di cellula a un’altra. I segni rivelatori più evidenti sono sequenze riconoscibili come derivate da virus batterici, chiamati anche batteriofagi (Figura 1.22). I virus sono piccoli pacchetti di materiale genetico che si sono evoluti come parassiti del macchinario riproduttivo e biosintetico delle cellule ospiti. Sebbene non siano cellule viventi agiscono spesso da vettori per il trasferimento di geni. I virus si replicano in una cellula, ne emergono con un involucro protettivo e quindi entrano in un’altra cellula, che può essere della stessa specie o di una specie diversa, e la infettano. Spesso la cellula infettata viene uccisa dalla massiccia proliferazione delle particelle virali al suo interno, ma talvolta il DNA virale, invece di generare direttamente queste particelle, può persistere nell’ospite per molte generazioni come passeggero relativamente innocuo, come frammento 283 geni in famiglie con 38-77 geni membri 764 geni in famiglie con 4-19 geni membri 273 geni in famiglie con 3 geni membri 568 geni in famiglie con 2 geni membri 2126 geni senza relazioni di famiglia Figura 1.20 Famiglie di geni evolutivamente correlati nel genoma del Bacillus subtilis. La famiglia più grande consiste di 77 geni che codificano varietà di trasportatori ABC, una classe di proteine di trasporto di membrana che si trovano in tutti e tre i domini del mondo vivente. (Adattata da F. Kunst et al., Nature 390:249-256, 1997. Con il permesso di MacMillan Publishers Ltd.) CAPITOLO 1 Cellule e genomi 20 © 978-88-08-62126-9 Figura 1.21 Geni paraloghi e ortologhi: due tipi di omologia genica basati su diverse vie evolutive. (A) Geni ortologhi. (B) Geni paraloghi. organismo ancestrale organismo ancestrale gene G gene G LA SPECIAZIONE DÀ ORIGINE A DUE SPECIE SEPARATE specie A specie B gene GA gene GB DUPLICAZIONE GENICA E DIVERGENZA organismo ancestrale successivo gene G1 gene G2 (A) i geni GA e GB sono ortologhi (B) i geni G1 e G2 sono paraloghi intracellulare separato di DNA, noto col nome di plasmide, o come sequenza inserita nel genoma regolare della cellula. Nei loro spostamenti i virus possono accidentalmente raccogliere frammenti di DNA dal genoma di una cellula ospite e portarli in un’altra cellula. Questi trasferimenti di materiale genetico sono molto frequenti nei procarioti. I trasferimenti orizzontali di geni fra cellule eucariotiche di specie diverse sono molto rari e non sembrano avere avuto un ruolo significativo nell’evoluzione degli eucarioti (anche se nel corso dell’evoluzione dei mitocondri e dei cloroplasti si sono verificati massicci trasferimenti dai genomi batterici a quelli eucariotici, come vedremo più avanti). I trasferimenti orizzontali avvengono invece molto più frequentemente fra specie diverse di procarioti. Molti procarioti hanno una notevole capacità di assumere anche molecole di DNA non virale dall’ambiente circostante e catturare così l’informazione genetica portata da queste molecole. In questo modo, o tramite trasferi- Figura 1.22 Il trasferimento virale di DNA da una cellula a un’altra. (A) Una micrografia elettronica di particelle di un virus batterico, il batteriofago T4. La testa di questo virus contiene il DNA virale; la coda contiene l’apparato per iniettare il DNA in un ospite batterico. (B) Una sezione trasversale di un batterio E. coli con un batteriofago T4 attaccato alla superficie. I grossi punti scuri dentro al batterio sono le teste di nuove particelle di T4 in corso di assemblaggio. Quando saranno mature, il batterio scoppierà per rilasciarle. (C-E) Il processo di iniezione del DNA all’interno del batterio, visualizzato mediante microscopia crio-elettronica di campioni congelati non colorati. (C) Inizia l’adesione. (D) Fase di adesione durante l’iniezione di DNA. (E) La testa del virus è stata svuotata di tutto il suo DNA trasferito nel batterio. (A, per gentile concessione di James Paulson; B, per gentile concessione di Jonathan King e Erika Hertwig, da G. Karp, Cell and Molecular Biology, 2a ed., New York: John Wiley & Sons, 1999. Con il permesso di John Wiley & Sons. C-E, per gentile concessione di Ian Molineux, Texas University, Austin e Jun Liu Health Science Center, Texas University, Houston). (B) (A) 100 nm (C) (D) 100 nm (E) 100 nm CAPITOLO 1 Cellule e genomi © 978-88-08-62126-9 mento mediato da virus, i batteri e gli archei in natura possono acquisire geni da cellule circostanti con relativa facilità. I geni che conferiscono resistenza a un antibiotico o la capacità di produrre una tossina, per esempio, possono essere trasferiti da specie a specie e fornire al batterio ricevente un vantaggio selettivo. In questo modo si è osservata l’evoluzione di ceppi batterici nuovi e talvolta pericolosi negli ecosistemi batterici che popolano ospedali o le varie nicchie del corpo umano. Per esempio, il trasferimento orizzontale di geni è responsabile della diffusione negli ultimi 40 anni di ceppi resistenti alla penicillina di Neisseria gonorrhoeae, il batterio che causa la gonorrea. Su una scala temporale più ampia le conseguenze possono essere ancora più profonde; è stato stimato che almeno il 18% di tutti i geni del genoma odierno di E. coli è stato acquisito per trasferimento orizzontale da un’altra specie negli ultimi 100 milioni di anni. ■ Il sesso porta a scambi orizzontali di informazione genetica all’interno di una specie Il trasferimento genico orizzontale fra i batteri ha un parallelo in un fenomeno a tutti familiare: il sesso. Oltre al consueto trasferimento verticale di materiale genetico da genitore a progenie, la riproduzione sessuale provoca un trasferimento orizzontale su vasta scala di informazioni genetiche fra due linee cellulari inizialmente separate, quelle del padre e della madre. Un aspetto chiave del sesso, naturalmente, è che lo scambio genetico normalmente avviene soltanto fra individui della stessa specie. Ma, indipendentemente dal fatto che avvenga all’interno di una specie o fra specie diverse, il trasferimento orizzontale di geni lascia un’impronta caratteristica: porta a individui che sono correlati più strettamente a una serie di parenti per quel che riguarda certi geni e più strettamente a un’altra serie di parenti per altri. Confrontando le sequenze di DNA di singoli genomi umani, un visitatore intelligente venuto dallo spazio potrebbe dedurre che gli esseri umani si riproducono sessualmente anche se non sapesse niente del comportamento umano. La riproduzione sessuale è un fenomeno molto diffuso (anche se non universale), specialmente fra gli eucarioti. Anche tra i batteri ogni tanto avvengono scambi sessuali controllati di DNA con altri membri della stessa specie. La selezione naturale ha chiaramente favorito organismi che si riproducono sessualmente, anche se i teorici dell’evoluzione ancora discutono su quale sia precisamente il vantaggio selettivo del sesso. ■ La funzione di un gene può spesso essere dedotta dalla sua sequenza Le relazioni familiari fra i geni sono importanti non soltanto per il loro interesse storico, ma perché semplificano la decifrazione della funzione di un gene. Una volta che la sequenza di un gene appena scoperto è stata determinata, un ricercatore può premere qualche tasto su un computer per cercare nell’intero database di sequenze geniche note geni a esso correlati. In molti casi la funzione di uno o più di questi omologhi sarà già stata determinata sperimentalmente e quindi, poiché la sequenza di un gene ne determina la funzione, si può spesso formulare una valida congettura sulla funzione del nuovo gene: è probabile che sia simile a quella degli omologhi già noti. In questo modo diventa possibile decifrare gran parte della biologia di un organismo semplicemente analizzando la sequenza del DNA del suo genoma e usando le informazioni che già possediamo sulle funzioni di geni in altri organismi che sono stati studiati più intensamente. ■ Più di 200 famiglie di geni sono comuni a tutti e tre i rami principali dell’albero della vita Essendo disponibili le sequenze genomiche di organismi che rappresentano tutti e tre i domini – archei, eubatteri ed eucarioti – si possono cercare sistematicamente omologie che attraversano questa enorme distanza evolutiva. In questo modo possiamo iniziare a considerare l’eredità comune di tutti gli es- 21 CAPITOLO 1 Cellule e genomi 22 © 978-88-08-62126-9 seri viventi. In questa impresa ci sono delle considerevoli difficoltà. Per esempio, singole specie hanno spesso perso qualche gene ancestrale; altri geni sono stati acquisiti quasi certamente per trasferimento orizzontale da un’altra specie e perciò possono non essere veramente ancestrali, anche se condivisi. In effetti i confronti dei genomi indicano con forza che sia la perdita di geni specifica di una linea, sia il trasferimento orizzontale di geni, in alcuni casi fra specie evolutivamente distanti, sono stati fattori importanti dell’evoluzione, almeno nel mondo procariotico. Infine, nel corso di 2 o 3 miliardi di anni alcuni geni che erano inizialmente condivisi saranno stati cambiati attraverso il processo di mutazione al di là di ogni possibilità di riconoscimento. A causa di tutti questi capricci del processo evolutivo sembra che soltanto una piccola percentuale di famiglie di geni ancestrali si sia mantenuta universalmente in forma riconoscibile. Così, delle 4873 famiglie di geni che codificano proteine definite confrontando i genomi di 50 specie di batteri, di 13 archei e di 3 eucarioti unicellulari, soltanto 63 sono veramente ubiquitarie (cioè rappresentate in tutti i genomi analizzati). La grande maggioranza di queste famiglie universali comprende componenti dei sistemi di traduzione e trascrizione. È difficile che in questo modo ci si avvicini a un’approssimazione realistica di una serie di geni ancestrali. Un’idea migliore – anche se ancora da perfezionare – di questa serie può essere ottenuta contando le famiglie di geni che hanno rappresentanti in più specie, ma non necessariamente in tutte, tratte da tutti e tre i domini principali. Questa analisi rivela 264 antiche famiglie conservate. A ciascuna di queste famiglie si può assegnare una funzione (almeno in termini di attività biochimica generale, ma di solito con più precisione) e il numero maggiore di famiglie di geni condivise è coinvolto nella traduzione e nel metabolismo e trasporto degli amminoacidi (Tabella 1.1). Tuttavia, questa serie di famiglie di geni altamente conservate rappresenta soltanto un quadro molto approssimativo dell’eredità comune di tutta la vita attuale; una ricostruzione più precisa del corredo di geni dell’ultimo progenitore universale comune potrebbe diventare possibile con l’ulteriore sequenziamento di genomi e con forme più sofisticate di analisi comparativa. ■ Le mutazioni rivelano le funzioni dei geni Senza ulteriori informazioni, per quanto si osservino le sequenze del genoma, non si riuscirà a scoprire la funzione dei geni. Possiamo riconoscere che il gene B è simile al gene A, ma in che modo scopriamo in primo luogo la funzioTABELLA 1.1 I numeri di famiglie di geni, classificate per funzione, che sono comuni a tutti e tre i domini del mondo vivente Elaborazione dell’informazione Metabolismo Traduzione 63 Trascrizione 7 Replicazione, riparazione, ricombinazione 13 Processi cellulari e segnalazione Produzione e conversione di energia 19 Trasporto e metabolismo dei carboidrati 16 Trasporto e metabolismo degli amminoacidi 43 Trasporto e metabolismo dei nucleotidi 15 22 Controllo del ciclo cellulare, mitosi e meiosi 2 Trasporto e metabolismo dei coenzimi Meccanismi di difesa 3 Trasporto e metabolismo dei lipidi 9 Meccanismi di trasduzione del segnale 1 Trasporto e metabolismo di ioni inorganici 8 Biogenesi della parete e della membrana cellulare 2 Biosintesi, trasporto e catabolismo di metaboliti secondari 5 Traffico intracellulare e secrezione 4 Poco caratterizzata Modificazioni post-traduzionali, turnover delle proteine, chaperoni 8 Funzioni biochimiche generali previste; ruolo biologico specifico sconosciuto 24 Per gli scopi di questa analisi le famiglie di geni sono definite come “universali” se sono rappresentate nei genomi di almeno due archei diversi (Archaeoglobus fulgidus e Aeropyrum pernix), due batteri evolutivamente distanti (Escherichia coli e Bacillus subtilis) e un eucariote (lievito, Saccharomyces cerevisiae). (Dati da R.L. Tatusov, E.V. Koonin e D.J. Lipman, Science 278:631-637, 1997, con il permesso di AAAS; R.L. Tatusov et al., BMC Bioinformatics 4:441, 2003, con il permesso di BioMed Central e il database COGs della US National Library of Medicine.) CAPITOLO 1 Cellule e genomi 23 © 978-88-08-62126-9 ne del gene A? E anche se conosciamo la funzione del gene A, in che modo controlliamo se la funzione del gene B è davvero la stessa, come la somiglianza di sequenza suggerisce? In che modo tracciamo la connessione fra il mondo dell’informazione genetica astratta e il mondo degli organismi viventi reali? L’analisi delle funzioni dei geni dipende da due approcci complementari: genetica e biochimica. La genetica inizia con lo studio di mutanti: troviamo o produciamo un organismo in cui un gene è alterato ed esaminiamo gli effetti sulla struttura e sulle prestazioni dell’organismo (Figura 1.23). La biochimica esamina le funzioni delle molecole: estraiamo molecole da un organismo e quindi ne studiamo l’attività chimica. Unendo genetica e biochimica è possibile trovare quelle molecole la cui produzione dipende da un dato gene. Allo stesso tempo studi delle prestazioni dell’organismo mutante ci mostrano quale ruolo quelle molecole hanno nelle attività dell’organismo nel suo insieme. Quindi genetica e biochimica combinate forniscono un modo di scoprire la connessione di geni e molecole alla struttura e funzione dell’organismo. Negli ultimi anni le informazioni di sequenza del DNA e i potenti strumenti della biologia molecolare hanno permesso un rapido progresso. Mediante confronti delle sequenze si possono spesso identificare regioni particolari all’interno di un gene che si sono conservate quasi senza cambiamenti nel corso dell’evoluzione. Queste regioni conservate sono probabilmente le parti più importanti del gene in termini di funzione. Possiamo controllare il loro contributo individuale all’attività del prodotto del gene creando in laboratorio mutazioni di siti specifici all’interno del gene, o costruendo geni ibridi artificiali che combinano parte di un gene con una parte di un altro. Gli organismi possono essere ingegnerizzati per produrre l’RNA o la proteina specificata dal gene in grandi quantità per facilitare l’analisi biochimica. Specialisti in struttura molecolare possono determinare la conformazione tridimensionale del prodotto del gene, rivelando la posizione esatta di tutti i suoi atomi. I biochimici possono determinare in che modo le varie parti della molecola specificata geneticamente contribuiscono al suo comportamento chimico. I biologi cellulari possono analizzare il comportamento di cellule ingegnerizzate per esprimere una versione mutante del gene. Non esiste tuttavia un’unica semplice ricetta per scoprire la funzione di un gene, né un semplice formato universale standard che la descriva. Possiamo scoprire, per esempio, che il prodotto di un dato gene catalizza una data reazione chimica eppure non avere idea di come e perché quella reazione sia importante per l’organismo. La caratterizzazione funzionale di ciascuna nuova famiglia di prodotti genici, a differenza della descrizione delle sequenze dei geni, presenta una nuova sfida per il biologo. Inoltre la funzione di un gene non è mai compresa del tutto fino a che non conosciamo il suo ruolo nella vita dell’organismo nel suo insieme. Per dare il senso finale alle funzioni di un gene dobbiamo perciò studiare organismi interi e non soltanto molecole o cellule. ■ I biologi molecolari si sono concentrati su E. coli Poiché gli organismi viventi sono così complessi, più impariamo su una specie particolare, più questa diventa interessante come oggetto di ulteriori studi. Ciascuna scoperta solleva nuove domande e fornisce nuovi strumenti con i quali affrontare questioni generali che riguardano l’organismo scelto. Per questa ragione grandi comunità di biologi si sono dedicate a studiare diversi aspetti dello stesso organismo modello. Nel mondo enormemente vario dei batteri il riflettore della biologia molecolare si è per lungo tempo concentrato intensamente su una singola specie: Escherichia coli o E. coli (vedi Figure 1.13 e 1.14). Questa piccola cellula batterica a forma di bastoncino vive normalmente nell’intestino dell’uomo e di altri vertebrati, ma può essere fatta crescere facilmente in un semplice brodo nutriente in una fiasca da coltura. Il batterio si adatta a condizioni chimiche variabili, si riproduce rapidamente e può evolvere per mutazione e selezione a notevole velocità. Come per altri batteri, ceppi diversi di E. coli, anche se sono classificati come membri di una singola specie, differiscono geneticamente in grado maggiore di quanto differiscano fra loro varietà diverse di 5 µm Figura 1.23 Un fenotipo mutante che riflette la funzione di un gene. Un lievito normale (della specie Schizosaccharomyces pombe) è confrontato con un mutante in cui un cambiamento in un singolo gene ha convertito la cellula da una forma a sigaro (sinistra) a una forma a T (destra). Il gene mutante ha perciò una funzione nel controllo della forma della cellula. Ma come, in termini molecolari, questo gene svolge tale funzione? Questa è una domanda più difficile e necessita di un’analisi biochimica per avere risposta. (Per gentile concessione di Kenneth Sawin e Paul Nurse.) CAPITOLO 1 Cellule e genomi 24 Figura 1.24 Il genoma di E. coli. (A) Un gruppo di cellule di E. coli. (B) Un disegno schematico del genoma del ceppo K-12 di E. coli. Il disegno è circolare perché il DNA di E. coli, come quello di altri procarioti, forma un unico anello chiuso. I geni che codificano proteine sono mostrati come barre gialle o arancione, a seconda del filamento di DNA dal quale vengono trascritti; geni che codificano soltanto molecole di RNA sono indicati da frecce verdi. Alcuni geni sono trascritti da un filamento della doppia elica del DNA (in senso orario in questo disegno), altri dall’altro filamento (antiorario). (A, per gentile concessione del dottor Tony Brain e David Parker/ Photo Researchers; B, adattato da F.R. Blattner et al., Science 277:14531462, 1997.) © 978-88-08-62126-9 origine della replicazione (A) Escherichia coli K-12 4 639 221 coppie di nucleotidi termine della replicazione (B) un organismo che si riproduce sessualmente come un vegetale o un animale. Un ceppo di E. coli può possedere centinaia di geni che sono assenti in un altro e i due ceppi possono avere in comune anche soltanto il 50% dei loro geni. Il ceppo standard di laboratorio di E. coli K-12 ha un genoma costituito approssimativamente da 4,6 milioni di coppie di nucleotidi, contenuti in una singola molecola di DNA circolare che codifica circa 4300 specie diverse di proteine (Figura 1.24). In termini molecolari abbiamo una conoscenza più approfondita del funzionamento di E. coli che di qualunque altro organismo vivente. La maggior parte della nostra comprensione dei meccanismi fondamentali della vita – per esempio il modo in cui le cellule replicano il loro DNA, o come decodificano le istruzioni rappresentate nel DNA per dirigere la sintesi di proteine specifiche – è derivata dallo studio di E. coli. I meccanismi genetici di base si sono rivelati altamente conservati durante l’evoluzione: questi meccanismi sono perciò essenzialmente gli stessi nelle nostre cellule e in E. coli. SOMMARIO I procarioti (cellule senza un nucleo distinto) sono biochimicamente gli organismi più diversificati e comprendono specie che possono ottenere tutta la loro energia e i loro nutrienti da fonti chimiche inorganiche, come le miscele reattive di minerali rilasciate dai camini idrotermali sul fondo dell’oceano, il tipo di dieta che può avere nutrito le prime cellule viventi 3,5 miliardi di anni fa. Il confronto delle sequenze di DNA rivela le relazioni familiari fra gli organismi viventi e mostra che i procarioti si dividono in due gruppi che si sono separati precocemente nel corso dell’evoluzione: i batteri (o eubatteri) e gli archei. Insieme agli eucarioti (cellule con un nucleo circondato da membrana) questi costituiscono i tre rami principali dell’albero della vita. La maggior parte dei batteri e degli archei sono piccoli organismi unicellulari con genomi compatti che comprendono 1000-6000 geni. Molti geni di un singolo organismo mostrano forti somiglianze familiari nella sequenza del DNA, il che implica che si sono originati dallo stesso gene ancestrale per duplicazione genica e divergenza. Somiglianze familiari (omologie) sono chiare anche quando si confrontano sequenze di geni fra specie diverse e più di 200 famiglie geniche si sono conservate al punto tale che possono essere riconosciute CAPITOLO 1 Cellule e genomi © 978-88-08-62126-9 come comuni alla maggior parte delle specie di tutti e tre i domini del mondo vivente. Così, data la sequenza di DNA di un gene appena scoperto, è spesso possibile dedurre la funzione del gene dalla funzione nota di un gene omologo in un organismo modello studiato intensivamente, come il batterio E. coli. ● LÕinformazione genetica negli eucarioti Le cellule eucariotiche, in generale, sono più grandi e più elaborate delle cellule procariotiche e i loro genomi sono anch’essi più grandi e più elaborati. Le maggiori dimensioni sono accompagnate da differenze radicali nella struttura e nella funzione della cellula. Inoltre molte classi di cellule eucariotiche formano organismi pluricellulari che arrivano a un livello di complessità mai raggiunto da nessun procariote. Poiché sono così complessi, gli eucarioti pongono ai biologi molecolari una serie speciale di sfide, che ci riguarderanno per il resto di questo libro. I biologi affrontano queste sfide sempre più attraverso l’analisi e la manipolazione dell’informazione genetica all’interno di cellule e organismi. È perciò importante conoscere da subito alcuni degli aspetti peculiari del genoma eucariotico. Inizieremo prendendo brevemente in esame la maniera in cui sono organizzate le cellule eucariotiche, come ciò riflette il loro modo di vivere e come i loro genomi differiscono da quelli dei procarioti. Ciò ci porterà a delineare la strategia per mezzo della quale i biologi molecolari, sfruttando l’informazione genetica, stanno tentando di scoprire il modo in cui funzionano gli organismi eucariotici. ■ Le cellule eucariotiche possono avere avuto origine come predatori Per definizione le cellule eucariotiche custodiscono il loro DNA in un compartimento interno chiamato nucleo. Il DNA è separato dal citoplasma dall’involucro nucleare, che consiste di un doppio strato di membrana che circonda il nucleo. Gli eucarioti hanno anche altri aspetti che li distinguono dai procarioti (Figura 1.25). Le loro cellule sono, di norma, 10 volte più grandi in dimensioni lineari e 1000 volte in volume. Esse hanno un citoscheletro, ovvero un sistema di filamenti proteici che si incrociano nel citoplasma e formano, insieme alle molte proteine che si attaccano a essi, una combinazione di fasce, corde e motori che conferiscono alla cellula forza meccanica, ne controllano la forma e ne azionano e guidano i movimenti (Filmato 1.1 ). L’involucro nucleare è soltanto una parte di una serie complessa di membrane interne, ciascuna strutturalmente simile alla membrana plasmatica, che racchiudono tipi diversi di spazi all’interno della cellula, molti dei quali sono coinvolti in processi correlati a digestione e secrezione. Essendo prive della robusta parete cellulare tipica della maggior parte dei batteri, le cellule animali e le cellule eucariotiche che vivono libere chiamate protozoi possono modificare la propria forma rapidamente e inglobare altre cellule e piccole particelle mediante la fagocitosi (Figura 1.26). È ancora un mistero il modo in cui tutte queste proprietà si sono evolute e in quale sequenza. Una visione plausibile, tuttavia, è che siano tutte riflessi del modo di vivere di una cellula eucariotica primordiale che era un predatore e viveva catturando altre cellule e mangiandole (Figura 1.27). Questo modo di vivere richiede una cellula grande con una membrana plasmatica flessibile, oltre a un citoscheletro elaborato per sostenere e muovere questa membrana. Può anche richiedere che le lunghe e fragili molecole di DNA siano sequestrate in un compartimento nucleare separato, per proteggere il genoma dai danni provocati dai movimenti del citoscheletro. ■ Le cellule eucariotiche attuali si sono evolute da una simbiosi Un modo di vivere predatorio aiuta a spiegare un altro aspetto delle cellule eucariotiche.Tutte queste cellule contengono, o hanno contenuto in qualche momento della loro storia, mitocondri (Figura 1.28). Questi piccoli corpi citoplasmatici, racchiusi da un doppio strato di membrane, assumono ossigeno e 25 CAPITOLO 1 Cellule e genomi 26 © 978-88-08-62126-9 microtubulo centrosoma con la coppia di centrioli 5 µm matrice extracellulare cromatina (DNA) poro nucleare involucro nucleare vescicole lisosoma filamenti di actina nucleolo perossisoma ribosomi nel citosol apparato del Golgi filamenti intermedi Figura 1.25 Le caratteristiche principali delle cellule eucariotiche. Il disegno rappresenta una tipica cellula animale, ma quasi tutti gli stessi componenti si trovano nei vegetali, nei funghi e in eucarioti monocellulari come lieviti e protozoi. Le cellule vegetali contengono cloroplasti oltre ai componenti mostrati qui e la loro membrana plasmatica è circondata da una robusta parete esterna formata da cellulosa. Figura 1.26 Fagocitosi. Questa serie di fermo-immagini di un film mostra un globulo bianco umano (un neutrofilo) che ingloba un globulo rosso (colorato artificialmente in rosso) che è stato trattato con un anticorpo che lo contrassegna affinché sia distrutto (vedi Filmato 13.5). (Per gentile concessione di Stephen E. Malawista e Anne de Boisfleury Chevance.) membrana plasmatica nucleo reticolo endoplasmatico mitocondrio imbrigliano energia dall’ossidazione di molecole di cibo – come gli zuccheri – per produrre la maggior parte dell’ATP che alimenta le attività della cellula. I mitocondri sono simili in dimensioni a piccoli batteri e, come i batteri, hanno un loro genoma sotto forma di una molecola circolare di DNA, propri ribosomi, diversi da quelli presenti altrove nella cellula eucariotica, e propri RNA transfer. È oggi generalmente accettato che i mitocondri si siano originati da batteri liberi che metabolizzavano ossigeno (aerobici) inglobati da una cellula eucariotica ancestrale che non poteva altrimenti fare uso dell’ossigeno (era cioè anaerobica). Sfuggendo alla digestione, questi batteri si sono evoluti in simbiosi con la cellula che li aveva inglobati e con la sua progenie, ricevendo riparo e nutrimento in cambio della generazione di energia che producevano per i loro ospiti. Questa simbiosi fra un predatore eucariotico anaerobico primitivo e una cellula batterica aerobica si pensa si sia stabilita circa 1,5 miliardi di anni fa, quando l’atmosfera della Terra cominciò a diventare ricca di ossigeno. Come mostrato nella Figura 1.29, analisi recenti del genoma suggeriscono che le prime cellule eucariotiche si sono formate dopo che un archibatterio ha inglobato un eubatterio aerobico. Questo spiegherebbe perché tutte le cellule eucariotiche odierne, anche quelle che vivono in condizioni strettamente anaerobiche, mostrano chiaramente di aver contenuto un tempo mitocondri. Molte cellule eucariotiche – specificamente, quelle dei vegetali e delle alghe – contengono anche un’altra classe di piccoli organelli circondati da 10 µm CAPITOLO 1 Cellule e genomi 27 © 978-88-08-62126-9 Figura 1.27 Un eucariote (A) 100 µm (B) membrana in parte simili ai mitocondri, i cloroplasti (Figura 1.30). I cloroplasti svolgono la fotosintesi, usando l’energia della luce solare per sintetizzare carboidrati da anidride carbonica atmosferica e acqua, e consegnano i prodotti alla cellula ospite come cibo. Come i mitocondri, i cloroplasti hanno un proprio genoma e quasi certamente si sono originati come batteri fotosintetici simbionti, acquisiti da cellule che possedevano già mitocondri (Figura 1.31). unicellulare che mangia altre cellule. (A) Il Didinium è un protozoo carnivoro, che appartiene al gruppo noto come ciliati. Ha un corpo globulare, circa 150 mm di diametro, circondato da due frange di ciglia, appendici sinuose simili a fruste che battono in continuazione; la sua estremità anteriore è appiattita eccetto per una singola protrusione, piuttosto simile a un muso. (B) Il Didinium che ingloba la sua preda. Il Didinium normalmente nuota nell’acqua ad alta velocità per mezzo del battito sincrono delle sue ciglia. Quando incontra una preda adatta, in genere un altro tipo di protozoo, rilascia numerosi piccoli dardi paralizzanti dalla regione del muso. Quindi il Didinium si attacca all’altra cellula e la divora per fagocitosi, rivoltandosi come una palla cava per inglobare la sua vittima, che è quasi delle stesse dimensioni. (Per gentile concessione di D. Barlow.) (B) (C) (A) 100 nm Figura 1.28 Un mitocondrio. (A) Una sezione trasversale, vista al microscopio elettronico. (B) Un disegno di un mitocondrio con una parte tagliata per mostrare la struttura tridimensionale (Filmato 1.2 ). (C) Una cellula eucariotica schematica, con in colore lo spazio interno di un mitocondrio, che contiene il DNA e i ribosomi mitocondriali. Si notino la membrana esterna liscia e la membrana interna convoluta, che ospita le proteine che generano ATP dall’ossidazione di molecole di cibo. (A, per gentile concessione di Daniel S. Friend.) CAPITOLO 1 Cellule e genomi 28 © 978-88-08-62126-9 cellula anaerobica derivata da un archibatterio cellula eucariotica aerobica primitiva nucleo primitivo nucleo membrana interna membrana batterica esterna membrana plasmatica batterica perdita della membrana derivata dall’archibatterio mitocondrio con due membrane batterio aerobico Figura 1.29 L’origine dei mitocondri. Si pensa che un’antica cellula predatrice anaerobica (un archibatterio) abbia inglobato l’antenato batterico dei mitocondri, iniziando una relazione simbiotica. Oggi si può riconoscere chiaramente nei genomi di tutti gli eucarioti una doppia eredità: sia dagli eubatteri che dagli archibatteri. Una cellula eucariotica equipaggiata con i cloroplasti non ha bisogno di cacciare altre cellule come preda; è nutrita dai cloroplasti prigionieri che ha ereditato dai suoi progenitori. Di conseguenza le cellule vegetali, anche se possiedono l’equipaggiamento citoscheletrico per il movimento, hanno perso la capacità di cambiare forma rapidamente e di inglobare altre cellule per fagocitosi e hanno invece creato intorno a sé una robusta parete cellulare protettiva. Se l’eucariote ancestrale era davvero un predatore, possiamo considerare le cellule vegetali come eucarioti che hanno compiuto la transizione dalla caccia alla coltivazione. I funghi rappresentano un ulteriore modo di vivere eucariotico. Le cellule dei funghi, come quelle degli animali, possiedono mitocondri ma non cloroplasti; tuttavia, a differenza delle cellule animali e dei protozoi, hanno una robusta parete esterna che limita la loro capacità di muoversi rapidamente o di inghiottire altre cellule. Sembra che i funghi si siano trasformati da cacciatori in spazzini: altre cellule secernono molecole nutrienti o le rilasciano quando muoiono e i funghi si nutrono di questi resti, eseguendo qualunque digestione sia necessaria al di fuori delle cellule, attraverso la secrezione di enzimi digestivi all’esterno. cloroplasti membrane contenenti clorofilla Figura 1.30 Cloroplasti. Questi organelli catturano l’energia della luce solare nelle cellule vegetali e in alcuni eucarioti unicellulari. (A) Una cellula isolata da una foglia di una pianta da fiore, vista al microscopio ottico, che mostra i cloroplasti verdi (Filmato 1.3 e vedi anche Filmato 14.9). (B) Disegno di uno dei cloroplasti, che mostra il sistema altamente ripiegato di membrane interne che contengono le molecole di clorofilla tramite le quali viene assorbita la luce. (A, per gentile concessione di Preeti Dahiya.) membrana interna membrana esterna (A) 10 µm (B) CAPITOLO 1 Cellule e genomi 29 © 978-88-08-62126-9 cellula eucariotica primitiva cellula eucariotica primitiva capace di fotosintesi cloroplasti batterio fotosintetico ■ Gli eucarioti hanno genomi ibridi L’informazione genetica delle cellule eucariotiche ha un’origine ibrida (dall’archibatterio ancestrale anaerobico e dai batteri adottati come simbionti). La maggior parte di questa informazione è conservata nel nucleo, ma una piccola quantità rimane nei mitocondri e, per le cellule delle alghe e dei vegetali, nei cloroplasti. Il DNA dei mitocondri e dei cloroplasti può essere separato dal DNA nucleare e analizzato e sequenziato individualmente. I genomi dei mitocondri e dei cloroplasti si sono rivelati versioni degenerate e ridotte dei corrispondenti genomi batterici. In una cellula umana, per esempio, il genoma mitocondriale consiste soltanto di 16 569 coppie di nucleotidi e codifica solamente 13 proteine, due RNA ribosomiali e 22 RNA transfer. I geni assenti nei mitocondri e nei cloroplasti non sono andati tutti perduti; molti di essi si sono invece spostati nel DNA del nucleo della cellula ospite. Il DNA nucleare umano contiene molti geni che codificano proteine che svolgono funzioni essenziali all’interno del mitocondrio; nei vegetali il DNA nucleare contiene anche molti geni che specificano proteine necessarie nei cloroplasti. In entrambi i casi le sequenze di DNA di questi geni nucleari mostrano chiaramente la loro origine dagli antenati batterici del rispettivo organello. ■ I genomi eucariotici sono grandi La selezione naturale ha evidentemente favorito mitocondri con genomi piccoli. Al contrario, sembra che i genomi nucleari della maggior parte degli eucarioti siano stati liberi di ingrandirsi. Forse il modo di vivere eucariotico ha reso le grandi dimensioni un vantaggio: i predatori devono essere più grandi della loro preda e le dimensioni cellulari in genere aumentano in proporzione alle dimensioni del genoma. Qualunque sia la spiegazione, aiutati dall’accumulo di elementi trasponibili parassiti (di cui parleremo nel Capitolo 5), i genomi della maggior parte degli eucarioti sono di ordini di grandezza maggiori rispetto a quelli dei batteri e degli archei (Figura 1.32). La libertà di essere prodighi con il DNA ha avuto profonde implicazioni. Gli eucarioti non solo hanno più geni dei procarioti; essi hanno anche molto più DNA che non codifica proteine. Il genoma umano contiene 1000 volte più coppie di nucleotidi del genoma di un batterio tipico, forse 10 volte più geni e molto più DNA non codificante (circa il 98,5% del genoma umano è non codificante, rispetto all’11% del genoma del batterio E. coli). Nella Tabella 1.2 sono elencati, per un facile confronto con E. coli, le dimensioni dei genomi e il numero dei geni stimati per alcuni eucarioti. Discuteremo brevemente di come ognuno di questi eucarioti serva da organismo modello. Figura 1.31 L’origine dei cloroplasti. Una cellula eucariotica primitiva, che già possedeva mitocondri, ha inglobato un batterio fotosintetico (un cianobatterio) e lo ha trattenuto in simbiosi. Si pensa che tutti i cloroplasti odierni discendano da una singola specie di cianobatterio che è stato adottato come simbionte interno (un endosimbionte) più di un miliardo di anni fa. CAPITOLO 1 Cellule e genomi 30 © 978-88-08-62126-9 Figura 1.32 Dimensioni dei uomo genomi a confronto. Le dimensioni dei genomi sono misurate in coppie di nucleotidi di DNA per genoma aploide, cioè per singola copia del genoma. (Le cellule di organismi che si riproducono sessualmente come noi sono generalmente diploidi: esse contengono due copie del genoma, una ereditata dalla madre e l’altra dal padre.) Organismi strettamente correlati possono variare molto nella quantità di DNA nel loro genoma, anche se contengono numeri simili di geni funzionalmente distinti. (Dati da W.H. Li, Molecular Evolution, pp. 380383. Sunderland, MA: Sinauer, 1997.) MAMMIFERI, UCCELLI, RETTILI pesce palla pesce zebra rana tritone ANFIBI, PESCI moscerino della frutta gamberetto CROSTACEI, INSETTI Caenorhabditis VERMI NEMATODI Arabidopsis grano giglio VEGETALI, ALGHE lievito FUNGHI parassita malarico ameba PROTOZOI micoplasma E. coli BATTERI ARCHEI 105 106 107 108 109 1010 coppie di nucleotidi per genoma aploide 1011 1012 TABELLA 1.2 Alcuni organismi modello e i loro genomi Organismo Escherichia coli (batterio) Dimensione del genoma* (coppie di nucleotidi) Numero approssimato di geni 4,6 3 106 4300 13 3 106 6600 Caenorhabditis elegans (verme) 130 3 106 21 000 Arabidopsis thaliana (pianta) 220 3 106 29 000 Drosophila melanogaster (moscerino) 200 3 106 15 000 Danio rerio (pesce zebra) 1400 3 106 32 000 Mus musculus (topo) 2800 3 106 30 000 Homo sapiens (uomo) 3200 3 106 30 000 Saccharomyces cerevisiae (lievito) *La dimensione del genoma include una stima della quantità di sequenze di DNA altamente ripetute non presenti nei database dei genomi. ■ I genomi eucariotici sono ricchi di DNA regolatore Buona parte del nostro DNA non codificante è quasi certamente una cianfrusaglia di cui si potrebbe fare a meno, che conserviamo come pile di vecchie carte perché quando nessuno ci obbliga a mantenere piccolo un archivio è più facile conservare tutto che selezionare le informazioni utili e scartare il resto. Certe specie eucariotiche eccezionali, come una specie di pesce palla, sono una testimonianza della tendenza allo spreco dei loro parenti; esse sono in qualche modo riuscite a liberarsi di grandi quantità di DNA non codificante. Eppure appaiono simili per struttura, comportamento e adattamento a specie correlate che hanno di gran lunga più DNA (vedi Figura 4.71). Anche nei genomi eucariotici compatti come quello del pesce palla c’è più DNA non codificante che DNA codificante e almeno una parte del DNA non codificante ha certamente funzioni importanti. In particolare, serve a regolare l’espressione di geni adiacenti. Con questo DNA regolatore gli eucarioti hanno evoluto modi caratteristici di controllare quando e dove un gene entra in azione. Questa sofisticata regolazione genica è cruciale per la formazione di complessi organismi pluricellulari. CAPITOLO 1 Cellule e genomi 31 © 978-88-08-62126-9 ■ Il genoma definisce il programma dello sviluppo pluricellulare Le cellule di un singolo animale o vegetale sono straordinariamente varie. Cellule adipose, cellule della pelle, cellule dell’osso, cellule nervose sembrano tanto dissimili quanto due cellule possono esserlo (Figura 1.33). Eppure tutti questi tipi cellulari sono i discendenti di una singola cellula uovo fecondata e tutte (con rare eccezioni) contengono copie identiche del genoma della specie. Le differenze derivano dal modo in cui queste cellule fanno un uso selettivo delle loro istruzioni genetiche secondo i segnali che ricevono dall’ambiente circostante durante lo sviluppo embrionale. Il DNA non è soltanto una lista della spesa che specifica le molecole che ogni cellula deve avere e la cellula non è un insieme di tutti gli articoli della lista. Piuttosto la cellula si comporta come una macchina con più funzioni, con sensori per ricevere segnali ambientali e capacità altamente sviluppate di mettere in azione serie diverse di geni secondo le sequenze di segnali ai quali la cellula è stata esposta. Il genoma di ciascuna cellula è abbastanza grande da contenere l’informazione che specifica un intero organismo pluricellulare, ma in ogni singola cellula viene usata soltanto una parte di quella informazione. Una grande frazione dei geni del genoma eucariotico codifica proteine che servono a regolare le attività di altri geni. La maggior parte di questi regolatori di trascrizione agisce legando, direttamente o indirettamente, DNA regolatore adiacente ai geni che devono essere controllati o interferendo con la capacità di altre proteine di farlo. Il genoma espanso degli eucarioti serve perciò non soltanto a specificare l’hardware della cellula, ma anche a conservare il software che controlla il modo in cui viene usato l’hardware (Figura 1.34). Le cellule non si limitano a ricevere passivamente dei segnali, ma scambiano invece attivamente segnali con le cellule circostanti. Quindi, in un organismo pluricellulare che si sviluppa, ciascuna cellula è governata dallo stesso sistema di controllo, ma con conseguenze diverse a seconda dei segnali che vengono scambiati. Il risultato, sorprendentemente, è una disposizione precisa di cellule in stati diversi, ciascuna con caratteristiche appropriate alla sua posizione nella struttura pluricellulare. neurone neutrofilo 25 µm Figura 1.33 I diversi tipi cellulari variano enormemente per forma e dimensioni. Una cellula nervosa animale comparata a un neutrofilo, un tipo di globulo bianco. Le cellule sono disegnate in scala. ■ Molti eucarioti vivono come cellule solitarie Molte specie di cellule eucariotiche conducono una vita solitaria: alcune come cacciatori (i protozoi), altre come fotosintetizzatori (le alghe unicellulari), alcune come spazzini (i funghi unicellulari o lieviti). La Figura 1.35 rappresenta una parte dell’impressionante varietà di forme che possono assumere questi eucarioti unicellulari. L’anatomia dei protozoi, in particolare, è spesso elaborata e comprende strutture come setole sensoriali, fotorecetto- Figura 1.34 Controllo genetico del programma di sviluppo pluricellulare. Il ruolo di un gene regolatore è dimostrato nella bocca di leone Antirrhinum. In questo esempio una mutazione in un singolo gene che codifica una proteina regolatrice provoca lo sviluppo di germogli dotati di foglie al posto dei fiori: poiché una proteina regolatrice è cambiata le cellule adottano caratteri che sarebbero appropriati a una posizione diversa nella pianta normale. Il mutante è a sinistra, la pianta normale a destra. (Per gentile concessione di Enrico Coen e Rosemary Carpenter.) CAPITOLO 1 Cellule e genomi 32 © 978-88-08-62126-9 (D) (A) (B) Figura 1.35 Un assortimento di protozoi: un piccolo esempio di una classe estremamente diversificata di organismi. I disegni sono eseguiti a scale diverse, ma in ciascun caso la barra rappresenta 10 mm. Gli organismi in (A), (C), e (G) sono ciliati; (B) è un eliozoo; (D) è un’ameba; (E) è un dinoflagellato; (F) è un euglenoide. (Da M.A. Sleigh, Biology of Protozoa. Cambridge, Regno Unito: Cambridge University Press, 1973.) (C) (E) (F) (G) ri, ciglia che battono sinuosamente, appendici simili a gambe, apparati boccali, dardi pungenti e fasci contrattili simili a muscoli. Sebbene siano cellule singole, i protozoi possono essere tanto intricati, versatili e complessi nel loro comportamento quanto molti organismi pluricellulari (vedi Figura 1.27, Filmato 1.4 e Filmato 1.5 ). In termini di antenati e di sequenze di DNA gli eucarioti unicellulari sono molto più diversificati degli animali, dei vegetali e dei funghi pluricellulari, che si sono originati come tre rami relativamente tardivi dell’albero genealogico eucariotico (vedi Figura 1.17). Come per i procarioti, gli esseri umani hanno avuto la tendenza a trascurarli perché sono microscopici. Soltanto oggi, con l’aiuto dell’analisi dei genomi, cominciamo a capire le loro posizioni nell’albero della vita e a mettere nel giusto contesto gli indizi che queste strane creature ci offrono sul nostro distante passato evolutivo. ■ Un lievito serve da modello eucariotico minimo La complessità molecolare e genetica degli eucarioti è impressionante. Ancora più che per i procarioti, i biologi devono concentrare le loro risorse limitate su pochi organismi modello selezionati per affrontare questa complessità. Per analizzare il funzionamento interno della cellula eucariotica, senza i problemi ulteriori dello sviluppo pluricellulare, ha senso usare una specie che sia unicellulare e più semplice possibile. La scelta per questo ruolo di modello eucariotico minimo è stata il lievito Saccharomyces cerevisiae (Figura 1.36), la stessa specie che è usata per fare la birra e il pane. S. cerevisiae è un piccolo membro unicellulare del regno dei funghi e quindi, secondo le moderne vedute, correlato agli animali almeno tanto quanto lo è ai vegetali. È resistente e facile da far crescere in un semplice mezzo nutriente. Come altri funghi, ha una parete cellulare robusta, è relativamente immobile e possiede mitocondri ma non cloroplasti. Quando i nutrienti sono abbondanti, cresce e si divide quasi alla stessa velocità di un batterio. Si può riprodurre sia vegetativamente (cioè per semplice divisione cellulare) che sessualmente: due cellule di lievito che sono aploidi (che possiedono una singola copia del genoma) si possono fondere per creare una cellula che è diploide (che contiene una doppia copia del genoma); la cellula diploide può subire la meiosi (una divisione riduttiva) per produrre cellule che sono di nuovo aploidi (Figura 1.37). A differenza degli animali e dei vegetali superiori, il lievito si può dividere indefinitamente sia allo stato aploide che diploide e il processo che porta da uno stato all’altro può essere indotto a piacere cambiando le condizioni di crescita. Oltre a queste caratteristiche, il lievito possiede un’ulteriore proprietà che lo rende un organismo adatto per gli studi genetici: il suo genoma, secondo gli standard eucariotici, è eccezionalmente piccolo. Nonostante ciò, CAPITOLO 1 Cellule e genomi 33 © 978-88-08-62126-9 Figura 1.36 Il lievito Saccharomyces cerevisiae. (A) Micrografia elettronica a scansione di un gruppo di cellule. Questa specie è nota anche come lievito gemmante; prolifera formando una protrusione o gemma che si ingrossa e quindi si separa dal resto della cellula originaria. Nella micrografia sono visibili molte cellule con gemme. (B) Una micrografia elettronica a trasmissione di una sezione trasversale di una cellula di lievito, che mostra il nucleo, un mitocondrio e la spessa parete cellulare. (A, per gentile concessione di Ira Herskowitz e Eric Schabatach.) parete cellulare nucleo mitocondrio (A) 10 µm (B) 2 µm è sufficiente per tutti i compiti fondamentali che ogni cellula eucariotica deve svolgere. Sono disponibili mutanti praticamente per ogni gene e studi sui lieviti (usando sia S. cerevisiae che altre specie) hanno fornito una chiave alla comprensione di molti processi determinanti, fra cui il ciclo di divisione cellulare eucariotico (la catena cruciale di eventi per cui il nucleo e tutti gli altri componenti di una cellula si duplicano e si dividono per creare due cellule figlie). Il sistema di controllo che governa questo processo si è conservato così bene nel corso dell’evoluzione che molti dei suoi componenti possono agire in modo intercambiabile nel lievito e nelle cellule umane: se a un lievito mutante privo di un gene essenziale per il ciclo cellulare del lievito viene fornita una copia del gene omologo umano, il lievito è curato del suo difetto e diventa capace di dividersi normalmente. ■ I livelli di espressione di tutti i geni di un organismo possono essere monitorati simultaneamente La sequenza completa del genoma di S. cerevisiae è stata determinata nel 1997. Essa consiste approssimativamente di 13 117 000 coppie di nucleotidi, compreso il piccolo contributo (78 520) del DNA mitocondriale. Il totale è soltanto circa 2,5 volte il DNA presente in E. coli e codifica proteine distinte pari soltanto a 1,5 volte (circa 6600 in tutto). Lo stile di vita di S. cerevisiae è simile sotto molti aspetti a quello di un batterio e sembra che questo lievito sia stato soggetto nello stesso modo a pressioni selettive che hanno mantenuto compatto il suo genoma. La conoscenza della sequenza completa del genoma di qualunque organismo – che sia un lievito o l’uomo – apre nuove prospettive sul funzionamento della cellula: questioni che una volta sembravano talmente complesse da renderne impossibile la comprensione adesso sembrano alla nostra portata. Usando tecniche che verranno descritte nel Capitolo 8 è oggi possibile, per esempio, monitorare simultaneamente la quantità di mRNA trascritto da ogni gene del genoma del lievito in qualunque condizione scelta e osservare come questo schema completo di attività genica cambi quando cambiano le condizioni. L’analisi può essere ripetuta con mRNA preparato da mutanti privi di un gene scelto (qualunque gene che ci interessi controllare). In linea di principio, questo approccio fornisce un modo di rivelare l’intero sistema di relazioni di controllo che governano l’espressione genica, non soltanto in queste cellule di lievito ma in qualunque organismo di cui sia nota la sequenza del genoma. ■ L’Arabidopsis è stata scelta fra 300 000 specie come modello di vegetale I grandi organismi pluricellulari che vediamo intorno a noi – i fiori, gli alberi e gli animali – sembrano incredibilmente vari, ma sono molto più simili fra loro nella loro origine evolutiva e nella loro biologia cellulare di base, rispetto alla grande quantità di organismi microscopici unicellulari. Quindi, men- 2n 2n proliferazione di cellule diploidi 2n meiosi e sporulazione (scatenate dalla mancanza di nutrienti) 2n n n accoppiamento (in genere immediatamente dopo che si sono schiuse le spore n n le spore si schiudono n n n proliferazione di cellule aploidi n CICLO VITALE DEL LIEVITO GEMMANTE Figura 1.37 I cicli riproduttivi del lievito S. cerevisiae. A seconda delle condizioni ambientali e di dettagli del genotipo le cellule di questa specie possono essere in uno stato diploide (2n), con una doppia serie di cromosomi, o in uno stato aploide (n), con una singola serie di cromosomi. La forma diploide può proliferare per cicli di divisione cellulare ordinaria o subire una meiosi producendo cellule aploidi. La forma aploide può proliferare per cicli di divisione cellulare ordinaria o subire una fusione sessuale con un’altra cellula aploide per diventare diploide. La meiosi è innescata da mancanza di nutrienti e dà origine a spore, cellule aploidi in uno stato dormiente, resistenti a condizioni ambientali avverse. CAPITOLO 1 Cellule e genomi 34 © 978-88-08-62126-9 tre batteri ed eucarioti sono separati da forse 3,5 miliardi di anni di evoluzione divergente, vertebrati e insetti sono separati da circa 700 milioni di anni, i pesci e i mammiferi da circa 450 milioni di anni e le diverse specie di piante da fiore da soltanto 150 milioni di anni. A causa della stretta relazione evolutiva fra tutte le piante da fiore possiamo, ancora una volta, ottenere informazioni sulla cellula e sulla biologia molecolare di questa intera classe di organismi concentrandoci per un’analisi dettagliata soltanto su una specie o su poche specie. Fra le parecchie centinaia di migliaia di specie di piante da fiore presenti oggi sulla Terra i biologi molecolari hanno scelto di concentrare i loro sforzi su una piccola erba infestante, la diffusa arabetta comune Arabidopsis thaliana (Figura 1.38), che può essere fatta crescere in serra in grande quantità e produce una progenie di migliaia di piante dopo 8-10 settimane. L’Arabidopsis ha un genoma approssimativamente di 220 milioni di coppie di basi, circa 17 volte quello del lievito (vedi Tabella 1.2). ■ Il mondo delle cellule animali è rappresentato da un verme, da un moscerino, da un topo e da un essere umano 1 cm Figura 1.38 Arabidopsis thaliana, la pianta scelta come modello principale per studiare la genetica molecolare dei vegetali. (Per gentile concessione di Toni Hayden e della John Innes Foundation.) Gli animali pluricellulari costituiscono la maggioranza di tutte le specie conosciute di organismi viventi e sono oggetto della parte più consistente degli sforzi della ricerca biologica. Cinque specie sono emerse come modelli principali per gli studi di genetica molecolare e sono, in ordine di grandezza crescente, il verme nematode Caenorhabditis elegans, il moscerino Drosophila melanogaster, il pesce zebra Danio rerio, il topo Mus musculus e l’uomo, Homo sapiens. Di tutti questi organismi è stato sequenziato il genoma. Caenorhabditis elegans (Figura 1.39) è un piccolo parente inoffensivo di un verme che attacca i raccolti. Con un ciclo vitale di pochi giorni soltanto, una capacità di sopravvivere in un congelatore indefinitamente in uno stato di vita sospeso, un piano corporeo semplice e un ciclo vitale insolito che ben si adatta agli studi genetici (descritti nel Capitolo 21), è un organismo modello ideale. C. elegans si sviluppa con precisione cronometrica da una cellula uovo fecondata in un verme adulto con esattamente 959 cellule corporee (più un numero variabile di cellule uovo e spermatiche): un grado insolito di regolarità per un animale. Oggi abbiamo una descrizione minutamente dettagliata della sequenza di eventi tramite i quali ciò accade, man mano che le cellule si dividono, si muovono e cambiano caratteristiche secondo regole rigide e prevedibili. Il genoma di 130 milioni di coppie di nucleotidi codifica circa 21 000 proteine ed è disponibile una gran quantità di mutanti e di altri strumenti per controllare la funzione dei geni. Sebbene il verme abbia un piano corporeo molto diverso dal nostro, la conservazione dei meccanismi biologici è stata sufficiente a permettere al verme di essere utilizzato come modello per molti dei processi biologici e di sviluppo che avvengono nel corpo umano. Lo studio del verme ci aiuta a capire, per esempio, i programmi di divisione cellulare e di morte cellulare che determinano il numero di cellule nel corpo, un argomento di grande importanza per la biologia dello sviluppo e per la ricerca sul cancro. 0,2 mm Figura 1.39 Caenorhabditis elegans, il primo organismo pluricellulare di cui è stata determinata la sequenza completa del genoma. Questo piccolo nematode, lungo circa 1 mm, vive nel terreno. La maggior parte degli individui è ermafrodita e produce sia uova che spermatozoi. (Per gentile concessione di Maria Gallegos, Wisconsin University, Madison.) CAPITOLO 1 Cellule e genomi 35 © 978-88-08-62126-9 Figura 1.40 Drosophila melanogaster. Studi di genetica molecolare di questo moscerino hanno fornito la chiave principale per la comprensione del modo in cui gli animali si sviluppano da un uovo fecondato in un adulto. (Da E.B. Lewis, Science 221: copertina, 1983. Con il permesso di AAAS.) 1 mm ■ Lo studio della Drosophila fornisce una chiave per lo sviluppo dei vertebrati Il moscerino della frutta Drosophila melanogaster (Figura 1.40) è stato usato come organismo genetico modello più a lungo di qualunque altro; in effetti le fondamenta della genetica classica sono state costruite in gran parte su studi di questo insetto. Più di 80 anni fa questo moscerino ha fornito, per esempio, la prova definitiva che i geni – le unità astratte dell’informazione ereditaria – sono portati su cromosomi, oggetti fisici concreti il cui comportamento era stato seguito attentamente nella cellula eucariotica con il microscopio ottico, ma la cui funzione era rimasta all’inizio sconosciuta. La prova dipese da una delle molte caratteristiche che rendono la Drosophila particolarmente adatta per i genetisti: i cromosomi giganti, con un tipico aspetto bandeggiato, che sono visibili in alcune delle sue cellule (Figura 1.41). Si trovò che cambiamenti specifici nell’informazione ereditaria, manifesti in famiglie di mosche mutanti, erano correlati esattamente con la perdita o l’alterazione di bande specifiche dei cromosomi giganti. In tempi più recenti la Drosophila, più di qualunque altro organismo, ci ha mostrato come ripercorrere la catena di causa ed effetto dalle istruzioni genetiche codificate nel DNA cromosomico alla struttura del corpo pluricellulare adulto. Mutanti di Drosophila con parti del corpo stranamente fuori posto o con uno schema alterato hanno fornito la chiave per identificare e caratterizzare i geni necessari per costruire un corpo correttamente strutturato, con intestino, arti, occhi e tutte le altre parti al posto giusto. Una volta che questi geni di Drosophila sono stati sequenziati, è stato possibile ricercare loro omologhi nei genomi dei vertebrati. Questi sono stati trovati e le loro funzioni nei vertebrati sono state quindi controllate analizzando topi in cui i geni erano stati mutati. I risultati, come vedremo più avanti in questo testo, rivelano un grado stupefacente di somiglianza nei meccanismi molecolari dello sviluppo degli insetti e dei vertebrati (discussi nel Capitoli 21). La maggioranza delle specie conosciute di organismi viventi sono insetti. Anche se la Drosophila non avesse niente in comune con i vertebrati, ma solo con gli insetti, sarebbe ancora un importante organismo modello. Ma se l’obiettivo è la comprensione della genetica molecolare dei vertebrati, perché non affrontare semplicemente il problema in modo diretto? Perché avvicinarsi a esso obliquamente, attraverso lo studio della Drosophila? La Drosophila richiede soltanto 9 giorni per progredire da un uovo fecondato a un adulto; è enormemente più facile e più economica da allevare di qualunque vertebrato e il suo genoma è molto più piccolo, circa 200 milioni di coppie di nucleotidi, in confronto ai 3200 milioni di un essere umano. Questo genoma codifica circa 15 000 proteine, e oggi si possono ottenere mutanti praticamente per qualunque gene. Ma c’è anche un’altra ragione più profonda del perché meccanismi genetici che sono difficili da scoprire in un vertebrato sono spesso facilmente rivelati nella mosca. Ciò è correlato, come spiegheremo adesso, alla frequenza di duplicazione genica, che è notevolmente maggiore nei genomi dei vertebrati rispetto al genoma della mosca, e 20 µm Figura 1.41 Cromosomi giganti delle ghiandole salivari di Drosophila. Poiché sono avvenuti molti cicli di replicazione del DNA senza che siano intervenute divisioni cellulari, ciascun cromosoma in queste cellule insolite contiene più di 1000 molecole identiche di DNA, tutte allineate a registro. Ciò rende facile la loro visualizzazione al microscopio ottico, dove mostrano uno schema di bandeggio caratteristico e riproducibile. Bande specifiche possono essere identificate così come la posizione di geni specifici: una mosca mutante con una regione dello schema di bandeggio assente mostra un fenotipo che riflette la perdita dei geni in quella regione. I geni che sono trascritti ad alta frequenza corrispondono a bande con un’apparenza “rigonfia”. Le bande colorate in nero sono siti in cui una particolare proteina regolatrice è attaccata al DNA. (Per gentile concessione di B. Zink e R. Paro, da R. Paro, Trends Genet. 6:416-421, 1990. Con il permesso di Elsevier.) CAPITOLO 1 Cellule e genomi 36 © 978-88-08-62126-9 che è stata probabilmente cruciale nel rendere i vertebrati creature complesse e ingegnose quali sono. ■ Il genoma dei vertebrati è un prodotto di duplicazioni ripetute Figura 1.42 Due specie della rana genere Xenopus. X. tropicalis, in alto, ha un genoma ordinario diploide; X. laevis, in basso, ha il doppio del DNA per cellula. Dallo schema di bandeggio dei loro cromosomi e dalla disposizione dei geni lungo di essi, oltre che da confronti di sequenze geniche, è chiaro che la specie col genoma più grande si è evoluta per duplicazioni dell’intero genoma. Si pensa che queste duplicazioni siano avvenute come conseguenza di accoppiamenti fra rane di specie leggermente divergenti di Xenopus. (Per gentile concessione di E. Amaya, M. Offield e R. Grainger, Trends Gen. 14:253-255, 1998. Con il permesso di Elsevier.) Quasi ogni gene nel genoma dei vertebrati ha dei paraloghi (altri geni nello stesso genoma che sono senza dubbio correlati e devono essersi originati per duplicazione genica). In molti casi un intero gruppo di geni è strettamente correlato con gruppi simili presenti altrove nel genoma, suggerendo che i geni si siano duplicati in gruppi collegati invece che come individui isolati. Secondo un’ipotesi, in uno stadio precoce dell’evoluzione dei vertebrati, l’intero genoma subì una duplicazione due volte di seguito, dando origine a quattro copie di ogni gene. Il corso preciso dell’evoluzione del genoma dei vertebrati resta incerto, perché molti altri cambiamenti evolutivi si sono verificati dopo questi antichi eventi. Geni che una volta erano identici si sono diversificati; molte copie di un gene sono andate perdute in seguito a mutazioni; alcuni hanno subito ulteriori cicli di duplicazione locale; e il genoma, in ciascun ramo dell’albero genealogico dei vertebrati, ha subito ripetuti riarrangiamenti, alterando la maggior parte dell’ordine originale dei geni. Il confronto dell’ordine dei geni in due organismi correlati, come l’uomo e il topo, rivela che – nella scala temporale dell’evoluzione dei vertebrati – i cromosomi si fondono e si frammentano per spostare grandi blocchi di sequenza di DNA. In effetti è possibile, come vedremo nel Capitolo 4, che lo stato presente sia il risultato di molte duplicazioni separate di frammenti del genoma, anziché di duplicazioni dell’intero genoma. Tuttavia non c’è dubbio che queste duplicazioni dell’intero genoma avvengano veramente di tanto in tanto nel corso dell’evoluzione, perché possiamo vedere esempi recenti in cui serie di cromosomi duplicati possono ancora essere identificate come tali. Il genere delle rane Xenopus, per esempio, comprende una serie di specie molto simili correlate fra loro da ripetute duplicazioni o triplicazioni dell’intero genoma. Fra queste rane si trova X. tropicalis, con un normale genoma diploide; la specie comune di laboratorio X. laevis, con un genoma duplicato e il doppio di DNA per cellula; e X. ruwenzoriensis, con un genoma duplicato sei volte e sei volte la quantità di DNA per cellula (108 cromosomi, rispetto ai 36 di X. laevis, per esempio). Si calcola che queste specie si siano separate l’una dall’altra negli ultimi 120 milioni di anni (Figura 1.42). ■ La rana e il pesce zebra forniscono modelli per lo sviluppo dei vertebrati Le rane sono usate da molto tempo per studiare le prime fasi dello sviluppo embrionale dei vertebrati perché le loro uova sono grandi, facili da manipolare, e fecondate al di fuori dell’animale, cosicché è facile seguire il successivo sviluppo dell’embrione (Figura 1.43). Xenopus laevis, in particolare, continua a essere un importante organismo modello, anche se è poco adatto all’analisi genetica (Filmato 1.6 e vedi anche Filmato 21.1). Il pesce zebra Danio rerio ha vantaggi simili ma senza questa limitazione; il suo genoma è compatto – grande solo la metà di quello di topo o dell’uomo – e ha un tempo di generazione di circa tre mesi solamente. Sono noti molti mutanti e la sua ingegnerizzazione genetica è relativamente semplice. Il pesce zebra ha un’ulteriore caratteristica favorevole: per le prime due settimane di vita è trasparente, in questo modo si può vedere il comportamento delle singole cellule all’interno dell’organismo vivente (vedi Filmato 21.2).Tutto ciò lo ha reso un modello di vertebrato sempre più importante (Figura 1.44). ■ Il topo è il principale organismo modello per i mammiferi I mammiferi hanno di norma due volte più geni della Drosophila, un genoma che è 16 volte più grande e milioni o miliardi di volte più cellule nel lo- CAPITOLO 1 Cellule e genomi 37 © 978-88-08-62126-9 ore 0 6 16 34 16 cellule blastula gastrula 67 96 284 1 mm uovo fecondato neurula larva Figura 1.43 Fasi del normale sviluppo di una rana. Questo disegno mostra lo sviluppo di un girino di Rana pipiens a partire da un uovo fecondato. L’intero processo avviene al di fuori della madre, rendendo il meccanismo coinvolto facilmente accessibile per studi sperimentali. (Da W. Shumway, Anat. Rec. 78:139-147, 1940.) ro corpo adulto. In termini di dimensioni e funzione del genoma, di biologia cellulare e di meccanismi molecolari, i mammiferi sono tuttavia un gruppo altamente uniforme di organismi. Anche anatomicamente le differenze fra i mammiferi sono principalmente una questione di dimensioni e proporzioni; è difficile pensare a una parte del corpo umano che non abbia un corrispettivo negli elefanti e nei topi e viceversa. L’evoluzione gioca liberamente con caratteristiche quantitative, ma non cambia facilmente la logica della struttura. Per ottenere una misura più esatta di quanto strettamente le specie dei mammiferi si assomiglino geneticamente possiamo confrontare le sequenze nucleotidiche di geni corrispondenti (ortologhi), o le sequenze degli amminoacidi delle proteine che questi geni codificano. I risultati per singoli geni e proteine variano di molto. Ma di norma, se allineiamo la sequenza degli amminoacidi di una proteina umana con quella della proteina ortologa, diciamo, di un elefante, circa l’85% degli amminoacidi è identico. Un simile confronto fra uomo e uccelli mostra un’identità di amminoacidi di circa il 70%: il doppio delle differenze, perché gli uccelli e i mammiferi hanno avuto un tempo doppio per diversificarsi rispetto all’elefante e all’uomo (Figura 1.45). Il topo, essendo piccolo, robusto e riproducendosi rapidamente, è diventato l’organismo modello più importante per lo studio sperimentale della genetica molecolare dei vertebrati. Sono note molte mutazioni che si verificano naturalmente e spesso queste sono simili agli effetti di mutazioni corrispondenti nell’uomo (Figura 1.46). Inoltre sono stati sviluppati metodi per controllare la funzione di qualunque gene di topo, o di qualunque porzione non codificante del genoma del topo, creando artificialmente mutazioni, come spiegheremo più avanti in questo testo. (A) (B) 1 cm 150 µm girino Figura 1.44 Il pesce zebra come modello per lo studio dello sviluppo dei vertebrati. Questi pesci tropicali piccoli e robusti sono molto utili per studi genetici. Inoltre, hanno embrioni trasparenti che si sviluppano al di fuori della madre, cosicché si possono osservare chiaramente le cellule che si muovono e cambiano le loro caratteristiche nell’organismo vivente nel corso del suo sviluppo. (a) Pesce adulto. (B) Un embrione 24 ore dopo la fecondazione. (A, con autorizzazione da Steve Baskauf; B, da M. Rhinn et al., Neural Dev. 4:12, 2009.) CAPITOLO 1 Cellule e genomi 38 Figura 1.46 Uomo e topo: geni simili e sviluppo simile. Il bambino e il topo mostrati qui hanno chiazze bianche simili sulla fronte perché entrambi hanno mutazioni nello stesso gene (chiamato Kit), necessario per lo sviluppo e il mantenimento di cellule pigmentate. (Per gentile concessione di R.A. Fleischman.) uomo/scimpanzé 100 Terziario 50 uomo /orangutan topo/ratto gatto/cane 98 84 86 Cretaceo maiale/balena maiale/pecora uomo/coniglio uomo/elefante uomo/topo uomo/bradipo 77 87 82 83 89 81 Giurassico uomo/canguro 81 uccelli/coccodrillo 76 uomo/lucertola 57 uomo/pollo 70 uomo/rana 56 uomo/tonno 55 uomo/squalo 51 uomo/lampreda 35 150 200 Triassico 250 Permiano 300 Carbonifero 350 Devoniano 400 Siluriano 450 % di amminoacidi identici nella catena α dell’emoglobina 0 100 tempo in milioni di anni Figura 1.45 Tempi di divergenza di vari vertebrati. La scala sulla sinistra mostra la data stimata e l’era geologica dell’ultimo antenato comune di ogni coppia specificata di animali. Ciascuna stima temporale si basa su confronti delle sequenze di amminoacidi di proteine ortologhe; più tempo ha avuto una coppia di animali di evolvere indipendentemente, più bassa è la percentuale di amminoacidi che rimangono identici. La scala temporale è stata calibrata per corrispondere alla prova fossile che l’ultimo antenato comune di mammiferi e uccelli è vissuto 310 milioni di anni fa. I numeri sulla destra forniscono dati sulla divergenza di sequenza per una proteina particolare, la catena a dell’emoglobina. Si noti che sebbene per questa proteina vi sia una chiara tendenza generale all’aumento della divergenza con l’aumentare del tempo, ci sono anche alcune irregolarità. Queste riflettono la casualità del processo evolutivo e, probabilmente, l’azione della selezione naturale che induce cambiamenti particolarmente rapidi della sequenza di emoglobina in alcuni organismi che sono stati soggetti a particolari richieste fisiologiche. In media, all’interno di una determinata linea evolutiva, le emoglobine accumulano cambiamenti a un ritmo di circa 6 amminoacidi alterati per 100 amminoacidi ogni 100 milioni di anni. Alcune proteine, soggette a limitazioni funzionali più rigide, evolvono molto più lentamente di questa, altre fino a 5 volte più velocemente. Tutto ciò dà origine a sostanziali incertezze nelle stime dei tempi di divergenza e alcuni esperti pensano che i gruppi principali di mammiferi si siano separati l’uno dall’altro fino a 60 milioni di anni dopo rispetto a quanto mostrato qui. (Adattata da S. Kumar e S.B. Hedges, Nature 392:917-920, 1998. Con il permesso di Macmillan Publishers Ltd.) © 978-88-08-62126-9 Ordoviciano 500 Cambriano 550 Proterozoico Un topo mutante prodotto ad hoc può fornire una messe di informazioni al biologo cellulare: rivela gli effetti della mutazione scelta in una serie di diversi contesti, controllando simultaneamente l’azione del gene in tutti i differenti tipi di cellule del corpo che potrebbero in linea di principio essere colpiti. ■ Gli esseri umani manifestano le proprie peculiarità Come esseri umani abbiamo un interesse speciale per il genoma umano.Vogliamo conoscere la serie completa delle parti di cui siamo composti e scoprire il modo in cui funzionano. Ma anche se fossimo topi, preoccupati della biologia molecolare dei topi, gli esseri umani sarebbero attraenti per noi come organismo genetico modello per una proprietà speciale: tramite esami medici e autodenuncia cataloghiamo i nostri disordini genetici (e non solo). La popolazione umana è enorme, consistendo oggi di circa 7 miliardi di individui, e questa proprietà di autodocumentazione significa che è disponibile un enorme banca dati di informazioni. La sequenza completa del genoma umano di più di 3 miliardi di coppie di nucleotidi è stata determinata per CAPITOLO 1 Cellule e genomi 39 © 978-88-08-62126-9 migliaia di persone diverse, rendendo più facile che mai identificare a livello molecolare lo specifico cambiamento genetico responsabile di ciascun fenotipo umano mutante. Mettendo insieme le informazioni derivate da uomo, topo, mosca, verme, lievito, vegetali e batteri – usando le somiglianze di sequenze geniche per mappare le corrispondenze fra un organismo modello e un altro – possiamo arricchire la nostra conoscenza di tutti questi organismi. ■ Nei dettagli siamo tutti diversi Che cosa intendiamo precisamente quando parliamo del genoma umano? Il genoma di chi? In media, qualunque coppia di persone prese a caso differisce in circa uno o due nucleotidi ogni 1000 nella sequenza del DNA. Il genoma della specie umana è, parlando correttamente, qualcosa di molto complesso, e contiene l’intera raccolta di varianti geniche che si trovano nella popolazione umana. La conoscenza di questa variazione ci sta aiutando a capire, ad esempio, perché alcune persone sono inclini a una malattia, altre a un’altra; perché alcune rispondono bene a un farmaco, altre invece male. Inoltre sta fornendo nuovi indizi sulla nostra storia: i movimenti di popolazioni e i mescolamenti dei nostri antenati, le infezioni di cui hanno sofferto, la dieta di cui si nutrivano.Tutto ciò ha lasciato tracce nelle forme varianti dei geni che sopravvivono oggi nelle comunità umane che popolano il pianeta ■ Per capire le cellule e gli organismi abbiamo bisogno della matematica, di computer e di informazioni quantitative Sfruttando la conoscenza di sequenze genomiche complete, possiamo elencare i geni e le proteine di una cellula e iniziare a tracciare la rete di interazioni che li collegano. Ma come possiamo trasformare tutte queste informazioni in una comprensione del modo in cui funzionano le cellule? Anche per un singolo tipo cellulare che appartiene a una singola specie di organismo, l’attuale diluvio di dati sembra impossibile da analizzare. Il tipo di ragionamento informale su cui si basano di solito i biologi appare completamente inadeguato di fronte a tale complessità. In realtà la difficoltà non è soltanto una questione di un semplice sovraccarico di informazioni. I sistemi biologici sono, per esempio, pieni di circuiti a feedback e il comportamento anche dei sistemi a feedback più semplici è notevolmente difficile da prevedere soltanto intuitivamente (Figura 1.47); piccoli cambiamenti dei parametri possono causare cambiamenti radicali del risultato. Per passare dal diagramma di un circuito alla previsione del comportamento del sistema abbiamo bisogno di informazioni quantitative dettagliate e per trarre deduzioni da quelle informazioni abbiamo bisogno della matematica e di computer. Questi strumenti che permettono ragionamenti quantitativi sono essenziali, ma non hanno un potere infinito. Si potrebbe pensare che, conoscendo come ciascuna proteina influenza ogni altra proteina e come l’espressione di ciascun gene è regolata dai prodotti degli altri, dovremmo rapidamente essere in grado di calcolare il modo in cui una cellula si comporterà nel suo insieme, proprio come un astronomo può calcolare le orbite dei pianeti, o un ingegnere chimico può calcolare i flussi attraverso un impianto chimico. Ma qualunque tentativo di svolgere questa impresa per un’intera cellula vivente rivela rapidamente i limiti dello stato attuale delle conoscenze. Le informazioni che possediamo, per quanto abbondanti, sono piene di lacune e di incertezze. Inoltre sono in gran parte qualitative e non quantitative. Nella maggior parte dei casi i biologi cellulari che studiano i sistemi di controllo della cellula riassumono le loro conoscenze attraverso semplici diagrammi schematici – questo libro ne è pieno – invece che mediante numeri, grafici ed equazioni differenziali. Progredire dalle descrizioni qualitative e dal ragionamento intuitivo alle descrizioni quantitative e alle deduzioni matematiche è una delle sfide più grandi della biologia cellulare contemporanea. Finora la sfida è stata vinta soltanto per pochi frammenti molto semplici del macchinario delle cellule viventi, sottosistemi che coinvolgono una manciata di proteine diverse, o due o tre DNA regolatore regione codificante del gene mRNA proteina di regolazione della trascrizione Figura 1.47 Un circuito molto semplice di regolazione dei geni: un singolo gene che regola la propria espressione mediante il legame del suo prodotto proteico al proprio DNA regolatore. Semplici disegni schematici come questo sono spesso usati in tutto il libro per riassumere ciò che sappiamo anche se lasciano molte domande senza risposta. Quando la proteina si lega, inibisce o stimola la trascrizione? La velocità di trascrizione quanto strettamente dipende dalla concentrazione della proteina? Quanto a lungo, in media, una molecola proteica resta legata al DNA? Quanto ci vuole per produrre ciascuna molecola di mRNA o di proteina e quanto rapidamente viene degradato ciascun tipo di molecola? Come spiegato nel Capitolo 8, i modelli matematici mostrano che abbiamo bisogno di risposte quantitative a tutte queste e ad altre domande prima di poter prevedere il comportamento persino di questo sistema a gene singolo. Per valori diversi dei parametri, il sistema si può stabilizzare in uno stato all’equilibrio unico o può comportarsi da interruttore, capace di trovarsi in uno di una serie di stati alternativi; o può oscillare; o può mostrare grandi fluttuazioni casuali. CAPITOLO 1 Cellule e genomi 40 © 978-88-08-62126-9 QUELLO CHE NON SAPPIAMO • Quali nuovi approcci potrebbero fornire una visione più chiara dell’archeo anaerobico che si pensa abbia formato il nucleo della prima cellula eucariotica? In che modo la simbiosi di questa cellula con un batterio anaerobico ha portato al mitocondrio? Ci sono da qualche parte sulla Terra cellule non ancora identificate che possano colmare le lacune sull’origine delle cellule eucariotiche? • Il sequenziamento del DNA ha rivelato un mondo di cellule microbiche ricco e precedentemente ignoto, la maggioranza del quale non è coltivabile in laboratorio. Come si potrebbero rendere queste cellule più accessibili per studi dettagliati? • Quali nuovi organismi o cellule modello dovrebbero essere sviluppati per essere studiati dagli scienziati? Perché concentrarsi in maniera concertata su questi modelli potrebbe accelerare il progresso verso la comprensione di aspetti cruciali della funzione cellulare che sono ancora poco noti? • Come sono sorte le prime membrane cellulari? geni cross-regolatori, in cui la teoria e gli esperimenti si adattano facilmente l’una agli altri. Ci occuperemo di alcuni di questi esempi più avanti nel testo e dedicheremo l’intera sezione finale del Capitolo 8 al ruolo della quantificazione in biologia cellulare. La conoscenza e la comprensione forniscono il potere di intervenire: per gli esseri umani, per evitare o prevenire malattie; per i vegetali, per ottenere raccolti migliori; per i batteri, affinché possano essere utilizzati per i nostri scopi. Tutte queste imprese biologiche sono collegate perché l’informazione genetica di tutti gli organismi viventi è scritta nello stesso linguaggio. La nuova capacità dei biologi molecolari di leggere e decifrare questo linguaggio ha già iniziato a trasformare le nostre relazioni con il mondo vivente. La biologia cellulare che verrà presentata nei capitoli successivi vi preparerà, noi speriamo, a comprendere la grande avventura scientifica del XXI secolo e forse a contribuirvi. SOMMARIO Nelle cellule eucariotiche, per definizione, il DNA si trova in un compartimento separato circondato da membrana, il nucleo. Esse hanno inoltre un citoscheletro che conferisce robustezza e permette loro di muoversi, compartimenti intracellulari elaborati per digestione e secrezione, la capacità (in molte specie) di inglobare altre cellule e un metabolismo che dipende dall’ossidazione di molecole organiche da parte dei mitocondri. Queste proprietà inducono a pensare che gli eucarioti si siano originati come predatori di altre cellule. I mitocondri – e, nei vegetali, i cloroplasti – contengono materiale genetico proprio ed evidentemente si sono evoluti da batteri assunti nel citoplasma della cellula eucariotica e sono sopravvissuti come simbionti. Le cellule eucariotiche hanno di norma da 3 a 30 volte più geni dei procarioti e spesso migliaia di volte più DNA non codificante. Il DNA non codificante permette una regolazione complessa dell’espressione dei geni, il che è necessario per la costruzione di complessi organismi pluricellulari. Molti eucarioti sono tuttavia unicellulari, fra di essi il lievito Saccharomyces cerevisiae, che serve da organismo modello semplice per la biologia cellulare eucariotica, rivelando le basi molecolari di molti processi fondamentali che si sono incredibilmente conservati durante un miliardo di anni di evoluzione. Un piccolo numero di altri organismi è stato scelto per lo studio intensivo: un verme, una mosca, un pesce e il topo servono da “organismi modello” per gli animali pluricellulari e una piccola pianta della famiglia delle euforbie serve da modello per le piante. Tecnologie nuove e potenti come il sequenziamento del genoma stanno permettendo notevoli avanzamenti nella nostra conoscenza degli esseri umani e stanno aiutando ad aumentare la nostra comprensione della salute e delle malattie umane. Gli organismi viventi sono però estremamente complessi e i genomi dei mammiferi contengono omologhi multipli, strettamente correlati, della maggior parte dei geni. Questa ridondanza genetica ha permesso la diversificazione e la specializzazione dei geni per nuovi scopi, ma ha reso anche più difficile decifrare la funzione dei geni. Per questa ragione, organismi modello più semplici hanno svolto un ruolo chiave nella analisi dei meccanismi genetici universali dello sviluppo animale, e la ricerca che usa questi sistemi rimane di importanza vitale per avanzare nella scienza e nella medicina. ● PROBLEMI Quali affermazioni sono vere? Spiegate perché sì o perché no. 1.1 Ogni membro della famiglia genica dell’emoglo- bina umana, che consiste di sette geni disposti in due gruppi su due cromosomi, è un ortologo di tutti gli altri membri. 1.2 Il trasferimento orizzontale dei geni è più diffuso negli organismi unicellulari che in quelli pluricellulari. 1.3 La maggior parte delle sequenze di DNA di un ge- noma batterico codifica proteine, mentre la maggior parte delle sequenze del genoma umano non lo fa. Discutete i seguenti problemi. 1.4 Da quando è stato decifrato quarant’anni fa, alcu- ni hanno sostenuto che il codice genetico deve essere un incidente congelato, mentre altri hanno ritenuto che si sia formato per selezione naturale. Una caratteristica sorprendente del codice genetico è la sua intrinseca resistenza agli effetti delle mutazioni. Per esempio, un cambiamento nella terza posizione di un codone spesso specifica lo stesso amminoacido o uno con proprietà chimiche simili. Il codice naturale resiste alle mutazioni più efficacemente (ed è meno suscettibile di errori) della maggior parte delle altre versioni possibili, come CAPITOLO 1 Cellule e genomi 41 © 978-88-08-62126-9 illustrato nella Figura P1.1. Soltanto uno del milione di codici “casuali” generati dal computer è più resistente agli errori del codice genetico naturale. Questa straordinaria resistenza alle mutazioni del codice genetico depone a favore della sua origine come incidente congelato o come risultato della selezione naturale? Spiegate il vostro ragionamento. 1.10 Le cellule animali non hanno pareti cellulari né 20 nnumero di codici (migliaia) tendono a coinvolgere grandi aggregati di prodotti genici diversi, mentre le reazioni metaboliche sono di solito catalizzate da enzimi composti da una singola proteina. Perché la complessità del processo sottostante – informazionale o metabolico – dovrebbe avere un effetto sulla velocità del trasferimento genico orizzontale? 15 10 codici naturali 5 0 0 5 10 15 suscettibilità alle mutazioni 20 Figura P1.1 Suscettibilità del codice naturale in confronto ai milioni di codici generati da computer (Problema 1.4). La suscettibilità misura il cambiamento medio delle proprietà degli amminoacidi causato da mutazioni casuali. Un valore basso indica che le mutazioni tendono a causare piccoli cambiamenti. (Dati gentilmente forniti da Steve Freeland.) 1.5 Avete iniziato a caratterizzare un campione ottenu- to dalle profondità oceaniche di Europa, una delle lune di Giove. Sorprendentemente, il campione contiene una forma di vita che cresce in un brodo ricco. L’analisi preliminare mostra che è cellulare e contiene DNA, RNA e proteine. Quando mostrate i vostri risultati a una collega, lei suggerisce che il vostro campione sia stato contaminato da un organismo terrestre. Quali approcci usereste per distinguere fra contaminazione e una nuova forma di vita cellulare basata su DNA, RNA e proteine? cloroplasti, mentre le cellule vegetali li hanno entrambi. Le cellule dei funghi si trovano più o meno nel mezzo; hanno pareti cellulari ma non hanno cloroplasti. È più probabile che le cellule dei funghi siano cellule animali che hanno acquisito la capacità di formare una parete cellulare oppure cellule vegetali che hanno perso i loro cloroplasti? Questa domanda ha rappresentato un argomento di difficile soluzione per i primi ricercatori che hanno provato ad assegnare relazioni evolutive basandosi solamente sulle caratteristiche e sulla morfologia delle cellule. Come pensate sia stato risolto alla fine questo quesito? 1.11 Quando sono stati scoperti per la prima volta i geni vegetali dell’emoglobina nei legumi, fu così sorprendente trovare un gene tipico del sangue degli animali che si ipotizzò che il gene vegetale si fosse originato per trasferimento orizzontale da un animale. Oggi sono stati sequenziati molti più geni dell’emoglobina e un albero filogenetico basato su queste sequenze è mostrato nella Figura P1.2. A. Questo albero supporta o confuta l’ipotesi che le emoglobine delle piante si siano originate per trasferimento genico orizzontale? B. Supponendo che i geni vegetali dell’emoglobina siano derivati in origine da un nematode parassita, per 1.6 Non è così difficile immaginare cosa significhi nu- trirsi delle molecole organiche prodotte dagli esseri viventi. Dopo tutto, si tratta di quello che tutti noi facciamo. Ma che cosa significa “nutrirsi” di luce, come fanno i fototrofi? O, cosa ancora più strana, “nutrirsi” di rocce, come fanno i litotrofi? Dove si trova il “cibo”, per esempio, in una miscela di composti chimici (H2S, H2, CO, Mn+, Fe2+, Ni2+, CH4 e NH4+) emessi da un camino idrotermale? VERTEBRATI Salamandra Coniglio Cobra Pollo Balena Gatto Uomo Mucca Rana Pesce rosso VEGETALI Orzo 1.7 Quanti alberi (schemi ramificati) possibili diversi si possono disegnare per eubatteri, archei ed eucarioti, presumendo che derivino tutti da un antenato comune? 1.8 I geni dell’RNA ribosomiale sono altamente con- servati (sono relativamente pochi i cambiamenti di sequenza) in tutti gli organismi terrestri; quindi si sono evoluti molto lentamente. Forse i geni dell’RNA ribosomiale sono “nati” perfetti? 1.9 I geni che partecipano ai processi informazionali come replicazione, trascrizione e traduzione sono trasferiti fra le specie molto meno spesso dei geni coinvolti nel metabolismo. Le basi di questa diversità non sono chiare al momento, ma un’ipotesi è che siano correlate alla sottostante complessità. I processi informazionali Loto Lombrico Alfalfa Insetti Fagiolo Molluschi bivalve INVERTEBRATI Nematode Chlamydomonas PROTOZOI Paramecio Figura P1.2 Albero filogenetico dei geni dell’emoglobina di varie specie (Problema 1.11). I legumi sono evidenziati in verde. Le lunghezze delle linee che connettono le specie presenti al giorno d’oggi rappresentano la distanza evolutiva che le separa. CAPITOLO 1 Cellule e genomi 42 © 978-88-08-62126-9 esempio, quale aspetto prenderebbe l’albero filogenetico? 1.12 La velocità dell’evoluzione sembra variare in li- nee diverse. Per esempio, la velocità di evoluzione della linea del ratto è significativamente maggiore di quella della linea umana. Queste differenze di velocità diven- tano evidenti quando si osservano i cambiamenti nelle sequenze proteiche che sono soggette a pressione selettiva o ai cambiamenti nelle sequenze nucleotidiche non codificanti, che non sono soggette a un’evidente pressione selettiva. Potete offrire una o più spiegazioni possibili della minore frequenza di cambiamenti evolutivi nella linea umana rispetto a quella del ratto? BIBLIOGRAFIA Generale Alberts B, Bray D, Hopkin K et al. (2014) Essential Cell Biology, 4a ed. New York: Garland Science. [Trad. it.: L’essenziale di biologia della cellula, Zanichelli, Bologna 2015.] Barton NH, Briggs DEG, Eisen JA et al. (2007) Evolution. Cold Spring Harbor, NY: Cold Spring Harbor Laboratory Press. Darwin C (1859) On the Origin of Species. London: Murray. [Trad. it.: L’origine della specie, Zanichelli, Bologna 2005. (Ristampa anastatica.)] Graur D e Li W-H (1999) Fundamentals of Molecular Evolution, 2a ed. Sunderland, MA: Sinauer Associates. Madigan MT, Martinko JM, Stahl D et al. (2010) Brock Biology of Microorganisms, 13a ed. Menlo Park, CA: BenjaminCummings. [Trad. it.: Biologia dei microrganismi, Pearson, Milano-Torino 2012.] Margulis L e Chapman MJ (2009) Kingdoms and Domains: An Illustrated Guide to the Phyla of Life on Earth, 1a ed. San Diego: Academic Press. Moore JA (1993) Science As a Way of Knowing. Cambridge, MA: Harvard University Press. Moore JA (1972) Heredity and Development, 2a ed. New York: Oxford University Press. (Free download at www.nap.edu) Yang Z (2014) Molecular Evolution: A Statistical Approach. Oxford: Oxford University Press. Le caratteristiche universali delle cellule sulla Terra Andersson SGE (2006) The bacterial world gets smaller. Science 314, 259-260. Brenner S, Jacob F e Meselson M (1961) An unstable intermediate carrying information from genes to ribosomes for protein synthesis. Nature 190, 576-581. Deamer D e Szostak JW eds. (2010) The Origins of Life (Cold Spring Harbor Perspectives in Biology). NY: Cold Spring Harbor Laboratory Press. Gibson DG, Benders GA, Andrews-Pfannkoch C et al. (2008) Complete chemical synthesis, assembly, and cloning of a Mycoplasma genitalium genome. Science 319, 1215-1220. Glass JI, Assad-Garcia N, Alperovich N et al. (2006) Essential genes of a minimal bacterium. Proc. Natl Acad. Sci. USA 103, 425-430. Harris JK, Kelley ST, Spiegelman GB et al. (2003) The genetic core of the universal ancestor. Genome Res. 13, 407-413. Koonin EV (2005) Orthologs, paralogs, and evolutionary genomics. Annu. Rev. Genet. 39, 309-338. Noller H (2005) RNA structure: reading the ribosome. Science 309, 1508-1514. Rinke C, Schwientek P, Sczyrba A et al. (2013) Insights into the phylogeny and coding potential of microbial dark matter. Nature 499, 431-437. Watson JD e Crick FHC (1953) Molecular structure of nucleic acids. A structure for deoxyribose nucleic acid. Nature 171, 737-738. La diversità dei genomi e l’albero della vita Blattner FR, Plunkett G, Bloch CA et al. (1997) The complete genome sequence of Escherichia coli K-12. Science 277, 1453-1474. Boucher Y, Douady CJ, Papke RT et al. (2003) Lateral gene transfer and the origins of prokaryotic groups. Annu. Rev. Genet. 37, 283-328. Cavicchioli R (2010) Archaea-timeline of the third domain. Nat. Rev. Microbiol. 9, 51-61. Choudhuri S (2014) Bioinformatics for Beginners: Genes, Genomes, Molecular Evolution, Databases and Analytical Tools, 1a ed. San Diego: Academic Press. Dixon B (1997) Power Unseen: How Microbes Rule the World. Oxford:Oxford University Press. Handelsman J (2004) Metagenomics: applications of genomics to uncultured microorganisms. Microbiol. Mol. Biol. Rev. 68, 669-685. Kerr RA (1997) Life goes to extremes in the deep earth – and elsewhere? Science 276, 703-704. Lee TI, Rinaldi NJ, Robert F et al. (2002) Transcriptional regulatory networks in Saccharomyces cerevisiae. Science 298, 799-804. Olsen GJ e Woese CR (1997) Archaeal genomics: an overview. Cell 89:991-994. Williams TA, Foster PG, Cox CJ e Embley TM (2013) An archaeal origin of eukaryotes supports only two primary domains of life. Nature 504, 231-235. Woese C (1998) The universal ancestor. Proc. Natl Acad. Sci. USA 95, 6854-6859. L’informazione genetica negli eucarioti Adams MD, Celniker SE, Holt RA et al. (2000) The genome sequence of Drosophila melanogaster. Science 287, 2185-2195. Amborella Genome Project (2013) The Amborella genome and the evolution of flowering plants. Science 342, 1241089. Andersson SG, Zomorodipour A, Andersson JO et al. (1998) The genome sequence of Rickettsia prowazekii and the origin of mitochondria. Nature 396, 133-140. The Arabidopsis Initiative (2000) Analysis of the genome sequence of the flowering plant Arabidopsis thaliana. Nature 408, 796-815. Carroll SB, Grenier JK e Weatherbee SD (2005) From DNA to Diversity: Molecular Genetics and the Evolution of Animal Design, 2a ed. Maldon, MA: Blackwell Science. [Trad. it.: Dal DNA alla diversità: evoluzione molecolare del progetto corporeo animale (edizione condotta sulla 1a ed. americana), Zanichelli, Bologna 2004.] de Duve C (2007) The origin of eukaryotes: a reappraisal. Nat. Rev. Genet. 8, 395-403. Delsuc F, Brinkmann H e Philippe H (2005) Phylogenomics and the reconstruction of the tree of life. Nat. Rev. Genet. 6, 361-375. DeRisi JL, Iyer VR e Brown PO (1997) Exploring the metabolic and genetic control of gene expression on a genomic scale. Science 278, 680-686. Gabriel SB, Schaffner SF, Nguyen H et al. (2002) The structure of haplotype blocks in the human genome. Science 296, 22252229. Goffeau A, Barrell BG, Bussey H et al. (1996) Life with 6000 genes. Science 274, 546-567. International Human Genome Sequencing Consortium (2001) Initial sequencing and analysis of the human genome. Nature 409, 860-921. CAPITOLO 1 Cellule e genomi © 978-88-08-62126-9 Keeling PJ e Koonin EV a cura di (2014) The Origin and Evolution of Eukaryotes (Cold Spring Harbor Perspectives in Biology). NY: Cold Spring Harbor Laboratory Press. Lander ES (2011) Initial impact of the sequencing of the human genome. Nature 470, 187-197. Lynch M e Conery JS (2000) The evolutionary fate and consequences of duplicate genes. Science 290, 1151-1155. National Center for Biotechnology Information. http://www.ncbi.nlm.nih.gov/ Owens K e King MC (1999) Genomic views of human history. Science 286, 451-453. Palmer JD e Delwiche CF (1996) Second-hand chloroplasts and the case of the disappearing nucleus. Proc. Natl Acad. Sci. USA 93, 7432-7435. Reed FA e Tishkoff SA (2006) African human diversity, origins and migrations. Curr. Opin. Genet. Dev. 16, 597-605. 43 Rine J (2014) A future of the model organism model. Mol. Biol. Cell 25, 549-553. Rubin GM, Yandell MD, Wortman JR et al. (2000) Comparative genomics of the eukaryotes. Science 287, 2204-2215. Shen Y, Yue F, McCleary D et al. (2012) A map of the cis-regulatory sequences in the mouse genome. Nature 488, 116-120. The C. elegans Sequencing Consortium (1998) Genome sequence of the nematode C. elegans: a platform for investigating biology. Science 282, 2012-2018. Tinsley RC e Kobel HR eds. (1996) The Biology of Xenopus. Oxford: Clarendon Press. Tyson JJ, Chen KC e Novak B (2003) Sniffers, buzzers, toggles and blinkers: dynamics of regulatory and signaling pathways in the cell. Curr. Opin. Cell Biol. 15, 221-231. Venter JC, Adams MD, Myers EW et al (2001) The sequence of the human genome. Science 291, 1304-1351. CAPITOLO 2 • I componenti chimici di una cellula • La catalisi e l’uso di energia da parte delle cellule • Il modo in cui le cellule ottengono energia dal cibo Figura 2.1 Gli elementi principali nelle cellule, evidenziati nella tavola periodica. Quando sono ordinati in base al loro numero atomico e disposti in questa maniera, gli elementi sono disposti in colonne verticali che mostrano caratteristiche simili. Gli atomi nella stessa colonna, per poter riempire il guscio più esterno devono guadagnare (o perdere) lo stesso numero di elettroni e quindi si comportano allo stesso modo nella formazione di legami covalenti o ionici. Perciò, per esempio, Mg e Ca tendono a cedere i due elettroni del guscio più esterno. C, N, O completano il loro secondo guscio condividendo elettroni. I quattro elementi evidenziati in rosso costituiscono il 99% del numero totale di atomi presenti nel corpo umano. Altri sette elementi, evidenziati in azzurro, rappresentano insieme circa lo 0,9% del totale. Gli elementi mostrati in verde sono necessari in tracce per gli esseri umani. Resta da chiarire se gli elementi mostrati in giallo siano essenziali per gli esseri umani. Sembra perciò che la chimica della vita sia in modo predominante la chimica degli elementi più leggeri. I pesi atomici mostrati qui sono quelli dell’isotopo più comune di ciascun elemento. Chimica e bioenergetica della cellula A prima vista è difficile accettare l’idea che ciascuna creatura vivente sia semplicemente un sistema chimico. L’incredibile diversità delle forme viventi, il loro comportamento apparentemente determinato e la loro capacità di crescere e di riprodursi sembrano separarle dal mondo dei solidi, dei liquidi e dei gas che la chimica descrive normalmente. In effetti fino al XIX secolo si pensava che gli animali contenessero una Forza vitale – un’“anima” – che era responsabile delle loro proprietà distintive. Oggi sappiamo che non c’è niente negli organismi viventi che disobbedisce alle leggi chimiche e fisiche.Tuttavia la chimica della vita è di un tipo speciale. Per prima cosa, si basa in modo preponderante sui composti del carbonio, il cui studio è noto come chimica organica. In secondo luogo, le cellule sono per il 70% acqua e la vita dipende quasi esclusivamente da reazioni chimiche che avvengono in soluzione acquosa.Terzo, e più importante, la chimica cellulare è enormemente complessa: anche la chimica della cellula semplice è di gran lunga più complicata di qualunque altro sistema chimico conosciuto. Sebbene le cellule abbiano al loro interno varie piccole molecole che contengono carbonio, la maggior parte degli atomi di carbonio nelle cellule è incorporata in enormi molecole polimeriche, catene di subunità chimiche legate l’una all’altra. Sono le proprietà uniche di queste macromolecole che permettono alle cellule e agli organismi di crescere e di riprodursi, oltre a svolgere tutti gli altri compiti che sono caratteristici della vita. I componenti chimici di una cellula Gli organismi viventi sono costituiti solamente da una piccola frazione dei 92 elementi presenti in natura, quattro dei quali – carbonio (C), idrogeno (H), azoto (N) e ossigeno (O) – rappresentano fino al 96,5% del peso di un organismo (Figura 2.1). Gli atomi di questi elementi sono legati fra loro mediante legami covalenti per formare molecole (vedi Quadro 2.1 pp. 94-95). Poiché i legami covalenti sono di norma 100 volte più forti dell’energia termica presente all’interno della cellula non vengono spezzati dai movimenti causati numero atomico 1 H He peso atomico 1 5 Li Be 11 12 Al Na Mg 23 19 K 39 24 6 C 12 14 Si 28 20 Ca Sc 40 Rb Sr B 11 Y Ti 23 V 51 24 25 26 27 28 29 30 7 N 14 15 P 31 8 O 16 16 S 32 9 F 19 17 Cl 55 56 59 59 64 65 Cs Ba La Hf Ta W Re Os Fr Ra Ac Rf Db Ir Pt Au Hg Tl Pb Kr 79 Zr Nb Mo Tc Ru Rh Pd Ag Cd In Sn Sb Te 96 Ar 35 34 Cr Mn Fe Co Ni Cu Zn Ga Ge As Se Br 52 42 Ne 53 I 127 Xe Bi Po At Rn CAPITOLO 2 Chimica e bioenergetica della cellula 45 © 978-88-08-62126-9 idrolisi di ATP nella cellula movimenti termici medi CONTENUTO DI ENERGIA (kJcal/mole) 1 10 legame non covalente nell’acqua Figura 2.2 Alcune forme di rottura del legame C–C 100 1000 luce verde 10 000 kJ ossidazione completa del glucosio dall’energia termica stessa e normalmente vengono spezzati soltanto durante reazioni chimiche specifiche con altri atomi e molecole. Due molecole diverse possono essere tenute insieme da legami non covalenti, che sono molto più deboli (Figura 2.2).Vedremo più avanti che i legami non covalenti sono importanti nelle numerose situazioni in cui molecole devono associarsi e dissociarsi rapidamente per svolgere le loro funzioni biologiche. ■ L’acqua è tenuta insieme da legami idrogeno Le reazioni intracellulari avvengono in un ambiente acquoso. La vita sulla Terra è incominciata nell’oceano e le condizioni dell’ambiente primordiale hanno lasciato un segno permanente sulla chimica degli esseri viventi. La vita perciò dipende dalle proprietà dell’acqua, che sono riassunte nel Quadro 2.2, pp. 96-97. In ciascuna molecola d’acqua (H2O) i due atomi di H sono uniti all’atomo di O da legami covalenti. I due legami sono altamente polari poiché l’O ha una forte attrazione per gli elettroni, mentre l’H ha solo una debole attrazione. Di conseguenza c’è una distribuzione ineguale di elettroni in una molecola d’acqua, con una preponderanza di carica positiva sui due atomi di H e di carica negativa sull’atomo di O. Quando una regione carica positivamente di una molecola d’acqua (cioè uno dei suoi atomi di H) si trova vicina a una regione carica negativamente (cioè l’atomo di O) di una seconda molecola d’acqua, l’attrazione elettrica fra di esse può portare a un legame idrogeno. Questi legami sono molto più deboli dei legami covalenti e vengono facilmente spezzati dai movimenti termici casuali dovuti all’energia di calore delle molecole, così che ogni legame ha una durata breve. Ma l’effetto combinato di molti legami deboli può essere profondo. Ciascuna molecola d’acqua può formare legami idrogeno tramite i suoi due atomi di H con altre due molecole d’acqua, producendo una rete in cui i legami idrogeno si formano e si spezzano in continuazione. È soltanto per i legami idrogeno che uniscono le sue molecole che l’acqua è un liquido a temperatura ambiente, con un punto di ebollizione alto e un’alta tensione superficiale, invece di essere un gas. Le molecole, come gli alcol, che contengono legami polari e che possono formare legami idrogeno con l’acqua si sciolgono facilmente in acqua. Le molecole che trasportano cariche positive o negative (ioni) interagiscono anch’esse in modo favorevole con l’acqua. Queste molecole sono dette idrofiliche, che significa che amano l’acqua. Una grossa proporzione delle molecole nell’ambiente acquoso di una cellula fa necessariamente parte di questa categoria, compresi zuccheri, DNA, RNA e la maggioranza delle proteine. Le molecole idrofobiche (che odiano l’acqua), invece, non sono cariche e formano pochi, o nessuno, legami idrogeno e quindi non si sciolgono in acqua. Gli idrocarburi ne sono un esempio importante. In queste molecole gli atomi di H sono legati covalentemente ad atomi di C da un legame in larga misura non polare perciò non possono formare legami idrogeno efficaci con altre molecole (vedi Quadro 2.2 pp. 96-97). Ciò rende gli idrocarburi idrofobici nel loro insieme, una proprietà che viene sfruttata nelle cellule, le cui membrane sono costituite da molecole che hanno lunghe code idrocarburiche, come vedremo nel Capitolo 10. ■ Quattro tipi di interazioni non covalenti aiutano a unire tra loro le molecole nelle cellule In biologia molto dipende dal legame specifico di molecole diverse fra loro, legame causato da tre tipi di legami non covalenti: attrazioni elettro- energia importanti per le cellule. Una proprietà cruciale di ogni legame – covalente o non covalente – è la sua forza. La forza di legame è misurata dalla quantità di energia che deve essere fornita per romperlo, espressa sia in kilojoules per mole (kJ/mole) che in chilocalorie per mole (kcal/mole). Perciò se è necessaria un’energia di 100 kJ per rompere 6 3 1023 legami di un tipo specifico (cioè, una mole di questi legami), allora la forza del legame è di 100 kJ/mole. Si noti che queste energie sono confrontate su scala logaritmica. Forze e lunghezze tipiche delle principali classi di legami chimici sono riportate nella Tabella 2.1. Un joule (J) è la quantità di energia necessaria per muovere un oggetto per una distanza di un metro contro la forza di un Newton. Questa misura dell’energia deriva dalle unità SI (Système Internationale d’Unitès) usato universalmente dagli scienziati. Una seconda unità di misura per l’energia, spesso usata dai biologi cellulari, è la chilocaloria (kcal); una caloria è la quantità necessaria di energia per alzare la temperatura di un grammo di acqua di 1 °C. Un kJ è equivalente a 0,239 kcal (1 kcal = 4,18 kJ). CAPITOLO 2 Chimica e bioenergetica della cellula 46 © 978-88-08-62126-9 Figura 2.3 Rappresentazione schematica del modo in cui due macromolecole con superfici complementari possono legarsi strettamente l’una all’altra tramite interazioni non covalenti. I legami chimici non covalenti hanno una forza di legame che è meno di 1/20 di quella di un legame covalente. Essi sono in grado di dare origine a un legame solido solo quando si formano in gran numero simultaneamente. Sebbene qui siano illustrate solamente interazioni elettrostatiche, in realtà, tutte e quattro le forze covalenti spesso contribuiscono a tenere insieme due macromolecole (Filmato 2.1 ). (A) legame idrogeno lungo circa 0,3 nm atomo donatore N atomo accettore H O ■ Alcune molecole polari in acqua formano acidi e basi legame covalente lungo circa 0,1 nm (B) O O O N + N N atomo donatore H H H H H H statiche (legami ionici), legami idrogeno e attrazioni di van der Waals e da un quarto fattore che può spingere insieme le molecole: la forza idrofobica. Le proprietà dei quattro tipi di legami non covalenti sono presentate nel Quadro 2.3 (pp. 98-99). Sebbene ciascuna singola attrazione non covalente sia decisamente troppo debole per essere efficace in confronto ai movimenti termici, la loro energia si può sommare per creare una notevole forza tra due molecole separate. Quindi insiemi di attrazioni non covalenti spesso permettono alle superfici complemetari di due macromolecole di restare unite (Figura 2.3). La Tabella 2.1 mette a confronto la forza di un legame non covalente con quella di un tipico legame covalente, sia in presenza che in assenza di acqua. Si noti che, formando interazioni che competono con quelle delle molecole coinvolte, l’acqua riduce grandemente la forza sia delle attrazioni elettrostatiche che dei legami idrogeno. La struttura di un tipico legame idrogeno è illustrata nella Figura 2.4. Questo legame rappresenta una forma speciale di interazione polare in cui un atomo di idrogeno elettropositivo è parzialmente condiviso da due atomi elettronegativi. Questo idrogeno può essere visto come un protone che si è dissociato parzialmente da un atomo donatore, permettendone così la condivisione da parte di un secondo atomo accettore. A differenza di una tipica interazione elettrostatica, questo legame è altamente direzionale, ed è più forte quando tutti e tre gli atomi coinvolti si trovano sulla stessa retta. Il quarto effetto che ha spesso un ruolo importante nell’unire fra loro molecole nell’acqua non è, in senso stretto, un legame. Tuttavia una forza idrofobica molto importante è causata dal fatto che le superfici non polari sono spinte fuori dalla rete di acqua legata da legami idrogeno, nella quale interferirebbero fisicamente con le interazioni altamente favorevoli fra le molecole d’acqua. Poiché unire due superfici qualunque non polari riduce il loro contatto con l’acqua, la forza è in questo senso non specifica. Nonostante ciò, vedremo nel Capitolo 3 che le forze idrofobiche hanno un ruolo centrale nel ripiegamento appropriato delle molecole proteiche. O O N O O N atomo accettore Una delle specie più semplici di reazioni chimiche, e che ha un significato profondo nelle cellule, avviene quando una molecola che possiede un legame covalente altamente polare fra un atomo di idrogeno e un secondo atomo si scioglie in acqua. L’atomo di idrogeno in una molecola di questo tipo ha in gran parte ceduto il suo elettrone all’atomo compagno e quindi assomiglia a un nucleo di idrogeno carico positivamente quasi nudo: in altre parole, TABELLA 2.1 Legami chimici covalenti e non covalenti Forza (kJ/mole)** Tipo di legame Lunghezza (nm) Covalente Figura 2.4 Legami idrogeno. (A) Modello a palle e bastoncini di un tipico legame idrogeno. La distanza fra l’atomo di idrogeno e quello di ossigeno qui è minore della somma dei loro raggi di van der Waals, il che indica una parziale condivisione di elettroni. (B) I legami idrogeno più comuni nelle cellule. Non covalente nel vuoto in acqua 0,15 377 (90) 377 (90) ionico* 0,25 335 (80) 12,6 (3) idrogeno 0,30 16,7 (4) 4,2 (1) attrazione di van der Waals (per atomo) 0,35 0,4 (0,1) 0,4 (0,1) *Un legame ionico è un’attrazione elettrostatica fra due atomi completamente carichi. **I valori in parentesi sono in kcal/mole. 1 kJ = 0,239 kcal e 1kcal = 4,18 kJ. CAPITOLO 2 Chimica e bioenergetica della cellula 47 © 978-88-08-62126-9 O CH3 + O δ– O H C H δ+ acido acetico CH3 O H O H acqua ione acetato H H2O (B) O H H O H H2O il protone si muove da una molecola all’altra + O (A) H H C H + + + H O + H ione idronio O H – H3O OH ione idronio ione ossidrilico Figura 2.5 I protoni si muovono velocemente in soluzioni acquose. (A) La reazione che avviene quando una molecola di acido acetico si scioglie in acqua. A pH 7, quasi tutto l’acido acetico è presente come ione acetato. (B) Le molecole d’acqua scambiano continuamente protoni fra di loro per formare ioni idronio e ossidrilici. Questi ioni a loro volta si ricombinano rapidamente per formare molecole d’acqua. un protone (H+). Quando la molecola polare viene circondata da molecole d’acqua, il protone viene attratto dalla carica negativa parziale dell’atomo di ossigeno di una molecola d’acqua adiacente e si può dissociare dal partner originale per associarsi invece all’atomo di ossigeno della molecola d’acqua per generare uno ione idronio (H3O1) (Figura 2.5A). Anche la reazione inversa avviene molto prontamente, così che si deve immaginare uno stato di equilibrio in cui miliardi di protoni costantemente passano in modo rapido da una molecola in soluzione a un’altra. Le sostanze che rilasciano protoni per formare H3O+ quando si sciolgono in acqua sono dette acidi. Più alta è la concentrazione di H3O+, più acida è la soluzione. H3O+ è presente anche nell’acqua pura a una concentrazione di 10–7 M, come risultato del movimento di protoni da una molecola d’acqua all’altra (Figura 2.5B). Per convenzione, la concentrazione di H3O+ viene in genere riferita come concentrazione di H+, anche se quasi tutto l’H+ in una soluzione acquosa è presente come H3O+. Per evitare l’uso di numeri poco maneggevoli, la concentrazione di H+ è espressa utilizzando una scala logaritmica chiamata scala di pH. L’acqua pura ha un pH di 7,0 ed è neutra, cioè non è né acida (pH < 7,0) né basica (pH > 7,0). Gli acidi sono caratterizzati dall’essere forti o deboli e ciò dipende da quanto facilmente essi cedono i loro protoni all’acqua. Gli acidi forti, come l’acido cloridrico (HCl), perdono velocemente i loro protoni. L’acido acetico invece è un acido debole perché quando viene sciolto in acqua trattiene i suoi protoni più saldamente. Molti degli acidi importanti nella cellula – come le molecole che contengono un gruppo carbossilico (COOH) – sono acidi deboli (Si veda il Quadro 2.2, pp. 96-97). Poiché il protone di uno ione idronio può essere passato facilmente a molti tipi di molecole nelle cellule, alterandone le caratteristiche, la concentrazione di H3O+ all’interno di una cellula (acidità) deve essere rigidamente regolata. Gli acidi – specialmente gli acidi deboli - perderanno i loro protoni più facilmente se la concentrazione di H3O+ in soluzione è bassa e tenderanno a riacquistarli se la concentrazione in soluzione è alta. L’opposto di un acido è una base. Qualunque molecola capace di accettare un protone da una molecola d’acqua viene chiamata base. L’idrossido di sodio (NaOH) è basico (o alcalino) perché in soluzione acquosa si dissocia velocemente per formare ioni Na+ e OH–. A causa di questa proprietà l’idrossido di sodio è definito una base forte. Tuttavia, nelle cellule viventi sono più importanti le basi deboli, quelle che hanno una tendenza debole ad accettare protoni dall’acqua in maniera reversibile. Molte molecole biologicamente importanti contengono un gruppo amminico (NH2). Questo gruppo è una base debole che può generare OH– prendendo un protone dall’acqua: –NH2 + H2O n –NH3+ + OH– (vedi Quadro 2.2, pp. 96-97). CAPITOLO 2 Chimica e bioenergetica della cellula 48 © 978-88-08-62126-9 Poiché uno ione OH– si combina con uno ione H3O+ per formare due molecole di acqua, un aumento nella concentrazione di OH– forza una diminuzione nella concentrazione di H3O+, e viceversa. Una soluzione pura di acqua contiene una uguale concentrazione (10–7 M) di entrambi gli ioni, rendendola neutra. Anche l’interno di una cellula è mantenuto vicino alla neutralità grazie alla presenza di tamponi: acidi e basi deboli che possono rilasciare o acquisire protoni vicino a pH 7 mantenendo l’ambiente della cellula relativamente costante in varie condizioni. ■ Una cellula è formata da composti del carbonio Dopo aver osservato i modi in cui gli atomi si combinano in piccole molecole e il modo in cui queste molecole si comportano in un ambiente acquoso, esaminiamo ora le classi principali di piccole molecole che si trovano nelle cellule. Vedremo che poche categorie base di molecole, formate da una manciata di elementi diversi, danno origine a tutta la straordinaria ricchezza di forme e di comportamenti mostrati dagli esseri viventi. Ad eccezione dell’acqua e degli ioni inorganici come il potassio, quasi tutte le molecole di una cellula si basano sul carbonio. Il carbonio spicca fra gli altri elementi per la sua capacità di formare grosse molecole; il silicio è secondo a distanza. Poiché è piccolo e ha quattro elettroni e quattro spazi vuoti nel suo guscio più esterno, un atomo di carbonio può formare quattro legami covalenti con altri atomi. Cosa più importante, un atomo di carbonio può unirsi ad altri atomi di carbonio tramite legami covalenti altamente stabili C–C per formare catene e anelli e quindi generare molecole grandi e complesse senza limiti evidenti alle loro dimensioni. I composti grandi e piccoli di carbonio formati dalle cellule sono chiamati molecole organiche, invece, tutte le altre molecole, inclusa l’acqua, sono definite inorganiche. Certe combinazioni di atomi, come il metile (–CH3), l’ossidrile (–OH), il carbossile (–COOH), il carbonile (–C=O), il fosfato (–PO32–), il sulfidrile (–SH) e i gruppi amminici (–NH2), si trovano con frequenza nelle molecole prodotte dalle cellule. Ciascuno di questi gruppi chimici ha proprietà chimiche e fisiche distinte che influenzano il comportamento della molecola in cui il gruppo si trova. I gruppi chimici più comuni e alcune delle loro proprietà sono riassunti nel Quadro 2.1, pp. 94-95. ■ Le cellule contengono quattro famiglie principali di piccole molecole organiche Le piccole molecole organiche della cellula sono composti basati sul carbonio che hanno pesi molecolari variabili fra 100 e 1000 e contengono fino a circa 30 atomi di carbonio. In genere si trovano libere in soluzione e hanno molti destini diversi. Alcune sono usate come subunità monomeriche per costruire polimeri giganti, le macromolecole: le proteine, gli acidi nucleici e i grandi polisaccaridi. Altre agiscono da fonti di energia e vengono demolite e trasformate in altre piccole molecole in un labirinto di vie metaboliche intracellulari. Molte piccole molecole hanno più di un ruolo nella cellula: per esempio, agiscono sia da subunità potenziali per una macromolecola che da fonte di energia. Le piccole molecole organiche sono molto meno abbondanti delle macromolecole organiche, e assommano soltanto a un decimo della massa totale di materia organica in una cellula. Approssimativamente, in una cellula tipica ci sono circa mille specie diverse di queste piccole molecole. Tutte le molecole organiche sono sintetizzate a partire dalla stessa serie di piccoli composti nei quali vengono anche demolite. Come conseguenza i composti presenti in una cellula sono correlati chimicamente e la maggior parte può essere classificata in un piccolo numero di famiglie distinte. In termini generali le cellule contengono quattro famiglie principali di piccole molecole organiche: gli zuccheri, gli acidi grassi, i nucleotidi e gli amminoacidi (Figura 2.6). Sebbene molti composti presenti nelle cellule non rientrino in queste categorie, queste quattro famiglie di piccole molecole organiche, insieme alle macromolecole costruite legandole insieme in lunghe catene, formano gran parte della massa cellulare. CAPITOLO 2 Chimica e bioenergetica della cellula 49 © 978-88-08-62126-9 CH2OH H C HO C H O OH H H OH + H3N C H C C H OH C unità più grandi della cellula ZUCCHERI POLISACCARIDI ACIDI GRASSI GRASSI, LIPIDI, MEMBRANE AMMINOACIDI PROTEINE NUCLEOTIDI ACIDI NUCLEICI COO CH3 UNO ZUCCHERO UN AMMINOACIDO H H H H H H H H H H H H H H H unità da costruzione della cellula C C C C C C C C C C C C C C O C _ O H H H H H H H H H H H H H H UN ACIDO GRASSO NH2 N O –O P O– O O P O– N O O P O CH2 N N O O– OH OH UN NUCLEOTIDE Gli amminoacidi e le proteine da essi formate saranno il soggetto del Capitolo 3. Un riassunto delle strutture e delle proprietà delle rimanenti tre famiglie – zuccheri, grassi e nucleotidi – è presentato nei Quadri 2.4, 2.5 e 2.6 rispettivamente (vedi pp. 100-105). ■ La chimica delle cellule è dominata da macromolecole con proprietà notevoli In peso le macromolecole sono le più abbondanti fra le molecole che contengono carbonio in una cellula vivente (Figura 2.7). Esse sono le principali unità di cui è costituita una cellula e anche i componenti che conferiscono le proprietà più distintive degli esseri viventi. Le macromolecole delle cellule sono polimeri costruiti unendo covalentemente piccole molecole organiche (chiamate monomeri) in lunghe catene (Figura 2.8), e hanno molte proprietà notevoli, che non potevano essere previste in base ai loro semplici costituenti. Le proteine sono abbondanti e incredibilmente versatili e svolgono migliaia di funzioni diverse nelle cellule. Molte proteine servono da enzimi, i catalizzatori che dirigono il grande numero di reazioni di formazione e rottu- cellula batterica 30% composti chimici VOLUME CELLULARE DI 2 × 10–12 cm3 ioni inorganici (1%) piccole molecole (3%) fosfolipidi (2%) DNA (1%) RNA (6%) MACROMOLECOLE 70% H2O Figura 2.6 Le quattro famiglie principali di piccole molecole organiche nelle cellule. Queste piccole molecole formano le unità da costruzione monomeriche, o subunità, della maggior parte delle macromolecole e di altri complessi cellulari. Alcune, come gli zuccheri e gli acidi grassi, sono anche fonte di energia. Le loro strutture sono qui schematizzate e riportate in maggior dettaglio nei quadri alla fine di questo capitolo e nel Capitolo 3. proteine (15%) polisaccaridi (2%) Figura 2.7 La distribuzione delle molecole nelle cellule. La composizione approssimativa di una cellula batterica è mostrata in peso. La composizione di una cellula animale è simile, sebbene il suo volume sia approssimativamente 1000 maggiore. Si noti che le macromolecole dominano. Fra i principali ioni inorganici ci sono Na+, K+, Mg2+, Ca2+ e Cl–. CAPITOLO 2 Chimica e bioenergetica della cellula 50 © 978-88-08-62126-9 SUBUNITÀ MACROMOLECOLE zucchero polisaccaride amminoacido proteina nucleotide acido nucleico Figura 2.8 Tre famiglie di macromolecole. Ciascuna è un polimero formato da piccole molecole (chiamate monomeri o subunità) unite insieme da legami covalenti. ra di legami covalenti di cui la cellula ha bisogno. Gli enzimi catalizzano tutte le reazioni tramite le quali le cellule estraggono energia dalle molecole di cibo; per esempio, un enzima chiamato ribulosio bifosfato carbossilasi converte CO2 in zuccheri negli organismi fotosintetici, producendo la maggior parte della materia organica necessaria per la vita sulla Terra. Altre proteine sono usate per costruire componenti strutturali, come la tubulina, una proteina che si autoassembla per produrre i lunghi microtubuli della cellula, o gli istoni, proteine che compattano il DNA nei cromosomi. Altre proteine ancora agiscono da motori molecolari per produrre forza e movimento, come nel caso della miosina del muscolo. Le proteine svolgono anche varie altre funzioni ed esamineremo le basi molecolari di molte di esse più avanti in questo libro. Sebbene siano diverse nei dettagli per proteine, acidi nucleici e polisaccaridi, le reazioni chimiche che aggiungono subunità a ciascun polimero hanno importanti caratteristiche in comune. Ciascun polimero cresce per l’aggiunta di un monomero all’estremità di un polimero in crescita in una reazione di condensazione, in cui una molecola d’acqua viene persa ogni volta che viene aggiunta una subunità (Figura 2.9). La polimerizzazione in passaggi successivi di monomeri in una lunga catena è un modo semplice per costruire una grossa molecola complessa, poiché le subunità sono aggiunte nella stessa reazione ripetuta in continuazione dalla stessa serie di enzimi. A parte alcuni polisaccaridi, la maggior parte delle macromolecole è costituita da una serie di monomeri che sono leggermente diversi l’uno dall’altro, per esempio, i 20 diversi amminoacidi da cui sono costituite le proteine. Per la vita è cruciale che la catena polimerica non sia assemblata a caso a partire da queste subunità; le subunità sono invece aggiunte in un ordine particolare, o sequenza. I meccanismi elaborati che permettono agli enzimi di farlo sono descritti in dettaglio nei Capitoli 5 e 6. ■ Legami non covalenti specificano sia la forma precisa di una macromolecola che il suo legame con altre molecole Figura 2.9 La condensazione e l’idrolisi come reazioni opposte. Le macromolecole delle cellule sono polimeri formati da subunità (o monomeri) per mezzo di una reazione di condensazione e che sono scissi in monomeri mediante idrolisi. Le reazioni di condensazione sono energeticamente sfavorevoli; per questo motivo la formazione di polimeri richiede energia, come verrà descritto nel testo. La maggior parte dei legami covalenti in una macromolecola permette la rotazione degli atomi che essi uniscono, così che la catena polimerica abbia grande flessibilità. In linea di principio ciò permette a una macromolecola di adottare un numero quasi illimitato di forme, o conformazioni, quando l’energia termica casuale fa contorcere e ruotare la catena polimerica.Tuttavia le forme della maggior parte delle macromolecole biologiche sono molto limitate a causa dei numerosi legami non covalenti deboli che si formano fra parti diverse della stessa molecola. Se questi legami non covalenti si formano in numero sufficiente, la catena polimerica può preferire fortemente una conformazione particolare, determinata dalla sequenza lineare dei monomeri della sua catena. La maggior parte delle molecole proteiche e delle molecole di RNA molto piccole che si trovano nelle cellule si ripiegano strettamente in una conformazione nettamente preferita (Figura 2.10). I quattro tipi di interazioni non covalenti importanti nelle molecole biologiche sono stati descritti in precedenza in questo capitolo e sono discussi ulteriormente nel Quadro 2.3 (pp. 98-99). Queste interazioni, oltre a ripiegare macromolecole biologiche in forme uniche, possono anche sommarsi per creare una forte attrazione fra due molecole diverse (vedi Figura 2.3). Questa forma di interazione molecolare fornisce una grande specificità, in quanto i contatti in molteplici punti necessari per un legame forte rendono possibile a una macromolecola di scegliere – tramite il legame – soltanto uno delle molte migliaia di altri tipi di molecole presenti in una cellula. Inoltre, poiché la for- H2O A H + HO B CONDENSAZIONE energeticamente sfavorevole H2O A B IDROLISI energeticamente favorevole A H + HO B CAPITOLO 2 Chimica e bioenergetica della cellula 51 © 978-88-08-62126-9 Figura 2.10 Le proteine e le molecole di RNA si ripiegano in una sola struttura tridimensionale particolarmente stabile, o conformazione. Se i legami non covalenti che mantengono questa conformazione stabile vengono rotti, la molecola diventa una catena flessibile che perde la sua attività biologica. molte conformazioni instabili una conformazione ripiegata stabile za del legame dipende dal numero dei legami non covalenti che si formano, sono possibili interazioni quasi con qualunque grado di affinità, permettendo quando è necessario una rapida dissociazione. Come vedremo in seguito, legami di questo tipo sono alla base di tutte le catalisi biologiche, rendendo possibile alle proteine di svolgere la funzione di enzimi. Inoltre le interazioni non covalenti permettono anche alle macromolecole di essere usate come unità da costruzione per la formazione di strutture più grandi, formando così macchinari complicati con molteplici parti in movimento che svolgono compiti complessi come la replicazione del DNA e la sintesi proteica (Figura 2.11). SOMMARIO Gli organismi viventi sono sistemi chimici autonomi capaci di autopropagarsi. Essi sono costituiti da una serie caratteristica e limitata di piccole molecole basate sul carbonio che sono essenzialmente le stesse per ogni specie vivente. Ciascuna di queste molecole è composta da una piccola serie di atomi uniti fra loro in una configurazione precisa da legami covalenti. Le categorie principali sono zuccheri, acidi grassi, amminoacidi e nucleotidi. Gli zuccheri sono una fonte primaria di energia chimica per le cellule e possono essere incorporati in polisaccaridi per conservare energia. Anche gli acidi grassi sono importanti per la conservazione dell’energia, ma la loro funzione più cruciale è la formazione delle membrane cellulari. Polimeri consistenti di amminoacidi costituiscono le macromolecole notevolmente diverse e versatili note come proteine. I nucleotidi hanno un ruolo centrale nel trasferimento di energia e sono anche le subunità di cui sono fatte le macromolecole informazionali, RNA e DNA. SUBUNITÀ MACROMOLECOLE legami covalenti legami non covalenti COMPLESSI MACROMOLECOLARI ad esempio, zuccheri, amminoacidi e nucleotidi 30 nm ad esempio, proteine globulari e RNA Figura 2.11 Piccole molecole si legano covalentemente a formare macromolecole che a loro volta si assemblano mediante legami non covalenti a formare grandi complessi. Piccole molecole, proteine e un ribosoma disegnati ad esempio, ribosoma approssimativamente in scala. I ribosomi sono una parte centrale del macchinario che la cellula usa per produrre proteine: ciascun ribosoma è formato da un complesso di circa 90 macromolecole (molecole di proteine e di RNA). CAPITOLO 2 Chimica e bioenergetica della cellula 52 © 978-88-08-62126-9 La maggior parte della massa secca di una cellula consiste di macromolecole che sono state prodotte come polimeri lineari di amminoacidi (proteine) o di nucleotidi (DNA e RNA), uniti covalentemente fra loro in un preciso ordine. La maggior parte delle molecole proteiche e molti degli RNA si ripiegano in una conformazione unica che dipende dalla loro sequenza di subunità. Questo processo di ripiegamento crea superfici peculiari e dipende da una grande serie di interazioni deboli prodotte da forze non covalenti fra gli atomi. Queste forze sono di quattro tipi: attrazioni elettrostatiche, legami idrogeno, attrazioni di van der Waals e un’interazione fra gruppi non polari causata dalla loro espulsione idrofobica dall’acqua. La stessa serie di forze deboli governa l’attacco specifico di altre molecole alle macromolecole, rendendo possibile la miriade di associazioni fra molecole biologiche che producono la struttura e la chimica di una cellula. ● La catalisi e l’uso di energia da parte delle cellule Una proprietà degli esseri viventi in particolare li fa sembrare quasi miracolosamente diversi dalla materia non vivente: essi creano e mantengono ordine in un universo che tende sempre al maggior disordine (Figura 2.12). Per creare questo ordine le cellule di un organismo vivente devono svolgere una serie ininterrotta di reazioni chimiche. In alcune di queste reazioni piccole molecole organiche – amminoacidi, zuccheri, nucleotidi e lipidi – vengono demolite o modificate per produrre tutte le altre piccole molecole che la cellula richiede. In altre reazioni queste piccole molecole vengono usate per costruire una gamma enormemente diversificata di proteine, acidi nucleici e altre macromolecole che conferiscono ai sistemi viventi tutte le loro caratteristiche più distintive. Ciascuna cellula può essere vista come una minuscola fabbrica chimica, che svolge milioni di reazioni al secondo. ■ Il metabolismo cellulare • organizzato da enzimi Le reazioni chimiche svolte da una cellula avverrebbero normalmente soltanto a temperature molto più alte di quelle esistenti all’interno delle cellule. Per questa ragione ciascuna reazione richiede una spinta specifica in termini di reattività chimica. Questa necessità è cruciale, perché permette alla cellula di controllare ciascuna reazione. Il controllo è esercitato tramite catalizzatori biologici specializzati. Questi sono quasi sempre proteine chiamate enzimi, sebbene esistano anche RNA con funzione di catalizzatore chiamati ribozimi. Ciascun enzima accelera, o catalizza, soltanto uno dei molti tipi possibili di reazioni cui una particolare molecola potrebbe andare incontro. Le reazioni (A) 20 nm (B) 50 nm (C) Figura 2.12 Le strutture biologiche sono altamente ordinate. Negli organismi viventi si possono trovare a ogni livello di organizzazione schemi spaziali ben definiti, elaborati e belli. In ordine di dimensioni crescenti: (A) molecole proteiche nel rivestimento di un virus (un parassita che, sebbene tecnicamente non sia un organismo vivente, contiene lo stesso tipo di molecole trovate nelle cellule viventi; (B) la disposizione regolare di microtubuli visti in una sezione trasversale della coda 10 µm (D) 0,5 mm (E) 20 mm di uno spermatozoo; (C) contorni della superficie di un grano di polline (una singola cellula); (D) sezione trasversale di fusto di felce che mostra la disposizione regolare delle cellule; (E) disposizione a spirale delle foglie di una pianta grassa. (A, per gentile concessione di R.A. Grant e J.M. Hogle; B, per gentile concessione di Lewis Tilney; C, per gentile concessione di Colin MacFarlane e Chris Jeffree; D, per gentile concessione di Jim Haseloff.) CAPITOLO 2 Chimica e bioenergetica della cellula 53 © 978-88-08-62126-9 molecola molecola molecola molecola molecola molecola A B C D E F catalisi da parte dell’enzima 1 catalisi da parte dell’enzima 2 catalisi da parte dell’enzima 3 catalisi da parte dell’enzima 4 catalisi da parte dell’enzima 5 catalizzate da enzimi sono di solito connesse in serie, così che il prodotto di una reazione diventa il materiale di partenza, o substrato, di quella successiva (Figura 2.13). Queste lunghe vie lineari di reazioni sono a loro volta collegate fra loro, formando un labirinto di reazioni interconnesse che rendono la cellula capace di sopravvivere, crescere e riprodursi. Due flussi opposti di reazioni chimiche si verificano nelle cellule: (1) le vie cataboliche demoliscono il cibo in molecole più piccole, generando così sia una forma utile di energia per la cellula che alcune delle piccole molecole di cui la cellula ha bisogno come unità da costruzione; (2) le vie anaboliche, o biosintetiche, usano l’energia imbrigliata dal catabolismo per spingere la sintesi delle molte altre molecole che formano la cellula. Insieme queste due serie di reazioni costituiscono il metabolismo della cellula (Figura 2.14). Molti dettagli del metabolismo cellulare costituiscono il soggetto tradizionale della biochimica e non ci riguardano. Ma i principi generali in base ai quali le cellule ottengono energia dall’ambiente e la usano per creare ordine sono fondamentali per la biologia cellulare. Iniziamo con una discussione sul motivo per cui un apporto costante di energia è necessario per sostenere gli organismi viventi. ABBREVIATE COME Figura 2.13 Il modo in cui una serie di reazioni catalizzate da enzimi genera una via metabolica. Ciascun enzima catalizza una particolare reazione chimica, che lascia l’enzima immutato. In questo esempio un gruppo di enzimi che agisce in serie converte la molecola A nella molecola F, formando una via metabolica. (Per un diagramma di molte delle reazioni che avvengono in una cellula umana, abbreviate come mostrato, vedi Figura 2.63.) ■ L’ordine biologico è reso possibile dal rilascio di energia sotto forma di calore dalle cellule La tendenza universale delle cose a diventare disordinate è espressa in una legge fondamentale della fisica – la seconda legge della termodinamica – secondo la quale nell’universo, o in qualunque sistema isolato (un insieme di materia che è completamente isolato dal resto dell’universo), il grado di disordine può soltanto aumentare. Questa legge ha implicazioni così profonde per tutti gli esseri viventi che vale la pena di enunciarla in diversi modi. Per esempio, possiamo presentare la seconda legge in termini di probabilità e dire che i sistemi cambieranno spontaneamente verso quelle disposizioni che presentano il maggior grado di probabilità. Se consideriamo, per esempio, una scatola contenente 100 monete tutte con la testa rivolta verso l’alto, una serie di urti che scuota la scatola tenderà a mutare la disposizione verso una miscela di 50 teste e 50 croci. La ragione è semplice: vi è un numero enorme di disposizioni possibili delle singole monete che può portare al risultato molecole di cibo VIE CATABOLICHE le molte molecole che formano la cellula forme utili di energia + VIE ANABOLICHE calore perso le molte unità da costruzione per le biosintesi Figura 2.14 Rappresentazione schematica della relazione fra vie cataboliche e anaboliche nel metabolismo. Come suggerito qui, una porzione importante dell’energia conservata nei legami chimici delle molecole di cibo è dissipata come calore. Inoltre, la massa di cibo richiesta da un organismo che deriva tutta la sua energia dal catabolismo è molto maggiore della massa delle molecole che possono essere prodotte dall’anabolismo. CAPITOLO 2 Chimica e bioenergetica della cellula 54 Figura 2.15 Un esempio nella vita di tutti i giorni del processo spontaneo verso il disordine. Invertire questa tendenza verso il disordine richiede uno sforzo intenzionale e un apporto di energia: non è spontaneo. In effetti, in base alla seconda legge della termodinamica, possiamo essere certi che l’intervento umano richiesto rilascerà verso l’ambiente più calore di quello necessario a compensare il riordino degli oggetti in questa stanza. © 978-88-08-62126-9 REAZIONE “SPONTANEA” come passa il tempo SFORZO ORGANIZZATO CHE RICHIEDE APPORTO DI ENERGIA 50-50, ma soltanto una possibile disposizione che tiene tutte le monete orientate con la testa verso l’alto. Poiché la disposizione 50-50 è perciò la più probabile, noi diciamo che è la più “disordinata”. Per la stessa ragione, è un’esperienza comune che lo spazio in cui viviamo diventerà sempre più disordinato senza sforzo intenzionale: il movimento verso il disordine è un processo spontaneo, che richiede uno sforzo periodico per invertirlo (Figura 2.15). La quantità di disordine in un sistema può essere calcolata ed espressa come entropia del sistema: maggiore è il disordine e maggiore è l’entropia. Così un altro modo di esprimere la seconda legge della termodinamica è quello di dire che i sistemi cambieranno spontaneamente verso disposizioni con maggiore entropia. Le cellule viventi – sopravvivendo, crescendo e formando organismi complessi – generano ordine e così potrebbe sembrare che sfidino la seconda legge della termodinamica. Come è possibile? La risposta è che una cellula non è un sistema isolato: prende energia dall’ambiente sotto forma di cibo, o come fotoni dal sole (o anche, come in alcuni batteri chemosintetici, soltanto da molecole inorganiche), e quindi usa questa energia per generare ordine al suo interno. Nel corso delle reazioni chimiche che generano ordine parte dell’energia che la cellula usa viene convertita in calore. Il calore è scaricato nell’ambiente della cellula e lo rende disordinato, così che l’entropia totale – quella della cellula più quella dell’ambiente circostante – aumenta, come previsto dalle leggi della termodinamica. Per comprendere i principi che governano queste conversioni di energia pensate a una cellula come se si trovasse in un mare di materia che rappresenta il resto dell’universo. Mentre la cellula vive e cresce crea ordine interno. Ma rilascia costantemente energia sotto forma di calore mentre sintetizza molecole e le assembla in strutture cellulari. Il calore è energia nella sua forma più disordinata: scontri casuali fra molecole. Quando la cellula rilascia calore nel mare, ciò aumenta l’intensità dei movimenti molecolari nel mare (movimenti termici), aumentando così la casualità, o disordine, del mare. La seconda legge della termodinamica è soddisfatta perché l’aumento nella quantità di ordine all’interno della cellula è più che compensato da una maggiore diminuzione nell’ordine (aumento di entropia) del mare circostante di materia (Figura 2.16). Da dove viene il calore che la cellula rilascia? Qui incontriamo un’altra importante legge della termodinamica. La prima legge della termodinamica afferma che l’energia può essere convertita da una forma a un’altra, ma che non può essere creata né distrutta. Alcune forme di interconversione di energia sono illustrate nella Figura 2.17. La quantità di energia in forme diverse cambierà CAPITOLO 2 Chimica e bioenergetica della cellula 55 © 978-88-08-62126-9 mare di materia Figura 2.16 Una semplice analisi cellula CALORE disordine aumentato ordine aumentato come risultato delle reazioni chimiche all’interno della cellula, ma la prima legge ci dice che la quantità totale di energia deve sempre essere la stessa. Per esempio, una cellula animale assume cibo e converte una parte dell’energia presente nei legami chimici fra gli atomi di queste molecole di cibo (energia di legami chimici) nei movimenti termici casuali di molecole (energia di calore). il mattone che cade ha energia cinetica il mattone sollevato ha un’energia potenziale dovuta alla forza di gravità 1 termodinamica di una cellula vivente. Nel disegno schematico a sinistra le molecole della cellula e del resto dell’universo (il mare di materia) sono rappresentate in uno stato relativamente disordinato. Nel disegno schematico a destra la cellula ha assunto energia da molecole di cibo e ha rilasciato calore da una reazione che ordina le molecole che la cellula contiene. Il calore rilasciato aumenta il disordine nell’ambiente che circonda la cellula (rappresentato dalle frecce spezzate e dalle molecole distorte, che indicano l’aumento dei movimenti molecolari provocati dal calore). Come risultato, la seconda legge della termodinamica – che dice che la quantità di disordine nell’universo deve sempre crescere – è soddisfatta mentre la cellula cresce e si divide. Per una discussione dettagliata vedi Quadro 2.7 (pp. 106-107). viene rilasciato calore quando il mattone colpisce il pavimento energia potenziale dovuta alla posizione energia cinetica energia di calore + due molecole di idrogeno gassoso 2 molecola di ossigeno gassoso vibrazioni e rotazioni rapide di due molecole d’acqua appena formate rapidi movimenti molecolari in H2O energia di legame chimico in H2 e O2 batteria – calore disperso nell’ambiente energia di calore motore del ventilatore – + + cavi ventilatore 3 energia di legame chimico luce solare 4 energia elettromagnetica (luce) energia elettrica molecola di clorofilla energia cinetica molecola di clorofilla in uno stato eccitato elettroni ad alta energia fotosintesi energia di legame chimico Figura 2.17 Alcune interconversioni tra forme diverse di energia. Tutte le forme di energia sono, in linea di principio, interconvertibili. In tutti questi processi la quantità totale di energia è conservata; così, per esempio, dall’altezza e dal peso del mattone in (1) possiamo prevedere esattamente quanto calore sarà rilasciato quando colpisce il pavimento. In (2) si noti che la grande quantità di energia chimica di legame rilasciata quando si forma acqua viene inizialmente convertita in movimenti termici molto rapidi nelle due nuove molecole d’acqua; ma collisioni con altre molecole diffondono quasi istantaneamente questa energia cinetica in modo uniforme nell’ambiente circostante (trasferimento di calore), rendendo le nuove molecole indistinguibili da tutto il resto. CAPITOLO 2 Chimica e bioenergetica della cellula 56 © 978-88-08-62126-9 La cellula non può derivare alcun beneficio dall’energia di calore che rilascia, a meno che le reazioni che generano calore all’interno della cellula non siano direttamente collegate ai processi che generano ordine molecolare. È lo stretto accoppiamento della produzione di calore a un aumento dell’ordine che distingue il metabolismo di una cellula dallo spreco di combustibile in un fuoco. Più avanti in questo capitolo illustreremo il modo in cui avviene questo accoppiamento. Per il momento è sufficiente riconoscere che un collegamento diretto tra la “combustione” di molecole di cibo e la generazione di ordine biologico è necessario alle cellule per creare e mantenere un’isola di ordine in un universo che tende verso il caos. ■ Le cellule ottengono energia dall’ossidazione di molecole organiche Figura 2.18 Fotosintesi e respirazione come due processi complementari nel mondo vivente. La fotosintesi usa l’energia elettromagnetica della luce solare per produrre energia di legame chimico negli zuccheri e altre molecole organiche. Le piante, le alghe e i cianobatteri ottengono gli atomi di carbonio di cui hanno bisogno per questo scopo dalla CO2 atmosferica e dall’idrogeno dell’acqua, liberando O2 gassoso come scarto. Le molecole organiche prodotte dalla fotosintesi a loro volta servono come cibo per altri organismi. Molti di questi organismi effettuano la respirazione aerobica, un processo che usa O2 per formare CO2 dagli stessi atomi di carbonio che sono stati assunti come CO2 e convertiti in zuccheri dalla fotosintesi. Nel processo, gli organismi che respirano ottengono l’energia di legame chimico di cui hanno bisogno per sopravvivere. Si pensa che le prime cellule sulla Terra non fossero capaci né di fotosintesi né di respirazione (vedi Capitolo 14). Tuttavia, la fotosintesi deve avere preceduto la respirazione sulla Terra poiché ci sono prove molto forti che siano stati necessari molti miliardi di anni di fotosintesi prima che venisse rilasciato O2 in quantità sufficiente a creare un’atmosfera ricca di questo gas. (L’atmosfera della Terra oggi contiene il 20% di O2.) Tutte le cellule animali e vegetali sono alimentate da energia conservata in legami chimici di molecole organiche, sia che si tratti di zuccheri che un vegetale ha fotosintetizzato come cibo per se stesso o che siano la miscela di molecole piccole e grandi che un animale ha mangiato. Per usare questa energia per vivere, crescere e riprodursi gli organismi devono estrarla in una forma utilizzabile. Sia nei vegetali che negli animali l’energia viene ricavata dalle molecole di cibo tramite un processo di ossidazione graduale, o combustione controllata. L’atmosfera terrestre contiene una grande quantità di ossigeno, e in presenza di ossigeno la forma energeticamente più stabile del carbonio è CO2 e quella dell’idrogeno è H2O. Una cellula è perciò capace di ottenere energia da zuccheri e altre molecole organiche permettendo ai loro atomi di carbonio e di idrogeno di combinarsi con ossigeno a produrre rispettivamente CO2 e H2O: un processo chiamato respirazione aerobica. La fotosintesi (discussa in dettaglio nel Capitolo 14) e la respirazione sono processi complementari (Figura 2.18). Ciò significa che le transazioni fra vegetali e animali non sono tutte unidirezionali.Vegetali, animali e microrganismi hanno convissuto su questo pianeta per così tanto tempo che molti di essi sono diventati una parte essenziale del comune ambiente. L’ossigeno rilasciato dalla fotosintesi è consumato nella combustione di molecole organiche da quasi tutti gli organismi. Una parte della CO2 che viene fissata oggi in molecole organiche dalla fotosintesi in una foglia verde è stata rilasciata ieri nell’atmosfera dalla respirazione di un animale, o da quella di un fungo o di un batterio che decompone materia organica morta.Vediamo perciò che l’utilizzo del carbonio dà vita a un enorme ciclo che coinvolge la biosfera (tutti gli organismi viventi sulla Terra) nel suo insieme (Figura 2.19). In modo simile gli atomi di azoto, fosforo e zolfo si spostano fra il mondo vivente e quello non vivente in cicli che coinvolgono vegetali, animali, funghi e batteri. ■ Ossidazione e riduzione comportano trasferimenti di elettroni La cellula non ossida le molecole organiche in un solo passaggio, come avviene quando si brucia materiale organico in un fuoco.Tramite l’uso di cata- FOTOSINTESI CO2 + H2O O2 H2O RESPIRAZIONE CELLULARE O2 + ZUCCHERI ZUCCHERI+ O2 CO2 VEGETALI, ALGHE, ALCUNI BATTERI ENERGIA DELLA LUCE SOLARE CO2 ZUCCHERI E ALTRE MOLECOLE ORGANICHE H2O + CO2 O2 MAGGIOR PARTE DEGLI ORGANISMI VIVENTI ENERGIA DI LEGAME CHIMICO UTILE H2O CAPITOLO 2 Chimica e bioenergetica della cellula 57 © 978-88-08-62126-9 Figura 2.19 Il ciclo del carbonio. CO2 IN ATMOSFERA E ACQUA RESPIRAZIONE Singoli atomi di carbonio sono incorporati in molecole organiche del mondo vivente dall’attività fotosintetica di batteri, alghe e piante. Essi passano ad animali, microrganismi e nel materiale organico nel terreno e negli oceani in vie cicliche. La CO2 viene restituita nell’atmosfera quando molecole organiche sono ossidate dalle cellule o bruciate dagli esseri umani come combustibili. FOTOSINTESI VEGETALI, BATTERI ALGHE ANIMALI CATENA ALIMENTARE HUMUS E MATERIA ORGANICA DISSOLTA SEDIMENTI E COMBUSTIBILI FOSSILI lizzatori enzimatici, nel processo metabolico le molecole subiscono numerose reazioni che soltanto raramente comportano l’aggiunta diretta di ossigeno. Prima di considerare alcune di queste reazioni e il loro scopo, dobbiamo vedere che cosa si intende per processo di ossidazione. Ossidazione, nel senso usato sopra, non significa soltanto l’aggiunta di atomi di ossigeno, ma si applica più generalmente a qualunque reazione in cui elettroni sono trasferiti da un atomo a un altro. Ossidazione in questo senso si riferisce alla rimozione di elettroni, e riduzione – l’opposto dell’ossidazione – significa aggiunta di elettroni. Così Fe2+ è ossidato se perde un elettrone per diventare Fe3+ e un atomo di cloro è ridotto se guadagna un elettrone per diventare Cl–. Poiché in una reazione chimica il numero di elettroni è conservato (nessuna perdita o guadagno), ossidazione e riduzione avvengono sempre simultaneamente: se una molecola guadagna un elettrone in una reazione (riduzione), una seconda molecola perde un elettrone (ossidazione). Quando una molecola di zucchero è ossidata a CO2 e H2O, per esempio, le molecole di O2 coinvolte nella formazione di H2O guadagnano elettroni e si dice che sono state ridotte. I termini “ossidazione” e “riduzione” si applicano anche quando c’è soltanto uno spostamento parziale di elettroni fra atomi uniti da un legame covalente (Figura 2.20). Quando un atomo di carbonio si lega covalentemente a un atomo con una forte affinità per gli elettroni, come ossigeno, cloro o zolfo, per esempio, cede più della sua giusta quota di elettroni e forma un lega- Figura 2.20 Ossidazione e riduzione. (A) Quando due atomi formano un legame covalente polare, l’atomo che alla fine ha una quota maggiore di elettroni si dice ridotto, mentre l’altro atomo ha una quota minore di elettroni e si dice ossidato. L’atomo ridotto ha acquisito una carica negativa parziale (d–) perché la carica positiva sul nucleo atomico è adesso più che compensata dalla carica totale degli elettroni che lo circondano e, viceversa, l’atomo ossidato ha acquisito una carica positiva parziale (d+). (B) Il singolo atomo di carbonio del metano può essere convertito in quello di anidride carbonica in seguito alla sostituzione successiva dei suoi atomi di idrogeno legati covalentemente con atomi di ossigeno. In ciascun passaggio elettroni sono rimossi dal carbonio (come indicato dall’ombreggiatura blu) e l’atomo di carbonio diventa progressivamente più ossidato. Ciascuno di questi passaggi è energeticamente favorevole nelle condizioni presenti all’interno di una cellula. e + + e _ e ATOMO 1 (A) _ e + _ e ATOMO 2 carica positiva parziale (indicata con δ+) ossidata H O I H A e O + N C D OH U Z formaldeide H C O I O H acido formico N C O E C O H HO E (B) I H D I MOLECOLA R H metanolo S _ carica positiva parziale (indicata con δ–) ridotta H H Z + _ e C S O _ _ FORMAZIONE DI UN LEGAME COVALENTE POLARE H metano anidride carbonica CAPITOLO 2 Chimica e bioenergetica della cellula 58 © 978-88-08-62126-9 me covalente polare: la carica positiva del nucleo di carbonio è ora un po’ più grande della carica negativa dei suoi elettroni e l’atomo acquisisce quindi una parziale carica positiva e si dice che è ossidato.Viceversa, un atomo di carbonio in un legame C–H ha leggermente più della sua quota di elettroni e si dice quindi che è ridotto. Quando una molecola in una cellula assume un elettrone (e–), spesso assume contemporaneamente un protone (H+) (i protoni sono liberamente disponibili nell’acqua). L’effetto netto in questo caso è l’aggiunta di un atomo di idrogeno alla molecola A + e– + H+ n AH Anche se sono coinvolti un protone e un elettrone (invece di un elettrone soltanto), queste reazioni di idrogenazione sono riduzioni, e l’inverso, la reazione di deidrogenazione, è un’ossidazione. È particolarmente facile capire se una molecola organica viene ossidata o ridotta: si ha una riduzione se il numero di legami C–H aumenta, mentre si ha un’ossidazione se il numero di legami C–H diminuisce (vedi Figura 2.20B). Le cellule usano enzimi per catalizzare l’ossidazione di molecole organiche in piccoli passaggi, in una sequenza di reazioni che permettono di raccogliere energia utile. Ora dobbiamo spiegare come funzionano gli enzimi e alcune delle restrizioni a cui sono soggetti. ■ Gli enzimi abbassano le barriere che bloccano le reazioni chimiche Consideriamo la reazione carta + O2 n fumo + cenere + calore + CO2 + H2O La carta brucia facilmente, rilasciando nell’atmosfera energia come calore e acqua e anidride carbonica come gas. Questa reazione è irreversibile in quanto il fumo e la cenere non recuperano spontaneamente queste entità dall’atmosfera riscaldata e non si ricostituiscono in carta. Quando la carta brucia, la sua energia chimica viene dissipata come calore, non persa dall’universo, poiché l’energia non può mai essere creata né distrutta, ma viene dispersa in modo irrecuperabile nei movimenti termici caotici casuali delle molecole. Allo stesso tempo gli atomi e le molecole della carta vengono dispersi disordinatamente. Nel linguaggio della termodinamica, c’è stata una perdita di energia libera, cioè di energia che può essere imbrigliata per eseguire un lavoro o per spingere reazioni chimiche. Questa perdita riflette una perdita di ordine nel modo in cui l’energia e le molecole erano conservate nella carta. Discuteremo l’energia libera in maggiore dettaglio fra breve, ma il principio generale è abbastanza chiaro intuitivamente: le reazioni chimiche procedono spontaneamente soltanto nella direzione che porta a una perdita di energia libera; in altre parole, la direzione spontanea per qualunque reazione è la direzione che va “in discesa”. Una reazione “in discesa” in questo senso si dice spesso energeticamente favorevole. Sebbene la forma energeticamente più favorevole del carbonio in condizioni ordinarie sia CO2 e quella dell’idrogeno sia H2O, un organismo vivente non scompare in uno sbuffo di fumo e il libro nelle vostre mani non prende fuoco. Ciò perché le molecole dell’organismo vivente e del libro sono in uno stato relativamente stabile e non possono passare a uno stato a minore energia senza un apporto di energia: in altre parole, una molecola richiede energia di attivazione – una spinta per passare una barriera di energia – prima di poter subire una reazione chimica che la lascia in uno stato più stabile (Figura 2.21). Nel caso di un libro che brucia, l’energia di attivazione è fornita dal calore di un fiammifero acceso. Per le molecole nella soluzione acquosa di una cellula, la spinta è data da una collisione casuale insolitamente energetica con molecole circostanti, collisioni che diventano più violente se si alza la temperatura. La chimica di una cellula vivente è strettamente controllata poiché la spinta per superare la barriera di energia è molto facilitata da una classe specializzata di proteine, gli enzimi. Ciascun enzima si lega con forza a una o due molecole, chiamate substrati, e le tiene unite in modo da ridurre molto l’e- CAPITOLO 2 Chimica e bioenergetica della cellula 59 a energia di attivazione per reazione Y X Y b reagente energia totale energia totale © 978-88-08-62126-9 d Y l’enzima abbassa l’energia di attivazione per la reazione catalizzata Y X b reagente X X c (A) c prodotto via di reazione non catalizzata (B) prodotto via di reazione catalizzata da un enzima nergia di attivazione di una particolare reazione chimica che i substrati legati possono subire. Una sostanza che può abbassare l’energia di attivazione di una reazione si chiama catalizzatore; i catalizzatori aumentano la velocità delle reazioni chimiche perché permettono una quota molto più alta di collisioni casuali con molecole circostanti per spingere i substrati oltre la barriera di energia, come illustrato nella Figura 2.22. Gli enzimi sono fra i catalizzatori noti più efficienti, alcuni sono capaci di accelerare le reazioni di un fattore fino a 1014 e oltre. Gli enzimi perciò permettono reazioni che altrimenti non sarebbero potute avvenire rapidamente a temperature normali. ■ Gli enzimi possono dirigere le molecole di substrato lungo vie specifiche di reazione Un enzima non può cambiare il punto di equilibrio di una reazione. La ragione è semplice: quando un enzima (o qualunque catalizzatore) abbassa l’energia di attivazione per la reazione X n Y, necessariamente abbassa anche l’energia di attivazione della reazione Y n X della stessa quantità (vedi Figura 2.21). Le reazioni in avanti e indietro saranno quindi accelerate da un enzi- numero di molecole energia necessaria per far avvenire la reazione chimica catalizzata dall’enzima molecole con energia media energia necessaria per far avvenire una reazione chimica non catalizzata energia per molecola Figura 2.22 L’abbassamento dell’energia di attivazione aumenta molto la probabilità di una reazione. Una popolazione di molecole identiche di substrato avrà in ciascun istante una quantità di energia che è distribuita come mostrato nel grafico. Le energie variabili derivano da collisioni con molecole circostanti, che fanno oscillare, vibrare e girare le molecole di substrato. Affinché una molecola subisca una reazione chimica l’energia della molecola deve superare la barriera di energia di attivazione per quella reazione (linee tratteggiate); per la maggior parte delle reazioni biologiche ciò non avviene quasi mai senza catalisi enzimatica. Anche con la catalisi enzimatica le molecole di substrato devono subire una collisione particolarmente energetica per reagire, come indicato qui (area ombreggiata in rosso). Anche un aumento di temperatura può far crescere il numero di molecole con energia sufficiente a superare l’energia di attivazione necessaria per una reazione; tuttavia, a differenza della catalisi enzimatica, questo effetto non è selettivo e accelera tutte le reazioni (Filmato 2.2 ). Figura 2.21 Il principio importante dell’energia di attivazione. (A) Il composto Y (un reagente) è in uno stato relativamente stabile ed è necessaria energia per convertirlo nel composto X (un prodotto), anche se X è a un livello globale di energia più basso di Y. Questa conversione non avverrà, perciò, a meno che il composto Y non possa acquisire abbastanza energia di attivazione (energia a meno energia b) dall’ambiente per sostenere la reazione che lo converte nel composto X. Questa energia può essere fornita da una collisione insolitamente energetica con altre molecole. Per la reazione inversa, X n Y, l’energia di attivazione sarà molto più grande (energia a meno energia c); questa reazione avverrà quindi molto più raramente. Le energie di attivazione sono sempre positive; notate però che il cambiamento totale di energia per la reazione energeticamente favorevole Yn X è energia c meno energia b, un numero negativo. (B) Le barriere di energia di reazioni specifiche possono essere abbassate da catalizzatori, come indicato dalla linea marcata d. Gli enzimi sono catalizzatori particolarmente efficaci perché riducono di molto l’energia di attivazione delle reazioni che catalizzano. CAPITOLO 2 Chimica e bioenergetica della cellula 60 © 978-88-08-62126-9 Figura 2.23 Gli enzimi non energia possono cambiare il punto di equilibrio delle reazioni. Gli enzimi, come tutti i catalizzatori, aumentano la velocità in avanti e indietro di una reazione chimica dello stesso fattore. Quindi, per entrambe le reazioni, catalizzata e non catalizzata, mostrate qui, il numero di molecole che va incontro alla transizione Y n X è uguale al numero di molecole che va incontro alla reazione X n Y quando il rapporto di molecole Y e di molecole X è 3 a 1. In altre parole, le due reazioni raggiungono l’equilibrio esattamente allo stesso punto. Figura 2.24 Indirizzamento di molecole di substrato attraverso una via di reazione specifica per mezzo della catalisi enzimatica. Una molecola substrato in una cellula (palla verde) è convertita in una molecola diversa (palla blu) per mezzo di una serie di reazioni catalizzate da enzimi. Come indicato (rettangoli gialli), diverse reazioni sono energeticamente favorevoli a ogni passaggio, ma solo una è catalizzata da ogni specifico enzima. Serie di enzimi determinano in tal modo l’esatta via di reazione che è seguita da ogni molecola all’interno della cellula. X (A) Y X REAZIONE NON CATALIZZATA ALL’EQUILIBRIO (B) Y REAZIONE CATALIZZATA DA ENZIMA ALL’EQUILIBRIO ma nella stessa misura e il punto di equilibrio della reazione rimarrà immutato (Figura 2.23). Perciò non importa quanto un enzima accelera una reazione, non potrà comunque cambiare la sua direzione. Nonostante le limitazioni appena descritte, gli enzimi guidano tutte le reazioni che avvengono nelle cellule attraverso vie di reazione specifiche. Questo perché gli enzimi sono sia altamente selettivi sia molto precisi, catalizzando solitamente solo una particolare reazione. In altre parole, abbassano selettivamente l’energia di attivazione soltanto di una delle parecchie reazioni chimiche che il substrato legato potrebbe subire. In questo modo gli enzimi dirigono ciascuna delle molte molecole diverse presenti in una cellula lungo vie specifiche di reazione (Figura 2.24). Il successo degli organismi viventi è attribuibile alla capacità di una cellula di produrre enzimi di molti tipi, ciascuno con proprietà precisamente specificate. Ogni enzima ha una forma unica che contiene un sito attivo, una tasca o fessura nell’enzima in cui si adattano soltanto substrati particolari (Figura 2.25). Come tutti gli altri catalizzatori, le molecole enzimatiche rimangono immutate dopo aver partecipato a una reazione e perciò possono svolgere la loro funzione moltissime volte. Nel Capitolo 3 discuteremo ulteriormente il modo in cui funzionano gli enzimi. ■ Il modo in cui gli enzimi trovano i loro substrati: l’enorme rapidità dei movimenti molecolari Un tipico enzima catalizza spesso la reazione di migliaia di molecole di substrato al secondo. Ciò significa che deve essere capace di legare una nuova molecola di substrato in una frazione di millisecondo. Ma sia enzimi che substrati sono presenti in numeri relativamente piccoli in una cellula. In che modo si trovano così rapidamente? Un legame rapido è possibile perché i movimenti provocati dall’energia di calore sono enormemente veloci a livello molecolare. Questi movimenti molecolari possono essere classificati in tre categorie: (1) il movimento di una molecola da un posto a un altro (movimento traslazionale); (2) il rapido movimento avanti e indietro di atomi legati covalentemente l’uno rispetto all’altro (vibrazioni); (3) le rotazioni.Tutti questi movimenti sono importanti per avvicinare le superfici di molecole interagenti. La frequenza dei movimenti molecolari può essere misurata mediante varie tecniche spettroscopiche. Una grossa proteina globulare rotola costantemente, ruotando intorno al suo asse circa un milione di volte al secondo. Le mole- Figura 2.25 Il modo in cui funzionano gli enzimi. Ciascun enzima ha un sito attivo a cui si attaccano una o più molecole di substrato, formando un complesso enzima-substrato. Una reazione avviene sul sito attivo, producendo un complesso enzima-prodotto. Il prodotto viene quindi rilasciato, permettendo all’enzima di legare ulteriori molecole di substrato. enzima sito attivo molecola A (substrato) enzima CATALISI complesso enzima-substrato complesso enzima-prodotto molecola B (prodotto) CAPITOLO 2 Chimica e bioenergetica della cellula 61 © 978-88-08-62126-9 cole sono anche in continuo movimento di traslazione, che fa loro esplorare, vagando, lo spazio interno della cellula in modo molto efficiente, un processo chiamato diffusione. In questo modo ogni molecola in una cellula collide con un numero enorme di altre molecole ogni secondo. Mentre le molecole in un liquido collidono e rimbalzano, una singola molecola si muove prima in una direzione e poi in un’altra, seguendo un percorso che costituisce un cammino casuale (Figura 2.26). In questo cammino la distanza media che ciascuna molecola percorre in linea d’aria dal punto di partenza è proporzionale alla radice quadrata del tempo: cioè, se ci vuole in media 1 secondo perché la molecola percorra 1 mm, ci vogliono 4 secondi per percorrere 2 mm, 100 secondi per percorrere 10 mm e così via. L’interno di una cellula è molto affollato (Figura 2.27). Nonostante ciò, esperimenti in cui coloranti fluorescenti e altre molecole marcate vengono iniettati nelle cellule mostrano che piccole molecole organiche diffondono attraverso il gel acquoso del citosol quasi alla stessa velocità a cui si muovono nell’acqua. Una piccola molecola organica, per esempio, richiede soltanto un quinto di secondo in media per diffondere a una distanza di 10 mm. La diffusione è perciò un modo efficiente per le piccole molecole di muoversi per le distanze limitate all’interno di una cellula (una tipica cellula animale ha un diametro di 15 mm). Poiché nelle cellule gli enzimi si muovono più lentamente dei substrati, possiamo considerarli come se fossero fermi. La frequenza di incontro di ciascuna molecola enzimatica con il suo substrato dipenderà dalla concentrazione delle molecole di substrato. Per esempio, alcuni substrati abbondanti sono presenti a una concentrazione di 0,5 mM. Poiché l’acqua pura è 55,5 M, nella cellula c’è soltanto una molecola di questo substrato per ogni 105 molecole d’acqua. Nonostante ciò, il sito attivo di un enzima che lega questo substrato sarà bombardato da circa 500 000 collisioni casuali con una molecola di substrato al secondo. (Per una concentrazione di substrato dieci volte più bassa il numero di collisioni scende a 50 000 al secondo e così via.) Un incontro casuale fra la superficie di un enzima e la superficie corrispondente del suo substrato spesso porta immediatamente alla formazione di un complesso enzima-substrato. Una reazione in cui si rompe o si forma un legame covalente può adesso avvenire con estrema rapidità. Una volta che ci si rende conto di quanto rapidamente le molecole si muovono e reagiscono, le velocità osservate di catalisi enzimatica non sembrano così stupefacenti. Due molecole che sono tenute unite da legami non covalenti possono anche dissociarsi. I legami deboli multipli che formano fra loro persisteranno fino a che i movimenti termici casuali non faranno dissociare di nuovo le molecole. In generale, più forte è il legame fra enzima e substrato, più lenta è la loro velocità di dissociazione. Tuttavia, quando due molecole che collidono hanno superfici che non si adattano bene, si formano pochi legami non covalenti e la loro energia totale è trascurabile in confronto a quella dei movimenti termici. In questo caso le due molecole si dissociano alla stessa velocità alla quale si uniscono, impedendo che si formino associazioni non corrette e non volute fra molecole che non si adattano, come quella fra un enzima e il substrato sbagliato. ■ Il cambiamento in energia libera di una reazione, DG, determina se essa pu˜ avvenire spontaneamente Sebbene gli enzimi aumentino la velocità delle reazioni non possono far sì che avvengano reazioni energeticamente sfavorevoli. Ricorrendo a un’analogia con l’acqua, gli enzimi di per sé non possono spingere l’acqua in salita. Le cellule, però, devono fare proprio questo per crescere e dividersi: devono costruire molecole altamente ordinate e ricche di energia da molecole piccole e semplici.Vedremo che ciò avviene tramite enzimi che accoppiano direttamente reazioni energeticamente favorevoli, che rilasciano energia e producono calore, a reazioni energeticamente sfavorevoli, che producono ordine biologico. Che cosa intende un biologo cellulare con il termine “energeticamente favorevole” e come si può quantificare? In base alla seconda legge della termodinamica l’universo tende verso il massimo disordine (maggiore entropia o distanza finale percorsa Figura 2.26 Un cammino casuale. Le molecole in soluzione si muovono in modo casuale per i continui colpi che ricevono nelle collisioni con altre molecole. Questo movimento permette alle piccole molecole di diffondere rapidamente da una parte all’altra della cellula, come descritto nel testo (Filmato 2.3 ). 100 nm Figura 2.27 La struttura del citoplasma. Il disegno è approssimativamente in scala e sottolinea l’affollamento nel citoplasma. Sono mostrate soltanto le macromolecole: gli RNA sono raffigurati in azzurro, i ribosomi in verde e le proteine in rosso. Gli enzimi e le altre macromolecole diffondono in modo relativamente lento nel citoplasma, in parte perché interagiscono con molte altre macromolecole; le piccole molecole, invece, diffondono in modo quasi altrettanto rapido che nell’acqua (Filmato 2.4 ). (Adattata da D.S. Goodsell, Trends Biochem. Sci. 16:203-206, 1991. Con il permesso di Elsevier.) CAPITOLO 2 Chimica e bioenergetica della cellula 62 © 978-88-08-62126-9 REAZIONE ENERGETICAMENTE FAVOREVOLE L’energia libera di Y è maggiore dell’energia libera di X. Perciò ∆G < 0 e il disordine dell’universo aumenta durante la reazione Y X. Y X questa reazione può avvenire spontaneamente REAZIONE ENERGETICAMENTE SFAVOREVOLE Y X Se la reazione X Y avvenisse, ∆G sarebbe > 0 e l’universo sarebbe più ordinato. questa reazione può avvenire soltanto se accoppiata a una seconda reazione energeticamente favorevole Figura 2.28 La distinzione fra reazioni energeticamente favorevoli e reazioni energeticamente sfavorevoli. più grande probabilità). Perciò una reazione chimica può procedere spontaneamente soltanto se porta a un aumento netto di disordine nell’universo (vedi Figura 2.16). Questo disordine dell’universo può essere espresso nel modo più utile in termini di energia libera di un sistema, un concetto che abbiamo già affrontato in precedenza. L’energia libera, G, è un’espressione dell’energia disponibile a fare un lavoro, per esempio il lavoro di spinta di una reazione chimica. Il valore di G interessa soltanto quando un sistema subisce un cambiamento, indicato con DG (delta G). Il cambiamento in G è critico perché, come spiegato nel Quadro 2.7 (pp. 106-107), il DG è una misura diretta della quantità di disordine creato nell’universo quando avviene una reazione. Le reazioni energeticamente favorevoli, per definizione, sono quelle che fanno diminuire l’energia libera, o, in altre parole, hanno un DG negativo e creano disordine nell’universo (Figura 2.28). Un esempio di una reazione energeticamente favorevole su scala macroscopica è la “reazione” per cui una molla compressa si rilassa in uno stato disteso, rilasciando come calore nell’ambiente circostante la sua energia elastica immagazzinata; un esempio su scala microscopica è lo scioglimento di un sale in acqua. Al contrario, le reazioni energeticamente sfavorevoli, con un DG positivo – come quelle in cui due amminoacidi sono uniti insieme a formare un legame peptidico – di per sé creano ordine nell’universo. Perciò, queste reazioni possono avvenire soltanto se sono accoppiate a una seconda reazione con un DG negativo così grande che il DG dell’intero processo sia negativo (Figura 2.29). ■ La concentrazione dei reagenti influenza il cambiamento di energia libera e la direzione di una reazione C Y ∆G negativo ∆G positivo X D la reazione energeticamente sfavorevole X Y è spinta dalla reazione energeticamente favorevole C D, perché il cambiamento in energia libera per la coppia di reazioni è minore di zero Figura 2.29 Come l’accoppiamento di reazioni è usato per spingere reazioni energeticamente sfavorevoli. Come abbiamo appena descritto, una reazione YnX andrà nella direzione YnX quando il cambiamento associato di energia libera, DG, è negativo, proprio come una molla in tensione lasciata a se stessa si rilasserà e perderà la sua energia accumulata come calore disperso nell’ambiente. Per una reazione chimica, però, DG dipende non solo dall’energia conservata in ciascuna singola molecola, ma anche dalle concentrazioni delle molecole nella miscela di reazione. Ricordate che DG riflette il grado in cui una reazione crea uno stato più disordinato – in altre parole più probabile – dell’universo. Riprendendo l’analogia della moneta, è molto probabile che una moneta si sposti da testa a croce se una scatola che viene scossa contiene 90 teste e 10 croci, ma questo è un evento meno probabile se la scatola contiene 10 teste e 90 croci. La stessa cosa vale per una reazione chimica. Per una reazione reversibile Y n X, un grande eccesso di Y su X tenderà a spingere la reazione nella direzione Y n X; cioè, ci sarà una tendenza per più molecole a subire la transizione Y n X di quante sono le molecole che subiscono la transizione X n Y. Perciò il DG diventa più negativo per la transizione Y n X (e più positivo per la transizione X n Y) man mano che aumenta il rapporto di Y su X. Quanta sia la differenza di concentrazione necessaria per compensare una data diminuzione in energia chimica di legame (e il corrispondente rilascio di calore) non è intuitivamente ovvio. Alla fine del XIX secolo, la relazione fu determinata mediante un’analisi termodinamica, che rese possibile separare la componente dell’energia libera dipendente dalla concentrazione da quella indipendente dalla concentrazione, come vedremo dopo. ■ Il cambiamento di energia libera standard, DG°, rende possibile la comparazione delle proprietà energetiche di reazioni differenti Poiché il DG dipende dalla concentrazione delle molecole nella mistura di reazione in qualunque tempo dato, non è un valore particolarmente utile per comparare le energie relative di diversi tipi di reazioni. Per mettere le reazioni in una situazione comparabile abbiamo bisogno del cambiamento di energia libera standard di una reazione, DG°. Il DG° è il cambiamento di energia libera in una condizione standard, definita come quella CAPITOLO 2 Chimica e bioenergetica della cellula 63 © 978-88-08-62126-9 condizione in cui le concentrazioni di tutti i reagenti sono fissate allo stesso valore di 1 mole/litro. Definito in questo modo, il DG° dipende solamente dalle caratteristiche intrinseche delle molecole che partecipano alla reazione. Per la semplice reazione Y n X a 37 °C, DG° è correlato a DG come segue: DG = DG° + RTln [X] [Y] dove DG è in kilojoule per mole, [Y] e [X] indicano le concentrazioni di Y e di X in moli/litro, ln è il logaritmo naturale e RT è il prodotto della costante dei gas, R, e la temperatura assoluta, T. A 37 °C, RT = 2,58 J mole–1 (una mole sono 6 3 1023 molecole di sostanza). È stata raccolta una grande quantità di dati termodinamici che ha permesso di determinare il cambiamento di energia libera standard DG° per le reazioni metaboliche importanti di una cellula. Dati questi valori di DG°, combinati con altre informazioni circa le concentrazioni di metaboliti e le vie di reazione, è possibile prevedere quantitativamente il corso della maggior parte delle reazioni biologiche. ■ La costante di equilibrio e il DG° si ottengono facilmente lÕuno dallÕaltro L’analisi dell’equazione riportata sopra rivela che il DG è uguale al valore di DG° quando le concentrazioni molari di Y e di X sono uguali. Ma al procedere di ogni reazione favorevole la concentrazione del prodotto aumenta e la concentrazione del substrato diminuisce. Questo cambiamento delle concentrazioni relative farà diventare [X]/[Y] sempre più grande, rendendo il DG inizialmente favorevole sempre meno negativo (il logaritmo di un numero x è positivo per x > 1, negativo per x < 1 e zero per x = 1). Alla fine, quando DG = 0, si raggiungerà un equilibrio chimico, dove l’effetto di concentrazione è esattamente pari alla spinta data alla reazione da DG°, e il rapporto fra substrato e prodotto raggiunge, all’equilibrio chimico, un valore costante (Figura 2.30). Possiamo definire la costante di equilibrio K per la reazione Y n X come [X] K= [Y] dove [X] è la concentrazione del prodotto e [Y] è la concentrazione del reagente all’equilibrio. Ricordando che DG = DG° + RT ln [X]/[Y] e che DG = 0 all’equilibrio, noi vediamo che [X] 5 –RTln K DG° = –RT ln [Y] A 37 °C, dove RT = 2,58, l’equazione all’equilibrio è perciò: DG° = –2,58 ln K Convertendo questa equazione dal logaritmo naturale (ln) al più usato logaritmo in base 10 (log), otteniamo DG° = –5,94 log K Questa equazione rivela come il rapporto all’equilibrio di X e Y (espresso come costante di equilibrio, K) dipende dalle caratteristiche intrinseche delle molecole (come espresso nel valore di DG° in kilojoules per mole). Si noti che per ogni 5,94 kj/mole di differenza in energia libera a 37 °C, la costante di equilibrio cambia di un fattore 10 (Tabella 2.2). Perciò più energeticamente favorevole è una reazione più prodotto si accumulerà se la reazione procede all’equilibrio. Più in generale, per una reazione con reagenti e prodotti multipli come A + B n C + D, [C][D] K5 [A][B] Le concentrazioni dei due reagenti e dei due prodotti vengono moltiplicate perché la velocità della reazione in avanti dipende dalle collisioni di A CAPITOLO 2 Chimica e bioenergetica della cellula 64 © 978-88-08-62126-9 Figura 2.30 Equilibrio chimico. Quando una reazione raggiunge l’equilibrio, il flusso avanti e indietro delle molecole che reagiscono è uguale e opposto. PER LA REAZIONE ENERGETICAMENTE FAVOREVOLE Y → X Y X quando X e Y sono alla stessa concentrazione, [Y] = [X], la formazione di X è energeticamente favorita. In altre parole, il ΔG di Y → X è negativo e il ΔG di X → Y è positivo, ma a causa dei bombardamenti termici ci sarà sempre un po’ di X che si trasformerà in Y. PERCIÒ, PER OGNI SINGOLA MOLECOLA Y X X Y la conversione di Y in X avverrà frequentemente. La conversione di X in Y avverrà meno frequentemente rispetto alla transizione Y → X, perché richiede una collisione a più alta energia Perciò il rapporto tra le molecole X e Y aumenterà con il tempo TABELLA 2.2 Relazione fra il cambiamento di energia libera standard, ΔG°, e la costante di equilibrio Costante di equilibrio [X] =K [Y] Energia libera di X meno energia libera di Y [kJ/mole (kcal/mole)] 105 –29,7 (–7,1) 104 –23,8 (–5,7) 103 –17,8 (–4,3) 102 –11,9 (–2,8) 101 –5,9 (–1,4) 1 0 (0) 10–1 5,9 (1,4) 10–2 11,9 (2,8) 10–3 17,8 (4,3) 10–4 23,8 (5,7) 10–5 29,7 (7,1) I valori della costante di equilibrio sono stati calcolati per la semplice reazione chimica Y m n X usando l’equazione riportata nel testo. Il ∆G° riportato qui è in kilojoule per mole a 37 °C con kilocalorie per mole fra parentesi. Un kilojoule (kJ) corrisponde a 0,239 kilocalorie (kcal), (1 kcal = 4,184 kJ). Come spiegato nel testo, ∆G° rappresenta la differenza di energia libera in condizioni standard (dove tutti i componenti sono presenti a una concentrazione di 1,0 moli/ litro). Da questa tabella vediamo che se c’è un cambiamento favorevole di energia libera standard ∆G° di –17,8 kJ/mole (–4,3 kcal/ mole) per la transizione Y n X, ci saranno 1000 volte più molecole nello stato X che nello stato Y all’equilibrio (K = 1000). ALLA FINE ci sarà un largo eccesso di X rispetto a Y, suféciente a compensare la bassa velocità di X → Y, così che il numero di molecole di Y che saranno convertite in X in ogni secondo sarà esattamente uguale al numero di molecole X che saranno convertite in Y in ogni secondo. A questo punto la reazione avrà raggiunto l’equilibrio. Y X ALL’EQUILIBRIO non c’è un netto cambiamento nel rapporto tra Y e X e il ΔG per entrambe le reazioni in avanti e indietro sarà zero. e B e la velocità della reazione all’indietro dipende dalle collisioni di C e D. Perciò a 37 °C: [C][D] DG° = –5,94 log [A][B] dove DG° è espresso in kilojoules per mole e [A], [B], [C] e [D] indicano le concentrazioni dei reagenti e dei prodotti in moli/litro. ■ I cambiamenti di energia libera delle reazioni accoppiate sono additivi Abbiamo visto che le reazioni sfavorevoli possono essere accoppiate ad altre favorevoli per spingere quelle sfavorevoli in avanti (vedi Figura 2.29). In termini termodinamici questo è possibile perché il cambiamento di energia libera totale per una serie di reazioni accoppiate è la somma dei cambiamenti di energia libera in ciascuno dei passaggi che la compongono. Consideriamo, per esempio, due reazioni sequenziali Xn Y e YnZ in cui i valori di DG° sono rispettivamente +5 e –13 kcal/mole. Se queste due reazioni avvengono in sequenza, il DG° per la reazione accoppiata sarà –8 kcal/mole. Quindi la reazione non favorevole X n Y, che non avverrà spontaneamente, può essere spinta dalla reazione favorevole Y n Z, purché la seconda reazione segua la prima. Per esempio, diverse reazioni nella lunga via che converte gli zuccheri in CO2 e H2O hanno valori di DG° positivi ma nonostante ciò la via proce- CAPITOLO 2 Chimica e bioenergetica della cellula 65 © 978-88-08-62126-9 de perché il DG° totale delle serie di reazioni sequenziali ha un ampio valore negativo. Tuttavia formare una via sequenziale non è adeguato per molti scopi. Spesso la via desiderata è semplicemente X n Y, senza ulteriore conversione di Y in qualche altro prodotto. Fortunatamente, esistono altri modi generali di usare enzimi per accoppiare insieme reazioni. Il modo in cui questi agiscono è l’argomento che discuteremo adesso. ■ Le molecole trasportatrici attivate sono essenziali per la biosintesi L’energia rilasciata dall’ossidazione delle molecole di cibo deve essere conservata temporaneamente prima di essere incanalata nella costruzione di molte altre molecole necessarie alla cellula. Nella maggior parte dei casi, l’energia è conservata come energia di legame chimico in una piccola serie di “molecole trasportatrici” attivate, che contengono uno o più legami covalenti ricchi di energia. Queste molecole diffondono rapidamente nella cellula e portano così la loro energia di legame dai siti di generazione di energia ai siti in cui l’energia è usata per la biosintesi e per altre attività cellulari (Figura 2.31). I trasportatori attivati conservano energia in una forma facilmente intercambiabile, sia come gruppo chimico facilmente trasferibile che come elettroni ad alta energia, e possono svolgere un doppio ruolo come fonte di energia e di gruppi chimici nelle reazioni biosintetiche. Per ragioni storiche queste molecole sono talvolta chiamate anche coenzimi. Le molecole trasportatrici attivate più importanti sono ATP e due molecole che sono strettamente correlate fra loro, NADH e NADPH. Le cellule usano molecole trasportatrici attivate come moneta per pagare il prezzo di reazioni che altrimenti non avverrebbero. ■ La formazione di un trasportatore attivato è accoppiata a una reazione energeticamente favorevole I meccanismi di accoppiamento richiedono enzimi e sono fondamentali per tutti gli scambi di energia della cellula. La natura di una reazione accoppiata è illustrata da un’analogia meccanica nella Figura 2.32, in cui una reazione chimica energeticamente favorevole è rappresentata da rocce che cadono da una scarpata. L’energia delle rocce che cadono normalmente andrebbe completamente sprecata sotto forma di calore generato dalla frizione quando la roccia colpisce il terreno (vedi il disegno del mattone che cade nella Figura 2.17). Con una progettazione accurata, però, parte di questa energia potrebbe esse- ENERGIA ENERGIA molecola di cibo molecola necessaria alla cellula reazione energeticamente favorevole reazione energeticamente sfavorevole ENERGIA molecola di cibo ossidata CATABOLISMO molecola trasportatrice attivata molecola disponibile nella cellula ANABOLISMO Figura 2.31 Trasferimento di energia e ruolo dei trasportatori attivati nel metabolismo. Servendo da navette che portano energia, le molecole trasportatrici attivate svolgono la loro funzione come intermediari che collegano la demolizione di molecole di cibo e il rilascio di energia (catabolismo) alle biosintesi che richiedono energia di piccole e grosse molecole organiche (anabolismo). CAPITOLO 2 Chimica e bioenergetica della cellula 66 © 978-88-08-62126-9 (A) (B) (C) macchine idrauliche calore L’energia cinetica delle rocce che cadono è trasformata soltanto in energia di calore. Figura 2.32 Un modello meccanico che illustra il principio delle reazioni chimiche accoppiate. La reazione spontanea mostrata in (A) è analoga all’ossidazione diretta di glucosio a CO2 e H2O, che produce soltanto calore. In (B) la stessa reazione è accoppiata a una seconda reazione; questa seconda reazione è analoga alla sintesi di molecole trasportatrici attivate. L’energia prodotta in (B) è in una forma più utile che in (A) e può essere usata per spingere varie reazioni altrimenti energeticamente sfavorevoli (C). LAVORO UTILE calore Parte dell’energia cinetica è usata per sollevare un secchio d’acqua e una quantità corrispondentemente minore è trasformata in calore. L’energia cinetica potenziale conservata nel secchio d’acqua sollevato può essere usata per spingere macchine idrauliche che svolgono vari compiti utili. re invece usata per far girare una ruota a pale che solleva un secchio d’acqua (Figura 2.32B). Poiché le rocce possono adesso raggiungere il suolo soltanto dopo aver mosso la ruota a pale, diciamo che la reazione energeticamente favorevole della caduta delle rocce è stata direttamente accoppiata alla reazione energeticamente sfavorevole del sollevamento del secchio d’acqua. Si noti che poiché parte dell’energia è usata per fare un lavoro nella Figura 2.32B, le rocce colpiscono il terreno con velocità minore che nella Figura 2.32A e proporzionalmente meno energia è dissipata come calore. Nelle cellule avvengono processi simili, in cui enzimi svolgono il ruolo della ruota a pale della nostra analogia. Mediante meccanismi che saranno discussi più avanti in questo capitolo, essi accoppiano una reazione energeticamente favorevole, come l’ossidazione del cibo, a una reazione energeticamente sfavorevole, come la generazione di una molecola trasportatrice attivata. Come risultato, la quantità di calore rilasciato dalla reazione di ossidazione viene ridotta esattamente della quantità di energia che viene conservata nei legami covalenti ricchi di energia della molecola trasportatrice attivata. La molecola trasportatrice attivata a sua volta raccoglie un “pacchetto” di energia di dimensioni sufficienti ad alimentare una reazione chimica altrove nella cellula. ■ L’ATP è la molecola trasportatrice attivata più usata Il trasportatore attivato più importante e versatile nelle cellule è l’ATP (adenosina trifosfato). Proprio come l’energia conservata nel secchio d’acqua sollevato nella Figura 2.32B può spingere una grande varietà di macchine idrauliche, l’ATP è un deposito utile e versatile, o moneta, di energia usata per spingere varie reazioni chimiche nelle cellule. L’ATP è sintetizzato in una reazione di fosforilazione energeticamente sfavorevole in cui un gruppo fosfato viene aggiunto ad ADP (adenosina difosfato). Quando necessario, l’ATP cede il suo pacchetto di energia tramite la sua idrolisi energeticamente favorevole ad ADP e fosfato inorganico (Figura 2.33). L’ADP rigenerato è quindi disponibile per essere usato in un altro ciclo della reazione di fosforilazione che forma ATP. La reazione energeticamente favorevole dell’idrolisi di ATP è accoppiata a molte reazioni altrimenti non favorevoli tramite le quali sono sintetizzate altre molecole. Molte di esse comportano il trasferimento del fosfato terminale dell’ATP a un’altra molecola, come illustrato dalla reazione di fosforilazione nella Figura 2.34. L’ATP è il trasportatore attivato più abbondante nelle cellule. Per esempio, è usato per fornire energia a molte delle pompe che trasportano sostanze dentro e fuori la cellula (vedi Capitolo 11). L’ATP alimenta anche i moto- CAPITOLO 2 Chimica e bioenergetica della cellula 67 © 978-88-08-62126-9 Figura 2.33 L’idrolisi di ATP ad legami fosfoanidride O _ O _ O _ O _ ADENINA P O P O P O CH2 O O O ATP RIBOSIO H2O O H+ + _ _ O O P OH _ + O O _ O _ ADENINA P O P O CH2 O O ADP fosfato inorganico (Pi) RIBOSIO ADP e fosfato inorganico. I due fosfati più esterni dell’ATP sono legati al resto della molecola da legami fosfoanidride ad alta energia e sono prontamente trasferiti. Come indicato, si può aggiungere acqua ad ATP per formare ADP e fosfato inorganico (Pi). Questa idrolisi del fosfato terminale dell’ATP produce da 46 a 54 kJ/mole di energia utilizzabile, a seconda delle condizioni intracellulari. Il ∆G largamente negativo di questa reazione deriva da numerosi fattori: il rilascio del gruppo fosfato terminale elimina una repulsione sfavorevole fra cariche negative adiacenti, e lo ione fosfato inorganico (Pi) rilasciato è stabilizzato per risonanza e dalla formazione favorevole di legami idrogeno con l’acqua. ri molecolari che permettono alle cellule muscolari di contrarsi e alle cellule nervose di trasportare materiali da un’estremità all’altra dei loro lunghi assoni (vedi Capitolo 16). ■ L’energia conservata nell’ATP è spesso imbrigliata per unire due molecole Abbiamo discusso in precedenza un modo in cui una reazione energeticamente favorevole può essere accoppiata a una reazione energeticamente sfavorevole, X n Y, in modo da permetterle di avvenire. In quello schema un secondo enzima catalizza la reazione energeticamente favorevole Y n Z convertendo tutte le molecole di X in molecole di Y nel processo. Ma quando il prodotto richiesto è Y e non Z, questo meccanismo non è utile. Una tipica reazione biosintetica è quella in cui due molecole, A e B, sono unite per produrre A–B nella reazione di condensazione energeticamente sfavorevole A–H + B–OH n A–B + H2O C’è una via indiretta che permette ad A–H e B–OH di formare A–B, in cui un accoppiamento all’idrolisi di ATP fa procedere la reazione. Qui l’energia dell’idrolisi dell’ATP viene prima usata per convertire B–OH in un composto intermedio a energia maggiore, che quindi reagisce direttamente con il gruppo ossidrilico di un’altra molecola O _ O HO C C _ O _ O _ ADENINA P O P O P O CH2 O O O ATP RIBOSIO legame fosfoanidridico Figura 2.34 Un esempio di ΔG < 0 O _ _ O P O C C O legame fosfoesterico O _ + O _ O TRASFERIMENTO DI FOSFATO _ ADENINA P O P O CH2 O O ADP RIBOSIO una reazione di trasferimento di fosfato. Poiché un legame fosfoanidridico ricco di energia dell’ATP è convertito in un legame fosfoesterico, la reazione è energeticamente favorevole, avendo un ∆G nettamente negativo. Reazioni di questo tipo sono coinvolte nella sintesi dei fosfolipidi e nei passaggi iniziali delle reazioni che catabolizzano zuccheri. CAPITOLO 2 Chimica e bioenergetica della cellula 68 © 978-88-08-62126-9 (B) P O O C CH2 CH2 H3N+ CH COO– intermedio ad alta energia (A) P ATP O PASSAGGIO DI ATTIVAZIONE B ADP PASSAGGIO DI ATTIVAZIONE B OH Pi prodotti di idrolisi dell’ATP Figura 2.35 Un esempio di una reazione biosintetica energeticamente sfavorevole spinta dall’idrolisi dell’ATP. (A) Illustrazione schematica della formazione di A–B nella reazione di condensazione descritta nel testo. (B) La biosintesi dell’amminoacido comune glutammina da acido glutammico e ammoniaca. L’acido glutammico viene prima convertito in un intermedio fosforilato ad alta energia (corrispondente al composto B–O–PO3 descritto nel testo), che quindi reagisce con ammoniaca (corrispondente ad A–H) per formare glutammina. In questo esempio entrambi i passaggi avvengono sulla superficie dello stesso enzima, la glutammina sintetasi. I legami ad alta energia sono ombreggiati in rosso; qui, come altrove nel libro, il simbolo Pi = HPO42– e una P in un cerchio giallo =PO32–. A O CH2 H3N + CH NH2 C CH2 – COO acido glutammico B PASSAGGIO DI CONDENSAZIONE CH2 PASSAGGIO DI CONDENSAZIONE A Pi prodotti di idrolisi dell’ATP C H ATP ADP OH O intermedio ad alta energia NH3 ammoniaca CH2 H3N+ CH COO– glutammina A–H per dare A–B. Il meccanismo più semplice possibile comporta il trasferimento di un fosfato da ATP a B–OH per produrre B–O–PO3, nel qual caso la via di reazione contiene soltanto due passaggi: 1. B–OH + ATP n B–O–PO3 + ADP 2. A–H + B–O–PO3 n A–B + Pi Risultato netto: B–OH + ATP + A–H n A–B + ADP + Pi La reazione di condensazione, che di per sé è energeticamente sfavorevole, viene forzata dal fatto di essere direttamente accoppiata all’idrolisi di ATP in una via di reazione catalizzata da enzimi (Figura 2.35A). Una reazione biosintetica esattamente di questo tipo è usata per sintetizzare l’amminoacido glutammina, come illustrato nella Figura 2.35B. Vedremo fra poco che meccanismi molto simili (ma più complessi) sono usati anche per produrre quasi tutte le grosse molecole della cellula. ■ NADH e NADPH sono importanti trasportatori di elettroni Altri importanti trasportatori attivati partecipano alle reazioni di ossidazione-riduzione e fanno comunemente parte delle reazioni accoppiate nelle cellule. Questi trasportatori attivati sono specializzati nel portare elettroni tenuti a un alto livello di energia (talvolta chiamati elettroni “ad alta energia”) e atomi di idrogeno. I più importanti di questi trasportatori di elettroni sono NAD+ (nicotinammide adenina dinucleotide) e la molecola strettamente correlata NADP+ (nicotinammide adenina dinucleotide fosfato). NAD+ e NADP+ raccolgono un “pacchetto di energia” che corrisponde a due elettroni ad alta energia più un protone (H+), convertendosi in NADH (nicotinammide adenina dinucleotide ridotto) e NADPH (nicotinammide adenina dinucleotide fosfato ridotto) rispettivamente (Figura 2.36). Queste molecole possono perciò essere considerate anche trasportatori di ioni idruro (H+ più due elettroni, o H–). Come l’ATP, il NADPH è un trasportatore attivato che partecipa a molte reazioni biosintetiche importanti che altrimenti sarebbero energeticamente sfavorevoli. Il NADPH è prodotto secondo lo schema generale mostrato nella Figura 2.36A. Durante una serie speciale di reazioni cataboliche che producono energia due elettroni vengono rimossi dalla molecola di substrato. Entrambi gli elettroni ma solamente un protone (cioè uno ione idruro, H–) sono CAPITOLO 2 Chimica e bioenergetica della cellula 69 © 978-88-08-62126-9 (A) H C OH NADP+ C O NADPH C H C C + C +H ossidazione della molecola 1 (B) H riduzione della molecola 2 (C) NADP+ H O forma ridotta H + N C NH2 N O P RIBOSIO RIBOSIO H– ADENINA P O NH2 O ADENINA P O H C anello nicotinammidico P NADPH forma ossidata O RIBOSIO RIBOSIO O O P P questo gruppo fosfato + manca nel NAD e nel NADH aggiunti all’anello di nicotinammide del NADP+ per formare NADPH; il secondo protone (H+) è rilasciato in soluzione. Questa è una tipica reazione di ossido-riduzione; il substrato è ossidato e il NADP+ è ridotto. Il NADPH cede prontamente lo ione idruro in una successiva reazione di ossido-riduzione, perché senza di esso l’anello di nicotinammide può raggiungere una disposizione di elettroni più stabile. In questa reazione successiva, che rigenera NADP+, è il NADPH che diventa ossidato e il substrato che diventa ridotto. Il NADPH è un donatore efficace del suo ione idruro ad altre molecole per la stessa ragione per cui l’ATP trasferisce prontamente un fosfato: in entrambi i casi il trasferimento è accompagnato da un grande cambiamento negativo in energia libera. Un esempio dell’uso del NADPH nelle biosintesi è mostrato nella Figura 2.37. Il gruppo fosfato aggiuntivo del NADPH non ha effetto sulle proprietà di trasferimento di elettroni del NADPH rispetto al NADH, in quanto si trova lontano dalla regione coinvolta nel trasferimento di elettroni (vedi Figura 2.36C). Tuttavia conferisce alla molecola del NADPH una forma leggermente diversa da quella del NADH, rendendo possibile il legame di NADPH e NADH come substrati a serie diverse di enzimi. Così i due tipi di trasportatori sono usati per trasferire elettroni (o ioni idruro) fra due serie diverse di molecole. Perché dovrebbe esserci questa divisione del lavoro? La risposta sta nella necessità di regolare due serie di reazioni di trasferimento di elettroni in modo indipendente. Il NADPH opera principalmente con enzimi che catalizzano reazioni anaboliche, fornendo gli elettroni ad alta energia necessari per sintetizzare molecole biologiche ricche di energia. Il NADH, invece, ha un ruolo speciale come intermedio nel sistema catabolico di reazioni che gene- Figura 2.36 Il NADPH, un importante trasportatore di elettroni. (A) Il NADPH è prodotto in reazioni del tipo generale mostrato sulla sinistra, in cui due atomi di idrogeno sono rimossi da un substrato. La forma ossidata della molecola trasportatrice, NADP+, riceve un atomo di idrogeno più un elettrone (uno ione idruro), e il protone (H+) dall’altro atomo di H è rilasciato in soluzione. Poiché il NADPH trattiene il suo ione idruro in un legame ad alta energia, lo ione idruro aggiunto può essere trasferito facilmente ad altre molecole, come mostrato sulla destra. (B) e (C) La struttura del NADP+ e del NADPH. La parte della molecola di NADP+ nota come anello nicotinammidico accetta lo ione idruro, H– formando NADPH. NAD+ e NADH hanno una struttura identica a NADP+ e NADPH rispettivamente, eccetto che il gruppo fosfato indicato è assente in entrambi. CAPITOLO 2 Chimica e bioenergetica della cellula 70 © 978-88-08-62126-9 Figura 2.37 NADPH come agente riducente. (A) Il passaggio finale nella via biosintetica che porta al colesterolo. Come in molte altre reazioni biosintetiche, la riduzione del legame CPC viene ottenuta per trasferimento di uno ione idruro dalla molecola trasportatrice NADPH, più un protone (H+) dalla soluzione. (B) Tenendo i livelli di NADPH alti e i livelli di NADH bassi si alterano le loro affinità per gli elettroni (vedi Quadro 14.1 p. 816). Questo fa sì che il NADPH sia un donatore di elettroni (agente riducente) molto più forte del NADH e che il NAD+ sia quindi un migliore accettore di elettroni (agente ossidante) rispetto al NADP+, come indicato. agente ossidante per il catabolismo 7-deidrocolesterolo NAD+ NADH C NADP+ NADPH C HO H (B) agente riducente per l’anabolismo NADPH + H+ NADP+ C HO C H H H colesterolo (A) rano ATP tramite l’ossidazione di molecole di cibo, come vedremo fra breve. La genesi di NADH da NAD+ e quella di NADPH da NADP+ avviene per vie diverse ed è regolata in modo indipendente, così che la cellula può regolare in modo indipendente la scorta di elettroni per questi due scopi contrastanti. Dentro la cellula il rapporto fra NAD+ e NADH è mantenuto alto, mentre il rapporto fra NADP+ e NADPH è mantenuto basso. Ciò fornisce sufficiente NAD+ perché agisca da agente ossidante e sufficiente NADPH perché agisca da agente riducente (Figura 2.37B), come richiesto dai loro specifici ruoli rispettivamente nel catabolismo e nell’anabolismo. ■ Nelle cellule ci sono molte altre molecole trasportatrici attivate Anche altri trasportatori attivati raccolgono e portano un gruppo chimico in un legame ad alta energia facilmente trasferibile. Per esempio, il coenzima A porta un gruppo acetilico in un legame facilmente trasferibile e in questa forma attivata è noto come acetil CoA (acetil coenzima A). L’acetil CoA (Figura 2.38) è usato per aggiungere unità a due atomi di carbonio nella biosintesi di molecole più grandi. Nell’acetil CoA e nelle altre molecole trasportatrici il gruppo trasferibile costituisce soltanto una piccola parte della molecola. Il resto consiste di una grossa porzione organica che funge da pratica “maniglia”, che facilita il riconoscimento della molecola trasportatrice da parte di enzimi specifici. Come per l’acetil CoA, questa maniglia molto spesso contiene un nucleotide (generalmente adenosina difosfato), un fatto curioso che può essere una traccia di uno stadio iniziale dell’evoluzione. Oggi si pensa che i catalizzatori principali delle forme di vita primitive – prima di DNA o proteine – fossero molecole di RNA (o loro parenti stretti), come descritto nel Capitolo 6. Si è tentati di ipotizzare che molte delle molecole trasportatrici che troviamo oggi si siano originate in questo mondo primitivo a RNA, dove le loro porzioni nucleotidiche potrebbero essere state utili per il legame con enzimi a RNA (ribozimi). Quindi, l’ATP trasferisce il fosfato, il NADPH trasferisce elettroni e idrogeno e l’acetil CoA trasferisce gruppi acetilici con due atomi di carbonio. Il FADH2 (flavina adenina dinucleotide ridotto) è usato come il NADH nel trasferimento di elettroni e protoni (Figura 2.39). Le reazioni di altre molecole trasportatrici attivate coinvolgono i trasferimenti di gruppi metilici, carbossilici o glucosio per le biosintesi (Tabella 2.3). Questi trasportatori attivati sono generati in reazioni che sono accoppiate all’idrolisi di ATP, come nell’esempio CAPITOLO 2 Chimica e bioenergetica della cellula 71 © 978-88-08-62126-9 Figura 2.38 La struttura dell’importante molecola trasportatrice attivata acetil CoA. Sopra la struttura è mostrato un modello a palle e bastoncini. L’atomo di zolfo (giallo) forma un legame tioestere con l’acetato. Poiché questo è un legame ad alta energia, che rilascia una grande quantità di energia libera quando è idrolizzato, la molecola di acetato può essere prontamente trasferita ad altre molecole. gruppo acetilico nucleotide ADENINA H3C H H O H H O H C S C C N C C C N C C O H H H H H H CH3 H C O O C O P O P O CH2 O– O– OH CH3 H legame ad alta energia RIBOSIO –O gruppo acetilico coenzima A (CoA) FADH2 (A) CH3 CH3 H O N C C C + (B) H C C O P O O– C C C H FAD – 2e FADH2 NH C C N N CH2 H H C OH H C OH H C OH H2C O 2H O Figura 2.39 FADH2 è un P P O CH2 ADENINA trasportatore di idrogeno di elettroni ad alta energia, come NADH e NADPH. (A) Struttura del FADH2 con i suoi atomi trasportatori di idrogeno evidenziati in giallo. (B) La formazione del FADH2 a partire dal FAD. RIBOSIO TABELLA 2.3 Alcune molecole trasportatrici attivate ampiamente usate nel metabolismo Trasportatore attivato Gruppo trasportato in un legame ad alta energia ATP Fosfato NADH, NADPH, FADH2 Elettroni e atomi di idrogeno Acetil CoA Gruppo acetilico Biotina carbossilata Gruppo carbossilico S-Adenosilmetionina Gruppo metilico Uridina difosfato glucosio Glucosio CAPITOLO 2 Chimica e bioenergetica della cellula 72 © 978-88-08-62126-9 ATTIVAZIONE DEL GRUPPO CARBOSSILICO biotina carbossilata O C legame ad alta energia N ADP P P – O O O S ADENINA CH2 N H CH3 O RIBOSIO C O ENZIMA C ATP P P P O CH2 O ADENINA Pi – O piruvato RIBOSIO biotina – O O S C OH bicarbonato H N O CH2 C O O piruvato carbossilasi – C O N H ENZIMA O C O O– ossalacetato TRASFERIMENTO DEL GRUPPO CARBOSSILICO Figura 2.40 Una reazione di trasferimento di un gruppo carbossilico usando una molecola trasportatrice attivata. La biotina carbossilata è usata dall’enzima piruvato carbossilasi per trasferire un gruppo carbossilico nella produzione di ossalacetato, una molecola necessaria per il ciclo dell’acido citrico. L’accettore di questo trasferimento di gruppo è il piruvato. Altri enzimi usano biotina per trasferire gruppi carbossilici ad altre molecole. Si noti che la sintesi di biotina carbossilata richiede energia che è derivata da ATP, una caratteristica generale di molti trasportatori attivati. nella Figura 2.40. Perciò l’energia consente ai loro gruppi di essere usati per le biosintesi deriva, alla fine, dalle reazioni cataboliche che generano ATP. Processi simili avvengono nella sintesi delle grandi molecole della cellula – gli acidi nucleici, le proteine e i polisaccaridi – che discuteremo adesso. ■ La sintesi dei polimeri biologici richiede idrolisi di ATP Come discusso in precedenza, le macromolecole della cellula rappresentano la grande maggioranza della sua massa secca (vedi Figura 2.7). Queste molecole sono composte da subunità (o monomeri) unite insieme in una reazione di condensazione, in cui i costituenti di una molecola d’acqua (OH più H) sono rimossi dai due reagenti. Di conseguenza, la reazione inversa – la demolizione di tutti e tre i tipi di polimeri – avviene per l’aggiunta di acqua catalizzata da enzimi (idrolisi). Questa reazione di idrolisi è energeticamente favorevole, mentre le reazioni biosintetiche richiedono un apporto di energia (vedi Figura 2.9). Gli acidi nucleici (DNA e RNA), le proteine e i polisaccaridi sono tutti polimeri prodotti dall’aggiunta ripetuta di una subunità (chiamata anche monomero) a una estremità di una catena in crescita. Le reazioni di sintesi per questi tre tipi di macromolecole sono riportate nella Figura 2.41. Come indicato, il passaggio di condensazione in ciascun caso dipende da energia derivata dall’idrolisi di un nucleoside trifosfato. Eppure, eccetto che per gli acidi nucleici, non ci sono gruppi residui di fosfato nei prodotti finali. In che modo le reazioni che rilasciano l’energia di idrolisi dell’ATP sono accoppiate alla sintesi dei polimeri? Per ciascun tipo di macromolecola esiste una via catalizzata da enzimi che assomiglia a quella esaminata in precedenza per la sintesi dell’amminoacido glutammina (vedi Figura 2.35). Il principio è esattamente lo stesso, in quanto il gruppo -OH che sarà rimosso nella reazione di condensazione viene prima attivato coinvolgendolo in un legame ad alta energia con una seconda molecola. Tuttavia i meccanismi effettivi usati per collegare l’idrolisi di ATP alla sintesi di proteine e polisaccaridi sono più complessi di quello usato per la sintesi della glutammina, poiché è necessaria una serie di intermedi ad alta energia per generare il legame finale ad alta energia che viene spezzato durante il passaggio di condensazione (vedi Capitolo 6 a proposito della sintesi proteica). CAPITOLO 2 Chimica e bioenergetica della cellula 73 © 978-88-08-62126-9 (B) ACIDI NUCLEICI (A) POLISACCARIDI glucosio glicogeno CH2OH O CH2OH O CH2OH O OH OH OH OH HO O CH2 O HO CH2OH O OH O CH2OH O OH O CH2 C O OH H2O OH OH energia da idrolisi di un nucleoside trifosfato OH O (C) PROTEINE proteina C C R N C H H H H O N C OH H C R C C R _ CH2 O G O C nucleotide CH2 O G OH OH RNA OH OH energia da idrolisi di un nucleoside trifosfato H2 O O O P O O OH H O _ P OH O O amminoacido R C O O OH O _ O glicogeno H O P O CH2 O OH O P OH O _ OH O HO OH O RNA CH2OH O A O OH energia originariamente derivata da idrolisi di un nucleoside trifosfato H2 O CH2 A O O OH OH O R O N C C H H H N C H R O C OH proteina Figura 2.41 La sintesi di polisaccaridi, proteine e acidi nucleici. La sintesi di ciascun tipo di polimero biologico comporta la perdita di acqua in una reazione di condensazione. Non è mostrato il consumo di nucleosidi trifosfato ad alta energia richiesto per attivare ciascun monomero prima della sua aggiunta. La reazione inversa – la demolizione di tutti i tre tipi di polimeri – avviene invece per semplice aggiunta di acqua (idrolisi). Ci sono dei limiti a quello che ciascun trasportatore attivato può fare per spingere le biosintesi. Il DG per l’idrolisi di ATP a ADP e fosfato inorganico (Pi) dipende dalle concentrazioni di tutti i reagenti, ma nelle condizioni tipiche di una cellula è fra –46 e –54 kJ/mole. In linea di principio questa reazione di idrolisi può essere usata per spingere una reazione sfavorevole con un DG di circa +40 kJ/mole, purché sia disponibile una via di reazione adatta. Per alcune reazioni biosintetiche, però, anche –50 kJ/mole possono non essere sufficienti. In questi casi la via dell’idrolisi dell’ATP può essere alterata così che inizialmente produce AMP e pirofosfato (PPi), che viene poi idrolizzato in un passaggio successivo (Figura 2.42). L’intero processo rende disponibile un cambiamento totale in energia libera di circa –100 kJ/mole. Una reazione biosintetica importante che viene spinta in questo modo è la sintesi degli acidi nucleici (polinucleotidi) dai nucleosidi trifosfato, come illustrato nella parte destra della Figura 2.43. È interessante notare che le reazioni ripetitive di condensazione che producono macromolecole possono essere orientate in due modi diversi, dando origine alla polimerizzazione di testa o alla polimerizzazione di coda dei mo- CAPITOLO 2 Chimica e bioenergetica della cellula 74 Figura 2.42 Una via alternativa © 978-88-08-62126-9 (A) per l’idrolisi di ATP, in cui il pirofosfato prima si forma e poi viene idrolizzato. Questa via rilascia quasi il doppio dell’energia libera (approssimativamente –100kJ/ mole) della reazione mostrata in precedenza nella Figura 2.33 e forma AMP invece di ADP. (A) Nelle due successive reazioni di idrolisi gli atomi di ossigeno delle molecole d’acqua che partecipano sono trattenuti nei prodotti, come indicato, mentre gli atomi di idrogeno si dissociano formando ioni idrogeno liberi (H+, non mostrati). (B) Schema sintetico della reazione totale. (B) O O O ADENINA _ ATP O P O P O P O CH2 _ _ O _ O O RIBOSIO H2O adenosina trifosfato (ATP) H2O O O O _ O P O P O O _ _ + ADENINA _ O P O CH2 + P Pi _ _ AMP O O RIBOSIO pirofosfato H2O adenosina monofosfato (AMP) H2O O O _ O P OH + _ O P OH _ _ O O fosfato fosfato + Pi Pi nomeri. Nella cosiddetta polimerizzazione di testa il legame reattivo necessario per la reazione di condensazione è portato sull’estremità del polimero in crescita e deve perciò essere rigenerato ogni volta che viene aggiunto un monomero. In questo caso ciascun monomero porta il legame reattivo che sarà usato per aggiungere il monomero successivo della serie. Nella polimerizzazione di coda il legame reattivo portato da ciascun monomero viene invece usato immediatamente per la sua aggiunta (Figura 2.44). Vedremo nei capitoli successivi che vengono usati entrambi i tipi di polimerizzazione. La sintesi dei polinucleotidi e di alcuni polisaccaridi semplici, per esempio, avviene per polimerizzazione di coda, mentre la sintesi delle proteine avviene per un processo di polimerizzazione di testa. base 3 P P P O zucchero base 1 OH P O intermedio ad alta energia Figura 2.43 La sintesi di un polinucleotide, RNA o DNA, è un processo in molti passaggi spinto dall’idrolisi di ATP. Nel primo passaggio un nucleoside monofosfato è attivato mediante trasferimento sequenziale dei gruppi fosfato terminali a partire da due molecole di ATP. L’intermedio ad alta energia che si forma – un nucleoside trifosfato – si trova libero in soluzione finché reagisce con l’estremità in crescita di una catena di RNA o di DNA con rilascio di pirofosfato. L’idrolisi di quest’ultimo a fosfato inorganico è altamente favorevole e aiuta a spingere la reazione totale nella direzione della sintesi del polinucleotide. Per dettagli vedi il Capitolo 5. zucchero 2 ATP base 2 P O P Pi zucchero H2O base 3 P 2 ADP OH O zucchero OH nucleoside monofosfato catena polinucleotidica contenente due nucleotidi 2 Pi base 1 prodotti di idrolisi dell’ATP P O zucchero base 2 P O zucchero catena polinucleotidica contenente tre nucleotidi base 3 P O zucchero OH CAPITOLO 2 Chimica e bioenergetica della cellula 75 © 978-88-08-62126-9 POLIMERIZZAZIONE DI TESTA (ad esempio, PROTEINE, ACIDI GRASSI) 6 6 + 7 POLIMERIZZAZIONE DI CODA (ad esempio, DNA, RNA, POLISACCARIDI) ciascun monomero porta un legame ad alta energia che sarà usato per l’aggiunta del monomero successivo 7 + 1 7 7 ciascun monomero porta un legame ad alta energia per la propria aggiunta 1 SOMMARIO Le cellule viventi, per sopravvivere e crescere, devono creare ordine al loro interno e mantenerlo. Ciò è termodinamicamente possibile soltanto grazie a un continuo apporto di energia, parte della quale deve essere rilasciata dalle cellule all’ambiente come calore che aumenta il disordine di ciò che le circonda. Le uniche reazioni chimiche possibili sono quelle che aumentano la quantità totale di disordine nell’universo. Il cambiamento di energia libera di una reazione, DG, misura questo disordine e deve essere minore di zero affinché una reazione possa procedere spontaneamente. Questo DG dipende sia dalle proprietà intrinseche dei reagenti sia dalle loro concentrazioni e può essere calcolato a partire da queste concentrazioni se si conoscono la costante all’equilibrio della reazione (K) o il suo cambiamento di energia libera standard DG°. L’energia necessaria alla vita deriva in ultima istanza dalle radiazioni elettromagnetiche del sole, che alimentano la formazione di molecole organiche negli organismi fotosintetici come le piante verdi. Gli animali ricavano la loro energia ingerendo queste molecole organiche e ossidandole in una serie di reazioni catalizzate da enzimi accoppiate alla formazione di ATP, una “moneta” comune di energia in tutte le cellule. Per rendere possibile la continua generazione di ordine nelle cellule l’idrolisi energeticamente favorevole di ATP è accoppiata a reazioni energeticamente sfavorevoli. Nella biosintesi delle macromolecole l’ATP è usato per formare intermedi reattivi fosforilati. Poiché la reazione energeticamente sfavorevole diventa adesso energeticamente favorevole, si dice che l’idrolisi di ATP spinge la reazione. Le molecole polimeriche come proteine, acidi nucleici e polisaccaridi sono assemblate a partire da piccoli precursori attivati mediante reazioni ripetitive di condensazione che sono spinte in questo modo. Altre molecole reattive, chiamate trasportatori attivi o coenzimi, trasferiscono altri gruppi chimici nel corso della biosintesi: il NADPH trasferisce idrogeno in forma di un protone più due elettroni (uno ione idruro), per esempio, mentre l’acetil CoA trasferisce un gruppo acetilico. ● Il modo in cui le cellule ottengono energia dal cibo L’apporto costante di energia necessario alle cellule per generare e mantenere l’ordine biologico che consente loro di vivere deriva dall’energia chimica di legame nelle molecole di cibo. Le proteine, i lipidi e i polisaccaridi che compongono la maggior parte del cibo che mangiamo devono essere demoliti in molecole più piccole prima che le nostre cellule possano usarli, sia come fonte di energia che come unità da costruzione per altre molecole. La digestione enzimatica demolisce le grandi molecole polimeriche del cibo nelle loro subunità monomeriche: le proteine in amminoacidi, i polisaccaridi in zuccheri, i grassi in acidi grassi e glicerolo. Dopo la digestione le piccole molecole organiche derivate dal cibo entrano nel citosol delle cellule, dove inizia la loro graduale ossidazione. Gli zuccheri sono molecole combustibili particolarmente importanti e sono ossidati in piccoli passaggi controllati ad anidride carbonica (CO2) e acqua (Figura 2.45). In questa sezione delineeremo le fasi principali della demolizione, o catabolismo, degli zuccheri e mostreremo come questi producano ATP, Figura 2.44 L’orientamento degli intermedi attivi nelle reazioni di condensazione ripetitive che formano i polimeri biologici. La crescita di testa dei polimeri è confrontata con la crescita alternativa di coda. Come indicato, questi due meccanismi sono usati per produrre tipi diversi di macromolecole biologiche. CAPITOLO 2 Chimica e bioenergetica della cellula 76 © 978-88-08-62126-9 (A) COMBUSTIONE DIRETTA DI UNO ZUCCHERO IN UN SISTEMA NON VIVENTE (B) OSSIDAZIONE IN PIÙ PASSAGGI DI UNO ZUCCHERO IN UNA CELLULA grande energia di attivazione superata dal calore di un fuoco ZUCCHERO + O2 energia libera ZUCCHERO + O2 piccole energie di attivazione superate da enzimi che agiscono alla temperatura corporea tutta l’energia libera è rilasciata come calore; nessuna è conservata CO2 + H2O Figura 2.45 Rappresentazione schematica dell’ossidazione controllata in più passaggi di uno zucchero in una cellula, confrontata con la combustione ordinaria. (A) Se lo zucchero fosse invece ossidato a CO2 e H2O in un singolo passaggio rilascerebbe una quantità di energia molto più grande di quella che potrebbe essere catturata per scopi utili. (B) Nella cellula, gli enzimi catalizzano l’ossidazione in una serie di piccoli passaggi in cui l’energia libera è trasferita in pacchetti di dimensioni utili a molecole trasportatrici, più spesso ATP e NADH. In ciascun passaggio un enzima controlla la reazione riducendo la barriera di energia di attivazione che deve essere superata prima che la reazione specifica possa avvenire. L’energia libera totale rilasciata è esattamente la stessa in (A) e in (B). molecole trasportatrici attivate conservano energia CO2 + H2O NADH e altre molecole trasportatrici attivate nelle cellule animali. Una via molto simile opera anche nei vegetali, nei funghi e in molti batteri. Come vedremo, l’ossidazione degli acidi grassi è ugualmente importante per le cellule. Altre molecole, come le proteine, possono anch’esse servire da fonte di energia quando sono incanalate in vie enzimatiche appropriate. ■ La glicolisi è una via centrale che produce ATP Il processo più importante della demolizione degli zuccheri è la sequenza di reazioni nota come glicolisi (dal greco glycos, “zucchero”, e lysis, “rottura”). La glicolisi produce ATP senza il coinvolgimento di ossigeno molecolare (O2 gassoso). Avviene nel citosol della maggior parte delle cellule, compresi molti microrganismi anaerobi. La glicolisi si è probabilmente evoluta precocemente nella storia della vita, prima che le attività degli organismi fotosintetici introducessero ossigeno nell’atmosfera. Durante la glicolisi una molecola di glucosio con sei atomi di carbonio è convertita in due molecole di piruvato, ciascuna delle quali contiene tre atomi di carbonio. Per ciascuna molecola di glucosio due molecole di ATP vengono idrolizzate per fornire l’energia necessaria per spingere i passaggi iniziali, ma quattro molecole di ATP sono prodotte nei passaggi successivi. Alla fine della glicolisi c’è di conseguenza un guadagno netto di due molecole di ATP per ciascuna molecola di glucosio demolita. Sono prodotte anche due molecole del trasportatore attivato NADH. La via glicolitica è presentata schematicamente nella Figura 2.46 e con maggiori dettagli nel Quadro 2.8 (pp. 108-109) e Filmato 2.5 . La glicolisi consta di una sequenza di 10 reazioni separate, ciascuna delle quali produce uno zucchero intermedio diverso ed è catalizzata da un enzima diverso. Come la maggior parte degli enzimi, questi hanno tutti nomi che terminano in -asi – come isomerasi e deidrogenasi – che indicano il tipo di reazione che catalizzano. Sebbene nella glicolisi non sia coinvolto ossigeno molecolare, si ha ossidazione, in quanto vengono rimossi elettroni a opera del NAD+ (producendo NADH) da alcuni dei carboni derivati dalla molecola di glucosio. Il fatto che il processo avvenga in più passaggi permette all’energia di ossidazione di essere rilasciata in piccoli “pacchetti”, così che molta di essa può essere conservata in molecole trasportatrici attivate invece di essere tutta rilasciata come calore (vedi Figura 2.45). Così una parte dell’energia rilasciata dall’ossidazione spinge la sintesi diretta di molecole di ATP da ADP e Pi e una parte resta con gli elettroni nel trasportatore di elettroni ad alta energia NADH. Per ogni molecola di glucosio si formano due molecole di NADH nel corso della glicolisi. Negli organismi aerobi queste molecole di NADH donano i loro elettroni alla catena di trasporto degli elettroni descritta nel Capitolo 14 e il NAD+ formato dal NADH viene usato di nuovo per la glicolisi (vedi il passaggio 6 nel Quadro 2.8 pp. 108-109). CAPITOLO 2 Chimica e bioenergetica della cellula 77 © 978-88-08-62126-9 Figura 2.46 Uno schema della CH2OH O una molecola di glucosio OH HO OH investimento di energia che verrà recuperato più tardi OH ATP PASSAGGIO 1 PASSAGGIO 2 ATP PASSAGGIO 3 P OH2C CH2O P O fruttosio 1,6 bifosfato HO OH OH PASSAGGIO 4 PASSAGGIO 5 due molecole di gliceraldeide 3-fosfato CHO CHO CHOH CHOH CH2O P CH2O P NADH PASSAGGIO 6 NADH ATP PASSAGGIO 7 ATP taglio di uno zucchero a sei carboni in due zuccheri a tre carboni PASSAGGIO 8 PASSAGGIO 9 PASSAGGIO 10 ATP COO– due molecole di piruvato generazione di energia C CH3 O ATP COO– C O CH3 ■ Le fermentazioni producono ATP in assenza di ossigeno Per la maggior parte delle cellule animali e vegetali la glicolisi è soltanto un preludio allo stadio finale della demolizione delle molecole di cibo. In queste cellule il piruvato formato nella glicolisi viene rapidamente trasportato nei mitocondri, dove è convertito in CO2 più acetil CoA, che viene poi ossidato completamente a CO2 e H2O. Per molti organismi anaerobi – che non utilizzano ossigeno molecolare e possono crescere e dividersi senza di esso – la glicolisi è invece la fonte principale dell’ATP cellulare. Ciò vale anche per certi tessuti animali, come il muscolo scheletrico, che continuano a funzionare quando l’ossigeno molecolare è scarso. In queste condizioni anaerobiche il piruvato e gli elettroni del NADH si trovano nel citosol. Il piruvato è convertito in prodotti escreti dalla cellula, per esempio in etanolo e CO2 nei lieviti usati per fare birra e pane, o in lattato nei muscoli. In questo processo il NADH cede i suoi elettroni ed è convertito di nuovo in NAD+. Questa rigenerazione del NAD+ è necessaria per mantenere le reazioni della glicolisi (Figura 2.47). Vie che producono energia di questo tipo, in cui molecole organiche donano e accettano elettroni (e che spesso, come in questi casi, sono anaerobiche) sono chiamate fermentazioni. Lo studio delle fermentazioni svolte da lieviti importanti dal punto di vista economico ha ispirato buona parte della biochimica iniziale. Ricerche svolte nel XIX secolo hanno portato nel 1896 al riconoscimento, a quel tempo sorprendente, che questi processi potevano glicolisi. Ciascuno dei 10 passaggi mostrati è catalizzato da un enzima diverso. Si noti che il passaggio 4 taglia uno zucchero a sei carboni in due zuccheri a tre carboni, così che il numero di molecole a ogni stadio successivo raddoppia. Come indicato, il passaggio 6 dà inizio alla fase di generazione dell’energia della glicolisi. Poiché due molecole di ATP sono idrolizzate nella fase iniziale che consuma energia, la glicolisi porta alla sintesi netta di 2 molecole di ATP e 2 di NADH per ogni molecola di glucosio (vedi anche Quadro 2.8). CAPITOLO 2 Chimica e bioenergetica della cellula 78 (A) FERMENTAZIONE CHE PORTA ALL’ESCREZIONE DI LATTATO glucosio NAD+ glicolisi ADP ATP + O– O NAD+ NADH + H C C O– O rigenerazione + di NAD C H O C OH CH3 CH3 piruvato lattato (B) FERMENTAZIONE CHE PORTA ALL’ESCREZIONE DI ALCOL E CO2 glucosio ADP NAD+ glicolisi Figura 2.47 Due vie per la demolizione anaerobica del piruvato. (A) Quando non è presente una quantità di ossigeno adeguata, per esempio in una cellula muscolare in forte contrazione, il piruvato prodotto dalla glicolisi è convertito in lattato, come mostrato. Questa reazione rigenera il NAD+ consumato nel passaggio 6 della glicolisi, ma l’intera via produce in totale molta meno energia dell’ossidazione completa. (B) In alcuni organismi che possono crescere anaerobicamente, come i lieviti, il piruvato è convertito tramite acetaldeide in anidride carbonica ed etanolo. Di nuovo, questa via rigenera NAD+ da NADH, come è necessario per permettere alla glicolisi di continuare. Sia (A) che (B) sono esempi di fermentazioni. © 978-88-08-62126-9 ATP + NADH + H O– O H + rigenerazione + di NAD C C NAD+ HC O O CH3 CH3 acetaldeide piruvato H2C OH CH3 etanolo CO2 essere studiati fuori da organismi viventi, in estratti cellulari. Questa scoperta rivoluzionaria rese alla fine possibile la scomposizione e lo studio di ciascuna singola reazione del processo di fermentazione. La ricostruzione della via glicolitica completa negli anni ’30 del Novecento è stata uno dei più grandi trionfi della biochimica, rapidamente seguita dal riconoscimento del ruolo centrale dell’ATP nei processi cellulari. ■ La glicolisi illustra il modo in cui gli enzimi accoppiano l’ossidazione alla conservazione dell’energia La formazione di ATP durante la glicolisi fornisce una chiara dimostrazione di come gli enzimi accoppino reazioni energeticamente sfavorevoli a reazioni energeticamente favorevoli, spingendo in questo modo le molte reazioni che rendono possibile la vita. Due reazioni centrali della glicolisi (passaggi 6 e 7) convertono lo zucchero intermedio a tre carboni gliceraldeide 3-fosfato (un’aldeide) in 3-fosfoglicerato (un acido carbossilico; vedi Quadro 2.8, pp. 108-109), ossidando così un gruppo aldeidico in un gruppo carbossilico. La reazione totale rilascia abbastanza energia libera per convertire una molecola di ADP in ATP e per trasferire due elettroni (e un protone) dall’aldeide a NAD+ per formare NADH, rilasciando comunque abbastanza calore nell’ambiente per rendere la reazione totale energeticamente favorevole (il DG° per la reazione totale è –12,5 kJ/mole). La via utilizzata per compiere questa notevole impresa di raccolta di energia è schematizzata nella Figura 2.48. Le reazioni chimiche indicate sono guidate precisamente da due enzimi ai quali gli zuccheri intermedi sono strettamente legati. Infatti, come descritto dettagliatamente nella Figura 2.48, il primo en- CAPITOLO 2 Chimica e bioenergetica della cellula 79 © 978-88-08-62126-9 (A) H O C H C gliceraldeide 3-fosfato OH CH2O HS Figura 2.48 Immagazzinamento PASSAGGI 6 E 7 DELLA GLICOLISI P Un legame covalente a vita breve si forma fra gliceraldeide 3-fosfato (il substrato) e il gruppo –SH di una catena laterale di cisteina dell’enzima gliceraldeide 3-fosfato deidrogenasi, che si lega anche in modo non covalente a NAD+. ENZIMA NAD+ S H C OH H C OH PASSAGGIO 6 gliceraldeide 3-fosfato deidrogenasi ENZIMA CH2O P + NADH + H legame ad alta energia (tioestere) S ENZIMA H C O C OH CH2O legame fosfato ad alta energia P H C O C OH 1,3-bifosfoglicerato CH2O P P A P PASSAGGIO 7 Una molecola di fosfato inorganico sposta il legame ad alta energia per creare 1,3-bifosfoglicerato che contiene un legame fosfato ad alta energia. fosfato inorganico Pi O P fosfoglicerato chinasi La gliceraldeide 3-fosfato viene ossidata in quanto l’enzima rimuove un atomo di idrogeno (in giallo) e lo trasferisce, assieme a un elettrone al NAD+ formando così NADH (vedi Figura 2.37). Parte dell’energia rilasciata dall’ossidazione dell’aldeide viene così immagazzinata in NADH e parte in legami tioesterici ad alta energia che uniscono la gliceraldeide 3-fosfato all'enzima. P HO ADP Il gruppo fosfato ad alta energia è trasferito ad ADP per formare ATP. P A P ATP O C H C OH CH2O (B) 3-fosfoglicerato P RIASSUNTO DEI PASSAGGI 6 E 7 H O C HO NADH aldeide O C acido carbossilico ATP L'ossidazione di un'aldeide ad acido carbossilico rilascia energia, gran parte della quale viene acquisita dai trasportatori attivati ATP e NADH. di energia nei passaggi 6 e 7 della glicolisi. (A) Nel passaggio 6 l’enzima gliceraldeide 3-fosfato deidrogenasi accoppia l’ossidazione di un’aldeide, energeticamente favorevole, alla formazione, energeticamente sfavorevole, di un legame fosfato ad alta energia. Allo stesso tempo, permette all’energia di essere immagazzinata nella molecola di NADH. La formazione del legame fosfato ad alta energia è spinta dalla reazione di ossidazione, e l’enzima perciò agisce come l’accoppiatore “a turbina” della Figura 2.32B. Nel passaggio 7, il legame fosfato ad alta energia di nuova sintesi presente nell’1,3-bifosfoglicerato è trasferito all’ADP, formando una molecola di ATP e lasciando nello zucchero ossidato un gruppo di acido carbossilico libero. La parte della molecola che subisce un cambiamento è ombreggiata in azzurro, il resto della molecola rimane inalterato in tutte queste reazioni. (B) Riassunto del cambiamento chimico totale prodotto dalle reazioni 6 e 7. CAPITOLO 2 Chimica e bioenergetica della cellula 80 © 978-88-08-62126-9 P O O P O 1,3-bifosfoglicerato C O C ATP energia libera NADH formazione di un legame ad alta energia idrolisi del legame ad alta energia ADP NAD+ H O C gliceraldeide 3-fosfato HO 3-fosfoglicerato O C ossidazione del legame C–H PASSAGGIO 6 PASSAGGIO 7 IL CAMBIAMENTO TOTALE DI ENERGIA per il passaggio 6 seguito dal passaggio 7 è favorevole –12,5 kJ/mole Figura 2.49 Disegno schematico delle reazioni accoppiate che formano NADH e ATP nei passaggi 6 e 7 della glicolisi. L’energia dell’ossidazione del legame C–H spinge la formazione sia di NADH che di un legame fosfato ad alta energia. La rottura del legame ad alta energia spinge quindi la formazione di ATP. zima (gliceraldeide 3-fosfato deidrogenasi) forma un legame covalente a vita breve con l’aldeide tramite un gruppo reattivo –SH sull’enzima e catalizza la sua ossidazione da parte del NAD+ mentre è ancora attaccato. Il legame reattivo enzima-substrato viene quindi spostato da uno ione fosfato inorganico producendo un intermedio fosfato ad alta energia, che viene quindi rilasciato dall’enzima. Questo intermedio si lega poi al secondo enzima (fosfoglicerato chinasi), che catalizza il trasferimento energeticamente favorevole del fosfato ad alta energia appena creato ad ADP, formando ATP e completando il processo di ossidazione di un’aldeide ad acido carbossilico. Si noti che l’energia di ossidazione del legame C-H nel passaggio 6 spinge la formazione sia di NADH che di un legame fosfato ad alta energia. La rottura di questo legame ad alta energia porta poi alla formazione di ATP. Abbiamo mostrato questo particolare processo di ossidazione in dettaglio perché fornisce un chiaro esempio di conservazione di energia mediata enzimaticamente tramite reazioni accoppiate (Figura 2.49). I passaggi 6 e 7 della glicolisi sono le sole reazioni che creano un legame fosfato ad alta energia direttamente da fosfato inorganico. Come tali sono responsabili della resa netta di due ATP e di due NADH per molecola di glucosio (vedi Quadro 2.8, pp. 108-109). Come abbiamo appena visto, l’ATP si può formare facilmente da ADP quando si producono intermedi di reazione con legami fosfato ad energia superiore di quelli dell’ATP. I legami fosfato possono essere disposti in ordine di energia confrontando il cambiamento in energia libera standard (DG¡) per la rottura di ciascun legame per idrolisi. La Figura 2.50 mette a confronto i legami fosfoanidride ad alta energia dell’ATP con l’energia di altri legami fosfato, alcuni dei quali sono generati durante la glicolisi. ■ Gli organismi conservano le molecole di cibo in speciali depositi Tutti gli organismi devono mantenere un alto rapporto ATP/ADP, se nelle loro cellule deve essere mantenuto un ordine biologico. Eppure gli animali hanno soltanto un accesso periodico al cibo e i vegetali devono sopravvivere durante la notte in assenza di luce solare, senza la possibilità di produrre zuc- CAPITOLO 2 Chimica e bioenergetica della cellula 81 © 978-88-08-62126-9 O– O O C H2C C O O C C O C N H CH3 C –61,9 kJ O– per esempio, 1,3-bifosfoglicerato (vedi Quadro 2.8) –49,0 kJ –40 O N P H O– O– creatina fosfato (trasportatore attivato che conserva energia nel muscolo) –43,0 kJ o C –O P O– +NH 2 H O –60 fosfoenolpiruvato (vedi Quadro 2.8, pp. 108-109) O H2O legame fosfato nella creatina fosfato O– O– H 2O legame anidride con il carbonio P H2O legame anidride con fosfato (legame fosfoanidridico) O C O P O O O– O P O O– P O– per esempio, ATP quando è idrolizzato ad ADP –30,6 kJ O– –20 H2O O H legame fosfoesterico C C H ∆G PER L’IDROLISI legame enol fosfato O P O– O– per esempio, glucosio 6-fosfato (vedi Quadro 2.8) –17,5 kJ H2O tipo di legame fosfato esempi specifici che mostrano il cambiamento in energia libera standard (∆G°) per l’idrolisi del legame fosfato 0 Figura 2.50 I legami fosfato hanno energie diverse. Nelle molecole rappresentate a sinistra sono mostrati esempi di diversi tipi di legami fosfato con i loro siti di idrolisi. Quelli che iniziano con un atomo di carbonio grigio mostrano soltanto parte della molecola. Esempi di molecole contenenti questi legami sono riportati a destra, con il cambiamento di energia libera della loro idrolisi in kilojoule. Il trasferimento di un gruppo fosfato da una molecola a un’altra è energeticamente favorevole se il cambiamento di energia libera (∆G) per l’idrolisi del legame fosfato della prima molecola è più negativo di quello per l’idrolisi del legame fosfato della seconda molecola. Così, per esempio, in condizioni standard un gruppo fosfato è prontamente trasferito da 1,3-bifosfoglicerato ad ADP, formando ATP. (Spesso le condizioni standard non sono applicabili alle cellule viventi, dove le concentrazioni relative di reagenti e prodotti influenzeranno il reale cambiamento di energia libera.) La reazione di idrolisi può essere vista come trasferimento del gruppo fosfato all’acqua. cheri dalla fotosintesi. Per questa ragione sia i vegetali che gli animali convertono zuccheri e grassi in forme speciali di deposito (Figura 2.51). Per compensare lunghi periodi di digiuno gli animali conservano gli acidi grassi come goccioline di grasso composte di triacilgliceroli insolubili in acqua (chiamati anche trigliceridi). Negli animali i triacilgliceroli sono immagazzinati in gran parte nel citoplasma di cellule adipose specializzate chiamate adipociti. Per la conservazione a più breve termine gli zuccheri sono immagazzinati come subunità di glucosio nel grande polisaccaride ramificato glicogeno, che è presente in forma di piccoli granuli nel citoplasma di molte cellule, fra le quali quelle di fegato e muscolo. La sintesi e la degradazione del glicogeno sono regolate rapidamente secondo le necessità. Quando è necessario più ATP di quanto possa essere generato dalle molecole di cibo assunte dal torrente circolatorio, le cellule demoliscono glicogeno in una reazione che produce glucosio 1-fosfato, che è rapidamente convertito in glucosio 6-fosfato per la glicolisi (Figura 2.52). CAPITOLO 2 Chimica e bioenergetica della cellula 82 © 978-88-08-62126-9 granuli di glicogeno nel citoplasma di una cellula di fegato punto di ramificazione subunità di glucosio (A) (B) 1 µm involucro del cloroplasto vacuolo grani tilacoide amido gocciolina di grasso parete cellulare grani (C) (D) 1 µm Figura 2.51 La conservazione di zuccheri e grassi nelle cellule animali e vegetali. (A) Le strutture di amido e glicogeno, la forma di deposito degli zuccheri rispettivamente nei vegetali e negli animali. Entrambi sono polimeri di deposito dello zucchero glucosio e differiscono soltanto per la frequenza dei punti di ramificazione. Ci sono molte più ramificazioni nel glicogeno rispetto all’amido. (B) Una micrografia elettronica che mostra granuli di glicogeno nel citoplasma di una cellula di fegato. 50 µm (C) Una sezione sottile di un singolo cloroplasto di una cellula vegetale, che mostra i granuli di amido e le goccioline di lipidi che si sono accumulati come risultato delle biosintesi avvenute nell’organello. (D) Goccioline di grasso (colorate in rosso) che cominciano ad accumularsi in cellule adipose in fase di sviluppo di un animale. (B, per gentile concessione di Robert Fletterick e Daniel S. Friend; C, per gentile concessione di K. Plaskitt; D, per gentile concessione di Ronald M. Evans e Peter Totonoz.) Per gli animali il grasso è quantitativamente una forma di deposito molto più importante del glicogeno, presumibilmente perché rappresenta un deposito più efficiente. L’ossidazione di un grammo di grasso rilascia circa il doppio dell’energia rilasciata da un grammo di glicogeno. Inoltre il glicogeno differisce dal grasso in quanto lega una grande quantità di acqua, il che produce HOCH2 HOCH2 O O OH OH O HO OH polimero di glicogeno O OH P OCH2 HOCH2 Pi O glicogeno fosforilasi O P OH HOCH2 glucosio-1-fosfato O OH O HO OH GLICOLISI OH OH HO Figura 2.52 Come sono prodotti gli zuccheri a partire dal glicogeno. Le subunità di glucosio sono rilasciate a partire dal glicogeno mediante l’enzima glicogeno fosforilasi che produce glucosio-1-fosfato, rapidamente convertito in glucosio-6fosfato per la glicolisi. O polimero di glicogeno HO OH OH glucosio-6-fosfato CAPITOLO 2 Chimica e bioenergetica della cellula 83 © 978-88-08-62126-9 Figura 2.53 Alcuni semi che costituiscono un importante alimento per gli esseri umani. Mais, noci e piselli contengono riserve di amido e di grassi che forniscono al giovane embrione vegetale nel seme energia e unità da costruzione per le biosintesi. (Per gentile concessione della John Innes Foundation.) una differenza di sei volte nella massa effettiva di glicogeno richiesta per conservare la stessa quantità di energia del grasso. Un essere umano adulto medio immagazzina glicogeno sufficiente per un giorno soltanto di attività normale ma abbastanza grasso da sopravvivere quasi un mese. Se la nostra riserva principale di combustibile dovesse essere il glicogeno invece che il grasso, il peso corporeo dovrebbe aumentare in media di 30 kg. Lo zucchero e l’ATP necessari alle cellule vegetali sono prodotti in larga parte in organelli separati: gli zuccheri nei cloroplasti (gli organelli specializzati nella fotosintesi) e l’ATP nei mitocondri. Sebbene i vegetali producano NADPH e ATP nei loro cloroplasti, questo tipo di organelli è isolato dal resto della cellula vegetale da una membrana impermeabile a entrambi i tipi di molecole trasportatrici attivate. Inoltre i vegetali contengono molte altre cellule – come quelle delle radici – che sono prive di cloroplasti e perciò non producono i propri zuccheri. Perciò gli zuccheri sono esportati dai cloroplasti ai mitocondri che si trovano in tutte le cellule dei vegetali. La maggior parte dell’ATP necessario per il metabolismo generale della cellula vegetale viene sintetizzata in questi mitocondri, impiegando esattamente le stesse vie di demolizione ossidativa degli zuccheri che sono usate dagli organismi non fotosintetici; questo ATP viene poi passato al resto della cellula (vedi Figura 14.42). Nei periodi in cui la capacità fotosintetica è in eccesso, durante il giorno, i cloroplasti convertono una parte degli zuccheri che producono in grassi e in amido, un polimero di glucosio analogo al glicogeno degli animali. I grassi dei vegetali sono triacilgliceroli (trigliceridi), proprio come i grassi degli animali, e differiscono soltanto nei tipi di acidi grassi che predominano. Il grasso e l’amido sono entrambi conservati nel cloroplasto come riserve da mobilizzare come fonte di energia durante i periodi di buio (vedi Figura 2.51C). Gli embrioni all’interno di semi vegetali devono contare su fonti di energia conservate per un periodo prolungato, fino a che germinano producendo foglie che possono raccogliere l’energia della luce solare. Per questa ragione i semi vegetali contengono spesso quantità particolarmente abbondanti di grassi e amido, che li rendono una delle fonti principali di cibo per gli animali, compreso l’uomo (Figura 2.53). ■ Durante il digiuno la maggior parte delle cellule animali trae lÕenergia dagli acidi grassi Dopo un pasto la maggior parte dell’energia necessaria a un animale deriva dagli zuccheri presenti nel cibo. Se ci sono zuccheri in eccesso, questi sono usati per rifornire le scorte esaurite di glicogeno, o per sintetizzare grassi come deposito di cibo. Ma il grasso depositato nel tessuto adiposo viene molto presto richiamato e già al mattino dopo il digiuno notturno l’ossidazione degli acidi grassi genera la maggior parte dell’ATP di cui abbiamo bisogno. Bassi livelli di glucosio nel sangue innescano la demolizione dei grassi per la produzione di energia. Come illustrato nella Figura 2.54, i triacilgliceroli depositati nelle goccioline di grasso degli adipociti sono idrolizzati per produrre acidi grassi e glicerolo, e gli acidi grassi rilasciati sono trasferiti alle cellule del CAPITOLO 2 Chimica e bioenergetica della cellula 84 © 978-88-08-62126-9 Figura 2.54 Il modo in cui i grassi depositati sono mobilizzati per produrre energia negli animali. Bassi livelli di glucosio nel sangue innescano l’idrolisi delle molecole di triacilglicerolo delle goccioline di grasso in acidi grassi liberi e glicerolo. Questi acidi grassi entrano nel torrente circolatorio, dove si legano alla proteina albumina serica, abbondante nel sangue. Speciali trasportatori degli acidi grassi presenti nella membrana plasmatica delle cellule che ossidano gli acidi grassi, come le cellule muscolari, trasferiscono quindi questi acidi grassi nel citosol, e da qui sono spostati nei mitocondri per la produzione di energia. idrolisi grasso depositato acidi grassi torrente circolatorio glicerolo CELLULA ADIPOSA CELLULA MUSCOLARE acidi grassi ossidazione nei mitocondri CO2 ATP corpo attraverso il torrente circolatorio. Mentre convertono facilmente zuccheri in grassi, gli animali non possono convertire acidi grassi in zuccheri. Gli acidi grassi vengono invece ossidati direttamente. ■ Zuccheri e grassi sono entrambi degradati ad acetil CoA nei mitocondri Nel metabolismo aerobico il piruvato prodotto dagli zuccheri nella glicolisi citoplasmatica è trasportato nei mitocondri delle cellule eucariotiche, dove è rapidamente decarbossilato da un enorme complesso di tre enzimi, chiamato complesso della piruvato decarbossilasi. I prodotti della decarbossilazione del piruvato sono una molecola di CO2 (un prodotto di rifiuto), una molecola di NADH, e acetil CoA (vedi il Quadro 2.9). Gli acidi grassi importati dal torrente circolatorio sono condotti nei mitocondri, dove avviene tutta la loro ossidazione (Figura 2.55). Ciascuna molecola di acido grasso (come la molecola attivata acido grasso CoA) viene demolita completamente da un ciclo di reazioni che taglia due carboni alla volta dalla sua estremità carbossilica, generando una molecola di acetil CoA a ogni giro del ciclo. In questo processo sono prodotte anche una molecola di NADH e una di FADH2 (Figura 2.56). Gli zuccheri e i grassi rappresentano le fonti principali di energia per la maggior parte degli organismi non fotosintetici, compresi gli esseri umani. Tuttavia la maggioranza dell’energia utile che può essere ricavata dall’ossidazione di entrambi i tipi di nutrienti rimane conservata nelle molecole di acetil CoA che sono prodotte dai due tipi di reazione appena descritti. Le reazioni del ciclo dell’acido citrico, in cui il gruppo acetilico dell’acetil CoA viene ossidato a CO2 e H2O, sono perciò centrali per il metabolismo energetico degli organismi aerobici. Negli eucarioti queste reazioni hanno tutte luogo nei mitocondri. Non dovremmo perciò sorprenderci di scoprire che il mitocondrio Figura 2.55 Le vie di produzione di acetil CoA da zuccheri e grassi. Nelle cellule eucariotiche il mitocondrio è il luogo in cui viene prodotto acetil CoA a partire da entrambi i tipi principali di molecole di cibo ed è quindi dove avviene la maggior parte delle reazioni di ossidazione e dove viene prodotta la maggior parte dell’ATP. Anche gli amminoacidi (non mostrati) possono entrare nel mitocondrio dove sono convertiti in acetil CoA o in un altro intermedio del ciclo dell’acido citrico. La struttura e la funzione dei mitocondri sono trattate in dettaglio nel Capitolo 14. membrana plasmatica Zuccheri e polisaccaridi zuccheri glucosio piruvato piruvato acetil CoA Grassi acidi grassi acidi grassi acidi grassi MITOCONDRIO CITOSOL CAPITOLO 2 Chimica e bioenergetica della cellula 85 © 978-88-08-62126-9 (A) (C) R CH2 C CH2 CH2 S–CoA resto della coda idrocarburica gocciolina di grasso acido grasso CoA accorciato di due carboni il ciclo si ripete finché l’acido grasso non è degradato completamente O R CH2 l’acido grasso attivato entra nel ciclo O acido grasso CoA C S–CoA O CH3 FAD C S–CoA 1 µm FADH2 acetil CoA O O CH2 O C R coda idrocarburica O C O coda idrocarburica CH CH R CH2 C OH H O CH2 C C S–CoA H2O HS–CoA O CH CH2 R S–CoA CH2 C C H H O C S–CoA O CH2 O C coda idrocarburica NADH + H+ NAD+ legame estere (B) triacilglicerolo è il luogo in cui viene prodotta la maggior parte di ATP nelle cellule animali. I batteri aerobi svolgono invece tutte le loro reazioni, incluso il ciclo dell’acido citrico, in un unico compartimento, il citosol. ■ Il ciclo dell’acido citrico genera NADH ossidando gruppi acetilici a CO2 Nel XIX secolo i biologi notarono che in assenza di aria (condizioni anaerobiche) le cellule producono acido lattico (per esempio, nel muscolo) o etanolo (per esempio, nel lievito), mentre in presenza di aria (condizioni aerobiche) consumano O2 e producono CO2 e H2O. Gli sforzi per definire le vie del metabolismo aerobico si concentrarono alla fine sull’ossidazione del piruvato e portarono nel 1937 alla scoperta del ciclo dell’acido citrico, noto anche come ciclo dell’acido tricarbossilico o ciclo di Krebs. Il ciclo dell’acido citrico è responsabile di circa i due terzi dell’ossidazione totale dei composti del carbonio nella maggior parte delle cellule e i suoi prodotti finali principali sono CO2 ed elettroni ad alta energia sotto forma di NADH. La CO2 viene rilasciata come prodotto di scarto, mentre gli elettroni ad alta energia del NADH passano a una catena di trasporto degli elettroni attaccata alla membrana (discussa nel Capitolo 14), e alla fine si combinano con O2 per produrre H2O. Sebbene il ciclo dell’acido citrico non usi di per sé O2 (usa atomi di ossigeno derivanti dall’H2O),richiede O2 per procedere perché non esiste un altro modo efficiente per liberare il NADH dai suoi elettroni e quindi rigenerare il NAD+ che è necessario perché il ciclo non si fermi. Il ciclo dell’acido citrico, che ha luogo all’interno dei mitocondri nelle cellule eucariotiche, porta alla completa ossidazione degli atomi di carbonio dei gruppi acetilici dell’acetil CoA, convertendoli in CO2. Ma il gruppo acetilico non viene ossidato direttamente. Questo gruppo viene invece trasferito dall’acetil CoA a una molecola più grande a quattro carboni, l’ossalacetato, per formare l’acido tricarbossilico a sei carboni, l’acido citrico, dal Figura 2.56 L’ossidazione degli acidi grassi ad acetil CoA. (A) Micrografia elettronica di una gocciolina di lipidi nel citoplasma. (B) La struttura dei grassi. I grassi sono triacilgliceroli. Il glicerolo, a cui sono collegati tre acidi grassi tramite legami estere, è mostrato qui in azzurro. I grassi sono insolubili in acqua e formano grosse gocce lipidiche nelle cellule adipose (chiamate adipociti) in cui sono depositati. (C) Il ciclo di ossidazione degli acidi grassi. Il ciclo è catalizzato da una serie di quattro enzimi nel mitocondrio. Ciascun giro del ciclo accorcia la catena dell’acido grasso di due carboni (mostrati in rosso) e genera una molecola di acetil CoA e una molecola di NADH e di FADH2. (A, per gentile concessione di Daniel S. Friend.) CAPITOLO 2 Chimica e bioenergetica della cellula 86 © 978-88-08-62126-9 Figura 2.57 Uno schema semplificato del ciclo dell’acido citrico. La reazione di acetil CoA con ossalacetato inizia il ciclo producendo citrato (acido citrico). In ciascun giro del ciclo due molecole di CO2 hanno origine come prodotti di scarto, più tre molecole di NADH, una molecola di GTP e una molecola di FADH2. Il numero di atomi di carbonio in ciascun intermedio è riportato in un riquadro giallo. Per i dettagli vedi Quadro 2.9 (pp. 110-111). O H 3C C S–CoA acetil CoA 2C ossalacetato citrato 6C PASSAGGIO 1 4C PASSAGGIO 2 NADH 6C + +H PASSAGGIO 8 + NADH + H PASSAGGIO 3 4C PASSAGGIO 7 C O2 5C PASSAGGIO 4 PASSAGGIO 6 4C + PASSAGGIO 5 NADH + H 4C 4C FADH2 C O2 GTP RISULTATO NETTO: UN GIRO DEL CICLO PRODUCE TRE NADH, UN GTP E UN FADH2 E RILASCIA DUE MOLECOLE DI CO2 quale ha preso il nome il successivo ciclo di reazioni. La molecola dell’acido citrico viene quindi ossidata gradualmente, permettendo di imbrigliare l’energia di questa ossidazione per produrre molecole trasportatrici attivate ricche di energia. La catena di otto reazioni forma un ciclo perché alla fine l’ossalacetato è rigenerato ed entra in un nuovo ciclo, come mostrato schematicamente nella Figura 2.57. Finora abbiamo preso in esame soltanto uno dei tre tipi di molecole trasportatrici attivate che vengono prodotte nel ciclo dell’acido citrico, la coppia NAD+-NADH (vedi Figura 2.36). Oltre a tre molecole di NADH, ciascun giro del ciclo produce anche una molecola di FADH2 (flavina adenina dinucleotide ridotto) da FAD (vedi Figura 2.39) e una molecola del ribonucleotide GTP (guanosina trifosfato) da GDP. La struttura del GTP è illustrata nella Figura 2.58. Il GTP è un parente stretto dell’ATP e il trasferimento del suo gruppo fosfato terminale ad ADP produce una molecola di ATP in ciascun ciclo. Al pari del NADH, FADH2 è un trasportatore di elettroni ad alta energia e di idrogeno. Come vedremo fra breve, l’energia che è conservata negli elettroni ad alta energia prontamente trasferiti del NADH e del FADH2 sarà utilizzata successivamente per la produzione di ATP nel processo della fosforilazione ossidativa, l’unico passaggio del catabolismo ossidativo del cibo che richiede direttamente ossigeno gassoso (O2) dall’atmosfera. O guanina N O – O P O O – O P O – P N O N O– ribosio GDP GTP OH C C CH2 O OH Figura 2.58 La struttura del GTP. GTP e GDP sono parenti stretti rispettivamente di ATP e ADP. NH HC O O C C NH2 CAPITOLO 2 Chimica e bioenergetica della cellula 87 © 978-88-08-62126-9 GLUCOSIO nucleotidi glucosio 6-fosfato amminozuccheri glicolipidi glicoproteine fruttosio 6-fosfato GLICOLISI serina diidrossiacetone fosfato lipidi amminoacidi pirimidine 3-fosfoglicerato fosfoenolpiruvato alanina piruvato colesterolo acidi grassi aspartato altri amminoacidi purine pirimidine citrato ossalacetato CICLO DELL’ACIDO CITRICO α-chetoglutarato succinil CoA eme clorofilla glutammato altri amminoacidi purine Il ciclo completo dell’acido citrico è presentato nel Quadro 2.9 (pp. 110111) e nel Filmato 2.6 . Gli atomi di ossigeno extra necessari per produrre CO2 dai gruppi acetilici che entrano nel ciclo dell’acido citrico sono forniti non da ossigeno molecolare, ma dall’acqua. Come illustrato nel Quadro, tre molecole di acqua vengono spezzate in ciascun ciclo e gli atomi di ossigeno di alcune di esse sono alla fine usati per produrre CO2. Oltre al piruvato e agli acidi grassi, alcuni amminoacidi passano dal citosol nei mitocondri, dove sono anch’essi convertiti in acetil CoA o in uno degli altri intermedi del ciclo dell’acido citrico. Così nella cellula eucariotica il mitocondrio è il centro verso cui convergono tutti i processi che producono energia, che inizino con zuccheri, grassi o proteine. Sia il ciclo dell’acido citrico che la glicolisi costituiscono anche un punto di partenza per reazioni biosintetiche importanti poiché producono intermedi vitali contenenti carbonio, come ossalacetato e a-chetoglutarato. Alcune di queste sostanze prodotte dal catabolismo sono trasferite di nuovo dal mitocondrio al citosol, dove servono da precursori nelle reazioni anaboliche per la sintesi di molte molecole essenziali, come gli amminoacidi (Figura 2.59). ■ Il trasporto degli elettroni spinge la sintesi della maggior parte dell’ATP in quasi tutte le cellule La maggior parte dell’energia chimica è rilasciata nell’ultimo passaggio della degradazione di una molecola di cibo. In questo processo finale i trasportatori di elettroni NADH e FADH2 trasferiscono gli elettroni, che hanno guadagnato quando hanno ossidato altre molecole, alla catena di trasporto degli elettroni, che è posta nella membrana mitocondriale interna (vedi Figura 14.10). Quando gli elettroni percorrono questa lunga catena di accettori e donatori specializzati di elettroni, scendono a stati di energia progressivamente più bassi. L’energia che gli elettroni rilasciano in questo processo è usata per pompare ioni H+ (protoni) attraverso la membrana, dal compartimento mi- Figura 2.59 La glicolisi e il ciclo dell’acido citrico forniscono i precursori necessari per sintetizzare molte molecole biologiche importanti. Gli amminoacidi, i nucleotidi, i lipidi, gli zuccheri e altre molecole – mostrate qui come prodotti – servono a loro volta da precursori per molte macromolecole della cellula. Ciascuna freccia nera in questo schema indica una singola reazione catalizzata da un enzima; le frecce rosse rappresentano generalmente vie con molti passaggi che sono necessarie per dar vita ai prodotti indicati. CAPITOLO 2 Chimica e bioenergetica della cellula 88 © 978-88-08-62126-9 H+ elettrone ad alta energia eA proteina di membrana C B membrana eA B H C A B C H+ e- elettrone a bassa energia Figura 2.60 La generazione di un gradiente di H+ attraverso una membrana per mezzo delle reazioni di trasporto degli elettroni. Un elettrone ad alta energia (derivato, per esempio, dall’ossidazione di un metabolita) viene passato sequenzialmente dai trasportatori A, B e C a uno stato a energia più bassa. In questo schema il trasportatore B è disposto nella membrana in modo da assumere H+ da un lato e rilasciarlo dall’altro mentre passa l’elettrone. Il risultato è un gradiente di H+. Come vedremo nel Capitolo 14, questo gradiente rappresenta una forma di energia conservata che è imbrigliata da altre proteine di membrana per spingere la formazione di ATP (per un esempio reale si veda la Figura 14.21). Figura 2.61 Gli stadi finali dell’ossidazione delle molecole di cibo. Molecole di NADH e di FADH2 (il FADH2 non è mostrato) sono prodotte dal ciclo dell’acido citrico. Questi trasportatori attivati donano elettroni ad alta energia che sono alla fine usati per ridurre ossigeno gassoso ad acqua. La maggior parte dell’energia rilasciata durante il trasferimento di questi elettroni lungo una catena di trasferimento di elettroni nella membrana mitocondriale interna (o nella membrana plasmatica dei batteri) è imbrigliata per spingere la sintesi di ATP: di qui il nome fosforilazione ossidativa (trattata nel Capitolo 14). tocondriale interno (la matrice) allo spazio tra le due membrane (e poi al citosol), generando un gradiente di ioni H+ (Figura 2.60). Questo gradiente serve come fonte di energia, essendo utilizzato come una batteria per spingere varie reazioni che richiedono energia. La più rilevante di queste reazioni è la generazione di ATP mediante fosforilazione di ADP. Alla fine di questa serie di trasferimenti di elettroni, questi giungono a molecole di ossigeno gassoso (O2) che si sono diffuse nel mitocondrio e che si combinano simultaneamente con protoni (H+) dalla soluzione circostante per produrre molecole di acqua. Gli elettroni hanno adesso raggiunto il loro livello più basso di energia e perciò tutta l’energia disponibile è stata estratta dalla molecola di cibo che è stata ossidata. Questo processo, chiamato fosforilazione ossidativa (Figura 2.61), avviene anche nella membrana plasmatica dei batteri. Essendo una delle realizzazioni più notevoli dell’evoluzione cellulare, sarà un argomento centrale del Capitolo 14. In totale, l’ossidazione completa di una molecola di glucosio a H2O e CO2 è usata dalla cellula per produrre circa 30 molecole di ATP. Soltanto 2 molecole di ATP per molecola di glucosio sono invece prodotte dalla sola glicolisi. ■ Gli amminoacidi e i nucleotidi sono parte del ciclo dell’azoto Finora ci siamo concentrati soprattutto sul metabolismo dei carboidrati e non abbiamo ancora considerato il metabolismo dell’azoto o dello zolfo. Questi due elementi sono costituenti importanti delle macromolecole biologiche. Gli atomi di azoto e di zolfo passano da composto a composto e dagli organismi all’ambiente in una serie di cicli reversibili. Sebbene l’azoto molecolare sia abbondante nell’atmosfera terrestre, l’azoto è chimicamente non reattivo sotto forma di gas. Soltanto poche specie viventi sono capaci di incorporarlo in molecole organiche, un processo chiamato fissazione dell’azoto. La fissazione dell’azoto avviene in certi microrganismi e attraverso alcuni processi geofisici, come le scariche dei fulmini. È essenziale per la biosfera nel suo insieme, perché senza di essa la vita non esisterebbe su questo pianeta. Soltanto una piccola parte dei composti azotati negli organismi odierni, però, è dovuta a prodotti nuovi della fissazione dell’azoto dall’atmosfera. La maggior parte dell’azoto organico è in circolazione da tempo, passando da un organismo vivente all’altro. Così si può dire che le reazioni odierne di fissazione dell’azoto svolgano una funzione di “aggiunta” alle scorte totali di azoto. I vertebrati ricevono praticamente tutto il loro azoto dall’assunzione con la dieta di proteine e acidi nucleici. Nel corpo queste macromolecole sono demolite in amminoacidi e nei componenti dei nucleotidi e l’azoto che contengono è usato per produrre nuovi acidi nucleici e proteine o utilizzato per produrre altre molecole. Circa metà dei 20 amminoacidi presenti nelle proteine sono amminoacidi essenziali per i vertebrati (Figura 2.62), il che significa che non possono essere sintetizzati a partire da altri ingredienti della dieta. Gli altri possono essere sintetizzati usando vari materiali grezzi, compresi piruvato da glicolisi CO2 NADH da glicolisi O2 piruvato ADP + Pi acetil CoA CoA CICLO DELL’ACIDO CITRICO 2 eÐ NADH FOSFORILAZIONE NAD+ OSSIDATIVA ATP MITOCONDRIO H2O CAPITOLO 2 Chimica e bioenergetica della cellula 89 © 978-88-08-62126-9 intermedi del ciclo dell’acido citrico. Gli amminoacidi essenziali sono prodotti da vegetali e da altri organismi non vertebrati, in genere tramite lunghe vie energeticamente costose che sono state perdute nel corso dell’evoluzione dei vertebrati. I nucleotidi necessari per produrre RNA e DNA possono essere sintetizzati usando vie biosintetiche specializzate. Tutti gli atomi di azoto nelle basi puriniche e pirimidiniche (oltre ad alcuni dei carboni) derivano dagli amminoacidi abbondanti glutammina, acido aspartico e glicina, mentre il ribosio e il deossiribosio derivano dal glucosio. Non ci sono “nucleotidi essenziali” che devono essere forniti con la dieta. Gli amminoacidi che non sono utilizzati nelle biosintesi possono essere ossidati per generare energia metabolica. La maggior parte dei loro atomi di carbonio e di idrogeno alla fine forma CO2 e H2O, mentre i loro atomi di azoto sono trasportati sotto varie forme e alla fine compaiono come urea, che viene escreta. Ciascun amminoacido è processato in modo diverso ed esiste un’intera costellazione di reazioni enzimatiche per il loro catabolismo. Lo zolfo è abbondante sulla Terra nella sua forma più ossidata, il solfato (SO42–). Per convertirlo in forme utili per la vita il solfato deve essere ridotto a solfuro (S2–), lo stato di ossidazione richiesto per la sintesi di molecole biologiche essenziali. Queste molecole comprendono gli amminoacidi metionina e cisteina, il coenzima A (vedi Figura 2.39) e i centri ferro-zolfo essenziali per il trasporto degli elettroni (vedi Figura 14.16). Il processo di riduzione dello zolfo inizia nei batteri, nei funghi e nei vegetali, dove un gruppo speciale di enzimi usa ATP e potere riducente per creare una via di assimilazione del solfato. Gli esseri umani e altri animali non possono ridurre il solfato e devono perciò acquisire lo zolfo di cui hanno bisogno per il loro metabolismo con il cibo. ■ Il metabolismo • altamente organizzato e regolato Si può avere un’idea di quanto una cellula sia intricata come macchina chimica dalle relazioni della glicolisi e del ciclo dell’acido citrico con le altre vie metaboliche schematizzate nella Figura 2.63. Questo schema rappresenta soltanto una parte delle vie enzimatiche di una cellula umana. Ovviamente la nostra discussione del metabolismo cellulare ha riguardato soltanto una minima parte della chimica cellulare. Tutte queste reazioni avvengono in una cellula che ha un diametro di meno di 0,1 mm e ciascuna richiede un enzima diverso. Come risulta chiaramente dalla Figura 2.63, la stessa molecola spesso può essere parte di molte vie diverse. Il piruvato, per esempio, è un substrato per più di mezza dozzina di enzimi differenti, ciascuno dei quali lo modifica chimicamente in un modo diverso. Un enzima converte il piruvato in acetil CoA, un altro in ossalacetato; un terzo enzima cambia il piruvato nell’amminoacido alanina, un quarto in lattato e così via.Tutte queste vie diverse competono per la stessa molecola di piruvato e competizioni simili per migliaia di altre piccole molecole si verificano contemporaneamente. La situazione è ulteriormente complicata in un organismo multicellulare. Tipi diversi di cellule richiederanno in generale serie un po’ diverse di enzimi e ogni tessuto diverso dà contributi distinti alla chimica dell’organismo nel suo insieme. Oltre a differenze in prodotti specializzati come ormoni o anticorpi, ci sono differenze significative nelle vie metaboliche “comuni” fra i vari tipi di cellule dello stesso organismo. Sebbene praticamente tutte le cellule contengano gli enzimi della glicolisi, del ciclo dell’acido citrico, della sintesi e della demolizione dei lipidi e del metabolismo degli amminoacidi, i livelli di questi processi necessari in tessuti diversi non sono gli stessi. Per esempio, le cellule nervose, che sono probabilmente le cellule più esigenti del corpo, non mantengono riserve di glicogeno o di acidi grassi e si basano quasi interamente su un rifornimento costante di glucosio dal sangue. Le cellule del fegato, invece, forniscono glucosio alle cellule muscolari in attiva contrazione e riciclano l’acido lattico prodotto dalle cellule muscolari di nuovo in glucosio.Tutti i tipi di cellule hanno i loro tratti metabolici distintivi e cooperano estesamente nello stato normale, oltre che GLI AMMINOACIDI ESSENZIALI TREONINA METIONINA LISINA VALINA LEUCINA ISOLEUCINA ISTIDINA FENILALANINA TRIPTOFANO Figura 2.62 I nove amminoacidi essenziali. Questi non possono essere sintetizzati dalle cellule umane e devono così essere forniti dalla dieta. CAPITOLO 2 Chimica e bioenergetica della cellula 90 © 978-88-08-62126-9 glucosio 6-fosfato piruvato acetil CoA Figura 2.63 Nelle cellule umane la glicolisi e il ciclo dell’acido citrico sono al centro di un’elaborata serie di vie metaboliche. Sono mostrate schematicamente circa 2000 reazioni metaboliche con le reazioni della glicolisi e del ciclo dell’acido citrico in rosso. Molte altre reazioni conducono QUELLO CHE NON SAPPIAMO • La chemiosmosi ha preceduto la fermentazione come sorgente di energia biologica oppure alcune forme di fermentazione sono arrivate prima, come si è pensato per molti anni? • Qual è il numero minimo di componenti richiesti per generare una cellula vivente da zero? Come potremmo determinarlo? • Sono possibili altre chimiche della vita a fianco dell’unica conosciuta sulla Terra (e descritta in questo capitolo)? Tentando di scoprire la vita su altri pianeti che tipo di caratteristiche chimiche dovremmo cercare? • La chimica interna comune a tutte le cellule viventi è un indizio per ricostruire l’ambiente sulla Terra dove si sono originate le prime cellule? Per esempio, che cosa potremo concludere dal fatto che l’alto rapporto K+/Na+, il pH neutro e il ruolo centrale dei fosfati siano caratteristiche universalmente condivise? a queste due vie centrali – portando piccole molecole da catabolizzare con produzione di energia – o fuori di esse e quindi forniscono composti del carbonio per le biosintesi. (Adattata con permesso da Kanehisa Laboratories.) in risposta a stress e digiuno. Si potrebbe pensare che l’intero sistema debba essere bilanciato così finemente che qualunque minima alterazione, come un cambiamento temporaneo nella dieta, sarebbe disastrosa. In realtà l’equilibrio metabolico di una cellula è stabile in modo stupefacente. Ogni volta che l’equilibrio è perturbato, la cellula reagisce in modo da ripristinare lo stato iniziale. La cellula può adattarsi e continuare a funzionare durante digiuno o malattie. Mutazioni di molti tipi possono danneggiare o anche eliminare particolari vie di reazione, eppure – purché siano soddisfatti dei requisiti minimi – la cellula sopravvive. Ci riesce grazie a una rete elaborata di meccanismi di controllo che regola e coordina le velocità di tutte le sue reazioni. Questi controlli si basano, alla fine, sulle notevoli capacità delle proteine di cambiare forma e chimica in risposta a mutamenti del loro ambiente più prossimo. I principi che sono alla base del modo in cui molecole grandi come le proteine vengono costruite e della chimica che sta dietro alla loro regolazione saranno il prossimo argomento che considereremo. SOMMARIO Il glucosio e le altre molecole di cibo sono demoliti da un’ossidazione controllata in più passaggi per fornire energia chimica sotto forma di ATP e NADH. L’ossidazione è composta da tre serie principali di reazioni che agiscono l’una dopo l’altra; i prodotti di ciascuna sono il materiale di partenza della successiva: la glicolisi (che avviene nel citosol), il ciclo dell’acido citrico (nella matrice mitocondriale) e la fosforilazione ossidativa (nella membrana mitocondriale interna). I prodotti intermedi della glicolisi e del ciclo dell’acido citrico sono usati sia come fonte di energia metabolica che per produrre molte delle piccole molecole usate come materiali grezzi per le biosintesi. Le cellule conservano le molecole di zucchero in forma di glicogeno negli animali e di amido nei vegetali; sia vegetali che animali usano estesamente anche grassi come deposito di energia. Questi materiali di deposito servono a loro volta come fonte principale di cibo per gli esseri umani, insieme alle proteine che costituiscono la maggioranza della massa secca delle cellule dei cibi che mangiamo. ● 2 Chimica e bioenergetica della cellula CAPITOLO 91 © 978-88-08-62126-9 PROBLEMI Quali affermazioni sono vere? Spiegate perché sì o perché no. gale (160 mg/100 mL), quanto tempo deve passare perché il suo livello di alcol nel sangue scenda sotto il limite legale? 2.1 Una soluzione 10–8 M di HCl ha un pH di 8. cole mediate da legami non covalenti potrebbe essere mediata altrettanto bene da legami covalenti. 2.3 Gli animali e i vegetali usano l’ossidazione per estrarre energia dalle molecole di cibo. 2.4 Se in una reazione avviene un’ossidazione, questa deve essere accompagnata da una riduzione. 2.5 Il collegamento di una reazione energeticamen- te sfavorevole AnB a una seconda reazione favorevole BnC sposterà la costante di equilibrio della prima reazione. 2.6 Il criterio importante per decidere se una reazio- ne procede spontaneamente è ∆G e non ∆G°, perché ∆G tiene in considerazione le concentrazioni dei substrati e dei prodotti. 2.10 Si sa che una catena laterale di istidina ha un ruo- lo importante nel meccanismo catalitico di un enzima; tuttavia, non è chiaro se l’istidina è necessaria nella forma protonata (carica) o non protonata (scarica). Per rispondere a questa domanda misurate l’attività enzimatica in una gamma di pH, con il risultato mostrato nella Figura P2.1. Quale forma di istidina è necessaria per l’attività enzimatica? Figura P2.1 Attività enzimatica in funzione del pH (Problema 2.10). 100 attività (% del massimo) 2.2 La maggior parte delle interazioni fra macromole- 0 4 5 6 pH 7 8 9 10 2.7 L’ossigeno consumato durante l’ossidazione del glu- cosio nelle cellule animali ritorna come CO2 nell’atmosfera. Discutete i seguenti problemi. 2.8 La chimica organica delle cellule viventi è consi- derata speciale per due ragioni: avviene in un ambiente acquoso e svolge alcune reazioni molto complesse. Ma pensate che sia veramente così tanto diversa dalla chimica organica praticata nei migliori laboratori del mondo? Perché sì o perché no? 2.11 Le tre molecole della Figura P2.2 contengono i set- te gruppi reattivi più comuni in biologia. Per la maggior parte le molecole della cellula sono costruite a partire da questi gruppi funzionali. Indicate con il loro nome i gruppi funzionali di queste molecole. O –O O C HO 2.9 Il peso molecolare dell’etanolo (CH3CH2OH) è 46 O –O Figura P2.2 Tre molecole che illustrano i sette gruppi funzionali più comuni in biologia (Problema 2.11). 1,3-Bifosfoglicerato e piruvato sono intermedi della glicolisi e la cisteina è un amminoacido. CH CH 2 3 e la sua densità è 0,789 g/cm . A. Qual è la molarità dell’etanolo in una birra che è 5% etanolo in volume? [Il contenuto di alcol della birra varia da circa 4% (birra leggera) all’8% (birra forte).] B. Il limite legale per il contenuto di alcol nel sangue di un guidatore varia, ma 80 mg di etanolo per 100 mL di sangue (di solito riferito come un livello di alcol nel sangue di 0,08) è un valore tipico. Qual è la molarità dell’etanolo in una persona a questo limite legale? C. Quante bottiglie da 335 mL di birra al 5% potrebbe bere una persona di 70 kg e rimanere sotto il limite legale? Una persona di 70 kg contiene circa 40 litri di acqua. Ignorate il metabolismo dell’etanolo e assumete che il contenuto d’acqua della persona resti costante. D. L’etanolo è metabolizzato a una velocità costante di circa 120 mg per ora per kg di peso corporeo, indipendentemente dalla sua concentrazione. Se una persona di 70 kg fosse due volte sopra il limite le- P O– O– O O C P C O SH CH 2 O O– CH 3 1,3-bifosfoglicerato piruvato CH O C NH 3 + O– cisteina 2.12 La “diffusione” pare una cosa lenta, e sulla scala delle distanze a cui siamo abituati lo è, ma sulla scala di una cellula è molto veloce. La velocità istantanea media di una particella in soluzione, cioè l’intervallo fra le collisioni, è v = (kT/m)1/2 in cui k = 1,38 3 10–16 g cm2/K sec2, T = temperatura in gradi K (37 °C corrispondono a 310 K), m = massa in g/molecola. Calcolate la velocità istantanea di una molecola d’acqua (massa molecolare = 18 dalton), di una molecola di glucosio (massa molecolare = 180 dalton) e di una molecola di mioglobina (massa molecolare = 15 000 dalton) a CAPITOLO 2 Chimica e bioenergetica della cellula 92 © 978-88-08-62126-9 37 °C.Tanto per divertirvi, convertite questi numeri in chilometri/ora. Prima di fare il calcolo, provate a indovinare se le molecole si muovono strisciando lentamente (<1 km/ora), camminando normalmente (5 km/ora) o a una velocità record (40 km/ora). 2.13 La polimerizzazione delle subunità di tubulina nei microtubuli avviene con un aumento di ordine delle subunità. Eppure la polimerizzazione della tubulina avviene con un aumento di entropia (diminuzione di ordine). Come può essere? 2.14 Un essere umano adulto di 70 kg potrebbe soddi- sfare le sue necessità di energia di un giorno mangiando 3 moli di glucosio (540 g). (Non è raccomandabile.) Ciascuna molecola di glucosio genera 30 molecole di ATP quando è ossidata a CO2. La concentrazione di ATP nelle cellule è mantenuta a circa 2 mM e un adulto di 70 kg ha circa 25 litri di fluido intracellulare. Dato che la concentrazione di ATP resta costante nelle cellule, calcolate quante volte al giorno, in media, ciascuna molecola di ATP del corpo è idrolizzata e risintetizzata. 2.15 Assumendo che ci siano 5 3 1013 cellule nel cor- Figura P2.3 Il Cervino. (Problema 2.16) (Per gentile concessione dell’Ufficio Turistico di Zermatt.) venga svolto contro la gravità (cioè state semplicemente salendo in linea retta). Ricordate dal corso introduttivo di fisica che lavoro (J) = massa (kg) 3 g (m/sec2) 3 altezza guadagnata (m) po umano e che l’ATP abbia un turnover pari a 109 molecole al minuto in ciascuna cellula, quanti watt consuma il corpo umano? (Un watt è un joule per secondo.) Assumete che l’idrolisi dell’ATP produca 50 kJ/mole. in cui g è l’accelerazione dovuta alla gravità (9,8 m/sec2). Un joule è 1 kg m2/sec2 Quali considerazioni fatte qui porteranno a sottostimare di molto la quantità di barrette di cui avrete bisogno? 2.16 Una barretta energetica (65 g, 1360 kJ) fornisce 2.17 In assenza di ossigeno le cellule consumano glu- abbastanza energia per salire da Zermatt (altezza 1660 m) alla cima del Cervino (4478 m, Figura P2.3) o bisognerebbe fermarsi al rifugio Hörnli (3260 m) per mangiarne un’altra? Immaginate che voi e il vostro equipaggiamento abbiate una massa di 75 kg e che tutto il lavoro cosio a un ritmo alto e costante. Quando si aggiunge ossigeno, il consumo di glucosio precipita ed è quindi mantenuto al ritmo più basso. Perché il glucosio è consumato ad alta velocità in assenza di ossigeno e a bassa velocità in sua presenza? BIBLIOGRAFIA Generale Berg JM, Tymoczko JL e Stryer L (2011) Biochemistry, 7a ed. New York: WH Freeman. [Trad. it.: Biochimica, Zanichelli, Bologna 2012.] Garrett RH e Grisham CM (2012) Biochemistry, 5a ed. Philadelphia: Thomson Brooks/Cole. [Trad. it.: Biochimica, Piccin, Padova 2014.] Moran LA, Horton HR, Scrimgeour G e Perry M (2011) Principles of Biochemistry, 5a ed. Upper Saddle River, NJ: Prentice Hall. Nelson DL e Cox MM (2012) Lehninger Principles of Biochemistry, 6a ed. New York: Worth. [Trad. it.: I principi di biochimica di Lehninger, Zanichelli, Bologna 2015.] van Holde KE, Johnson WC e Ho PS (2005) Principles of Physical Biochemistry, 2a ed. Upper Saddle River, NJ: Prentice Hall. Van Vranken D e Weiss G (2013) Introduction to Bioorganic Chemistry and Chemical Biology. New York: Garland Science. Voet D, Voet JG e Pratt CM (2012) Fundamentals of Biochemistry, 4a ed. New York: Wiley. [Trad. it.: Fondamenti di biochimica, Zanichelli, Bologna 2013.] I componenti chimici di una cellula Atkins PW (2003) Molecules, 2a ed. New York: WH Freeman. [Trad. it.: Molecole, Zanichelli, Bologna 1992 (condotta sulla 1a ed. americana).] Baldwin RL (2014) Dynamic hydration shell restores Kauzmann’s 1959 explanation of how the hydrophobic factor drives protein folding. Proc. Natl Acad. Sci. USA 111, 13052-13056. Bloomfield VA, Crothers DM e Tinoco I (2000) Nucleic Acids: Structures, Properties, and Functions. Sausalito, CA: University Science Books. Branden C e Tooze J (1999) Introduction to Protein Structure, 2a ed. New York: Garland Science. [Trad. it.: Introduzione alla struttura delle proteine, Zanichelli, Bologna 2001.] de Duve C (2005) Singularities: Landmarks on the Pathways of Life. Cambridge: Cambridge University Press. [Trad. it.: Alle origini della vita, Longanesi, Milano 2008.] Dowhan W (1997) Molecular basis for membrane phospholipid diversity: why are there so many lipids? Annu. Rev. Biochem. 66, 199-232. Eisenberg D e Kauzmann W (1969) The Structure and Properties of Water. Oxford: Oxford University Press. Franks F (1993) Water. Cambridge: Royal Society of Chemistry. Henderson LJ (1927) The Fitness of the Environment, 1958 ed. Boston, MA: Beacon. Neidhardt FC, Ingraham JL e Schaechter M (1990) Physiology of the Bacterial Cell: A Molecular Approach. Sunderland, MA: Sinauer. Phillips R e Milo R (2009) A feeling for the numbers in biology. Proc. Natl Acad. Sci. USA 106, 21465-21471. CAPITOLO 2 Chimica e bioenergetica della cellula 93 © 978-88-08-62126-9 Skinner JL (2010) Following the motions of water molecules in aqueous solutions. Science 328, 985-986. Taylor ME e Drickamer K (2011) Introduction to Glycobiology, 3a ed. New York: Oxford University Press. Vance DE e Vance JE (2008) Biochemistry of Lipids, Lipoproteins and Membranes, 5a ed. Amsterdam: Elsevier. van Meer G, Voelker DR e Feigenson GW (2008) Membrane lipids: where they are and how they behave. Nat. Rev. Mol. Cell Biol. 9, 112-124. Walsh C (2001) Enabling the chemistry of life. Nature 409, 226-231. Westheimer FH (1987) Why nature chose phosphates. Science 235, 1173-1178. La catalisi e l’uso dell’energia da parte delle cellule Il modo in cui le cellule ottengono energia dal cibo Atkins PW (1994) The Second Law: Energy, Chaos and Form. New York: Scientific American Books. [Trad. it.: Il secondo principio (condotta sulla 1a ed. americana), Zanichelli, Bologna 1988.] Atkins PW e De Paula JD (2011) Physical Chemistry for the Life Sciences, 2a ed. Oxford: Oxford University Press. [Trad. it.: Chimica fisica biologica (condotta sulla 1a ed. inglese), Zanichelli, Bologna 2008.] Baldwin JE e Krebs H (1981) The evolution of metabolic cycles. Nature 291, 381-382. Berg HC (1983) Random Walks in Biology. Princeton, NJ: Princeton University Press. Dill KA e Bromberg S (2010) Molecular Driving Forces: Statistical Thermodynamics in Biology, Chemistry, Physics, and Nanoscience, 2a ed. New York: Garland Science. Einstein A (1956) Investigations on the Theory of the Brownian Movement. New York: Dover. Fruton JS (1999) Proteins, Enzymes, Genes: The Interplay of Chemistry and Biology. New Haven, CT: Yale University Press. Hohmann-Marriott MF e Blankenship RE (2011) Evolution of photosynthesis. Annu. Rev. Plant Biol. 62, 515-548. Karplus M e Petsko GA (1990) Molecular dynamics simulations in biology. Nature 347, 631-639. Kauzmann W (1967) Thermodynamics and Statistics: with Applications to Gases. In Thermal Properties of Matter, Vol 2. New York: WA Benjamin, Inc. Kornberg A (1989) For the Love of Enzymes. Cambridge, MA: Harvard University Press. Lipmann F (1941) Metabolic generation and utilization of phosphate bond energy. Adv. Enzymol. 1, 99-162. Lipmann F (1971) Wanderings of a Biochemist. New York: Wiley. Nisbet EG e Sleep NH (2001) The habitat and nature of early life. Nature 409, 1083-1091. Racker E (1980) From Pasteur to Mitchell: a hundred years of bioenergetics. Fed. Proc. 39, 210-215. Schrödinger E (1944 e 1958) What is Life? The Physical Aspect of the Living Cell and Mind and Matter, 1992 combined ed. Cambridge: Cambridge University Press. [Trad. it.: Che cos’è la vita? La cellula vivente dal punto di vista fisico, Adelphi, Milano 1995.] Caetano-Anollés D, Kim KM, Mittenthal JE e Caetano-Anollés G (2011) Proteome evolution and the metabolic origins of translation and cellular life. J. Mol. Evol. 72, 14-33. Cramer WA e Knaff DB (1990) Energy Transduction in Biological Membranes. New York: Springer-Verlag. Dismukes GC, Klimov VV, Baranov SV et al. (2001) The origin of atmospheric oxygen on Earth: the innovation of oxygenic photosyntheis. Proc. Natl Acad. Sci. USA 98, 2170-2175. Fell D (1997) Understanding the Control of Metabolism. London: Portland Press. Fothergill-Gilmore LA (1986) The evolution of the glycolytic pathway. Trends Biochem. Sci. 11, 47-51. Friedmann HC (2004) From Butyribacterium to E. coli: an essay on unity in biochemistry. Perspect. Biol. Med. 47, 47-66. Heinrich R, Meléndez-Hevia E, Montero F et al. (1999) The structural design of glycolysis: an evolutionary approach. Biochem. Soc. Trans. 27, 294-298. Huynen MA, Dandekar T e Bork P (1999) Variation and evolution of the citric-acid cycle: a genomic perspective. Trends Microbiol. 7, 281-291. Koonin EV (2014) The origins of cellular life. Antonie van Leeuwenhoek 106, 27-41. Kornberg HL (2000) Krebs and his trinity of cycles. Nat. Rev. Mol. Cell Biol. 1, 225-228. Krebs HA (1970) The history of the tricarboxylic acid cycle. Perspect. Biol. Med. 14, 154-170. Krebs HA e Martin A (1981) Reminiscences and Reflections. Oxford/New York: Clarendon Press/Oxford University Press. Lane N e Martin WF (2012) The origin of membrane bioenergetics. Cell 151, 1406-1416. Morowitz HJ (1993) Beginnings of Cellular Life: Metabolism Recapitulates Biogenesis. New Haven, CT: Yale University Press. Martijn J e Ettma TJG (2013) From archaeon to eukaryote: the evolutionary dark ages of the eukaryotic cell. Biochem. Soc. Trans. 41, 451-457. Mulkidjanian AY, Bychkov AY, Dibrova DV et al. (2012) Open questions on the origin of life at anoxic geothermal fields. Orig. Life Evol. Biosph. 42, 507-516. Zimmer C (2009) On the origin of eukaryotes. Science 325, 665-668. CAPITOLO 2 Chimica e bioenergetica della cellula 94 © 978-88-08-62126-9 QUADRO 2.1 Legami e gruppi chimici incontrati comunemente nelle molecole biologiche SCHELETRI DI CARBONIO Il carbonio ha un ruolo unico nella cellula per la sua capacità di formare forti legami covalenti con altri atomi di carbonio. Così gli atomi di carbonio si possono unire a formare catene. alberi ramificati anelli catene C C C C C C C C C C C C C C C C C C C C C C anche scritto come anche scritto come anche scritto come C C LEGAMI COVALENTI LEGAMI COVALENTI IDROCARBURI Un legame covalente si forma quando due atomi si avvicinano molto e condividono uno o più elettroni. In un legame singolo è condiviso un elettrone di ciascuno dei due atomi; in un legame doppio è condiviso un totale di quattro elettroni. Ciascun atomo forma un numero fisso di legami covalenti in una disposizione spaziale definita. Per esempio, il carbonio forma quattro legami singoli disposti a tetraedro, mentre l'azoto forma tre legami singoli e l'ossigeno forma due legami singoli disposti come mostrato sotto. Carbonio e idrogeno si combinano formando composti stabili (o gruppi chimici) chiamati idrocarburi. Questi sono non polari, non formano legami idrogeno e sono generalmente insolubili in acqua. C N O I doppi legami esistono e hanno una disposizione spaziale diversa. C N O Atomi uniti da due o più legami covalenti non possono ruotare liberamente intorno all’asse del legame. Questa limitazione esercita un’influenza importante sulla forma tridimensionale di molte macromolecole. H H C H H H H C H metano gruppo metilico H2C CH2 DOPPI LEGAMI ALTERNATI H2C La catena di carboni può includere doppi legami. Se questi sono su atomi alternati di carbonio, gli elettroni di legame si muovono all’interno della molecola, stabilizzando la struttura per un fenomeno chiamato risonanza. C C C C C H la struttura vera è intermedia fra queste C C C C C H H2C C C C C H H benzene CH2 H H2C ←→ C H C H C C C H2C CH2 H H C CH2 Doppi legami alternati in un anello possono generare una struttura molto stabile. H H CH2 H2C H CH2 H3C spesso scritto come parte della “coda” idrocarburica di una molecola di acido grasso CAPITOLO 2 Chimica e bioenergetica della cellula 95 © 978-88-08-62126-9 GRUPPI CHIMICI C–O GRUPPI CHIMICI C–N Molti composti biologici contengono un carbonio legato a un ossigeno. Per esempio, Le ammine e le ammidi sono due esempi importanti di composti contenenti un carbonio legato a un azoto. Le ammine in acqua si combinano con uno ione H+ per diventare cariche positivamente. H alcol C L’–OH è chiamato gruppo ossidrilico. OH H H aldeide C O H H O C O O C C O acido carbossilico OH acido ammina C HO C NH2 H C alcol N C C C citosina (una pirimidina) H2O O OH acido C Il C H N O estere GRUPPO SULFIDRILICO ammide H L’azoto si trova anche in parecchi composti ad anello, compresi costituenti importanti degli acidi nucleici: purine e pirimidine. O C H2O C N Gli esteri si formano in una reazione di condensazione fra un acido e un alcol. O C C H2N OH Il –COOH è chiamato gruppo carbossilico. In + acqua perde uno ione _ H per diventare –COO . C C H+ N Le ammidi si formano combinando un acido e un’ammina. A differenza delle ammine, le ammidi sono prive di carica in acqua. Un esempio è il legame peptidico che unisce gli amminoacidi in una proteina. — è chiamato Il C—O gruppo carbonilico. C esteri C H C chetone H H+ N H SH è chiamato gruppo sulfidrilico. Nell’amminoacido cisteina il gruppo sulfidrilico può esistere nella forma ridotta C SH o più raramente in una forma ossidata che ha la struttura di un ponte C S S C FOSFATI Il fosfato inorganico è uno ione stabile formato da acido fosforico H3PO4. È spesso scritto Pi . Gli esteri fosfati si possono formare fra un fosfato e un gruppo ossidrilico libero. I gruppi fosfato sono spesso attaccati alle proteine in questo modo. O HO O P O O _ C OH HO _ O _ O P O _ C O _ O P H2O anche scritto come C _ O O P La combinazione di un fosfato e di un gruppo carbossilico, o di due o più gruppi fosfato, dà un’anidride acida. Poiché composti di questo genere sono facilmente idrolizzati all’interno della cellula, certe volte si dice che contengono un legame ad “alta energia”. HO C H2O O O OH O _ O P O C _ O O O H2O O P OH _ O HO _ O P O P O O _ H2O _ O O _ _ O P O H2O legame ad alta energia acil fosfato (anidride acido carbossilico-fosforico) presente in alcuni metaboliti O O _ O P O _ fosfoanidride, un legame ad alta energia presente in molecole come ATP anche scritto come O C O P anche scritto come O P P CAPITOLO 2 Chimica e bioenergetica della cellula 96 © 978-88-08-62126-9 QUADRO 2.2 L’acqua e la sua influenza sul comportamento delle molecole biologiche STRUTTURA DELL’ACQUA L’ACQUA Due atomi, connessi da un legame covalente, possono esercitare attrazioni diverse per gli elettroni del legame. In questi casi il legame è polare, con _ un’estremità leggermente carica negativamente (δ ) e l’altra leggermente carica + positivamente (δ ). H Le molecole dell’acqua si uniscono transitoriamente in un reticolo legato da legami idrogeno. Anche a 37 °C, il 15% delle molecole d’acqua è unito ad altre quattro in un complesso a vita breve noto come “gruppo tremolante”. δ+ regione elettropositiva O δ δ+ H _ regione elettronegativa δ _ Sebbene una molecola d’acqua abbia una carica globale neutra (avendo lo stesso numero di elettroni e di protoni), gli elettroni sono distribuiti asimmetricamente, il che rende la molecola polare. Il nucleo dell’ossigeno attira gli elettroni allontanandoli dai nuclei di idrogeno, che rimangono con una piccola carica netta positiva. L’eccesso di densità elettronica dell’atomo di ossigeno crea regioni debolmente negative agli altri due vertici di un tetraedro immaginario. La natura coesiva dell’acqua è responsabile di molte delle sue proprietà insolite, come l’elevata tensione superficiale, il calore specifico e il calore di vaporizzazione. LEGAMI IDROGENO legame idrogeno 0,17 nm H H 2δ _ δ O I legami idrogeno sono più forti quando i tre atomi sono allineati. lunghezze di legame δ+ δ+ Poiché sono polarizzate, due molecole d’acqua adiacenti possono formare un legame noto come legame idrogeno. I legami idrogeno hanno soltanto 1/20 della forza di un legame covalente. H H + O H 2δ _ O H H legame idrogeno 0,10 nm legame covalente δ+ MOLECOLE IDROFOBICHE MOLECOLE IDROFILICHE Le sostanze che si sciolgono prontamente in acqua sono chiamate idrofiliche. Esse sono composte da ioni o molecole polari che attraggono molecole d’acqua tramite effetti di carica elettrica. Le molecole d’acqua circondano ciascuno ione o molecola polare sulla superficie di una sostanza solida e la portano in soluzione. H H O δ H Oδ H _ Na+ δ H _ δ _ δ O O H H + δ O H Cl δ+ H H H O H δ+ H H O H O O_ _ H H H H O H _ H δ+ H O H H δ+ O O O Le sostanze ioniche come il cloruro di sodio si sciolgono perché le molecole d’acqua sono attratte dalla carica positiva _ (Na+) o negativa (Cl ) di ciascuno ione. H O H H H H H H O H N O H C H H H N Le molecole che contengono una preponderanza di legami non polari sono di solito insolubili in acqua e sono chiamate idrofobiche. Ciò è vero specialmente per gli idrocarburi, che contengono molti legami C–H. Le molecole d’acqua non sono attratte da queste molecole e hanno quindi scarsa tendenza a circondarle e a portarle in soluzione. H C O H C H Le sostanze polari come l’urea si sciolgono perché le loro molecole formano legami idrogeno con le molecole d’acqua circostanti. H O H H O H H H O H O H O H H C H H O H H O H H H CAPITOLO 2 Chimica e bioenergetica della cellula 97 © 978-88-08-62126-9 LÕACQUA COME SOLVENTE Molte sostanze, come lo zucchero da tavola, si sciolgono in acqua: le loro molecole si separano l’una dall’altra e ciascuna viene circondata da molecole d’acqua. Quando una sostanza si scioglie in un liquido, la miscela viene chiamata soluzione. La sostanza disciolta (in questo caso lo zucchero) è il soluto, e il liquido che lo scioglie (in questo caso l’acqua) è il solvente. L’acqua è un solvente eccellente per molte sostanze a causa dei suoi legami polari. lo zucchero si scioglie molecola d’acqua cristallo di zucchero molecola di zucchero ACIDI SCAMBIO DI IONI IDROGENO Le sostanze che rilasciano ioni idrogeno in soluzione sono chiamate acidi. Ioni idrogeno carichi positivamente (H+) possono muoversi spontaneamente da una molecola d’acqua a un’altra, creando così due specie ioniche. + HCl H acido cloridrico (acido forte) ione idrogeno Cl – H ione cloruro H O H + H O O H ione idronio ione ossidrilico (acqua che agisce (acqua che agisce da base debole) da acido debole) O spesso scritta come O H+ H H Molti degli acidi importanti nella cellula sono solo parzialmente dissociati e sono perciò acidi deboli, per esempio, il gruppo carbossilico (–COOH), che si dissocia in soluzione per dare uno ione idrogeno. C H O + H2O H OH ione idrogeno C – – ione ossidrilico Si noti che questa è una reazione reversibile. Poiché il processo è rapidamente reversibile, gli ioni idrogeno si muovono continuamente fra le molecole d’acqua. L’acqua pura contiene una concentrazione stabile di ioni idrogeno e di ioni ossidrilici (entrambi 10–7M). pH BASI OH O (acido debole) conc. di H+ moli/litro _1 10 10 ACIDO L’acidità di una soluzione è definita dalla concentrazione di ioni H+ che possiede. Per convenienza usiamo la scala di pH, in cui 10 10 10 10 pH = _log10[H+] _ [H+] = 10 7 moli/litro _3 _4 _5 _6 _ 10 7 _ 10 8 ALCALINO Per l’acqua pura _2 10 10 10 10 10 10 _9 _10 _11 _12 _13 _14 pH Le sostanze che riducono il numero di ioni idrogeno in soluzione sono chiamate basi. Alcune basi, come l’ammoniaca, si combinano direttamente con ioni idrogeno. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 NH3 + + H NH4 ammoniaca ione idrogeno ione ammonio Altre basi, come l’idrossido di sodio, riducono il numero di ioni H+ indirettamente, producendo ioni OH– che si combinano quindi direttamente con ioni H+ per produrre H2O. Na+ NaOH idrossido di sodio (base forte) ione sodio OH– ione ossidrilico Molte basi presenti nelle cellule sono parzialmente dissociate e sono dette basi deboli. Ciò è vero per composti che contengono un gruppo amminico (–NH2), che ha una debole tendenza ad accettare reversibilmente uno ione H+ dall’acqua, aumentando la quantità di ioni OH– liberi. –NH2 H+ –NH3+ CAPITOLO 2 Chimica e bioenergetica della cellula 98 © 978-88-08-62126-9 QUADRO 2.3 I tipi principali di legami non covalenti deboli che tengono insieme le macromolecole ATTRAZIONI DI VAN DER WAALS LEGAMI CHIMICI NON COVALENTI DEBOLI Le molecole organiche possono interagire con altre molecole tramite tre tipi di forze di attrazione a corto raggio note come legami non covalenti: attrazioni di van der Waals, attrazioni elettrostatiche e legami idrogeno. La repulsione dei gruppi idrofobici dall’acqua è importante anche per piegare le macromolecole biologiche. Se due atomi sono troppo vicini si respingono con molta forza. Per questa ragione un atomo può spesso essere trattato come una sfera con un raggio fisso. Le “dimensioni” caratteristiche per ciascun atomo sono specificate da uno specifico raggio di van der Waals. La distanza di contatto fra due atomi legati non covalentemente è la somma dei loro raggi di van der Waals. legame non covalente debole H C N O raggio di 0,12 nm raggio di 0,2 nm raggio di 0,15 nm raggio di 0,14 nm A distanze molto brevi due atomi mostrano una debole interazione di legame dovuta alle loro cariche elettriche fluttuanti. I due atomi saranno attratti l’uno dall’altro in questo modo fino a che la distanza fra i loro nuclei è approssimativamente uguale alla somma dei loro raggi di van der Waals. Sebbene siano singolarmente molto deboli, le attrazioni di van der Waals possono diventare importanti quando due superfici macromolecolari combaciano molto bene, perché sono coinvolti molti atomi. Si noti che quando due atomi formano un legame covalente i centri dei due atomi (i due nuclei) sono molto più vicini della somma dei loro raggi di van der Waals. Così I legami chimici non covalenti deboli hanno meno di 1/20 della forza di un legame covalente forte. Sono abbastanza forti da fornire un legame stretto soltanto quando se ne formano simultaneamente molti. LEGAMI IDROGENO Come già descritto per l’acqua (vedi Quadro 2.2), i legami idrogeno si formano quando un atomo di idrogeno è “intrappolato” fra due atomi che attraggono elettroni (di solito ossigeno e azoto). 0,4 nm due atomi di carbonio non legati I legami idrogeno sono più forti quando i tre atomi sono allineati: O H O N H LEGAMI IDROGENO IN ACQUA Gli amminoacidi di una catena polipeptidica possono essere uniti da legami idrogeno che stabilizzano la struttura della proteina ripiegata. C C H R C C O H N H H legame peptidico N H O Le molecole che possono formare legami idrogeno fra loro possono formare in alternativa legami idrogeno con l’acqua. A causa di questa competizione con le molecole d’acqua, i legami idrogeno formati fra due molecole sciolte in acqua sono relativamente deboli. C O R C C N C O 2H2O C H C H Due basi, G e C, legate da legami idrogeno nel DNA. H N C H O C C H N H N C C C O H C C N N H H C C C N H O C C O 2H2O H H N C N N H O N H O H 0,13 nm due atomi di carbonio con un doppio legame O Esempi nelle macromolecole: R 0,15 nm due atomi di carbonio con un legame singolo N H C C CAPITOLO 2 Chimica e bioenergetica della cellula 99 © 978-88-08-62126-9 FORZE IDROFOBICHE L’acqua forza insieme i gruppi idrofobici, perché facendo così riduce al minimo i loro effetti dirompenti sul reticolo d’acqua tenuto insieme da legami idrogeno. Talvolta si dice che i gruppi idrofobici tenuti insieme in questo modo sono uniti da “legami idrofobici”, anche se l’apparente attrazione è in realtà causata da una repulsione dall’acqua. H H C C H H H H ATTRAZIONI ELETTROSTATICHE IN SOLUZIONI ACQUOSE H H I gruppi carichi sono schermati dalle loro interazioni con molecole d’acqua. Le attrazioni elettrostatiche sono perciò molto deboli in acqua. H C H H C H O H H O O H P H H H H O H O O O H H H H O O + Mg O H H H ATTRAZIONI ELETTROSTATICHE O + H O H H Le forze d’attrazione agiscono fra gruppi completamente carichi (legame ionico) e fra i gruppi parzialmente carichi delle molecole polari. In modo simile altri ioni in soluzione si possono raggruppare intorno a gruppi carichi e possono indebolire ulteriormente le attrazioni elettrostatiche. Na + δ+ δ– O + Na Cl + Cl Na O + + Na + N H Cl – La forza di attrazione fra le due cariche, δ e δ , decresce rapidamente man mano che aumenta la distanza fra le cariche. H H C Cl + Na Cl Nonostante il fatto che sono indebolite da acqua e sali, le attrazioni elettrostatiche sono molto importanti nei sistemi biologici. Per esempio, un enzima che lega un substrato carico positivamente avrà spesso una catena laterale di un amminoacido carica negativamente nel posto appropriato. In assenza di acqua le forze elettrostatiche sono molto potenti. Esse sono responsabili della forza di minerali come il marmo e l’agata e della formazione di cristalli nel comune sale da cucina, NaCl. Cl– substrato Na+ + – enzima un cristallo di sale, NaCl H O H H H O O 1 mm CAPITOLO 2 Chimica e bioenergetica della cellula 100 © 978-88-08-62126-9 QUADRO 2.4 Alcuni tipi di zuccheri comunemente presenti nelle cellule MONOSACCARIDI I monosaccaridi di solito hanno la formula generale (CH2O) n, dove n può essere 3, 4, 5, 6, 7 o 8, e hanno due o più gruppi O ossidrilici. Essi contengono un gruppo aldeidico ( C H ) e si chiamano aldosi, o gruppi chetonici ( 3 carboni (TRIOSI) 5 carboni (PENTOSI) C O ) e si chiamano chetosi. 6 carboni (ESOSI) O H C O H ALDOSI C O H C H C OH H C OH HO C H H C OH H C OH H C OH H C OH H C OH H C OH H C OH H C OH H H H gliceraldeide ribosio glucosio H H H CHETOSI H H H C OH C O HO C H H C OH C O C OH H C OH H C OH C O H C OH H C OH C OH H C OH H C OH H H H diidrossiacetone ribulosio fruttosio FORMAZIONE DELL’ANELLO ISOMERI In soluzione acquosa, il gruppo aldeidico o chetonico di uno zucchero tende a reagire con un gruppo ossidrilico della stessa molecola, chiudendo così la molecola in un anello. Molti monosaccaridi differiscono soltanto nella disposizione spaziale degli atomi, cioè sono isomeri. Per esempio, glucosio, galattosio e mannosio hanno la stessa formula (C6H12O6) ma differiscono nella disposizione dei gruppi intorno a uno o due atomi di carbonio. O H H HO H H 2 3 4 5 C OH C H C OH C OH CH2OH 6 1C H H O 5 H H 4 OH HO 2 3 4 C C OH C OH CH2OH 5 1 glucosio CH2OH OH H CH2OH 5 H HO H 2 3 4 OH CH2OH OH H H O O H H CH2OH 6 C 1 H HO OH H 3 2 OH OH 1 ribosio O H OH H H OH glucosio H Si noti che ciascun atomo di carbonio ha un numero. H O H OH H OH H H OH OH CH2OH H H galattosio HO O H OH OH H H OH H mannosio Queste lievi differenze producono soltanto piccoli cambiamenti nelle proprietà chimiche degli zuccheri. Ma sono riconosciute da enzimi e altre proteine e perciò possono avere effetti biologici importanti. 2 Chimica e bioenergetica della cellula CAPITOLO 101 © 978-88-08-62126-9 LEGAMI a E b DERIVATI DEGLI ZUCCHERI Il gruppo ossidrilico del carbonio che porta l’aldeide o il chetone può spostarsi rapidamente da una posizione all’altra. Queste due posizioni sono chiamate α e β. I gruppi ossidrilici di un monosaccaride CH2OH O semplice possono essere sostituiti OH da altri gruppi. Per esempio O CH2OH O O OH HO OH HO OH OH H OH NH2 H O OH C glucosammina O NH β ossidrile N-acetilglucosammina C α ossidrile Non appena uno zucchero è unito a un altro, la forma α o β diventa fissa. acido glucuronico O OH HO CH3 DISACCARIDI OH CH2OH α glucosio β fruttosio O Il carbonio che porta l’aldeide o il chetone può reagire con qualunque gruppo ossidrilico di un secondo zucchero a formare un disaccaride. Il legame si chiama legame glicosidico. + OH HO HO OH HO OH OH O maltosio (glucosio + glucosio) lattosio (galattosio + glucosio) saccarosio (glucosio + fruttosio) O HOCH2 HO OH HO Qui è mostrata la reazione che forma il saccarosio. CH2OH H2O CH2OH Tre disaccaridi comuni sono O HOCH2 O OH CH2OH OH saccarosio OLIGOSACCARIDI E POLISACCARIDI Grosse molecole lineari e ramificate si possono formare da semplici subunità ripetute di zuccheri. Brevi catene sono chiamate oligosaccaridi, mentre lunghe catene sono chiamate polisaccaridi. Il glicogeno, per esempio, è un polisaccaride composto interamente da unità di glucosio unite insieme. glicogeno punti di ramificazione OLIGOSACCARIDI COMPLESSI In molti casi una sequenza di zuccheri non è ripetitiva. Sono possibili molte molecole diverse. Questi oligosaccaridi complessi sono di solito uniti a proteine o a lipidi, come nel caso di questo oligosaccaride che è parte di una molecola della superficie cellulare che definisce un particolare gruppo sanguigno. CH2OH CH2OH O HO CH2OH O HO O O O NH C O O CH3 O OH O OH CH3 HO OH NH C O CH3 OH CAPITOLO 2 Chimica e bioenergetica della cellula 102 © 978-88-08-62126-9 QUADRO 2.5 Acidi grassi e altri lipidi ACIDI GRASSI COMUNI TRIACILGLICEROLI Questi sono acidi carbossilici con lunghe code idrocarburiche. COOH COOH COOH CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH CH2 CH2 CH CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH3 CH2 CH2 CH2 CH3 acido palmitico (C16) acido stearico (C18) Gli acidi grassi sono conservati come riserva di energia (grassi e oli) tramite un legame estere al glicerolo per formare triacilgliceroli, noti anche come trigliceridi. O H2C O HC O H2C O C O H2C OH C HC OH O H2C OH C glicerolo Esistono centinaia di specie diverse di acidi grassi. Alcuni hanno uno o più doppi legami nelle loro code idrocarburiche e sono detti insaturi. Gli acidi grassi senza doppi legami sono saturi. – O – O O O C C Questo doppio legame è rigido e crea un ripiegamento nella catena. Il resto della catena è libero di ruotare intorno agli altri legami C–C. acido oleico acido stearico CH2 CH3 acido oleico (C18) modello a spazio pieno scheletro di carbonio INSATURI GRUPPO CARBOSSILICO SATURI FOSFOLIPIDI I fosfolipidi sono i costituenti principali delle membrane cellulari. Se libero, il gruppo carbossilico di un acido grasso sarà ionizzato. gruppo idrofilico O colina O C _ O O _ O P O CH2 Ma di solito è legato ad altri gruppi a formare esteri CH CH2 O C O C code idrofobiche di acidi grassi o ammidi. O modello a spazio pieno del fosfolipide fosfatidilcolina C N H struttura generale di un fosfolipide Nei fosfolipidi due dei gruppi –OH del glicerolo sono legati ad acidi grassi, mentre il terzo gruppo –OH è legato ad acido fosforico. Il fosfato è ulteriormente legato a un piccolo gruppo polare di vario tipo (colina). CAPITOLO 2 Chimica e bioenergetica della cellula 103 © 978-88-08-62126-9 AGGREGATI LIPIDICI POLIISOPRENOIDI polimeri di isoprene a lunga catena Gli acidi grassi hanno una testa idrofilica e una coda idrofobica. O– micella O In acqua possono formare un film superficiale o formare piccole micelle. P O– O I loro derivati possono formare aggregati più grandi tenuti insieme da forze idrofobiche. I trigliceridi possono formare goccioline sferiche di grasso nel citoplasma della cellula. I fosfolipidi e i glicolipidi formano doppi strati lipidici autosigillanti che sono la base di tutte le membrane cellulari. 200 nm o più 4 nm ALTRI LIPIDI STEROIDI Si definiscono lipidi le molecole delle cellule che sono insolubili in acqua ma solubili nei solventi organici. Altri due tipi comuni di lipidi sono gli steroidi e i poliisoprenoidi. Entrambi sono composti da unità di isoprene. CH3 C CH2 CH CH2 isoprene Gli steroidi hanno una struttura comune ad anelli multipli. OH HO colesterolo – presente in molte membrane O testosterone – ormone steroide maschile GLICOLIPIDI Come i fosfolipidi, questi composti sono costituiti da una regione idrofobica, contenente due lunghe code idrocarburiche, e una regione polare, che, però, a differenza dei fosfolipidi, non contiene fosfato ma uno o più residui di zuccheri. C galattosio OH H H C C H C O CH2 zucchero H C NH O un glicolipide semplice dolicol fosfato – usato per portare zuccheri attivati nella sintesi associata alla membrana di glicoproteine e di alcuni polisaccaridi CAPITOLO 2 Chimica e bioenergetica della cellula 104 © 978-88-08-62126-9 QUADRO 2.6 Una rassegna dei nucleotidi O BASI NH2 C NH2 HC C C citosina C N H uracile C N H N HC HC U 4 5 N 7 3N 6 C NH C HC timina T 2 5 1N 4 2 1 N 3 N PIRIMIDINA FOSFATI PURINA Un nucleotide consiste di una base contenente azoto, uno zucchero a cinque carboni e uno o più gruppi fosfato. O P O –O P O O– P P come in ADP CH2 –O O– P O CH2 O O O– P CH2 O O– come in ATP 4 Il fosfato rende un nucleotide carico negativamente. ZUCCHERI H H OH OH H ZUCCHERO uno zucchero a cinque carboni O 1’ 3’ 2’ H H OH sono usate due specie HOCH2 Ciascun carbonio numerato dello zucchero di un nucleotide è seguito da un segno primo; perciò si parla del “carbonio 5 primo”, ecc. H OH β-D-2-deossiribosio usato nell’acido deossiribonucleico H H H OH β-D-ribosio usato nell’acido ribonucleico OH O H 2 OH O H 4’ 3 La base è legata allo stesso carbonio (C1) usato nei legami zucchero-zucchero. H PENTOSIO C 1 HOCH2 C 5’ ZUCCHERO O H I nucleotidi sono subunità degli acidi nucleici. O O N O– O O P N 5 O O O– O –O N FOSFATO O NH2 BASE O– O C N NH2 come in AMP CH2 C N H legame N-glicosidico BASE –O NH G LEGAME FRA LA BASE E LO ZUCCHERO NUCLEOTIDI I fosfati sono normalmente uniti all’ossidrile C5 del ribosio o del deossiribosio (designato 5’). Sono comuni mono-, di- e trifosfati. C HC guanina O CH N C N C N H C O 6 9 N N A N H 8 H3C C HC O O O Le basi sono composti ad anello contenenti azoto, o pirimidine o purine. C N adenina NH HC H CAPITOLO 2 Chimica e bioenergetica della cellula 105 © 978-88-08-62126-9 Un nucleoside o un nucleotide prendono il nome dalla loro base azotata. NOMENCLATURA BASE NUCLEOSIDE ABBR. adenina adenosina A guanina guanosina G citosina citidina C uracile uridina U timina timidina T base Le abbreviazioni a una lettera sono usate in vario modo per (1) la base da sola, (2) il nucleoside o (3) l’intero nucleotide (il contesto rende di solito chiaro a che cosa ci si riferisce). Quando il contesto non è sufficiente si aggiungono i termini “base”, “nucleoside”, “nucleotide” o – come negli esempi sotto – si usa il codice completo dei nucleotidi a 3 lettere. AMP dAMP UDP ATP zucchero BASE + ZUCCHERO = NUCLEOSIDE base = adenosina monofosfato = deossiadenosina monofosfato = uridina difosfato = adenosina trifosfato P zucchero BASE + ZUCCHERO + FOSFATO = NUCLEOTIDE ACIDI NUCLEICI I NUCLEOTIDI HANNO MOLTE ALTRE FUNZIONI I nucleotidi sono uniti insieme da un legame fosfodiestere fra gli atomi di carbonio 5’ e 3’ per formare acidi nucleici. La sequenza lineare dei nucleotidi in un acido nucleico è abbreviata comunemente con un codice a una lettera, A—G—C—T—T—A—C—A, con l’estremità 5’ a sinistra. O –O P O NH2 legami fosfoanidride N O –O O P O P O– N O O O– P O N CH2 N O O– CH2 O OH esempio: ATP (o ATP ) OH zucchero + O OH 2 NH2 Si combinano con altri gruppi per formare coenzimi. base N N P O CH2 O– O zucchero HS OH estremità 5’ della catena O –O Portano energia chimica nei loro legami fosfoanidride facilmente idrolizzabili. base O– –O 1 P 5’ CH2 O O– H H C C N H H H O H H C C C N H H H O H CH3 H C C C HO O O C P O O O– CH3 H O esempio: coenzima A (CoA) O O 3 3’ O –O P Sono usati come molecole di segnalazione specifiche nella cellula. esempio: AMP ciclico (cAMP) O esempio: DNA N N O base 5’ CH2 P O– O NH2 legame fosfodiestere CH2 CH2 O N O O zucchero O 3’ OH estremità 3’ della catena P O– O OH O O– base zucchero N N P N OH O– CAPITOLO 2 Chimica e bioenergetica della cellula 106 © 978-88-08-62126-9 QUADRO 2.7 Energia libera e reazioni biologiche L’IMPORTANZA DELL’ENERGIA LIBERA PER LE CELLULE La vita è possibile per la complessa rete di reazioni chimiche interagenti che si verificano in ogni cellula. Osservando le vie metaboliche che compongono questa rete, si potrebbe sospettare che la cellula abbia avuto la capacità di evolvere un enzima per svolgere qualunque reazione di cui ha bisogno. Ma non è così. Sebbene gli enzimi siano catalizzatori potenti, possono accelerare soltanto quelle reazioni che sono termodinamicamente possibili; le altre reazioni procedono nelle cellule soltanto perché sono accoppiate a reazioni molto favorevoli che le spingono. Se una reazione può avvenire spontaneamente o invece ha bisogno di essere accoppiata a un’altra reazione è una questione centrale in biologia. La risposta si ottiene riferendosi a una quantità chiamata energia libera: il cambiamento totale di energia libera durante una serie di reazioni determina se l’intera sequenza di reazioni può avvenire o no. In questo quadro spiegheremo alcune delle idee fondamentali – derivate da una branca speciale della chimica e della fisica chiamata termodinamica – necessarie per comprendere che cos’è l’energia libera e perché è così importante per le cellule. L’ENERGIA RILASCIATA DA CAMBIAMENTI NEI LEGAMI CHIMICI È CONVERTITA IN CALORE SCATOLA CELLULA MARE UNIVERSO Un sistema chiuso è definito come un insieme di molecole che non scambia materia con il resto dell’universo (per esempio, la “cellula in una scatola” mostrata sopra). Qualunque sistema di questo tipo conterrà molecole con un’energia totale E. Questa energia sarà distribuita in vari modi: in parte come energia di traslazione delle molecole, in parte come energie vibrazionali e rotazionali, ma la maggior parte come energia di legame fra i singoli atomi che compongono le molecole. Supponiamo che nel sistema avvenga una reazione. La prima legge della termodinamica pone una restrizione ai tipi possibili di reazioni: essa dice che “in ogni processo, l’energia totale dell’universo rimane costante”. Per esempio, supponiamo che la reazione A n B avvenga in qualche punto della scatola e rilasci una grande quantità di energia di legame chimico. Questa energia inizialmente aumenterà l’intensità dei movimenti molecolari (di traslazione, vibrazionali e rotazionali) nel sistema, che equivale ad aumentare la sua temperatura. Tuttavia, questi maggiori movimenti verranno presto trasferiti fuori dal sistema da una serie di collisioni molecolari che scaldano prima le pareti della scatola e poi il mondo esterno (rappresentato dal mare nel nostro esempio). Alla fine il sistema ritorna alla sua temperatura iniziale, quando tutta l’energia chimica di legame rilasciata nella scatola è stata convertita in energia di calore e trasferita fuori dalla scatola nell’ambiente. Secondo la prima legge, il cambiamento nell’energia nella scatola (DEscatola, che indicheremo con DE) deve essere uguale e opposto alla quantità di energia di calore trasferita, che designeremo come h: cioè, DE = –h. Così l’energia nella scatola (E) diminuisce quando il calore lascia il sistema. E può anche cambiare durante una reazione dovuta all’esecuzione di un lavoro nel mondo esterno. Per esempio, supponiamo che vi sia un piccolo aumento nel volume (DV) della scatola durante una reazione. Poiché le pareti della scatola devono spingere contro la pressione costante (P) dell’ambiente per espandersi, ciò produce un lavoro nel mondo esterno e richiede energia. L’energia usata è P(DV), che secondo la prima legge deve far diminuire l’energia nella scatola (E) della stessa quantità. Nella maggior parte delle reazioni l’energia chimica di legame è convertita sia in lavoro che in calore. L’entalpia (H) è una funzione composita che include entrambi, sia lavoro che calore (H = E + PV). Per essere rigorosi, è il cambiamento in entalpia (DH) di un sistema chiuso, e non il cambiamento in energia, che è uguale al calore trasferito al mondo esterno durante una reazione. Le reazioni in cui H diminuisce rilasciano calore nell’ambiente e sono dette “esotermiche”, mentre le reazioni in cui H aumenta assorbono calore dall’ambiente e sono dette “endotermiche”. Così, –h = DH. Tuttavia il cambiamento di volume è trascurabile nella maggior parte delle reazioni biologiche, quindi con una buona approssimazione _h = ∆H = ~ ∆E LA SECONDA LEGGE DELLA TERMODINAMICA Consideriamo un contenitore in cui vi sono 1000 monete tutte a testa in su. Se il contenitore viene scosso vigorosamente, sottoponendo le monete ai tipi di movimenti casuali che tutte le molecole subiscono a causa delle loro frequenti collisioni con altre molecole, alla fine circa metà delle monete sarà a testa in giù. La ragione di questo riorientamento è che c’è soltanto un unico modo in cui lo stato originale ordinato delle monete può essere ripristinato (ogni moneta deve essere a testa in su), mentre ci sono molti modi diversi (circa 10298) di ottenere uno stato disordinato in cui c’è una miscela uguale di teste e di croci; in effetti ci sono più modi di ottenere uno stato 50-50 che di ottenere qualunque altro stato. Ciascuno stato ha una probabilità di verificarsi che è proporzionale al numero di modi in cui può realizzarsi. La seconda legge della termodinamica dice che “i sistemi cambieranno spontaneamente da stati a bassa probabilità a stati a probabilità maggiore”. Poiché gli stati a probabilità minore sono più “ordinati” degli stati ad alta probabilità, la seconda legge può essere riscritta: “l’universo cambia costantemente in modo da diventare più disordinato”. CAPITOLO 2 Chimica e bioenergetica della cellula 107 © 978-88-08-62126-9 L’ENTROPIA, S La seconda legge (ma non la prima legge) permette di prevedere la direzione di una particolare reazione. Ma per renderla utile per questo scopo c’è bisogno di una misura appropriata della probabilità o, in modo equivalente, del grado di disordine di uno stato. L’entropia (S) è questa misura. È una funzione logaritmica della probabilità che il cambiamento di entropia (DS) che avviene quando la reazione A n B converte una mole di A in una mole di B sia ∆S = R In p B /pA in cui pA e pB sono le probabilità dei due stati A e B, R è la costante dei gas (8,3 J K–1 mole) e DS è misurata in unità di entropia (eu). Nel nostro esempio iniziale di 1000 monete, la probabilità relativa di tutte teste (stato A) rispetto a metà teste e metà croci (stato B) è uguale al rapporto del numero di modi diversi in cui si possono ottenere i due risultati. Si può calcolare che pA = 1 e pB = 1000!(500! 3 500!) = 10299. Perciò il cambiamento di entropia per il riorientamento delle monete quando il loro contenitore viene scosso vigorosamente, ottenendo una miscela uguale di teste e di croci, è R ln (10298), o circa 1370 eu per mole di questi contenitori (6 3 1023 contenitori). Vediamo che, poiché DS definito sopra è positivo per la transizione dallo stato A allo stato B (pB /pA > 1), le reazioni con un grande aumento di entropia (per le quali, cioè, DS > 0) sono favorite e avverranno spontaneamente. Come discusso nel Capitolo 2, l’energia termica provoca movimenti casuali delle molecole. Poiché il trasferimento di calore da un sistema chiuso al suo ambiente aumenta il numero di disposizioni diverse che le molecole nel mondo esterno possono avere, la loro entropia aumenta. Si può dimostrare che il rilascio di una quantità fissa di energia di calore ha un effetto di disordine maggiore a bassa temperatura che ad alta temperatura e che il valore di DS per l’ambiente, come definito sopra (DSmare), è precisamente uguale alla quantità di calore trasferito all’ambiente dal sistema (h) diviso per la temperatura assoluta (T): ∆Smare = h / T L’ENERGIA LIBERA DI GIBBS, G Quando si ha a che fare con un sistema biologico chiuso, sarebbe auspicabile avere un modo semplice di prevedere se nel sistema una data reazione avverrà spontaneamente o no. Abbiamo visto che la questione cruciale è se il cambiamento di entropia per l’universo sia positivo o negativo quando avviene la reazione. Nel nostro sistema idealizzato, la cellula in una scatola, ci sono due componenti separati nel cambiamento di entropia dell’universo – il cambiamento di entropia per il sistema chiuso nella scatola e il cambiamento di entropia per il “mare” circostante – ed entrambi devono essere sommati prima di poter fare una previsione. Per esempio, è possibile che una reazione assorba calore e diminuisca così l’entropia del mare (DSmare < 0) e allo stesso tempo provochi un grado così alto di disordine all’interno della scatola (DSscatola > 0) che il totale DSuniverso = DSmare + DSscatola è maggiore di 0. In questo caso la reazione avverrà spontaneamente, anche se il mare cede calore alla scatola durante la reazione. Un esempio di una reazione di questo tipo è lo scioglimento di cloruro di sodio in un becker contenente acqua (la “scatola”), che è un processo spontaneo anche se la temperatura dell’acqua diminuisce quando il sale va in soluzione. I chimici hanno trovato utile definire un numero di nuove “funzioni composite” che descrivono combinazioni di proprietà fisiche di un sistema. Le proprietà che possono essere combinate includono la temperatura (T), la pressione (P), il volume (V), l’energia (E) e l’entropia (S). L’entalpia (H) è una di queste funzioni composite. Ma la funzione composita di gran lunga più utile per i biologi è l’energia libera di Gibbs, G. Essa serve da sistema di calcolo che permette di dedurre il cambiamento di entropia dell’universo prodotto da una reazione chimica nella scatola, mentre evita qualunque considerazione separata del cambiamento di entropia nel mare. La definizione di G è G = H _ TS in cui, per una scatola di volume V, H è l’entalpia descritta sopra (E + PV), T è la temperatura assoluta e S è l’entropia. Ciascuna di queste quantità si applica soltanto all’interno della scatola. Il cambiamento in energia libera durante una reazione nella scatola (il G dei prodotti meno il G dei materiali di partenza) è indicato come DG e, come dimostreremo adesso, è una misura diretta della quantità di disordine che si crea nell’universo quando avviene la reazione. A temperatura costante il cambiamento in energia libera (DG) durante una reazione è uguale a DH – TDS. Ricordando che DH = –h, il calore assorbito dal mare, avremo _∆G = _∆H + T∆S _∆G = h + T∆S, così _∆G/T = h/T + ∆S Ma h/T è uguale al cambiamento in entropia del mare (DSmare) e il DS nell’equazione precedente è DSscatola. Perciò _∆G/T = ∆S mare + ∆Sscatola = ∆Suniverso Concludiamo che il cambiamento in energia libera è una misura diretta del cambiamento in entropia dell’universo. Una reazione procederà nella direzione che provoca un cambiamento in energia libera (DG) minore di zero, perché in questo caso ci sarà un cambiamento positivo di entropia nell’universo quando la reazione avviene. Per una serie complessa di reazioni accoppiate che coinvolgono molte molecole diverse, il cambiamento totale in energia libera può essere calcolato semplicemente sommando le energie libere di tutte le diverse specie molecolari dopo la reazione e confrontando questo valore con la somma delle energie libere prima della reazione; per sostanze comuni i valori necessari di energia libera si possono trovare in tabelle pubblicate. In questo modo si può prevedere la direzione di una reazione e controllare così facilmente la fattibilità di un meccanismo proposto. Così, per esempio, dai valori osservati per la grandezza del gradiente protonico elettrochimico attraverso la membrana mitocondriale interna e il DG per l’idrolisi di ATP all’interno del mitocondrio, si può essere certi che l’ATP sintasi richiede il passaggio di più di un protone per ciascuna molecola di ATP che sintetizza. Il valore di DG per una reazione è una misura diretta di quanto la reazione è lontana dall’equilibrio. Il grande valore negativo per l’idrolisi dell’ATP in una cellula riflette semplicemente il fatto che le cellule tengono la reazione di idrolisi dell’ATP fino a 10 ordini di grandezza lontana dall’equilibrio. Se una reazione raggiunge l’equilibrio, DG = 0, la reazione procede allora a velocità esattamente uguali nella direzione in avanti e in quella all’indietro. Per l’idrolisi dell’ATP l’equilibrio è raggiunto quando gran parte dell’ATP è stata idrolizzata, come succede in una cellula morta. CAPITOLO 2 Chimica e bioenergetica della cellula 108 © 978-88-08-62126-9 QUADRO 2.8 Dettagli dei 10 passaggi della glicolisi Per ciascun passaggio la parte della molecola che subisce un cambiamento è ombreggiata in azzurro e il nome dell’enzima che catalizza la reazione è in un riquadro giallo. Passaggio 1 CH2OH Il glucosio è fosforilato da ATP per formare uno zucchero fosfato. La carica negativa del fosfato impedisce il passaggio dello zucchero fosfato attraverso la membrana plasmatica, intrappolando il glucosio dentro la cellula. CH2O O + OH HO P O esochinasi ATP OH + OH HO + ADP H+ OH OH OH glucosio glucosio 6-fosfato Passaggio 2 Un riarrangiamento C1 P 6 CH2O rapidamente 5 O H C OH reversibile della fosfoglucosio 2 isomerasi struttura chimica HO C H 4 1 (isomerizzazione) 3 OH muove l’ossigeno HO 2 OH 3 H C OH 4 carbonilico dal carbonio 1 al H C OH OH 5 carbonio 2, formando P CH2O (forma ad anello) un chetosio da un aldosio. (Vedi Quadro (forma a catena aperta) 2.4 pp. 100-101.) glucosio 6-fosfato 1 CH2OH C O C H 2 HO H H 4 OH2C P 3 6 C OH C OH CH2O 1 HO 2 3 OH 4 5 CH2OH O 5 OH (forma ad anello) P (forma a catena aperta) fruttosio 6-fosfato Passaggio 3 Il nuovo gruppo ossidrilico sul carbonio 1 è fosforilato da ATP, P in preparazione per la formazione di due zuccheri fosfati a tre carboni. L’ingresso degli zuccheri nella glicolisi è controllato a livello di questo passaggio attraverso la regolazione dell’enzima fosfofruttochinasi. OH2C O CH2OH fosfofruttochinasi + HO + H + OH fruttosio 1,6-bifosfato C CH2O O ADP OH fruttosio 6-fosfato OH2C P + OH OH P HO HO OH OH (forma ad anello) C CH2O P O aldolasi H H C OH H C OH CH2O HO C CH2O O H C + diidrossiacetone fosfato O C H diidrossiacetone fosfato H C OH CH2O H P C P triosio fosfato isomerasi O O P H (forma a catena aperta) fruttosio 1,6-bifosfato CH2OH C H Passaggio 5 L’altro prodotto del passaggio 4, il diidrossiacetone fosfato, è isomerizzato per formare gliceraldeide 3-fosfato. CH2O O HO CH2O P OH2C ATP Passaggio 4 Lo zucchero a sei carboni viene tagliato per produrre due molecole a tre carboni. Soltanto la gliceraldeide 3-fosfato può procedere immediatamente nella glicolisi. P C OH CH2O P gliceraldeide 3-fosfato gliceraldeide 3-fosfato P CAPITOLO 2 Chimica e bioenergetica della cellula 109 © 978-88-08-62126-9 Passaggio 6 gliceraldeide 3-fosfato deidrogenasi H O Le due molecole di gliceraldeide 3-fosfato sono ossidate. La fase C + di generazione dell’energia della H C OH glicolisi inizia nel momento in cui si formano NADH e un CH2O P nuovo legame anidride ad alta gliceraldeide 3-fosfato energia (vedi Figura 2.46). Passaggio 7 O O H Pi + C CH2O P H CH2O C C fosfoglicerato mutasi C OH 2 CH2O H O O O C P CH2OH C P H2O + ATP C piruvato chinasi O + – O O + P CH2 C Il trasferimento ad ADP del gruppo fosfato ad alta energia che era stato generato nel passaggio 9 forma ATP, completando la glicolisi. O fosfoenolpiruvato – O O – C enolasi 2-fosfoglicerato Passaggio 10 P CH2OH – O O 2-fosfoglicerato C C C P 3 3-fosfoglicerato H O– O 1 La rimozione di acqua dal 2-fosfoglicerato crea un legame enol fosfato ad alta energia. P 3-fosfoglicerato O– O ADP + H+ C O CH2 CH3 fosfoenolpiruvato piruvato RISULTATO NETTO DELLA GLICOLISI O O – C CH2OH C O NADH OH HO ATP O– O OH ATP O CH3 ATP OH ATP C NADH ATP ATP C O CH3 glucosio ATP OH CH2O O Passaggio 9 + C P H O– C ADP 1,3-bifosfoglicerato Il restante legame estere fosfato nel 3-fosfoglicerato, che ha un’energia libera di idrolisi relativamente bassa, viene spostato dal carbonio 3 al carbonio 2 per formare 2-fosfoglicerato. P O fosfoglicerato chinasi OH Passaggio 8 + H+ NADH OH 1,3-bisfosfoglicerato + C P C H C Il trasferimento ad ADP del gruppo fosfato ad alta energia che era stato generato nel passaggio 6 forma ATP. + NAD+ O O Oltre al piruvato, i prodotti netti sono due molecole di ATP e due molecole di NADH due molecole di piruvato CAPITOLO 2 Chimica e bioenergetica della cellula 110 © 978-88-08-62126-9 QUADRO 2.9 Il ciclo completo dellÕacido citrico + NAD+ NADH + H coenzima A O CH3 C Il ciclo completo dell’acido citrico. I due carboni dell’acetil CoA che entrano in questo giro del ciclo (ombreggiati in rosso) verranno convertiti in CO2 nei giri successivi del ciclo: sono i due carboni ombreggiati in azzurro che sono convertiti in CO2 in questo ciclo. HS CoA – COO CO2 piruvato O acetil CoA (2C) CH3 C S CoA ciclo successivo NADH + H COO– – COO Passaggio 8 H C OH CH2 malato (4C) COO– H2O C O CH2 – COO + NAD+ HS CoA – COO COO– CH2 Passaggio 1 HO C ossalacetato (4C) COO– Passaggio 2 CH2 COO– C O CH2 – COO COO isocitrato (6C) CH2 citrato (6C) HC ossalacetato (4C) COO – HO CH COO– CICLO DELL’ACIDO CITRICO NAD+ Passaggio 3 H2O – COO fumarato (4C) Passaggio 7 – α-chetoglutarato (5C) COO– CH CH succinil CoA (4C) succinato (4C) COO– Passaggio 6 COO– CH2 CH2 FADH2 H 2O Passaggio 5 Passaggio 4 CH2 CH2 GTP HS CoA GDP + Pi CH2 + CO2 CH2 C O COO– NAD+ C O COO– FAD – COO NADH + H HS CoA S CoA NADH + H + CO2 Dettagli degli otto passaggi sono mostrati sotto. Per ciascun passaggio la parte della molecola che subisce un cambiamento è ombreggiata in azzurro e il nome dell’enzima che catalizza la reazione è in un riquadro giallo. Passaggio 1 Dopo che l’enzima ha rimosso – O C S CoA COO un protone dal gruppo CH3 citrato – sintasi CH2 dell’acetil CoA, il CH2 C O O C S CoA carico negativamente forma + – HO C COO un legame con un carbonio CH2 CH3 carbonilico dell’ossalacetato. CH2 – COO La successiva perdita per – COO idrolisi del coenzima A (CoA) spinge la reazione fortemente acetil CoA ossalacetato intermedio S-citril-CoA in avanti. Passaggio 2 Una reazione di isomerizzazione, in cui viene prima rimossa acqua e quindi aggiunta di nuovo, sposta il gruppo ossidrilico da un atomo di carbonio a quello vicino. – COO C H HO C COO– H C H H COO– citrato – COO H2O H aconitasi H2O – COO H2O CH2 HO C – + HS CoA + H+ COO CH2 – COO citrato – COO H2O C H H C H C COO– H C COO– C H HO C H COO– intermedio cis-aconitato H2O COO– isocitrato CAPITOLO 2 Chimica e bioenergetica della cellula 111 © 978-88-08-62126-9 Passaggio 3 Nel primo dei quattro passaggi di ossidazione del ciclo, il carbonio che porta il gruppo ossidrilico è convertito in gruppo carbonilico. Il prodotto immediato è instabile e perde CO2 mentre è ancora attaccato all’enzima. COO– H C COO– isocitrato deidrogenasi H H C COO HO C H COO H NAD+ – + NADH + H isocitrato H C H H C H C O COO C O H – COO + H H C H C O CO2 COO complesso della α-chetoglutarato deidrogenasi + HS CoA NAD+ NADH + H C H H C H C O succinil-CoA – COO – COO H C H H C H C O succinil-CoA sintetasi H C H H C H – COO H2O S CoA Pi GTP GDP succinil-CoA succinato COO – C H H C H COO COO COO C – C H COO – COO fumarasi C HO C H H C H COO– H2O fumarato malato COO– HO C H H C H – COO malato – fumarato – – H C FADH2 FAD H COO – succinato deidrogenasi H Passaggio 8 H S CoA CO2 H – + α-chetoglutarato Passaggio 7 Nell’ultimo dei quattro passaggi di ossidazione del ciclo, il carbonio che porta il gruppo ossidrilico è convertito in gruppo carbonilico, rigenerando l’ossalacetato necessario per il passaggio 1. C α-chetoglutarato succinato L’aggiunta di acqua al fumarato pone un gruppo ossidrilico vicino a un carbonio carbonilico. H – COO COO– Passaggio 6 Nel terzo passaggio di ossidazione del ciclo, il FAD riceve due atomi di idrogeno dal succinato. C – COO– Passaggio 5 Una molecola di fosfato dalla soluzione sposta il CoA, formando un legame fosfato ad alta energia con il succinato. Questo fosfato è quindi trasferito al GDP per formare GTP. (Nei batteri e nei vegetali si forma invece ATP.) H intermedio ossalosuccinato Passaggio 4 Il complesso dell’α-chetoglutarato deidrogenasi assomiglia molto al grosso complesso enzimatico che converte il piruvato in acetil CoA, il complesso piruvato deidrogenasi mostrato nella Figura 3.54D, E. In modo analogo catalizza un’ossidazione che produce NADH, CO2, e un legame tioestere ad alta energia con il coenzima A (CoA). C H – COO– COO– malato deidrogenasi C O CH2 + NAD + NADH + H COO – ossalacetato + HS CoA CAPITOLO 3 • La forma e la struttura delle proteine • Funzione delle proteine Le proteine Q uando guardiamo una cellula al microscopio o ne analizziamo l’attività elettrica o biochimica stiamo essenzialmente osservando proteine. Le proteine costituiscono la maggior parte della massa secca di una cellula. Esse non sono soltanto le unità di cui sono costituite le cellule, ma svolgono anche quasi tutte le funzioni cellulari. Così gli enzimi forniscono a una cellula le intricate superfici molecolari che promuovono le sue numerose reazioni chimiche. Proteine immerse nella membrana plasmatica formano canali e pompe che controllano il passaggio di piccole molecole dentro e fuori la cellula. Altre proteine conducono messaggi da una cellula all’altra o agiscono come integratori di segnali che ritrasmettono serie di segnali dalla membrana plasmatica all’interno della cellula fino al nucleo. Altre ancora servono da minuscole macchine molecolari con parti in movimento: la chinesina, per esempio, muove organelli attraverso il citoplasma; la topoisomerasi può districare molecole annodate di DNA. Altre proteine specializzate agiscono da anticorpi, tossine, ormoni, molecole anticongelanti, fibre elastiche, funi o fonti di luminescenza. Per poter sperare di comprendere come funzionano i geni, come i muscoli si contraggono, come i nervi conducono elettricità, come si sviluppa un embrione o come funzionano i nostri corpi, dobbiamo raggiungere una conoscenza profonda delle proteine. La forma e la struttura delle proteine Da un punto di vista chimico le proteine sono di gran lunga le molecole strutturalmente più complesse e funzionalmente più sofisticate. Ciò probabilmente non è sorprendente, una volta che ci si rende conto che la struttura e la chimica di ciascuna proteina si sono sviluppate e raffinate in miliardi di anni di storia evolutiva. I calcoli teorici dei genetisti di popolazione rivelano che, in un arco di tempo evolutivo, è sufficiente un vantaggio selettivo sorprendentemente piccolo per causare la diffusione di una proteina, la cui sequenza è stata alterata in maniera casuale, in una popolazione di organismi. Eppure, anche agli esperti, la notevole versatilità delle proteine può sembrare veramente stupefacente. In questa sezione considereremo il modo in cui la posizione di ciascun amminoacido nella lunga sequenza che dà origine a una proteina ne determini la forma tridimensionale. Useremo quindi questa conoscenza della struttura delle proteine a livello atomico per spiegare come la forma precisa di ciascuna proteina ne determini la funzione in una cellula. ■ La forma di una proteina è specificata dalla sua sequenza di amminoacidi Nelle proteine esistono 20 tipi di amminoacidi, codificati direttamente dal DNA dell’organismo, ciascuno con proprietà chimiche diverse. Una proteina è costituita da una lunga catena di questi amminoacidi, ciascuno legato al suo vicino da un legame peptidico covalente. Le proteine sono perciò note anche come polipeptidi. Ciascun tipo di proteina ha una sequenza caratteristica di amminoacidi e ci sono parecchie migliaia di proteine diverse in una cellula. La sequenza ripetuta di atomi lungo il nucleo della catena polipeptidica viene chiamata ossatura polipeptidica. Attaccate a questa catena ripetitiva vi sono quelle porzioni degli amminoacidi che non sono coinvolte nella formazione di un legame peptidico e conferiscono a ciascun amminoacido le CAPITOLO OH O O C catene laterali ossatura polipeptidica CH2 terminale amminico (N-terminale) H 3 Le proteine 113 © 978-88-08-62126-9 + H H O N C C H CH2 N C C H H O H H O N C C CH2 O N C H H C O terminale carbossilico (C-terminale) CH2 legami peptidici CH2 legame peptidico CH H3C S CH3 catene laterali CH3 Metionina (Met) Acido aspartico (Asp) Leucina (Leu) Tirosina (Tyr) sue proprietà peculiari: le 20 diverse catene laterali degli amminoacidi (Figura 3.1). Alcune di queste catene laterali sono non polari e idrofobiche (“che temono l’acqua”), altre sono cariche negativamente o positivamente, alcune formano velocemente legami covalenti, e così via. Le loro strutture atomiche sono presentate nel Quadro 3.1 e un breve elenco con abbreviazioni è riportato nella Figura 3.2. Come discusso nel Capitolo 2, gli atomi si comportano più o meno come se fossero sfere solide con un raggio definito (il raggio di van der Waals). L’impossibilità di sovrapposizione fra due atomi limita di molto i possibili angoli di legame in una catena polipeptidica (Figura 3.3). Questa restrizione e altre interazioni steriche riducono drasticamente la varietà di disposizioni tridimensionali (o conformazioni) degli atomi possibili. Nonostante ciò, una lunga catena flessibile, come è una proteina, può ancora ripiegarsi in un numero enorme di modi. Il ripiegamento di una catena proteica è tuttavia ulteriormente limitato da molte serie differenti di deboli legami non covalenti che si formano fra parti diverse della catena. Questi coinvolgono atomi dell’ossatura polipeptidica, oltre ad atomi delle catene laterali degli amminoacidi. I legami deboli sono di tre tipi: legami idrogeno, attrazioni elettrostatiche e attrazioni di van der Waals, come CATENA LATERALE AMMINOACIDO Acido aspartico Acido glutammico Arginina Lisina Istidina Asparagina Glutammina Serina Treonina Tirosina Asp Glu Arg Lys His Asn Gln Ser Thr Tyr D E R K H N Q S T Y negativa negativa positiva positiva positiva polare senza carica polare senza carica polare senza carica polare senza carica polare senza carica AMMINOACIDI POLARI CATENA LATERALE AMMINOACIDO Alanina Glicina Valina Leucina Isoleucina Prolina Fenilalanina Metionina Triptofano Cisteina Ala Gly Val Leu Ile Pro Phe Met Trp Cys A G V L I P F M W C non polare non polare non polare non polare non polare non polare non polare non polare non polare non polare AMMINOACIDI NON POLARI Figura 3.2 I 20 amminoacidi che si trovano nelle proteine. Ciascun amminoacido ha un’abbreviazione a tre lettere e una a una lettera. Ci sono numeri uguali di catene laterali polari e non polari, ma alcune catene laterali elencate qui come polari sono abbastanza grandi da avere alcune proprietà non polari (per esempio, Tyr, Thr, Arg, Lys). Per le strutture atomiche, vedi Quadro 3.1 (pp. 116-117). Figura 3.1 I componenti di una proteina. Una proteina consiste di un’ossatura polipeptidica con catene laterali attaccate. Ciascun tipo di proteina differisce nella sequenza e nel numero di amminoacidi; perciò è la sequenza delle catene laterali chimicamente diverse che contraddistingue ciascuna proteina. Le due estremità di una catena polipeptidica sono chimicamente diverse: l’estremità con il gruppo amminico libero (NH3+, scritto anche NH2) è il terminale amminico, o N-terminale, mentre l’estremità con il gruppo carbossilico libero (COO–, scritto anche COOH) è il terminale carbossilico, o C-terminale. La sequenza degli amminoacidi di una proteina è sempre presentata nella direzione N-C e si legge da sinistra a destra. CAPITOLO 3 Le proteine 114 © 978-88-08-62126-9 (A) (B) amminoacido +180 H O R2 H C Cα N Cα N R1 H H phi H C Cα O R3 psi psi 0 legami peptidici –180 –180 0 phi +180 alfa elica (destrorsa) foglietto beta elica sinistrorsa Figura 3.3 Limitazioni steriche agli angoli di legame principale di una proteina è determinata da una coppia di angoli y e f per ciascun amminoacido; a causa di collisioni steriche fra atomi all’interno di ciascun amminoacido, la maggior parte degli angoli y e f è esclusa. In questo grafico, detto di Ramachandran, ciascun punto rappresenta una coppia osservata di angoli in una proteina. I tre raggruppamenti (cluster) di punti ombreggiati in colori diversi riflettono tre differenti “strutture secondarie” che si trovano ripetutamente nelle proteine, come descritto nel testo. (B, da J. Richardson, Adv. Prot. Chem. 34:174-175, 1981. © Academic Press.) in una catena polipeptidica. (A) Ciascun amminoacido contribuisce con tre legami (rosso) all’ossatura della catena. Il legame peptidico è planare (ombreggiatura grigia) e non permette rotazione. Una rotazione può invece avvenire intorno al legame Ca–C, il cui angolo di rotazione è chiamato psi (y), e intorno al legame N–Ca, il cui angolo di rotazione è chiamato phi (f). Per convenzione un gruppo R è spesso usato per indicare una catena laterale di un amminoacido (circoli viola). (B) La conformazione degli atomi della catena spiegato nel Capitolo 2 (vedi p. 45). I singoli legami non covalenti sono 30300 volte più deboli dei tipici legami covalenti che creano le molecole biologiche. Ma molti legami deboli possono agire in parallelo per tenere due regioni di una catena polipeptidica strettamente legate. In questo modo la stabilità di ciascuna forma ripiegata è determinata dalla forza combinata di un gran numero di questi legami non covalenti (Figura 3.4). acido glutammico N H H O C C attrazioni elettrostatiche CH2 + R CH2 C O C legame idrogeno H H H N + O C CH2 C O H lisina CH3 CH3 H N H N H CH3 C C H valina CH3 CH3 C O H N H C O C C H H N C C O H alanina C R C R CH2 C H H C attrazioni di van der Waals CH2 N O H N CH2 H C H O valina O Figura 3.4 Tre tipi di legami non covalenti aiutano le proteine a ripiegarsi. Sebbene uno solo di questi legami sia molto debole, molti di essi agiscono insieme per creare una disposizione di legami forte, come nell’esempio mostrato. Come nella figura precedente, R è usata come designazione generale per una catena laterale di un amminoacido. CAPITOLO 3 Le proteine 115 © 978-88-08-62126-9 Figura 3.5 Il modo in cui una polipeptide svolto catene laterali non polari catene laterali polari la catena laterale polare all’esterno della molecola può formare legami idrogeno con l’acqua ossatura polipeptidica il nucleo idrofobico contiene catene laterali non polari conformazione ripiegata in ambiente acquoso Una quarta forza debole ha un ruolo centrale nel determinare la forma di una proteina. Come descritto nel Capitolo 2, le molecole idrofobiche, comprese le catene laterali non polari di particolari amminoacidi, tendono a unirsi in un ambiente acquoso per ridurre al minimo i loro effetti che alterano la rete di legami idrogeno delle molecole d’acqua (vedi Quadro 2.2, pp. 96-97). Perciò, un fattore importante che governa il ripiegamento di qualunque proteina è la distribuzione dei suoi amminoacidi polari e non polari. Le catene laterali non polari (idrofobiche) di una proteina – che appartengono ad amminoacidi quali fenilalanina, leucina, valina e triptofano – tendono a raggrupparsi nell’interno della molecola (proprio come goccioline d’olio idrofobiche si uniscono nell’acqua formando una goccia più grande). Ciò permette loro di evitare il contatto con l’acqua che le circonda all’interno di una cellula. Le catene laterali polari – come quelle che appartengono ad arginina, glutammina e istidina – tendono invece a disporsi vicino all’esterno della molecola, dove possono formare legami idrogeno con l’acqua e con altre molecole polari (Figura 3.5). Gli amminoacidi polari immersi all’interno della proteina in genere sono legati da legami idrogeno ad altri amminoacidi polari o all’ossatura polipeptidica. ■ Le proteine si ripiegano nella conformazione con l’energia più bassa Come risultato di tutte queste interazioni la maggior parte delle proteine ha una struttura tridimensionale particolare, che è determinata dall’ordine degli amminoacidi nella sua catena. La struttura finale ripiegata, o conformazione, adottata da una catena polipeptidica è in genere quella che riduce al minimo l’energia libera. Il ripiegamento delle proteine è stato studiato in provetta usando proteine altamente purificate. Una proteina può essere svolta, o denaturata, mediante trattamento con certi solventi, che distruggono le interazioni non covalenti che tengono insieme la catena ripiegata. Questo trattamento converte la proteina in una catena polipeptidica flessibile che ha perso la sua forma naturale. Quando il solvente denaturante viene rimosso la proteina spesso si ripiega spontaneamente, o rinatura, nella sua conformazione originale, il che sta a indicare che tutte le informazioni necessarie per specificare la forma tridimensionale di una proteina sono contenute nella sua sequenza di amminoacidi e questo è un punto cruciale per comprendere la biologia cellulare. La maggior parte delle proteine si ripiega in un’unica conformazione stabile.Tuttavia la conformazione spesso cambia leggermente quando la proteina interagisce con altre molecole nella cellula. Questo cambiamento di forma è spesso cruciale per la funzione della proteina, come vedremo più avanti. proteina si ripiega in una conformazione compatta. Le catene laterali di amminoacidi polari tendono a raggrupparsi all’esterno della proteina, dove possono interagire con l’acqua; le catene laterali di amminoacidi non polari sono immerse all’interno e formano un nucleo idrofobico compatto di atomi non in contatto con l’acqua. In questo disegno schematico la proteina contiene soltanto circa 17 amminoacidi. CAPITOLO 3 Le proteine 116 © 978-88-08-62126-9 QUADRO 3.1 I 20 amminoacidi che si trovano nelle proteine ISOMERI OTTICI LÕAMMINOACIDO L’atomo di carbonio α è asimmetrico, il che permette la formazione di due isomeri speculari (o stereo-), L e D. La formula generale di un amminoacido è atomo di carbonio α H gruppo amminico H2N C gruppo carbossilico COOH R H gruppo della catena laterale H COO– NH3+ L R è comunemente una delle 20 diverse catene laterali. A pH 7 sia il gruppo amminico che quello carbossilico sono ionizzati. H COO– NH3+ Cα Cα R R D + H3N C COO R Le proteine consistono esclusivamente di L-amminoacidi. LEGAMI PEPTIDICI Legame peptidico: i quattro atomi in ciascun riquadro grigio formano un’unità planare rigida. Non c’è rotazione intorno al legame C–N. Gli amminoacidi sono comunemente uniti insieme da un legame ammidico, chiamato legame peptidico. H H N H C R O C N OH H H2O R H C O H C H O C C N OH H H R R N C H H O C OH SH Le proteine sono lunghi polimeri di amminoacidi uniti da legami peptidici e vengono sempre scritte con l’N-terminale verso sinistra. La sequenza di questo tripeptide è istidina-cisteina-valina. N-terminale o amminoterminale +H N 3 H O C C Gli amminoacidi comuni sono raggruppati a seconda che le loro catene laterali siano acide basiche polari senza carica non polari A questi 20 amminoacidi vengono date abbreviazioni a tre e a una lettera. Così: alanina = Ala = A N C C H H N C O H CH2 HN C-terminale o carbossiterminale COO– CH CH3 C CH HC FAMIGLIE DI AMMINOACIDI CH2 + NH CH3 Questi due legami singoli permettono rotazione, pertanto le lunghe catene di amminoacidi sono molto flessibili. CATENE LATERALI BASICHE lisina arginina istidina (Lys, o K) (Arg, o R) (His, o H) H O H O H O N C C N C C N C C H CH2 H CH2 H CH2 CH2 CH2 CH2 NH3 C CH2 + Questo gruppo è molto basico perché la sua carica positiva è stabilizzata da risonanza. CH2 HC NH C +H N 2 HN NH2 CH NH+ Questi azoti hanno un’affinità relativamente debole per un H+ e sono soltanto parzialmente positivi a pH neutro. CAPITOLO 3 Le proteine 117 © 978-88-08-62126-9 CATENE LATERALI ACIDE CATENE LATERALI NON POLARI alanina valina (Val, o V) acido aspartico acido glutammico (Ala, o A) (Asp, o D) (Glu, o E) H O C H O N C C H CH2 H O N C N C C H CH3 H CH2 O N C C H CH CH3 CH3 CH2 C O– O H leucina isoleucina (Leu, o L) (Ile, o I) C O– O H O N C C H CH2 CH3 O N C C H CH CH3 CH CATENE LATERALI POLARI PRIVE DI CARICA H CH3 CH2 CH3 asparagina glutammina prolina fenilalanina (Asn, o N) (Gln, o Q) (Pro, o P) (Phe, o F) H O N C C H CH2 H O N C C H CH2 NH2 O C C CH2 CH2 CH2 C O N H H O N C C H CH2 CH2 (in effetti un amminoacido) C O NH2 Sebbene l’ammide N non sia carica a pH neutro, è polare. metionina triptofano (Met, o M) (Trp, o W) H O N C C H CH2 H O N C C H CH2 CH2 S serina treonina tirosina (Ser, o S) (Thr, o T) (Tyr, o Y) H O N C C H CH2 H O N C C H CH OH CH3 CH3 N H H O glicina cisteina N C C (Gly, o G) (Cys, o C) H CH2 OH H O N C C H H OH Il gruppo –OH è polare. H O N C C H CH2 SH Legami disolfuro si possono formare fra due catene laterali di cisteine nelle proteine. CH2 S S CH2 CAPITOLO 3 Le proteine 118 Figura 3.6 Quattro tipi di rappresentazione che descrivono la struttura di un piccolo dominio proteico. Formato da una sequenza di 100 amminoacidi, il dominio SH2 fa parte di molte proteine diverse (vedi per esempio la Figura 3.63). In questa figura la struttura del dominio SH2 è rappresentata come (A) un modello dell’ossatura polipeptidica, (B) un modello a nastro, (C) un modello a fil di ferro in cui sono comprese le catene laterali e (D) un modello a spazio pieno (Filmato 3.1 ). Queste immagini sono colorate in maniera tale che la catena polipeptidica possa essere seguita dall’N-terminale (viola) al C-terminale (rosso). (Codice PDB:1SHA.) © 978-88-08-62126-9 (A) (B) (C) (D) Sebbene una catena proteica si possa ripiegare nella sua conformazione corretta senza aiuto esterno, il ripiegamento delle proteine in una cellula vivente è spesso assistito da proteine speciali chiamate chaperoni molecolari. Queste proteine si legano a catene polipeptidiche parzialmente ripiegate e le aiutano a progredire lungo la via di ripiegamento energeticamente più favorevole. Nelle condizioni affollate del citoplasma i chaperoni impediscono alle regioni idrofobiche, temporaneamente esposte nelle proteine appena sintetizzate, di associarsi fra loro per formare aggregati proteici (vedi p. 374).Tuttavia la forma tridimensionale definitiva della proteina è ancora specificata dalla sua sequenza di amminoacidi: i chaperoni semplicemente rendono il processo di ripiegamento più affidabile. Le proteine hanno una grande varietà di forme e sono lunghe in genere da 50 a 2000 amminoacidi. Le proteine più grandi di solito consistono di parecchi domini proteici distinti (unità strutturali che si ripiegano in modo più o meno indipendente l’una dall’altra, come vedremo più avanti). La struttura dettagliata anche di un piccolo dominio è complicata e per chiarezza vengono usati convenzionalmente diversi modi per rappresentarla, ciascuno dei quali mette in evidenza aspetti differenti della proteina. Come esempio, la Figura 3.6 mostra quattro possibili rappresentazioni di un dominio proteico chiamato SH2, una struttura presente in molte proteine diverse delle cellule eucariotiche e coinvolta nella segnalazione cellulare (vedi Figura 15.46). Le descrizioni delle strutture proteiche sono rese più semplici dal fatto che le proteine sono costituite da combinazioni di parecchi motivi strutturali comuni, di cui ci occuperemo adesso. ■ L’a elica e il foglietto b sono schemi comuni di ripiegamento Quando si confrontano le strutture tridimensionali di molte molecole proteiche diverse diventa chiaro che, sebbene la conformazione globale di ciascuna proteina sia unica, spesso si trovano in parti di esse due schemi regolari di ripiegamento. Entrambi gli schemi sono stati scoperti più di sessant’anni fa grazie a studi eseguiti sui peli e sulla seta. Il primo schema di ripiegamento a CAPITOLO carbonio R azoto R ossigeno R 0,7 nm carbonio R legame idrogeno 0,54 nm R R legame peptidico carbonio R R R R R catena laterale dell’amminoacido legame idrogeno idrogeno catena laterale dell’amminoacido R idrogeno R R R R ossigeno R carbonio azoto azoto R R R R (A) 3 Le proteine 119 © 978-88-08-62126-9 R (B) R R (C) Figura 3.7 La conformazione regolare dell’ossatura polipeptidica osservata nell’a elica e nel foglietto b. L’a elica è mostrata in (A) e (B). L’N–H di ogni legame peptidico forma legami idrogeno con il C=O di un legame peptidico vicino posto a quattro legami peptidici di distanza sulla stessa catena. Si noti che tutti i gruppi N–H sono rivolti in alto in questo disegno e che tutti i gruppi C=O sono rivolti in basso (verso il C-terminale); ciò dà una polarità all’elica, in cui il C-terminale ha una carica parziale negativa e l’N-terminale ha una carica parziale positiva (Filmato 3.2 ). Il foglietto b è mostrato (D) in (C) e (D). In questo esempio catene peptidiche adiacenti corrono in direzioni opposte (antiparallele). Le singole catene polipeptidiche (filamenti) in un foglietto b sono tenute insieme da legami idrogeno fra legami peptidici di filamenti diversi e le catene laterali degli amminoacidi di ciascun filamento si proiettano alternativamente sopra e sotto il piano del foglietto (Filmato 3.3 ). (A) e (C) mostrano tutti gli atomi dell’ossatura polipeptidica, ma le catene laterali degli amminoacidi sono tronche e indicate con R. (B) e (D) invece mostrano soltanto gli atomi di carbonio e di azoto dell’ossatura. essere stato scoperto, chiamato a elica, è stato trovato nella proteina a-cheratina, che è abbondante nella pelle e nei suoi derivati, come peli, unghie e corna. Dopo meno di un anno dalla scoperta dell’a elica, una seconda struttura ripiegata, chiamata foglietto b, fu trovata nella proteina fibroina, il costituente principale della seta. Questi due schemi sono particolarmente comuni perché derivano dalla formazione di legami idrogeno fra i gruppi NOH e CPO dell’ossatura polipeptidica, senza coinvolgere le catene laterali degli amminoacidi. Quindi, sebbene incompatibili con alcune catene laterali di amminoacidi, questi schemi possono essere formati da molte sequenze diverse di amminoacidi. In ciascun caso la catena proteica adotta una conformazione ripetitiva regolare. La Figura 3.7 mostra la struttura dettagliata di queste due importanti conformazioni, che nei modelli a nastro delle proteine sono rappresentate rispettivamente da un nastro elicoidale e da un gruppo di frecce allineate. Il nucleo di molte proteine contiene estese regioni a foglietto b. Come mostrato nella Figura 3.8, questi foglietti b si possono formare da catene polipeptidiche adiacenti che corrono nella stessa direzione (catene parallele) o da una catena polipeptidica che si ripiega avanti e indietro su se stessa, con ciascuna sezione della catena che corre nella direzione opposta a quella della catena più vicina (catene antiparallele). Entrambi i tipi di foglietto b producono una struttura molto rigida, tenuta insieme da legami idrogeno che connettono i legami peptidici di catene adiacenti (vedi Figura 3.7C). Un’a elica si genera quando una singola catena polipeptidica si avvolge su se stessa per formare un cilindro rigido. Si forma un legame idrogeno fra un legame peptidico e il quarto successivo, collegando il CPO di un legame peptidico con l’NOH di un altro (vedi Figura 3.7A). Ciò dà origine a un’elica regolare con un giro completo ogni 3,6 amminoacidi. Il dominio proteico SH2 illustrato nella Figura 3.6 contiene due a eliche, oltre a strutture a foglietto b a tre filamenti antiparalleli. (A) (B) Figura 3.8 Due tipi di strutture a foglietto b. (A) Un foglietto b antiparallelo (vedi Figura 3.7C). (B) Un foglietto b parallelo. Entrambe queste strutture sono comuni nelle proteine. CAPITOLO 3 Le proteine 120 Figura 3.9 Un coiled coil. (A) Una singola a elica, con catene laterali di amminoacidi successivi contrassegnate da una sequenza di sette, “abcdefg” (dal basso in alto). Gli amminoacidi “a” e “d” in questa sequenza si trovano vicini sulla superficie del cilindro, formando una “striscia” (verde) che si avvolge lentamente intorno all’a elica. Le proteine che formano coiled coil di norma hanno amminoacidi non polari nelle posizioni “a” e “d”. Di conseguenza, come mostrato in (B), le due a eliche possono avvolgersi l’una intorno all’altra con le catene laterali non polari di un’a elica che interagiscono con le catene laterali non polari dell’altra. (C) La struttura atomica di un coiled coil determinata mediante cristallografia ai raggi X. L’ossatura dell’a elica è mostrata in rosso e le catene laterali non polari sono rappresentate in verde, mentre le catene amminoacidiche laterali più idrofiliche, mostrate in grigio, sono lasciate esposte all’ambiente acquoso (Filmato 3.4 ). (Codice PDB: 3NMD.) © 978-88-08-62126-9 NH2 a e d a NH2 NH2 e d a g striscia di amminoacidi idrofobici “a” e “d” d a g 11 nm d c a g d c g le eliche si avvolgono l’una intorno all’altra per ridurre al minimo i contatti delle catene laterali idrofobiche degli amminoacidi con l’ambiente acquoso HOOC COOH 0,5 nm (A) (B) (C) Regioni ad a elica sono abbondanti in proteine poste nelle membrane cellulari, come proteine di trasporto e recettori. Come vedremo nel Capitolo 10, quelle porzioni di una proteina transmembrana che attraversano il doppio strato lipidico in genere lo attraversano sotto forma di un’a elica composta in gran parte da amminoacidi con catene laterali non polari. L’ossatura polipeptidica, che è idrofilica, forma legami idrogeno con se stessa nell’a elica ed è schermata dall’ambiente lipidico idrofobico della membrana dalle catene laterali non polari (vedi anche Figura 10.19). In altre proteine le a eliche si avvolgono l’una intorno all’altra per formare una struttura particolarmente stabile, nota come coiled coil. Questa struttura si può formare quando le due (o in qualche caso tre o quattro) a eliche hanno la maggior parte delle loro catene laterali non polari (idrofobiche) su un lato, così che possono avvolgersi l’una intorno all’altra, con queste catene laterali rivolte all’interno (Figura 3.9). Lunghi coiled coil a bastoncino forniscono la base strutturale di molte proteine allungate. Esempi di ciò sono l’a-cheratina, che forma le fibre intracellulari che rinforzano lo strato esterno della pelle e delle sue appendici, e la miosina, responsabile della contrazione muscolare. ■ I domini proteici sono unità modulari che costituiscono le proteine più grandi Anche una piccola molecola proteica è costituita da migliaia di atomi uniti insieme da legami covalenti e non covalenti orientati precisamente. I biologi riescono a visualizzare queste strutture così complicate mediante diversi sistemi grafici tridimensionali computerizzati. Le risorse dello studente presenti sul sito che accompagna questo libro contengono immagini generate con il computer di proteine selezionate, mostrate e ruotate sullo schermo in diversi formati diversi. Gli scienziati distinguono quattro livelli di organizzazione nella struttura di una proteina. La sequenza degli amminoacidi è nota come struttura primaria della proteina. Tratti di catena polipeptidica che formano a eliche e CAPITOLO Figura 3.10 Una proteina formata dominio SH3 da domini multipli. Nella proteina Src qui rappresentata un dominio C-terminale con due lobi (giallo e arancione) forma un enzima proteina chinasi, mentre i domini SH2 e SH3 svolgono funzioni regolatrici. (A) Un modello a nastro, con l’ATP substrato in rosso. (B) Un modello a spazio pieno, con l’ATP substrato in rosso. Si noti che il sito che lega l’ATP è posizionato all’interfaccia dei due lobi che formano la chinasi. La struttura dettagliata del dominio SH2 è illustrata nella Figura 3.6. (Codice PDB: 2SRC.) ATP (A) dominio SH2 (B) foglietti b costituiscono la struttura secondaria della proteina. L’organizzazione tridimensionale completa di una catena polipeptidica viene talvolta chiamata struttura terziaria e, se una particolare proteina è composta da un complesso di più di una catena polipeptidica, la struttura completa è definita struttura quaternaria. Lo studio della conformazione, della funzione e dell’evoluzione delle proteine ha anche rivelato l’importanza centrale di un’unità di organizzazione distinta dalle quattro appena descritte. Questa è il dominio proteico, una sottostruttura prodotta da qualunque parte di una catena polipeptidica che si possa ripiegare indipendentemente in una struttura compatta stabile. Un dominio in genere contiene dai 40 ai 350 amminoacidi ed è l’unità modulare da cui sono costituite molte proteine più grandi. I diversi domini di una proteina spesso sono associati a differenti funzioni. La Figura 3.10 mostra un esempio, la proteina chinasi Src, che agisce nelle vie di segnalazione all’interno delle cellule dei vertebrati (Src si pronuncia “sarc”). Questa proteina ha tre domini: i domini SH2 e SH3 hanno ruoli regolatori, mentre il dominio C-terminale è responsabile dell’attività catalitica della chinasi. Più avanti in questo capitolo ritorneremo su questa proteina, per spiegare il modo in cui le proteine possono formare interruttori molecolari che trasmettono l’informazione attraverso le cellule. La Figura 3.11 presenta modelli a nastro di tre domini proteici organizzati diversamente. Come illustrano questi esempi, il nucleo centrale di un dominio può essere costituito da a eliche, da foglietti b o da varie combinazioni di questi due fondamentali elementi ripiegati. (A) 3 Le proteine 121 © 978-88-08-62126-9 (B) (C) Figura 3.11 Modelli a nastro di tre diversi domini proteici. (A) Il citocromo b562, una proteina a singolo dominio coinvolta nel trasporto degli elettroni nei mitocondri. Questa proteina è composta quasi completamente da a eliche. (B) Il dominio che lega NAD dell’enzima lattico deidrogenasi, composto da una miscela di a eliche e di foglietti b paralleli. (C) Il dominio variabile di una catena leggera di una immunoglobulina (anticorpo), composta da un sandwich di due foglietti b antiparalleli. In questi esempi le a eliche sono mostrate in verde, mentre i filamenti organizzati come foglietti b sono riportati come frecce rosse. Si noti che la catena polipeptidica in genere attraversa l’intero dominio avanti e indietro, facendo curve strette soltanto in corrispondenza della superficie della proteina (Filmato 3.5 ). Sono le regioni sporgenti ad ansa (giallo) che spesso formano i siti di legame per altre molecole. (Adattata da disegni gentilmente concessi da Jane Richardson.) CAPITOLO 3 Le proteine 122 © 978-88-08-62126-9 Le molecole proteiche più piccole contengono soltanto un singolo dominio, mentre le proteine più grandi possono contenere anche parecchie decine di domini, in genere connessi fra loro da brevi tratti relativamente non strutturati di catena polipeptidica che può agire come una cerniera flessibile tra i domini. ■ Poche delle molte catene polipeptidiche possibili sono utili per le cellule Poiché ciascuno dei 20 amminoacidi è chimicamente distinto e ciascuno può, in linea di principio, trovarsi in qualunque posizione di una catena proteica, vi sono 20 3 20 3 20 3 20 5 160 000 catene polipeptidiche possibili lunghe quattro amminoacidi, o 20n catene polipeptidiche possibili lunghe n amminoacidi. Per una lunghezza tipica di una proteina di circa 300 amminoacidi si potrebbero teoricamente costruire più di 10390 (20300) diverse catene polipeptidiche. Questo è un numero talmente enorme che produrre anche una sola molecola di ciascun tipo richiederebbe molti più atomi di quanti ne esistano nell’universo. Soltanto una frazione piccolissima di questa enorme serie di catene polipeptidiche concepibili adotterebbe una conformazione tridimensionale singola stabile (secondo alcune stime, meno di una su un miliardo). Eppure, la maggior parte delle proteine presenti nelle cellule adotta conformazioni uniche e stabili. Com’è possibile? La risposta si trova nella selezione naturale. È improbabile che una proteina con una struttura e un’attività biochimica variabile in modo non prevedibile aiuti la sopravvivenza della cellula che la contiene. Queste proteine sarebbero quindi state eliminate dalla selezione naturale nel lunghissimo processo di prova ed errore che è alla base dell’evoluzione biologica. Poiché l’evoluzione ha selezionato la funzione delle proteine negli organismi viventi, la sequenza degli amminoacidi di una proteina odierna è tale da produrre una singola conformazione estremamente stabile. Inoltre questa conformazione ha proprietà chimiche finemente regolate per permettere alla proteina di svolgere una particolare funzione catalitica o strutturale nella cellula. Le proteine sono costruite in modo così preciso che il cambiamento anche di pochi atomi in un amminoacido può talvolta alterare la struttura dell’intera molecola in modo così grave da farle perdere completamente la funzione e, come vedremo più avanti nel capitolo, quando accadono certi rari eventi di ripiegamento errato della proteina, le conseguenze possono essere disastrose per l’organismo in cui essi si verificano. ■ Le proteine possono essere classificate in molte famiglie Una volta che una proteina che si ripiega in una conformazione stabile con proprietà utili si è evoluta, la sua struttura può essere modificata nel corso dell’evoluzione per permetterle di svolgere nuove funzioni. Questo processo è stato enormemente accelerato da meccanismi genetici che occasionalmente producono copie duplicate di geni, permettendo a una copia del gene di evolvere in modo indipendente per svolgere una nuova funzione (vedi Capitolo 4). Questo tipo di evento si è verificato molto spesso nel passato; come risultato, molte proteine odierne possono essere raggruppate in famiglie proteiche, i cui membri hanno una sequenza di amminoacidi e una conformazione tridimensionale che assomiglia a quella degli altri membri della famiglia. Consideriamo, per esempio, le serina proteasi, una grande famiglia di enzimi che tagliano proteine (proteolitici) che comprende gli enzimi digestivi chimotripsina, tripsina ed elastasi, e parecchie proteasi coinvolte nella coagulazione del sangue. Quando si confrontano le porzioni proteasiche di due di questi enzimi, si trova che parti delle loro sequenze di amminoacidi corrispondono. La somiglianza delle loro conformazioni tridimensionali è ancora più sorprendente: la maggior parte degli avvolgimenti e dei giri dettagliati delle loro catene polipeptidiche, che sono lunghe parecchie centinaia di amminoacidi, è praticamente identica (Figura 3.12). Le molte serina proteasi diverse hanno nonostante ciò attività enzimatiche distinte, e ciascuna taglia proteine diverse CAPITOLO 3 Le proteine 123 © 978-88-08-62126-9 Figura 3.12 Le conformazioni di HOOC HOOC NH 2 elastasi NH 2 chimotripsina due serina proteasi a confronto. Le conformazioni dell’ossatura di elastasi e chimotripsina. Sebbene soltanto gli amminoacidi ombreggiati in verde siano gli stessi nelle due proteine, le due conformazioni sono molto simili quasi dappertutto. Il sito attivo di ciascun enzima è cerchiato in rosso; questo è il punto in cui i legami peptidici delle proteine che servono da substrato sono legati e tagliati per idrolisi. Le serina proteasi derivano il loro nome dall’amminoacido serina, la cui catena laterale è parte del sito attivo di ciascun enzima e partecipa direttamente alla reazione di taglio. I due punti sul lato destro della molecola di chimotripsina segnano le due nuove terminazioni create quando l’enzima taglia la sua stessa ossatura. o legami peptidici fra tipi diversi di amminoacidi. Ciascuna perciò svolge una funzione differente in un organismo. Quanto detto per le serina proteasi potrebbe essere ripetuto per centinaia di altre famiglie proteiche. In generale, la struttura dei diversi membri di una famiglia si è conservata di più della sequenza degli amminoacidi. In molti casi le sequenze degli amminoacidi si sono talmente diversificate che non si può essere sicuri della relazione familiare fra due proteine senza determinare le loro strutture tridimensionali. La proteina a2 del lievito e la proteina engrailed di Drosophila, per esempio, sono entrambe proteine regolatrici della famiglia a omeodominio (vedi Capitolo 7). Poiché sono identiche soltanto in 17 dei 60 residui amminoacidici dei loro omeodomini, la loro relazione è diventata certa soltanto quando sono state confrontate le loro strutture tridimensionali (Figura 3.13). Molti esempi simili mostrano che due proteine con più del 25% di identità nella loro sequenza amminoacidica di solito hanno la stessa struttura generale. (A) (B) elica 2 elica 3 elica 1 COOH NH2 (C) H2N lievito G H R F T K E N V R I L E S W F A K N I E N P Y L D T K G L E N L MK N T S L S R I Q I K NWV S N R R R K E K T I R T A F S S E O L A R L K R E F N E N - - - R Y L T E R R R QQ L S S E L G L N E AQ I K I WF QN K R A K I K K S Drosophila Figura 3.13 Un confronto di una classe di domini che legano DNA, chiamati omeodomini, in una coppia di proteine di due organismi separati da più di un miliardo di anni di evoluzione. (A) Un modello a nastro della struttura comune a entrambe le proteine. (B) Una traccia delle posizioni dei carboni a. Le strutture tridimensionali qui rappresentate sono state determinate mediante cristallografia ai raggi X per COOH la proteina a2 del lievito (verde) e per la proteina engrailed di Drosophila (rossa). (C) Un confronto delle sequenze di amminoacidi della regione delle proteine mostrata in (A) e in (B). I pallini neri marcano siti con amminoacidi identici. I pallini arancione indicano la posizione di un inserto di tre amminoacidi nella proteina a2. (Adattata da C. Wolberger et al., Cell 67:517528, 1991. Con il permesso di Elsevier.) CAPITOLO 3 Le proteine 124 © 978-88-08-62126-9 Figura 3.14 Rimescolamento dei domini. Durante l’evoluzione delle proteine si è verificato un esteso rimescolamento di blocchi di sequenze proteiche (domini proteici). Quelle porzioni di una proteina indicate dalla stessa forma e dallo stesso colore in questo disegno schematico sono correlate evolutivamente. Le serina proteasi come la chimotripsina sono formate da due domini (marrone). Nelle altre tre proteasi mostrate, che sono altamente regolate e più specializzate, questi due domini proteasici sono connessi a uno o più domini omologhi a domini presenti nel fattore di crescita dell’epidermide (EGF; verde), a una proteina che lega il calcio (giallo) o a un dominio “kringle” (blu). La chimotripsina è illustrata nella Figura 3.12. EGF H2N COOH CHIMOTRIPSINA H2N COOH UROCHINASI H2N COOH FATTORE IX H2N COOH PLASMINOGENO H2N COOH I vari membri di una grande famiglia proteica hanno spesso funzioni distinte. Alcuni dei cambiamenti di amminoacidi che rendono diversi i membri della famiglia sono stati senza dubbio selezionati nel corso dell’evoluzione perché hanno portato a modificazioni utili nell’attività biologica, conferendo ai singoli membri della famiglia le diverse proprietà funzionali che hanno oggi. Ma molti altri cambiamenti di amminoacidi sono effettivamente “neutri”, non avendo né un effetto benefico né uno dannoso sulla struttura e sulla funzione base della proteina. Inoltre, poiché la mutazione è un processo casuale, devono esserci stati anche molti cambiamenti deleteri che hanno alterato la struttura tridimensionale di queste proteine in modo sufficiente da danneggiarle. Queste proteine difettose sarebbero state perdute tutte le volte che i singoli organismi che le producevano avevano uno svantaggio tale da essere eliminati dalla selezione naturale. Le famiglie proteiche si riconoscono facilmente quando si sequenzia il genoma di un organismo; per esempio, la determinazione della sequenza del DNA dell’intero genoma umano ha rivelato che noi possediamo circa 21 000 geni che codificano proteine. (Si noti tuttavia che, come risultato dello splicing alternativo, le cellule umane possono produrre più di 21 000 proteine diverse, come spiegheremo nel Capitolo 6).Tramite confronti di sequenze, si possono assegnare i prodotti di circa il 40% di questi geni a strutture proteiche note, appartenenti a più di 500 famiglie proteiche diverse. La maggior parte delle proteine di ciascuna famiglia si è evoluta per svolgere funzioni un po’ differenti, come per gli enzimi elastasi e chimotripsina illustrati in precedenza nella Figura 3.12. Come spiegato nel Capitolo 1 (vedi Figura 1.21), questi geni sono talvolta chiamati paraloghi per distinguerli dalle proteine corrispondenti in organismi diversi (ortologhi, come l’elastasi umana e di topo). Come vedremo nel Capitolo 8, grazie alle tecniche potenti di cristallografia ai raggi X e di risonanza magnetica nucleare (NMR) oggi conosciamo la forma tridimensionale, o conformazione, di più di 100 000 proteine. Confrontando attentamente le conformazioni di queste proteine, i biologi strutturali (cioè gli esperti della struttura delle molecole biologiche) hanno concluso che esiste un numero limitato di modi in cui i domini proteici si ripiegano in natura, forse meno di 2000, se consideriamo tutti gli organismi. Per la maggior parte di queste strutture, chiamate ripiegamenti proteici, è stato possibile determinare le strutture rappresentative. Il database attuale di sequenze proteiche note contiene più di venti milioni di voci e sta crescendo molto rapidamente man mano che vengono sequenziati altri genomi, rivelando un enorme numero di nuovi geni che codificano proteine. L’intervallo di dimensione dei polipeptidi codificati è molto ampio, da polipeptidi di 6 amminoacidi a proteine gigantesche di 33 000 amminoacidi. Confronti fra proteine sono importanti perché strutture correlate spesso implicano funzioni correlate. Si possono risparmiare anni di esperimenti scoprendo che una nuova proteina ha un’omologia nella sequenza amminoacidica con una proteina di cui è nota la funzione. Queste relazioni di sequenza, per esempio, hanno indicato per la prima volta che certi geni che provocano la trasformazione cancerosa delle cellule dei mammiferi codificano proteina chinasi (vedi Capitolo 20). ■ Alcuni domini proteici formano parti di molte proteine diverse Come abbiamo detto in precedenza, la maggior parte delle proteine è composta da una serie di domini proteici, in cui regioni diverse della catena polipeptidica si sono ripiegate in modo indipendente formando strutture compatte. Si pensa che queste proteine multidominio si siano originate quando le sequenze di DNA che codificano ciascun dominio si sono unite accidentalmente, creando un nuovo gene. Molte grandi proteine si sono evolute per unione di domini preesistenti in nuove combinazioni, un processo evolutivo chiamato rimescolamento dei domini (Figura 3.14). Nuove superfici di legame si sono spesso create in corrispondenza della giustapposizione dei domini e molti dei siti funzionali in cui le proteine legano piccole molecole si trovano in quei punti. CAPITOLO 3 Le proteine 125 © 978-88-08-62126-9 Figura 3.15 Le strutture tridimensionali di tre domini proteici usati comunemente. In questi disegni schematici a nastro i foglietti b sono mostrati come frecce e gli N- e i C-terminali sono indicati da sfere rosse. In natura esistono molti altri tipi di questi “moduli”. (Adattata da M. Baron, D.G. Norman e I.D. Campbell, Trends Biochem. Sci. 16:1317, 1991, con il permesso di Elsevier, e D.J. Leahy et al., Science 258:987991, 1992, con il permesso di AAAS.) 1 nm modulo immunoglobulinico modulo tipo 3 della fibronectina modulo kringle Una sottoserie di domini proteici è stata particolarmente mobile durante l’evoluzione; sembra che questi domini abbiano strutture molto versatili e sono talvolta chiamati moduli proteici. La struttura di uno di questi moduli, il dominio SH2, è stata illustrata nella Figura 3.6.Tre altri domini proteici abbondanti sono illustrati nella Figura 3.15. Ciascuno dei domini mostrati ha una struttura centrale stabile, formata da filamenti di foglietti b, da cui sporgono anse meno ordinate di catene polipeptidiche. Le anse sono situate in modo ideale per formare siti di legame per altre molecole, come dimostrato nel modo più evidente per il ripiegamento immunoglobulinico, che forma la base delle molecole anticorpali. Il successo evolutivo di questi moduli di foglietti b è probabilmente dovuto al fatto che forniscono una struttura appropriata per la generazione di nuovi siti di legami per ligandi tramite piccoli cambiamenti di queste anse sporgenti (vedi Figura 3.42). Un secondo aspetto dei domini proteici che ne spiega l’utilità è la facilità con cui possono essere integrati in altre proteine. Due dei tre domini illustrati nella Figura 3.15 hanno i loro N- e C-terminali su poli opposti del dominio. Quando il DNA che codifica un dominio di questo tipo subisce una duplicazione in tandem, che non è insolita nell’evoluzione dei genomi (vedi Capitolo 4), i moduli duplicati con questa disposizione “in linea” possono essere facilmente collegati in serie per formare strutture estese, sia con se stessi che con altri domini in linea (Figura 3.16). Rigide strutture estese composte da una serie di domini sono comuni specialmente nelle molecole della matrice extracellulare e nelle porzioni extracellulari di recettori proteici della superficie cellulare. Altri domini, compresi il dominio SH2 e il dominio kringle illustrato nella Figura 3.15, sono di un tipo “a spina”, con gli N- e i C-terminali vicini fra loro. Dopo riarrangiamenti genomici, questi moduli sono in genere disposti come un’inserzione in una regione ad ansa di una seconda proteina. Un confronto della frequenza relativa dell’utilizzo dei domini in eucarioti diversi ha rivelato che per molti domini comuni, come le proteina chinasi, la frequenza è simile in organismi così diversi come il lievito, i vegetali, i vermi, le mosche e gli esseri umani. Ma ci sono eccezioni notevoli, come il dominio di riconoscimento dell’antigene del complesso maggiore di istocompatibilità (MHC) (vedi Figura 24.36) che si trova in 57 copie negli esseri umani, ma è assente negli altri quattro organismi appena menzionati. Presumibilmente Figura 3.16 Una struttura estesa formata da una serie di domini proteici. Quattro domini di fibronectina tipo 3 (vedi Figura 3.15) della molecola della matrice extracellulare fibronectina sono illustrati in (A) come modello a nastro e in (B) come modello a spazio pieno. (Adattata da D.J. Leahy, I. Aukhil e H.P. Erickson, Cell 84:155164, 1996. Con il permesso di Elsevier.) (A) (B) CAPITOLO 3 Le proteine 126 © 978-88-08-62126-9 questi domini hanno funzioni specializzate che non sono condivise da altri eucarioti, avendo subito una forte selezione durante l’evoluzione per poter dare origine alle copie multiple osservate. In modo simile si potrebbe supporre che un dominio come SH2, che mostra un insolito aumento di numero negli eucarioti superiori, sia particolarmente utile per la pluricellularità. ■ Certe coppie di domini si trovano insieme in molte proteine Possiamo costruire una grande tavola che mostra l’utilizzo dei domini in ciascun organismo di cui conosciamo la sequenza del genoma. Per esempio, si stima che il genoma umano contenga circa 1000 domini immunoglobulinici, 500 domini di proteina chinasi, 250 omeodomini che legano il DNA, 300 domini SH3 e 120 domini SH2. Inoltre, emerge che più dei due terzi delle proteine consistono di due o più domini e che le stesse coppie di domini si trovano ripetutamente nella stessa disposizione relativa in una proteina. Sebbene metà di tutte le famiglie di domini sia comune ad archei, batteri ed eucarioti, soltanto il 5% delle combinazioni di due domini è ugualmente condiviso. Questo schema suggerisce che la maggior parte delle proteine che contengono combinazioni particolarmente utili di due domini sia comparsa relativamente tardi nel corso dell’evoluzione. ■ Il genoma umano codifica una serie complessa di proteine, la funzione di molte delle quali è sconosciuta lievito Ep1 PHD PHD Ep2 verme Ep1 PHD PHD Ep2 Br Ep2 Br uomo Znf Ep1 PHD PHD BMB Figura 3.17 Struttura a domini di un gruppo di proteine correlate evolutivamente che si pensa abbiano una funzione simile. In generale c’è una tendenza per le proteine degli organismi più complessi, come gli esseri umani, a contenere ulteriori domini, come nel caso delle proteine che legano il DNA confrontate qui. Il risultato del sequenziamento del genoma umano è stato sorprendente, perché rivela che i nostri cromosomi contengono soltanto circa 21 000 geni codificanti proteine. In base al numero dei geni sembriamo non essere più complessi della minuscola erba Arabidopsis e soltanto circa 1,3 volte più complessi di un nematode. Le sequenze del genoma rivelano anche che i vertebrati hanno ereditato quasi tutti i loro domini proteici dagli invertebrati; soltanto il 7% dei domini umani identificati è specifico dei vertebrati. Tuttavia ciascuna proteina umana è in media più complicata (Figura 3.17). Un processo di rimescolamento di domini durante l’evoluzione dei vertebrati ha dato origine a molte nuove combinazioni di domini proteici, con il risultato che nelle proteine umane vi è quasi il doppio delle combinazioni di domini che si trovano in un verme o in una mosca. Così, per esempio, il dominio serina proteasi simile a tripsina è collegato ad almeno altri 18 tipi di domini proteici nelle proteine umane, mentre si trova unito covalentemente a 5 soli domini diversi nel verme. Questa varietà extra nelle nostre proteine aumenta di molto la gamma di possibili interazioni proteina-proteina (vedi Figura 3.79), ma come contribuisca a renderci umani non è noto. La complessità degli organismi viventi è impressionante e sapere che al momento non abbiamo il minimo indizio su quale potrebbe essere la funzione di più di 10 000 delle proteine che abbiamo identificato finora nel genoma umano smorza alquanto l’entusiasmo. La prossima generazione di biologi cellulari dovrà affrontare certamente enormi sfide e non mancheranno affascinanti misteri da risolvere. ■ Le molecole proteiche più grandi spesso contengono più di una catena polipeptidica Gli stessi deboli legami non covalenti che rendono una catena proteica capace di ripiegarsi in una conformazione specifica permettono anche alle proteine di legarsi fra loro per produrre strutture più grandi nella cellula. Qualunque regione della superficie di una proteina che può interagire con un’altra molecola attraverso serie di legami non covalenti è chiamata sito di legame. Una proteina può contenere siti di legame per varie molecole, sia grandi che piccole. Se un sito di legame riconosce la superficie di una seconda proteina, lo stretto legame di due catene polipeptidiche ripiegate in corrispondenza di questo sito crea una molecola proteica più grande con una geometria precisamente definita. Ciascuna catena polipeptidica in una proteina di questo tipo è detta subunità proteica. CAPITOLO 3 Le proteine 127 © 978-88-08-62126-9 Figura 3.18 Due subunità proteiche identiche che si legano insieme per formare un dimero simmetrico. La proteina repressore Cro del batteriofago lambda si lega al DNA per spegnere specifici sottogruppi di geni virali. Le sue due subunità identiche si legano testa-testa, tenute insieme da una combinazione di forze idrofobiche (blu) e da una serie di legami idrogeno (regione gialla). (Adattata da D.H. Ohlendorf, D.E. Tronrud e B.W. Matthews, J. Mol. Biol. 280:129-136, 1998. Con il permesso di Academic Press.) Nel caso più semplice due identiche catene polipeptidiche ripiegate si legano fra loro in una disposizione “testa-testa”, formando un complesso simmetrico di due subunità proteiche (un dimero) tenuto insieme da interazioni fra due siti di legame identici. La proteina repressore Cro – una proteina virale regolatrice dei geni che si lega al DNA per spegnere geni virali in una cellula batterica infettata – fornisce un esempio (Figura 3.18). Nelle cellule si trovano comunemente molti altri tipi di complessi proteici simmetrici, formati da copie multiple di una singola catena polipeptidica (per esempio, vedi Figura 3.20). Molte proteine cellulari contengono due o più tipi di catene polipeptidiche. L’emoglobina, la proteina che trasporta ossigeno nei globuli rossi, contiene due subunità identiche di a-globina e due subunità identiche di b-globina, disposte simmetricamente (Figura 3.19). Queste proteine con molte subunità sono molto comuni nelle cellule e possono essere molto grandi (Filmato 3.6 ). ■ Alcune proteine globulari formano lunghi filamenti elicoidali Le proteine che abbiamo discusso finora sono per la maggior parte proteine globulari, in cui la catena polipeptidica si ripiega in una forma compatta come una palla con una superficie irregolare. Alcune di queste molecole proteiche possono assemblarsi formando filamenti che possono attraversare l’intera lunghezza di una cellula. Nel modo più semplice, una lunga catena di molecole proteiche identiche può essere costruita se ciascuna molecola ha un sito di legame complementare a un’altra regione della superficie della stessa molecola (Figura 3.20). Un filamento di actina, per esempio, è una lunga struttura elicoidale prodotta da molte molecole della proteina actina (Figura 3.21). L’actina è molto abbondante nelle cellule eucariotiche, dove costituisce uno dei principali sistemi di filamenti del citoscheletro (vedi Capitolo 16). Incontreremo molte strutture elicoidali in questo libro. Perché l’elica è una struttura così comune in biologia? Come abbiamo visto, le strutture biologiche spesso sono formate collegando subunità molto simili fra loro in lunghe catene ripetitive. Se tutte le subunità sono identiche, le subunità vicine nella catena spesso possono adattarsi l’una all’altra soltanto in un modo, aggiustando le loro posizioni relative per ridurre al minimo l’energia libera del contatto. β β α α Figura 3.19 Una proteina formata come complesso simmetrico di due subunità diverse. L’emoglobina è una proteina abbondante nei globuli rossi che contiene due copie di a-globina (verde) e due copie di b-globina (blu). Ciascuna delle quattro catene polipeptidiche contiene una molecola di eme (rosso), che è il sito a cui si lega l’ossigeno (O2). Così ciascuna molecola di emoglobina nel sangue porta quattro molecole di ossigeno. (Codice PDB: 2DHB.) (A) subunità libere strutture assemblate dimero sito di legame (B) elica siti di legame Figura 3.20 Complessi proteici. (A) Una proteina con un solo sito di legame può formare un dimero con un’altra proteina identica. (B) Proteine identiche con due siti di legame diversi spesso formano un lungo filamento elicoidale. (C) Se i due siti di legame sono disposti in modo appropriato l’uno rispetto all’altro, le subunità proteiche possono formare un anello chiuso invece di un’elica. (Per un esempio di A vedi Figura 3.18; per un esempio di B vedi Figura 3.21; per esempi di C vedi Figure 5.14 e 14.31.) (C) anello siti di legame CAPITOLO 3 Le proteine 128 © 978-88-08-62126-9 molecola di actina estremità meno 37 nm estremità più (A) 50 nm (B) Figura 3.21 Filamenti di actina. (A) Micrografie elettroniche a trasmissione di filamenti di actina colorati negativamente. (B) La disposizione a elica di molecole di actina in un filamento di actina. (A, per gentile concessione di Roger Craig.) Come risultato ciascuna subunità è posizionata esattamente nello stesso modo della successiva, così che la subunità 3 si adatta alla subunità 2 nello stesso modo in cui la subunità 2 si adatta alla subunità 1, e così via. Poiché è molto raro che le subunità si uniscano in una linea retta, questa disposizione generalmente dà luogo a un’elica, una struttura regolare che assomiglia a una scala a chiocciola, come illustrato nella Figura 3.22. Secondo la direzione di avvolgimento della scala, si dice che un’elica è destrorsa o sinistrorsa (Figura 3.22E). Questa direzione non cambia se si capovolge l’elica, ma viene invertita se l’elica si riflette in uno specchio. Le eliche si ritrovano comunemente nelle strutture biologiche, sia che le subunità siano piccole molecole unite da legami covalenti (per esempio, gli amminoacidi in un’a elica) sia che si tratti di grandi molecole proteiche unite da forze non covalenti (per esempio, le molecole di actina nei filamenti di actina). Ciò non è sorprendente. Un’elica non è una struttura eccezionale e si genera semplicemente ponendo molte subunità simili l’una vicina all’altra, ciascuna nella stessa relazione rigidamente ripetuta con la precedente, cioè con una rotazione fissa seguita da uno spostamento fisso lungo l’asse dell’elica, proprio come in una scala a chiocciola. ■ Molte molecole proteiche hanno una forma allungata fibrosa Gli enzimi tendono a essere proteine globulari: anche se molti sono grandi e complicati, con subunità multiple, la maggior parte ha una struttura nel complesso rotonda. Nella Figura 3.21 abbiamo visto che le proteine globulari si possono associare per formare lunghi filamenti. Ma ci sono anche funzioni che richiedono che ciascuna singola molecola proteica attraversi una grande distanza. Queste proteine generalmente hanno una struttura allungata relativamente semplice e sono comunemente chiamate proteine fibrose. Una grande famiglia di proteine fibrose intracellulari comprende l’a-cheratina, presentata in precedenza quando abbiamo introdotto l’a elica, e molecole correlate. I filamenti di cheratina sono estremamente stabili e sono il componente principale di strutture a lunga vita come capelli, corna e unghie. Una molecola di a-cheratina è un dimero di due subunità identiche, con le lunghe a eliche di ciascuna subunità disposte in modo da formare un coiled coil (vedi Figura 3.9). Le regioni coiled coil sono incappucciate a ciascuna estremità da domini globulari che contengono siti di legame. Ciò rende que- Figura 3.22 Alcune proprietà di un’elica. (A-D) Un’elica si forma quando una serie di subunità si legano fra loro in un modo regolare. In basso, ognuna di queste eliche è vista dall’alto: si vede che hanno due (A), tre (B) e sei (C e D) subunità per giro dell’elica. Si noti che l’elica in (D) ha un percorso più ampio di quello in (C), ma lo stesso numero di subunità per giro. (E) Come discusso nel testo, un’elica può essere destrorsa o sinistrorsa. Come riferimento è utile ricordare che le viti metalliche standard, che si inseriscono girandole in senso orario, sono destrorse. Si noti che un’elica mantiene la stessa direzione quando viene capovolta. (Codice PDB:2DHB.) elica sinistrorsa (E) (A) (B) (C) (D) elica destrorsa CAPITOLO 3 Le proteine 129 © 978-88-08-62126-9 sta classe di proteine capace di assemblarsi in filamenti intermedi a forma di corda, un componente importante del citoscheletro che crea l’impalcatura strutturale interna di una cellula (vedi Figura 16.67). Le proteine fibrose sono particolarmente abbondanti fuori dalle cellule, dove costituiscono uno dei componenti principali della matrice extracellulare simile a un gel che aiuta a legare insiemi di cellule per formare tessuti. Le proteine della matrice extracellulare sono secrete dalle cellule nell’ambiente circostante, dove spesso si assemblano in fogli o lunghe fibrille. Il collagene è la più abbondante di queste proteine nei tessuti animali. Una molecola di collagene consiste di tre lunghe catene polipeptidiche, ciascuna contenente l’amminoacido non polare glicina ogni tre residui. Questa struttura regolare permette alle catene di avvolgersi l’una intorno all’altra per generare una lunga tripla elica regolare (Figura 3.23A). Molte molecole di collagene si legano quindi l’una all’altra, fianco a fianco, per creare lunghe schiere sovrapposte, generando così fibrille di collagene estremamente robuste che conferiscono ai tessuti connettivi la loro resistenza alla tensione, come vedremo nel Capitolo 19. ■ Molte proteine contengono quantità sorprendentemente grandi di catene polipeptidiche non strutturate Da lungo tempo è noto che, a differenza del collagene, un’altra proteina abbondante della matrice extracellulare, l’elastina, è formata da un polipeptide altamente disordinato. Questo disordine è essenziale per la funzione dell’elastina. Le sue catene polipeptidiche relativamente sciolte e non strutturate sono legate covalentemente in un reticolo elastico simile a gomma che può essere tirato in modo reversibile da una conformazione all’altra, come illustrato nella Figura 3.23B. Le fibre elastiche che ne risultano rendono la pelle e altri tessuti, come arterie e polmoni, capaci di stirarsi e di distendersi senza strapparsi. Le regioni intrinsecamente non strutturate delle proteine sono molto frequenti in natura e hanno funzioni importanti all’interno delle cellule. Co- fibra elastica 50 nm breve sezione di fibrilla di collagene molecola di collagene 300 x 1,5 nm STIRAMENTO 1,5 nm tripla elica del collagene RILASSAMENTO singola molecola di elastina legame crociato (A) (B) Figura 3.23 Collagene ed elastina. (A) Il collagene è una tripla elica formata da tre catene proteiche estese che si avvolgono l’una intorno all’altra (in basso). Molte molecole di collagene a bastoncino sono legate fra loro nello spazio extracellulare e formano fibrille non estensibili di collagene (in alto), che hanno la resistenza alla tensione dell’acciaio. Le strisce delle fibrille di collagene sono dovute alla disposizione regolarmente ripetuta delle molecole di collagene nella fibrilla. (B) Catene polipeptidiche di elastina sono unite insieme da legami crociati, formando fibre elastiche simili a gomma. Ciascuna molecola di elastina si svolge in una conformazione più estesa quando la fibra è stirata e si riavvolge spontaneamente non appena viene rilasciata la forza stirante. I legami crociati che si formano nello spazio extracellulare, come menzionato, creano legami covalenti tra catene laterali di lisina, ma la chimica per il collagene e per l’elastina è diversa. CAPITOLO 3 Le proteine 130 Figura 3.24 Alcune funzioni importanti svolte da proteine con sequenza intrinsecamente non strutturata. (A) Spesso le regioni non strutturate di catene polipeptidiche formano siti di legame per altre proteine. Sebbene questi legami siano altamente specifici, spesso sono a bassa affinità, a causa del costo di energia libera necessario per il ripiegamento del partner normalmente non strutturato (e sono quindi prontamente reversibili). (B) Le regioni non strutturate possono essere facilmente modificate covalentemente in modo da far cambiare le loro preferenze di legame; per questo spesso sono coinvolte in processi di segnalazione cellulare. In questo disegno schematico sono indicati siti multipli di fosforilazione proteica. (C) Le regioni non strutturate creano di frequente “guinzagli” che tengono vicini domini proteici che interagiscono tra di loro. (D) Una densa rete di proteine non strutturate può formare una barriera di diffusione, come nel caso delle nucleoporine per il poro nucleare. © 978-88-08-62126-9 me abbiamo già visto, le proteine usano le brevi anse di catena polipeptidica che generalmente sporgono dal nucleo dei domini proteici per legare altre molecole. Alcune di queste anse rimangono ampiamente non strutturate finché non si legano a una molecola bersaglio, adottando una specifica conformazione ripiegata solamente quando questa molecola è legata. Si sa anche che molte proteine hanno code intrinsecamente non strutturate a una o all’altra estremità di un dominio strutturato (vedi, per esempio, gli istoni nella Figura 4.24). La quantità di tali regioni non strutturate è apparsa chiara solamente dopo che interi genomi sono stati sequenziati. Questo ha permesso di usare metodologie bioinformatiche per analizzare la sequenza amminoacidica codificata dai geni, cercando le regioni non strutturate in base alla loro idrofobicità insolitamente bassa e alla carica netta relativamente alta. Combinando questi risultati con altri dati, si è giunti ora a pensare che forse un quarto di tutte le proteine eucariotiche possa adottare conformazioni che sono in larga parte non strutturate, fluttuando rapidamente tra molte conformazioni differenti. Molte di queste regioni intrinsecamente non strutturate contengono sequenze ripetute di amminoacidi. A che cosa servono queste regioni non strutturate? Alcune funzioni note sono illustrate nella Figura 3.24. Una delle funzioni predominanti è quella di formare siti di legame specifici per altre molecole proteiche che siano ad alta specificità ma facilmente modificati dalla fosforilazione o dalla defosforilazione delle proteine, o da qualunque altra modifica covalente innescata dagli eventi di segnalazione cellulare (Figure 3.24A e B). Vedremo, per esempio, che l’enzima RNA polimerasi eucariotica che produce mRNA contiene una lunga coda al C-terminale non strutturata che è covalentemente modificata mentre procede la sua sintesi di RNA, attraendo in questo modo altre proteine specifiche nel complesso di trascrizione in tempi differenti (vedi Figura 6.22); inoltre questa coda non strutturata interagisce con un tipo diverso di dominio a bassa complessità quando la RNA polimerasi è reclutata nei siti specifici sul DNA dove inizia la sintesi. Come illustrato nella Figura 3.24C, una regione non strutturata può anche servire da “guinzaglio” per tenere due domini proteici vicini allo scopo di favorire la loro interazione. Per esempio, è questa funzione di guinzaglio che permette ai substrati di muoversi attraverso i siti attivi nei grandi complessi multienzimatici (vedi Figura 3.54). Una funzione guinzaglio simile permette a grandi proteine impalcatura (scaffold) con molteplici siti di legame proteici di concentrare serie di proteine interagenti, sia aumentando le velocità di reazione che confinando le loro reazioni in siti particolari della cellula (vedi Figura 3.78). Altre proteine sembra che assomiglino all’elastina, in quanto la loro funzione richiede che restino in gran parte non strutturate. Quindi, numerose catene proteiche non strutturate le une vicino alle altre possono creare all’interno della cellula microregioni con consistenza simile a gel che limitano la diffusione. Per esempio, le abbondanti nucleoporine che rivestono la superficie interna del complesso del poro nucleare formano un reticolo a gomitolo casuale (Figura 3.24) di importanza cruciale nel trasporto selettivo attraverso il nucleo (vedi Figura 12.8). P + P P P P P (A) LEGAME (B) SEGNALAZIONE (C) GUINZAGLIO (D) BARRIERA DI DIFFUSIONE CAPITOLO ■ Le proteine extracellulari spesso sono stabilizzate da legami crociati covalenti Molte proteine sono attaccate all’esterno della membrana plasmatica di una cellula o secrete per formare parte della matrice extracellulare. Tutte queste proteine sono direttamente esposte alle condizioni extracellulari. Per aiutare a mantenere le loro strutture, le catene polipeptidiche di queste proteine spesso sono stabilizzate da legami covalenti crociati. Questi legami possono unire due amminoacidi della stessa proteina o connettere catene polipeptidiche diverse in una proteina multisubunità. Sebbene ne esistano molti altri tipi, i legami crociati più comuni nelle proteine sono legami covalenti zolfo-zolfo. Questi legami disolfuro (chiamati anche legami SOS) si formano quando le proteine vengono preparate per l’esportazione dalle cellule. Come vedremo nel Capitolo 12, la loro formazione è catalizzata nel reticolo endoplasmatico da un enzima che collega insieme due coppie di gruppi OSH di catene laterali di cisteine che sono adiacenti nella proteina ripiegata (Figura 3.25). I legami disolfuro non cambiano la conformazione di una proteina, ma agiscono invece come “graffette” atomiche che ne rinforzano la conformazione più favorita. Per esempio, il lisozima – un enzima presente nelle lacrime che dissolve le pareti cellulari dei batteri – mantiene la sua attività antibatterica per un lungo periodo perché è stabilizzato da legami crociati di questo tipo. I legami disolfuro in genere non riescono a formarsi nel citosol della cellula, dove un’alta concentrazione di agenti riducenti converte di nuovo i legami SOS in gruppi OSH di cisteine. A quanto pare le proteine non richiedono questo tipo di rinforzo nell’ambiente relativamente mite all’interno della cellula. ■ Le molecole proteiche spesso servono da subunità per l’assemblaggio di grandi strutture Gli stessi principi che rendono una molecola proteica capace di configurarsi in modo tale da formare anelli o filamenti operano per generare strutture molto più grandi formate da serie di macromolecole differenti, come complessi enzimatici, ribosomi, filamenti proteici, virus e membrane. Questi grandi elementi non sono costruiti come singole molecole giganti legate covalentemente, ma sono invece formati dall’assemblaggio non covalente di molte molecole prodotte separatamente, che rappresentano subunità della struttura finale. cisteina C C CH2 CH2 SH S SH C CH2 SH S CH2 C OSSIDAZIONE RIDUZIONE CH2 C CH2 C C legame disolfuro intercatena CH2 S SH 3 Le proteine 131 © 978-88-08-62126-9 S legame disolfuro intracatena CH2 C Figura 3.25 Legami disolfuro. Legami covalenti disolfuro si formano tra catene laterali di cisteine adiacenti. Questi legami crociati possono unire due parti della stessa catena polipeptidica o due catene polipeptidiche diverse. Poiché l’energia richiesta per rompere un legame covalente è molto maggiore dell’energia richiesta per rompere persino un’intera serie di legami non covalenti (vedi Tabella 2.1, p. 46), un legame disolfuro può avere un importante effetto stabilizzante su una proteina (Filmato 3.7 ). CAPITOLO 3 Le proteine 132 © 978-88-08-62126-9 Figura 3.26 Assemblaggio di una singola subunità proteica che richiede contatti multipli proteina-proteina. Viene mostrato come subunità globulari compattate esagonalmente possano formare fogli piatti o tubi. Generalmente queste grandi strutture non sono considerate come singole “molecole” ma, come i filamenti di actina descritti precedentemente, sono viste come complessi formati da molte molecole diverse. foglio con compattamento esagonale subunità tubo L’uso di subunità più piccole per costruire strutture più grandi ha diversi vantaggi. 1. Una grande struttura costituita da una o più subunità più piccole ripetute richiede soltanto una piccola quantità di informazione genetica. 2. Sia l’assemblaggio che il disassemblaggio possono essere processi facilmente controllati e reversibili, poiché le subunità si associano tramite legami multipli a energia relativamente bassa. 3. Gli errori nella sintesi della struttura possono essere evitati più facilmente, poiché meccanismi di correzione possono operare durante l’assemblaggio per escludere subunità malformate. 20 nm Figura 3.27 Il capside proteico di un virus. La struttura del capside del virus SV40 della scimmia è stata determinata mediante cristallografia ai raggi X e, come per i capsidi di molti altri virus, è conosciuta nei dettagli atomici. (Per gentile concessione di Robert Grant, Stephan Crainic e James M. Hogle.) Alcune subunità proteiche si assemblano in fogli piatti in cui le subunità sono disposte in schemi esagonali. Proteine specializzate di membrana sono talvolta disposte in questo modo nei doppi strati lipidici. Con un leggero cambiamento nella geometria delle singole subunità un foglio esagonale può essere convertito in un tubo (Figura 3.26) o, con più cambiamenti, in una sfera cava. Tubi e sfere proteici che legano specifiche molecole di RNA e di DNA formano il rivestimento dei virus. La formazione di strutture chiuse, come anelli, tubi o sfere, fornisce ulteriore stabilità perché aumenta il numero di legami fra le subunità proteiche. Inoltre, poiché una struttura di questo tipo è creata da interazioni reciprocamente dipendenti e cooperative fra le subunità, può essere spinta ad assemblarsi o a disassemblarsi da un cambiamento relativamente piccolo che influenza individualmente ciascuna subunità. Questi principi sono illustrati in modo evidente nel rivestimento proteico, o capside, di molti virus semplici, che prende la forma di una sfera cava basata su un icosaedro (Figura 3.27). I capsidi spesso sono formati da centinaia di subunità proteiche identiche che racchiudono e proteggono l’acido nucleico virale (Figura 3.28). La proteina in questo capside deve avere una struttura particolarmente adattabile: deve non solo stabilire parecchie specie diverse di contatti per creare la sfera, ma anche cambiare questa disposizione per lasciare uscire l’acido nucleico in modo da iniziare la replicazione virale una volta che il virus è entrato in una cellula. ■ Molte strutture nelle cellule sono capaci di autoassemblaggio L’informazione necessaria per formare molti dei grandi complessi di macromolecole nelle cellule deve essere contenuta nelle subunità stesse, poiché subunità purificate possono assemblarsi spontaneamente nella struttura finale in condizioni appropriate. Il primo grande aggregato macromolecolare di cui è stata dimostrata la capacità di autoassemblaggio dei suoi componenti è stato il virus del mosaico del tabacco (TMV). Questo virus è un lungo bastoncino in cui un cilindro di proteine è disposto a elica intorno a un nucleo di RNA (Figura 3.29). Se l’RNA e le subunità proteiche dissociate sono mescolati insieme in soluzione, si ricombinano formando particelle virali completamente attive. Il processo di assemblaggio è inaspettatamente complesso e comprende la formazione di doppi anelli di proteine, che servono da intermedi che si aggiungono al rivestimento virale in crescita. CAPITOLO 3 Le proteine 133 © 978-88-08-62126-9 Figura 3.28 La struttura di un virus sferico. Nei virus spesso molte subunità proteiche identiche si compattano insieme creando un guscio sferico (un capside) che racchiude il genoma virale, composto da RNA o da DNA (vedi anche Figura 3.27). Per ragioni geometriche non più di 60 subunità identiche possono unirsi insieme in modo esattamente simmetrico. Se sono permesse piccole irregolarità, però, si possono usare più subunità per produrre un capside più grande che mantiene una simmetria icosaedrica. Il virus del nanismo a cespuglio del pomodoro (TBSV) mostrato qui, per esempio, è un virus sferico con un diametro di circa 33 nm formato da 180 copie identiche di una proteina del capside di 386 amminoacidi più un genoma a RNA di 4500 nucleotidi. Per costruire un capside così grande la proteina deve essere capace di adattarsi in tre ambienti leggermente diversi. Questo richiede tre conformazioni lievemente diverse, ciascuna delle quali è colorata in modo differente nella particella virale mostrata qui. È rappresentata la via di assemblaggio ipotizzata; la struttura tridimensionale precisa è stata determinata mediante diffrazione ai raggi X. (Per gentile concessione di Steve Harrison.) tre dimeri dimeri liberi dimero particella incompleta RNA virale dominio sporgente dominio del guscio braccio di connessione dominio che lega l’RNA dimeri liberi monomero della proteina del capside mostrato come modello a nastro particella virale intatta (90 dimeri) 10 nm Un altro complesso aggregato macromolecolare che si può riassemblare dai suoi componenti è il ribosoma batterico. Questa struttura è composta da circa 55 diverse proteine e da 3 diverse molecole di rRNA. Se i singoli componenti sono incubati in condizioni appropriate in una provetta, riformano spontaneamente la struttura originale. Cosa più importante, questi ribosomi ricostituiti sono capaci di catalizzare la sintesi proteica. Come ci si potrebbe aspettare, il riassemblaggio dei ribosomi segue una via specifica: dopo che cer- (A) (B) 50 nm Figura 3.29 La struttura del virus del mosaico del tabacco (TMV). (A) Una micrografia elettronica della particella virale, che consiste di una singola lunga molecola di RNA racchiusa in un rivestimento proteico cilindrico composto da subunità identiche. (B) Un modello che mostra parte della struttura del TMV. Una molecola di RNA a singolo filamento di 6395 nucleotidi è impacchettata in un rivestimento elicoidale costituito da 2130 copie di una proteina di rivestimento di 158 amminoacidi. Particelle virali completamente infettive si possono autoassemblare in provetta a partire da RNA e molecole proteiche purificate. (A, per gentile concessione di Robley Williams; B, per gentile concessione di Richard J. Feldmann.) 3 Le proteine CAPITOLO 134 © 978-88-08-62126-9 te proteine si sono attaccate all’RNA, questo complesso è quindi riconosciuto da altre proteine, e così via, fino a che la struttura è completa. Non è ancora chiaro come alcuni dei processi più elaborati di autoassemblaggio siano regolati. Molte strutture della cellula, per esempio, sembrano avere una lunghezza precisamente definita che è molte volte più grande di quella delle macromolecole che le compongono. In che modo si raggiunga la determinazione di questa lunghezza in molti casi è un mistero. Nel caso più semplice una lunga proteina che funge da nucleo di assemblaggio, o un’altra macromolecola, fornisce un’impalcatura che determina l’estensione del complesso finale. Questo è il meccanismo che determina la lunghezza della particella di TMV, in cui la catena di RNA rappresenta il nucleo. In modo simile si pensa che una proteina centrale interagisca con l’actina per determinare la lunghezza dei filamenti sottili nel muscolo. ■ La formazione di complesse strutture biologiche è spesso aiutata da fattori di assemblaggio Non tutte le strutture cellulari tenute insieme da legami non covalenti sono capaci di autoassemblaggio. Un ciglio, o una miofibrilla di una cellula muscolare, per esempio, non si possono formare spontaneamente da una soluzione delle macromolecole che li compongono. In questi casi parte dell’informazione di assemblaggio è fornita da enzimi speciali e da altre proteine cellulari che svolgono la funzione di stampo, fungendo da fattori di assemblaggio che guidano la costruzione, senza però prendere parte alla struttura finale assemblata. Anche strutture relativamente semplici possono essere prive di alcuni degli ingredienti necessari per il loro assemblaggio. Nella formazione di certi virus batterici, per esempio, la testa, che è costituita da molte copie di una singola subunità proteica, è assemblata su un’impalcatura provvisoria composta da una seconda proteina prodotta dal virus. Poiché la seconda proteina è assente nella particella virale finale, la struttura della testa non può riassemblarsi spontaneamente una volta che è stata demolita. Sono noti altri esempi in cui un taglio proteolitico è un passaggio essenziale e irreversibile del processo normale di assemblaggio. Questo è il caso anche di piccoli complessi proteici, tra cui la proteina strutturale collagene e l’ormone insulina (Figura 3.30). Da questi esempi relativamente semplici sembra certo che l’assemblaggio di una struttura complessa come un ciglio richiederà un ordine temporale e spaziale conferito da numerosi altri componenti. proinsulina SH ■ Molte proteine possono formare fibrille amiloidi SH SH SH SH SH ripiegamento specifico stabilizzato da legami disolfuro S S S S S S rimozione del peptide di connessione, che lascia la molecola completa a due catene dell’insulina S insulina S S S S S la riduzione separa irreversibilmente le due catene SH SH + SH SH Una classe speciale di strutture proteiche, utilizzate per alcune funzioni cellulari normali, può anche contribuire a patologie umane quando non è controllata. Queste strutture sono aggregati di foglietti b stabili e autopropaganti chiamati fibrille amiloidi.Tali fibrille sono costituite da una serie di catene polipeptidiche identiche disposte le une sopra le altre per creare una pila continua di foglietti b, con i filamenti b orientati perpendicolarmente all’asse della fibrilla allo scopo di formare un filamento crociato b (Figura 3.31). Di norma centinaia di monomeri si aggregheranno, formando una struttura fibrosa non ramificata lunga diversi micrometri e larga da 5 a15 nm. Una frazione sorprendentemente ampia di proteine è potenzialmente in grado di formare tali strutture, perché il breve segmento di catena polipeptidica che costituisce l’ossatura della fibrilla può avere varie sequenze diverse e seguire una tra SH SH Figura 3.30 Taglio proteolitico nell’assemblaggio dell’insulina. L’ormone polipeptidico insulina non può riformarsi spontaneamente in modo efficiente se i suoi legami disolfuro sono stati rotti. Esso è sintetizzato come una proteina più grande (proinsulina), che viene tagliata da un enzima proteolitico dopo che la catena proteica si è ripiegata in una forma specifica. L’escissione di parte della catena polipeptidica della proinsulina rimuove una parte dell’informazione necessaria perché la proteina si ripieghi spontaneamente nella sua conformazione normale. Una volta che l’insulina è stata denaturata e le sue due catene polipeptidiche sono state separate, la sua capacità di riassemblarsi va perduta. CAPITOLO 3 Le proteine 135 © 978-88-08-62126-9 Figura 3.31 Struttura dettagliata del nucleo di una fibrilla amiloide. In questa figura è illustrata la struttura centrale beta-crociata della fibrilla amiloide, formata da un peptide di sette amminoacidi della proteina Sup35, un prione di lievito molto studiato. La sua struttura, determinata mediante cristallografia ai raggi X, è costituita dalla sequenza glicina-asparagina-asparagina-glutammina-glutammina-asparagina-tirosina (GNNQQNY). Sebbene le strutture centrali beta-crociate di altre fibrille amiloidi siano simili, essendo formate da due lunghi foglietti b tenuti insieme da una “cerniera a zip sterica” (zipper sterico), si possono osservare diverse strutture in dettaglio a seconda della breve sequenza peptidica coinvolta. (A) È illustrata metà della struttura centrale. Qui una struttura standard a foglietti b paralleli (vedi p. 119) è tenuta insieme da una serie di legami idrogeno tra due catene laterali e da legami idrogeno tra due atomi dell’ossatura, come illustrato nella figura (gli atomi di ossigeno sono in rosso, quelli di azoto in blu). Si noti che in questo esempio i peptidi adiacenti sono perfettamente a registro. Sebbene siano mostrati solo cinque strati (ogni strato rappresentato da una freccia), la struttura reale si estende per molte decine di migliaia di strati nel piano del foglio. (B) La struttura centrale beta-crociata completa. Un secondo foglietto b identico è appaiato al primo per formare un motivo a due foglietti che corre lungo tutta la lunghezza della fibrilla. (C) Vista della struttura centrale completa raffigurata in (B) dall’alto. Le catene laterali fittamente interdigitate formano una giunzione stretta priva d’acqua nota come zipper sterico. (Per gentile concessione di David Eisenberg e Michael Sawaya, UCLA; sulla base di R. Nelson et al., Nature 435:773-778, 2005. Con il permesso di Macmillan Publishers Ltd.) le numerose differenti vie (Figura 3.32). Tuttavia, sono davvero poche le proteine che in realtà formano questo tipo di strutture all’interno della cellula. Negli esseri umani sani, i meccanismi di controllo di qualità delle proteine diminuiscono gradualmente con l’età, permettendo occasionalmente a proteine normali di formare aggregati patologici. Gli aggregati proteici possono essere rilasciati dalle cellule morte e accumularsi come sostanza amiloide nella matrice extracellulare. In casi estremi l’accumulo di queste fibrille amiloidi all’interno della cellula può uccidere le cellule e danneggiare i tessuti. Poiché il cervello è composto da un insieme di cellule nervose altamente organizzate che non possono rigenerarsi, è particolarmente vulnerabile a questo tipo di danno da accumulo. Perciò, sebbene le fibrille amiloidi si possano formare in tessuti differenti e siano ritenute responsabili dell’insorgenza di patologie in diversi distretti corporei, le più gravi malattie causate da deposito di amiloide sono quelle neurodegenerative. Per esempio, si pensa che l’anomala formazione di fibrille amiloidi molto stabili svolga un ruolo centrale nella patogenesi sia del morbo di Alzheimer che di quello di Parkinson. Le malattie da prioni sono un tipo particolare di queste patologie. Esse hanno raggiunto una certa notorietà perché, diversamente dal morbo di Alzheimer e da quello di Parkinson, possono diffondersi da un organismo all’altro, quando il secondo organismo mangia un tessuto che contiene l’aggregato di proteine. Un gruppo di malattie strettamente correlate – la scra- struttura centrale beta-crociata struttura centrale beta-crociata (A) domini periferici relativamente indefiniti 2 nm (B) 100 nm (C) (A) legame legame idrogeno idrogeno della catena dell’ossatura laterale (B) (C) Figura 3.32 La struttura di una fibrilla amiloide. (A) Disegno schematico della struttura di una fibrilla amiloide formata dall’aggregazione di una proteina. Solamente la struttura centrale beta-crociata di una fibrilla amiloide assomiglia alla struttura mostrata nella Figura 3.31. (B) Vista in sezione di una possibile struttura della fibrilla amiloide che può essere formata in provetta dall’enzima ribonucleasi A e che mostra come il nucleo della fibrilla, costituito da un breve segmento, si metta in relazione con il resto della struttura. (C) Micrografia elettronica di fibrille amiloidi. (A, da L. Esposito, C. Pedone e L. Vitagliano, Proc. Natl Acad. Sci. USA 103:1153311538, 2006; B, da S. Sambashivan et al., Nature 437:266-269, 2005; C, per gentile concessione di David Eisenberg.) CAPITOLO 3 Le proteine 136 © 978-88-08-62126-9 (A) la proteina prionica può assumere una forma anomala mal ripiegata cambiamento conformazionale molto raro proteina PrP normale forma prionica anomala della proteina PrP (PrP*) (B) la proteina mal ripiegata può indurre la formazione di aggregati proteici Prp Prp* eterodimero la proteina mal ripiegata converte la PrP normale nella conformazione anomala omodimero la conversione di più proteine PrP nella conformazione mal ripiegata crea una fibrilla amiloide stabile aggregati proteici in forma di fibrilla amiloide Figura 3.33 Gli aggregati proteici che provocano le malattie da prioni. (A) Illustrazione schematica del tipo di cambiamento conformazionale nella proteina PrP (proteina prionica) che produce materiale per una fibrilla amiloide. (B) La natura autoinfettiva dell’aggregazione proteica è centrale per le malattie prioniche. PrP è una proteina molto insolita perché la versione mal ripiegata, chiamata PrP*, induce nella proteina PrP normale con cui viene in contatto un cambiamento conformazionale, come mostrato. pie nelle pecore, la malattia di Creutzfeldt-Jacob (CJD) e il kuru negli esseri umani, e l’encefalopatia spongiforme bovina (BSE) nel bestiame – è causato da una forma male ripiegata e aggregata di una proteina particolare chiamata PrP (da proteina prionica). PrP si trova normalmente sulla faccia esterna della membrana plasmatica, prevalentemente nei neuroni, e ha la sfortunata proprietà di formare fibrille amiloidi che sono “infettive” perché convertono molecole di PrP con ripiegamento normale nella forma patologica (Figura 3.33). Questa proprietà determina un circuito a feedback positivo che propaga la forma anomala di PrP, chiamata PrP*, e permette alla conformazione patologica di diffondere rapidamente da cellula a cellula nel cervello, causando alla fine la morte. Può essere pericoloso mangiare tessuti di animali che contengono PrP*, come testimoniato dalla diffusione della BSE (comunemente chiamata “malattia della mucca pazza”) dal bestiame agli esseri umani. Fortunatamente, in assenza di PrP*, è estremamente difficile che PrP si converta nella forma patologica. Un’“eredità su sola base proteica” strettamente correlata è stata osservata nelle cellule di lievito. La possibilità di studiare proteine infettive nei lieviti ha chiarito un’altra interessante caratteristica dei prioni. Queste molecole proteiche possono formare tipi distintamente diversi di fibrille di amiloide dalla stessa catena polipeptidica. Inoltre ogni tipo di aggregato può essere infettivo, costringendo le molecole proteiche normali ad assumere lo stesso tipo anormale di struttura. Dalla stessa catena polipeptidica possono pertanto essere creati “ceppi” di particelle infettive differenti. ■ Le strutture amiloidi possono svolgere funzioni utili nelle cellule Inizialmente le fibrille amiloidi sono state studiate perché causavano malattie, ma adesso si sa che lo stesso tipo di strutture sono utilizzate dalle cellule per scopi utili. Le cellule eucariotiche, per esempio, depositano molti ormoni peptidici e proteici diversi che saranno secreti in “granuli secretori” specializzati, che immagazzinano una grande quantità di contenuto concentrato in densi nuclei con struttura regolare (vedi Figura 13.65). Oggi sappiamo che questi nuclei strutturati consistono di fibrille amiloidi, che in questo caso hanno una struttura che permette loro di dissolversi per rilasciare il contenuto solubile dopo essere state esocitate all’esterno della cellula (Figura 3.34A). Molti batteri usano la struttura amiloide in un modo molto diverso, secernendo proteine che formano lunghe fibrille amiloidi che si proiettano all’esterno della cellula. Queste lunghe fibrille amiloidi aiutano a legare i batteri circostanti in biofilm (Figura 3.34B). Poiché questi biofilm aiutano i batteri a sopravvivere in ambienti ostili (come nel caso degli esseri umani trattati con antibiotici), nuovi farmaci che distruggono specificamente la rete fibrosa formata dall’amiloide batterico potrebbero essere efficaci nel trattare infezioni nell’uomo. ■ Molte proteine contengono domini a bassa complessità che possono formare strutture amiloidi reversibili Fino a poco tempo fa si pensava che quelle strutture amiloidi con funzioni utili fossero confinate all’interno di vescicole specializzate o espresse all’esterno della cellula, come mostrato nella Figura 3.34.Tuttavia, nuovi esperimenti rivelano che un grande gruppo di domini a bassa complessità può formare fibre amiloidi che hanno ruoli funzionali sia nel nucleo che nel citoplasma della cellula. Questi domini normalmente non sono strutturati e sono costituiti da tratti di sequenza amminoacidica che può essere lunga centinaia di amminoacidi, ma che contiene solo una piccola parte dei 20 diversi amminoacidi. Diversamente dalle strutture amiloidi associate a malattie mostrate nella Figura 3.33, queste strutture scoperte di recente sono tenute assieme da legami non covalenti più deboli e si dissociano prontamente in risposta a segnali; per questo vengono definite strutture amiloidi reversibili. Molte proteine con tali domini contengono anche una serie differente di domini che legano altre specifiche proteine o molecole di RNA. Quindi, la loro aggregazione controllata all’interno della cellula può formare un idrogel che CAPITOLO 3 Le proteine 137 © 978-88-08-62126-9 Figura 3.34 Due funzioni normali delle fibrille amiloidi. (A) Nelle cellule eucariotiche, il cargo di proteine può essere stoccato nelle vescicole secretorie in forma molto compatta e immagazzinato finché alcuni segnali provocano il rilascio del cargo per esocitosi. Per esempio, gli ormoni proteici e peptidici dell’apparato endocrino, come il glucagone e la calcitonina, sono immagazzinati efficientemente in forma di brevi fibrille amiloidi, che si dissociano quando raggiungono l’esterno della cellula. (B) I batteri producono sulla loro superficie fibrille amiloidi secernendo le proteine precursore; queste fibrille formano quindi biofilm che legano insieme, e aiutano a proteggere, un elevato numero di batteri singoli. la fibrilla amiloide secreta rilascia peptidi ormonali solubili MEMBRANA PLASMATICA fibrilla amiloide sulla superficie batterica fusione granulo di secrezione ormone peptidico processato (A) cisterna del Golgi strato di peptidoglicani gemmazione membrana batterica fibrilla amiloide (B) subunità stampo subunità della fibrilla raggruppa queste e altre molecole in strutture puntiformi dette corpi intracellulari o granuli. mRNA specifici possono essere sequestrati in questi granuli, dove sono immagazzinati finché non vengono resi disponibili mediante un disassemblaggio controllato della struttura amiloide centrale che li tiene insieme. Si consideri la proteina FUS, una proteina nucleare essenziale con funzioni legate alla trascrizione, al processamento e al trasporto di molecole di mRNA specifiche. Più dell’80% del suo dominio C-terminale di 200 amminoacidi è composto da soli quattro amminoacidi: glicina, serina, glutammina e tirosina. Questo dominio a bassa complessità è attaccato ad altri domini che legano molecole di RNA; se viene posto all’interno di una provetta a concentrazioni sufficientemente elevate, esso forma un idrogel che si associerà sia con se stesso sia con domini a bassa complessità di altre proteine. Come illustrato dall’esperimento nella Figura 3.35, sebbene differenti domini a bassa complessità si proteina solubile con etichetta fluorescente verde LA PROTEINA SOLUBILE È STATA SOSTITUITA DA UN TAMPONE (A) la dissociazione della proteina con fluorescenza verde dal gel è misurata con un microscopio a fluorescenza in funzione del tempo t/2 nessuna dissociazione FUS gel preformato dalla proteina FUS hnRNPA2 t/2 = 10,1 min hnRNPA1 t/2 = 3,6 min 0,5 1 2 3 5 10 15 20 30 45 60 tempo dopo il lavaggio (B) Figura 3.35 Misurazione dell’associazione tra “amiloidi reversibili”. (A) Condizioni sperimentali. I domini che formano fibrille sono stati prodotti in grande quantità a partire da proteine contenenti un dominio a bassa complessità clonando le sequenze che li codificano in un plasmide adatto all’espressione in E. coli, in modo da permettere la sovrapproduzione dei domini (vedi p. 512). Dopo che questi domini sono stati purificati mediante cromatografia per affinità, una piccola goccia di soluzione concentrata di uno dei domini (qui il dominio a bassa complessità FUS) è stata depositata su un piatto per microscopio e lasciata gelificare. Il gel è stato poi bagnato in una soluzione diluita di un dominio a bassa complessità della stessa proteina, o di una diversa, marcato con un composto fluorescente, che ha reso quindi il gel fluorescente. Dopo aver sostituito la soluzione di proteina diluita con un tampone, la forza di legame relativa tra vari domini può essere misurata mediante il decadimento della fluorescenza, come indicato. (B) Risultati. Il dominio a bassa complessità della proteina FUS si lega più strettamente con se stesso che con i domini a bassa complessità delle proteine hnRNPA1 o hnRNPA2. Un esperimento separato rivela che queste tre diverse proteine che legano RNA si associano formando fibrille amiloidi miste. (Adattata da M. Kato et al., Cell 149:753-767, 2012.) CAPITOLO 3 Le proteine 138 © 978-88-08-62126-9 Figura 3.36 Un tipo di complesso formato da amiloidi reversibili. La struttura mostrata si basa su quanto osservato riguardo l’interazione della RNA polimerasi con un dominio a bassa complessità di una proteina che regola la trascrizione del DNA. (Adattata da I. Kwon et al., Cell 155:1049-1060, 2013.) struttura centrale beta-crociata debole proteina con dominio a bassa complessità proteina legata sito di legame per altre proteine con sequenze ripetute o per molecole di RNA leghino tra loro, le interazioni omotipiche sembrano avere la maggiore affinità (perciò il dominio a bassa complessità di FUS si lega più strettamente a se stesso). Ulteriori esperimenti hanno dimostrato che sia i legami omotipici sia quelli eterotipici sono mediati da un nucleo strutturale a foglietto b che forma le fibrille amiloidi e che queste strutture si legano ad altri tipi di sequenze ripetute nel modo indicato nella Figura 3.36. Molte di queste interazioni sembrano essere controllate dalla fosforilazione delle catene laterali della serina in uno o entrambi i partner che interagiscono.Tuttavia, molto rimane da capire su queste strutture recentemente scoperte e sul ruolo che svolgono nella biologia delle cellule eucariotiche. SOMMARIO La conformazione tridimensionale di una molecola proteica è determinata dalla sua sequenza di amminoacidi. La struttura ripiegata è stabilizzata da interazioni non covalenti fra parti diverse della catena polipeptidica. Gli amminoacidi con catene laterali idrofobiche tendono a raggrupparsi all’interno della molecola e interazioni a idrogeno locali fra legami peptidici vicini danno origine ad a eliche e a foglietti b. Regioni di sequenza amminoacidica note come domini sono le unità modulari da cui sono costituite molte proteine; questi domini generalmente contengono 40-350 amminoacidi, spesso ripiegati in una struttura globulare. Le proteine piccole sono costituite di norma da un solo dominio, mentre le proteine più grandi sono formate da parecchi domini uniti da tratti di diversa lunghezza di catena polipeptidica, alcuni dei quali possono essere relativamente disordinati. Quando le proteine si sono evolute, i domini si sono modificati e si sono combinati con altri domini per formare nuove proteine. Le proteine sono aggregate in strutture più grandi dalle stesse forze non covalenti che determinano il ripiegamento proteico. Proteine con siti di legame per la loro stessa superficie possono assemblarsi in dimeri, anelli chiusi, gusci sferici o polimeri elicoidali. La fibrilla amiloide è una lunga struttura non ramificata formata da un assemblamento di aggregati ripetuti di foglietti b. Sebbene alcune combinazioni di proteine e acidi nucleici possano assemblarsi spontaneamente in strutture complesse in una provetta, non tutte le strutture in una cellula sono capaci di riassemblarsi spontaneamente dopo essere state dissociate nelle loro parti costituenti, perché molti processi di assemblaggio biologici coinvolgono fattori di assemblaggio che non sono presenti nella struttura finale. ● Funzione delle proteine Abbiamo visto che ciascun tipo di proteina è caratterizzato da una sequenza precisa di amminoacidi, grazie alla quale può ripiegarsi in una particolare forma tridimensionale, o conformazione. Ma le proteine non sono blocchi rigidi di materiale. Esse possono avere parti in movimento progettate con precisione, le cui azioni meccaniche sono accoppiate a eventi chimici. È questo abbinamento di chimica e movimento che conferisce alle proteine le straor- CAPITOLO 3 Le proteine 139 © 978-88-08-62126-9 dinarie capacità che sono alla base dei processi dinamici nelle cellule viventi. In questa sezione vedremo in che modo le proteine si legano ad altre molecole selezionate e come la loro attività dipenda da questo legame. Mostreremo che la capacità di legarsi ad altre molecole permette alle proteine di agire da catalizzatori, da recettori di segnali, da interruttori, da motori o da minuscole pompe. Gli esempi che esamineremo in questo capitolo non esauriscono assolutamente il vasto repertorio funzionale delle proteine. Altrove in questo libro incontreremo le funzioni specializzate di molte altre proteine, basate sugli stessi principi. ■ Tutte le proteine si legano ad altre molecole Le proprietà biologiche di una molecola proteica dipendono dalle sue interazioni fisiche con altre molecole. Così gli anticorpi si attaccano a virus e batteri per marcarli per la distruzione, l’enzima esochinasi lega glucosio e ATP in modo da catalizzare una reazione fra di loro, molecole di actina si legano fra loro per assemblarsi in filamenti di actina e così via. In effetti tutte le proteine si attaccano ad altre molecole, o le legano. In alcuni casi questo legame è molto forte; in altri è debole e di breve durata. Ma il legame mostra sempre grande specificità, nel senso che ciascuna proteina può di solito legare poche molecole o anche una soltanto fra le molte migliaia di diversi tipi che incontra. La sostanza che è legata dalla proteina – che sia uno ione, una piccola molecola o una macromolecola – viene detta ligando di quella proteina. La capacità di una proteina di legare selettivamente e con alta affinità un ligando dipende dalla formazione di una serie di legami deboli non covalenti – legami idrogeno, attrazioni elettrostatiche e attrazioni di van der Waals – oltre a interazioni idrofobiche favorevoli (vedi Quadro 2.3, pp. 98-99). Poiché ciascun singolo legame è debole, un legame efficace si verifica soltanto quando si formano simultaneamente molti legami deboli. Ciò è possibile soltanto se il contorno della superficie del ligando si adatta molto bene alla proteina, come una mano in un guanto (Figura 3.37). La regione di una proteina che si associa a un ligando, nota come sito di legame del ligando, di solito è costituita da una cavità nella superficie della proteina formata da una particolare disposizione di amminoacidi. Questi amminoacidi possono appartenere a porzioni diverse della catena polipeptidica che si avvicinano quando la proteina si ripiega (Figura 3.38). Regioni separate della superficie della proteina forniscono in genere siti di legame per ligandi diversi, permettendo di regolare l’attività della proteina, come vedremo più avanti. E altre parti della proteina possono servire da maniglie per posizionare la proteina nella cellula; un esempio è il dominio SH2 esaminato in precedenza, che è spesso usato per spostare una proteina che lo contiene in siti intracellulari, in risposta a segnali particolari. Sebbene non abbiano un contatto diretto con il ligando, gli atomi immersi all’interno della proteina forniscono un’impalcatura essenziale che conferisce alla superficie il suo profilo e le sue proprietà chimiche e meccaniche. Anche piccoli cambiamenti negli amminoacidi all’interno di una molecola proteica possono modificare la sua forma tridimensionale in modo sufficiente a distruggere un sito di legame sulla superficie. legami non covalenti ligando sito di legame (B) (A) proteina Figura 3.37 Il legame selettivo di una proteina a un’altra molecola. Molti legami deboli sono necessari per rendere una proteina capace di legare strettamente un’altra molecola, chiamata ligando. Un ligando deve perciò adattarsi precisamente nel sito di legame di una proteina, come una mano in un guanto, così che si possa formare un numero elevato di legami non covalenti fra la proteina e il ligando. (A) Disegno schematico. (B) Modello a spazio pieno. (Codice PDB: 1G6N.) CAPITOLO 3 Le proteine 140 © 978-88-08-62126-9 catene laterali di amminoacidi H C N O C H H C (CH2)3 NH C proteina non ripiegata RIPIEGAMENTO arginina sito di legame serina CH2 legame idrogeno O H O O 5′ AMP ciclico P + NH2 NH2 O O O serina 3′ N O N H N O O _ N C CH2 proteina ripiegata (B) O CH2 C H N H H treonina O CH H3C CH2 (A) H H H attrazione elettrostatica N C acido glutammico H C H Figura 3.38 Il sito di legame di una proteina. (A) Il ripiegamento della catena polipeptidica crea di norma una fessura o una cavità sulla superficie della proteina. Questa fessura contiene una serie di catene laterali di amminoacidi disposte in modo da poter formare legami non covalenti soltanto con certi ligandi. (B) Un primo piano di un sito di legame reale che mostra i legami idrogeno e le interazioni elettrostatiche fra una proteina e il suo ligando. In questo esempio il ligando legato è l’AMP ciclico. ■ La conformazione della superficie di una proteina ne determina la chimica Le proteine hanno capacità chimiche impressionanti perché i gruppi chimici vicini sulla loro superficie spesso interagiscono con modalità che aumentano la reattività chimica delle catene laterali degli amminoacidi. Queste interazioni rientrano in due categorie principali. Per prima cosa, parti confinanti della catena polipeptidica possono interagire in un modo che limita l’accesso di molecole d’acqua ai siti di legame dei ligandi. Ciò è importante perché le molecole d’acqua formano facilmente legami idrogeno che possono competere con i ligandi per siti sulla superficie della proteina. La forza dei legami idrogeno (e delle interazioni elettrostatiche) fra le proteine e i loro ligandi aumenta quindi di molto se la proteina può escludere le molecole d’acqua dai suoi siti di legame. Potrebbe sembrare difficile immaginare un meccanismo che possa escludere una molecola piccola come l’acqua da una superficie proteica senza influenzare l’accesso del ligando stesso. Tuttavia, a causa della forte tendenza delle molecole d’acqua a formare legami idrogeno acqua-acqua, le molecole d’acqua esistono sotto forma di una grande rete unita da legami idrogeno (vedi Quadro 2.2, pp. 96-97). In effetti il sito di legame di un ligando può essere mantenuto asciutto, aumentando la reattività di quel sito, perché per singole molecole d’acqua è sfavorevole dal punto di vista energetico separarsi da questa rete, cosa che dovrebbero fare per introdursi in una fessura sulla superficie di una proteina. In secondo luogo, il raggruppamento di catene laterali vicine di amminoacidi polari può alterare la loro reattività. Se alcune catene laterali cariche negativamente vengono forzatamente avvicinate, nonostante la loro reciproca repulsione, a causa dei ripiegamenti della proteina, per esempio, l’affinità del sito per uno ione carico positivamente aumenta di molto. Inoltre, quando le catene laterali degli amminoacidi interagiscono fra loro tramite legami idrogeno, gruppi laterali normalmente non reattivi (come il –CH2OH sulla serina mostrata nella Figura 3.39) possono diventare reattivi e quindi capaci di formare o rompere legami covalenti selezionati. La superficie di ciascuna molecola proteica ha perciò una reattività chimica unica che dipende non solo da quali catene laterali di amminoacidi sono esposte, ma anche dal loro esatto orientamento l’una rispetto all’altra. Per questa ragione anche due conformazioni leggermente diverse della stessa proteina possono differire di molto nella loro chimica. CAPITOLO 3 Le proteine 141 © 978-88-08-62126-9 H Asp O C His O H C N C serina reattiva H O Ser N H O C CH2 O H C H C N C riarrangiamento di legami idrogeno ■ Il confronto delle sequenze fra membri di una famiglia proteica evidenzia siti di legame cruciali Come abbiamo detto in precedenza, grazie alle sequenze del genoma molti domini proteici possono essere raggruppati in famiglie che mostrano chiari segni della loro evoluzione da un antenato comune. Le strutture tridimensionali dei membri della stessa famiglia di domini sono notevolmente simili. Per esempio, anche quando l’identità della sequenza degli amminoacidi scende al 25% gli atomi dell’ossatura in un dominio seguono un ripiegamento proteico comune con una tolleranza di 0,2 nanometri (2 Å). Possiamo perciò usare un metodo chiamato tracciamento evolutivo per identificare quei siti in un dominio proteico che sono i più cruciali per la funzione del dominio stesso. Quei siti che legano altre molecole sono quelli mantenuti, con più probabilità, inalterati durante l’evoluzione di un organismo. Quindi, in questo metodo, quegli amminoacidi che non sono cambiati, o quasi, in tutti i membri noti della famiglia di proteine vengono mappati su un modello strutturale tridimensionale di un membro della famiglia. Quando ciò avviene le posizioni più invarianti spesso formano uno o più gruppi sulla superficie della proteina, come illustrato nella Figura 3.40A per il dominio SH2 descritto in precedenza (vedi Figura 3.6). Questi raggruppamenti generalmente corrispondono a siti di legame per ligandi. Il dominio SH2 è un modulo che funziona in interazioni proteina-proteina, legando la proteina che lo contiene a una seconda proteina che contiene una tirosina fosforilata nel contesto di una sequenza specifica di amminoacidi, come mostrato nella Figura 3.40B. Gli amminoacidi posti nel sito di legame N H O CH2 C H Figura 3.39 Un amminoacido insolitamente reattivo nel sito attivo di un enzima. Questo esempio è la “triade catalitica” AspHis-Ser presente nella chimotripsina, nell’elastasi e in altre serina proteasi (vedi Figura 3.12). La catena laterale dell’acido aspartico (Asp) induce l’istidina (His) a rimuovere il protone di una particolare serina (Ser). Ciò attiva la serina a formare un legame covalente con il substrato dell’enzima, idrolizzando un legame peptidico. Nella figura sono omesse le molte convoluzioni della catena polipeptidica. ligando polipeptidico fosfotirosina (A) FRONTE Figura 3.40 Il metodo di tracciamento evolutivo applicato al dominio SH2. (A) Immagini frontali e posteriori di un modello a spazio pieno del dominio SH2, con gli amminoacidi conservati durante l’evoluzione sulla superficie della proteina colorati in giallo e quelli più verso l’interno della proteina colorati in rosso. (B) La struttura di uno specifico RETRO (B) FRONTE dominio SH2 con il suo polipeptide legato. Qui gli amminoacidi posti entro 0,4 nm dal ligando attaccato sono colorati in azzurro. I due amminoacidi chiave del ligando sono gialli e gli altri viola. Si noti l’alto grado di corrispondenza fra (A) e (B). (Adattata da O. Lichtarge, H.R. Bourne e F.E. Cohen, J. Mol. Biol. 257:342358, 1996. Con il permesso di Elsevier. Codici PDB: 1SPR, 1SPS.) CAPITOLO 3 Le proteine 142 © 978-88-08-62126-9 per il polipeptide fosforilato sono stati i più lenti a cambiare durante il lungo processo evolutivo che ha prodotto la grande famiglia SH2 di domini che riconoscono un peptide. Il processo di mutazione è casuale, sopravvivere non lo è. Quindi la selezione naturale (mutazione casuale seguita da sopravvivenza non casuale) produce la conservazione della sequenza eliminando preferibilmente quegli organismi i cui domini SH2 hanno subito alterazioni tali da inattivarne il sito di legame, portando alla perdita di funzione del dominio. Il sequenziamento dei genomi ha portato alla scoperta di molte nuove famiglie di proteine le cui funzioni sono sconosciute. Una volta determinata la struttura tridimensionale di un membro della famiglia di proteine, il metodo di tracciamento evolutivo permette ai biologi di determinare i siti di legame dei membri della famiglia, fornendo un utile indizio per scoprire la funzione della proteina. ■ Le proteine si legano ad altre proteine tramite diversi tipi di interfaccia stringa superficie Le proteine si possono legare ad altre proteine in molteplici modi. In molti casi una porzione della superficie di una proteina entra in contatto con un’ansa estesa di catena polipeptidica (una “stringa”) di una seconda proteina (Figura 3.41A). Questa interazione superficie-stringa, per esempio, permette al dominio SH2 di riconoscere un’ansa polipeptidica fosforilata su una seconda proteina, come abbiamo appena descritto, e rende anche capace una proteina chinasi di riconoscere le proteine che fosforilerà (vedi oltre). Un secondo tipo di interfaccia proteina-proteina si forma quando due a eliche, una di ciascuna proteina, si accoppiano per formare un coiled coil (Figura 3.41B). Questo tipo di interfaccia proteica si trova in parecchie famiglie di proteine regolatrici di geni, come vedremo nel Capitolo 7. Il tipo più comune di interazione fra proteine avviene però tramite preciso adattamento di una superficie rigida a un’altra (Figura 3.41C). Queste interazioni possono essere molto forti, poiché si può formare un numero elevato di legami deboli fra due superfici che si adattano bene. Per la stessa ragione queste interazioni superficie-superficie possono essere estremamente specifiche, rendendo una proteina capace di selezionare un unico partner fra le molte migliaia di proteine diverse che si trovano in una cellula. ■ I siti di legame degli anticorpi sono particolarmente versatili (A) SUPERFICIE-STRINGA elica 2 (B) elica 1 ELICA-ELICA Tutte le proteine devono legarsi a ligandi particolari per svolgere le loro varie funzioni. Questa capacità di legame forte e selettivo è considerevole nella famiglia degli anticorpi (come vedremo in dettaglio nel Capitolo 24). Gli anticorpi, o immunoglobuline, sono proteine prodotte dal sistema immunitario in risposta a molecole estranee, come quelle sulla superficie di un microrganismo invasore. Ciascun anticorpo si lega a una molecola bersaglio particolare con estrema forza, inattivando così direttamente il suo bersaglio o marcandolo per la distruzione. Un anticorpo riconosce il suo bersaglio (chiamato antigene) con notevole specificità. Poiché vi sono potenzialmente miliardi di antigeni diversi che potremmo incontrare, dobbiamo essere capaci di produrre miliardi di anticorpi diversi. Gli anticorpi sono molecole a forma di Y con due siti di legame identici che sono complementari a una piccola porzione della superficie della molecola antigenica. Un esame dettagliato dei siti di legame per l’antigene degli anticorpi rivela che essi sono formati da diverse anse di catena polipeptidica superficie 1 superficie 2 Figura 3.41 Tre modi in cui due proteine possono legarsi fra loro. (C) SUPERFICIE-SUPERFICIE Sono mostrate soltanto le parti interagenti delle due proteine. (A) Una superficie rigida su una proteina può legarsi a un’ansa estesa di catena polipeptidica (una “stringa”) su una seconda proteina. (B) Due a eliche possono legarsi insieme formando un coiled coil. (C) Due superfici rigide complementari spesso uniscono due proteine. Le interazioni di legame possono anche coinvolgere l’appaiamento di filamenti b (vedi per esempio Figura 3.18). CAPITOLO 3 Le proteine 143 © 978-88-08-62126-9 catena pesante VH VH anse ipervariabili NH2 S S S S CH1 CH1 S S S S S S VL S S S S S S S S S S S S S S VL CL CL CH2 S S S S CH2 CH3 S S S S dominio variabile della catena leggera (VL) legame disolfuro CH3 (A) dominio costante della catena leggera (CL) COOH (B) che sporgono dalle estremità di una coppia di domini proteici strettamente giustapposti (Figura 3.42). L’enorme diversità dei siti di legame per l’antigene che caratterizza anticorpi diversi è generata cambiando soltanto la lunghezza e la sequenza degli amminoacidi di queste anse, senza alterare la struttura di base della proteina. Anse di questo tipo sono ideali per afferrare altre molecole. Esse permettono a numerosi gruppi chimici di circondare un ligando in modo che la proteina possa legarlo con molti legami deboli. Per questa ragione spesso è tramite anse che si formano i siti di legame nelle proteine. ■ La forza di legame è misurata dalla costante di equilibrio Le molecole nelle cellule si incontrano molto frequentemente a causa dei loro continui movimenti termici casuali. Quando le molecole che si scontrano hanno superfici che si adattano poco fra loro, si formano pochi legami non covalenti e le due molecole si dissociano con la stessa rapidità con cui si sono unite. All’altro estremo, quando si formano molti legami non covalenti, l’associazione può persistere per un tempo molto lungo (Figura 3.43). Forti interazioni si verificano nelle cellule tutte le volte che una funzione biologica richiede che le molecole restino associate per un lungo periodo (per esempio, quando un gruppo di molecole di RNA e un gruppo di proteine si uniscono per formare una struttura subcellulare come un ribosoma). La forza con cui due molecole qualsiasi si legano fra loro può essere misurata. Come esempio, consideriamo una popolazione di molecole anticorpali identiche che incontra una popolazione di ligandi che diffondono nel fluido che li circonda. A intervalli frequenti una delle molecole di ligando si scontrerà con il sito di legame di un anticorpo e formerà un complesso anticorpo-ligando. La popolazione di complessi anticorpo-ligando perciò aumenterà, ma non senza un limite: con il passare del tempo un secondo processo, in cui i singoli complessi si rompono a causa di movimenti termici indotti, diventerà sempre più importante. Alla fine qualunque popolazione di molecole di anticorpi e di ligandi raggiungerà uno stato stabile, o equilibrio, in cui il numero di eventi di legame (associazione) al secondo è precisamente uguale al numero di eventi “di rottura” del legame (dissociazione) (vedi Figura 2.30). Figura 3.42 Una molecola anticorpale. Una tipica molecola anticorpale ha la forma di una Y e ha due identici siti di legame per l’antigene, uno su ciascun braccio della Y. Come vedremo nel Capitolo 24, la proteina è composta da quattro catene polipeptidiche (due catene pesanti identiche e due catene leggere identiche più piccole) tenute insieme da legami disolfuro. Ciascuna catena è composta da parecchi domini immunoglobulinici diversi, qui ombreggiati in azzurro o in grigio. Il sito di legame per l’antigene si forma dove un dominio variabile di una catena pesante (VH) e un dominio variabile di una catena leggera (VL) si avvicinano. Questi sono i domini che differiscono di più per sequenza e struttura in anticorpi diversi. Ciascun dominio all’estremità dei due bracci della molecola anticorpale forma anse che si legano all’antigene (vedi Filmato 24.5). CAPITOLO 3 Le proteine 144 © 978-88-08-62126-9 B B A le superfici delle molecole A e B, nonché di A e C, non si adattano bene e sono capaci di formare solo pochi legami deboli; il movimento termico le separa rapidamente A A C A A C la molecola A incontra casualmente altre molecole (B, C e D) le superfici delle molecole A e D si adattano bene e perciò possono formare abbastanza legami deboli da sopportare lo scuotimento termico; esse perciò restano attaccate l’una all’altra D A A D Figura 3.43 Il modo in cui i legami non covalenti mediano le interazioni fra macromolecole (vedi Filmato 2.1). 1 Dalle concentrazioni all’equilibrio del ligando, dell’anticorpo e del complesso anticorpo-ligando si può calcolare una misura utile – la costante di equilibrio (K) – della forza di legame (Figura 3.44A). Questa costante è stata descritta in dettaglio nel Capitolo 2, dove è stata ottenuta la sua relazione con le differenze di energia libera (vedi p. 63). La costante di equilibrio per una reazione in cui due molecole (A e B) si legano fra loro per formare un complesso (AB) ha unità di litri/mole e metà dei siti di legame sarà occupata dal ligando quando la concentrazione del ligando (in moli/litro) raggiunge un valore uguale a 1/K. Questa costante di equilibrio è maggiore se è maggiore la forza di legame ed è una misura diretta della differenza di energia libera fra gli stati legati e liberi (Figura 3.44B). Anche un cambiamento di pochi legami non covalenti può avere un effetto notevole su un’interazione di lega- dissociazione La relazione fra differenze in energia libera standard (ΔG°) e costanti di equilibrio (37 oC) A + B costante velocità di concentrazione 5 di velocità 3 dissociazione di AB di dissociazione velocità di dissociazione = koff [AB] A B 2 A + B velocità di 5 associazione costante di equilibrio associazione A B costante concentrazione concentrazione di velocità 3 3 di A di B di associazione [AB] [A][B] (litri/mole) velocità di associazione = kon [A] [B] 3 ALL’EQUILIBRIO: velocità di associazione = velocità di dissociazione kon [A] [B] = koff [AB] [AB] [A][B] = kon koff = K = costante di equilibrio (A) Figura 3.44 Relazione fra differenze di energia libera standard (G°) e la costante di equilibrio (K). (A) L’equilibrio fra le molecole A e B e il complesso AB è mantenuto da un bilanciamento fra le due reazioni opposte mostrate nei riquadri 1 e 2. Le molecole A e B devono collidere se devono reagire e la velocità di associazione è perciò proporzionale al prodotto delle singole concentrazioni [A] 3 [B]. (Le parentesi quadre indicano concentrazione.) Come mostrato nel riquadro 3, il rapporto fra le costanti di velocità per le reazioni di associazione e di dissociazione è uguale alla costante =K (B) 1 10 102 103 104 105 106 107 108 109 1010 differenza in energia libera standard di AB meno energia libera di A + B (kJ/mole) 0 –5,9 –11,9 –17,8 –23,7 –29,7 –35,6 –41,5 –47,4 –53,4 –59,4 di equilibrio (K) della reazione (vedi anche p. 64). (B) La costante di equilibrio nel riquadro 3 è quella della reazione di associazione A + B mn AB; maggiore è il suo valore e più forte è il legame fra A e B. Si noti che ogni 5,91 kJ/mole di diminuzione di energia libera la costante di equilibrio aumenta di un fattore 10 a 37 °C. La costante di equilibrio qui ha unità di litro/mole; per semplici interazioni di legame è chiamata anche costante di affinità o costante di associazione, indicata con Ka. Il reciproco di Ka è chiamato costante di dissociazione, Kd (in unità di moli/litro). CAPITOLO 3 Le proteine 145 © 978-88-08-62126-9 me, come dimostrato nell’esempio della Figura 3.45. (Si noti che la costante di equilibrio, come viene definita qui, è indicata anche come costante di associazione o di affinità, Ka.) Abbiamo usato il caso di un anticorpo che si lega al suo ligando per illustrare l’effetto della forza di legame sullo stato di equilibrio, ma gli stessi principi si applicano a qualunque molecola e al suo ligando. Molte proteine sono enzimi che, come vedremo adesso, prima si legano al loro ligando e quindi catalizzano la rottura o la formazione di legami covalenti in queste molecole. Consideriamo 1000 molecole di A e 1000 molecole di B in una cellula eucariotica. La concentrazione di entrambe sarà circa 10–9 M. Se la costante di equilibrio (K) per A + B 34 AB è 1010, allora all’equilibrio ci saranno ■ Gli enzimi sono catalizzatori potenti e altamente specifici Molte proteine possono svolgere la loro funzione semplicemente legandosi a un’altra molecola. Una molecola di actina, per esempio, deve soltanto associarsi ad altre molecole di actina per formare un filamento. Esistono però altre proteine per le quali legare il ligando è soltanto un primo passo necessario per la loro funzione. Questo è il caso della grande e importantissima classe di proteine chiamate enzimi. Come abbiamo visto nel Capitolo 2, gli enzimi sono molecole notevoli che determinano tutte le trasformazioni chimiche che formano e rompono legami covalenti nelle cellule. Essi si legano a uno o più ligandi, chiamati substrati, e li convertono in uno o più prodotti modificati chimicamente; ciò avviene in continuazione con stupefacente rapidità. Gli enzimi accelerano le reazioni, spesso di un fattore di un milione o più, senza subire alcun cambiamento, cioè agiscono da catalizzatori che permettono alle cellule di formare o rompere legami covalenti in modo controllato. È la catalisi di serie organizzate di reazioni chimiche da parte degli enzimi che crea e mantiene la cellula, rendendo possibile la vita. Gli enzimi possono essere raggruppati in classi funzionali che svolgono reazioni chimiche simili (Tabella 3.1). Ciascun tipo di enzima all’interno di una classe è altamente specifico e catalizza soltanto un tipo di reazione. Così l’esochinasi aggiunge un gruppo fosfato a d-glucosio ma ignora il suo isomero ottico l-glucosio; l’enzima della coagulazione del sangue trombina taglia un tipo di proteina del sangue fra una particolare arginina e la glicina adiacente 270 270 730 molecole di A molecole di B molecole di AB Se la costante di equilibrio è un po’ più debole a 108, che rappresenta una perdita di 11,9 kilojoule/mole di energia di legame rispetto all’esempio precedente, o 2-3 legami idrogeno in meno, allora ci saranno 915 915 85 molecole di A molecole di B molecole di AB Figura 3.45 Piccoli cambiamenti nel numero di legami deboli possono avere effetti drastici su un’interazione di legame. Questo esempio illustra l’effetto drastico della presenza o dell’assenza di pochi legami deboli non covalenti in un contesto biologico. TABELLA 3.1 Alcuni tipi comuni di enzimi Enzimi Reazione catalizzata Idrolasi Termine generale per enzimi che catalizzano una reazione di taglio idrolitico; nucleasi e proteasi sono nomi più specifici per sottoclassi di questi enzimi Nucleasi Demoliscono acidi nucleici idrolizzando legami fra nucleotidi. Le endo- e le esonucleasi tagliano gli acidi nucleici rispettivamente all’interno e a partire dalle estremità delle catene polinucleotidiche Proteasi Demoliscono proteine idrolizzando legami fra amminoacidi Sintasi Sintetizzano molecole in reazioni anaboliche condensando insieme due molecole più piccole Ligasi Mettono insieme (legano) due molecole in un processo dipendente da energia. La DNA ligasi, per esempio, unisce le estremità di due molecole di DNA mediante legami fosfodiesterici Isomerasi Catalizzano il riarrangiamento di legami all’interno di una singola molecola Polimerasi Catalizzano reazioni di polimerizzazione come la sintesi di RNA e di DNA Chinasi Catalizzano l’aggiunta di gruppi fosfato a molecole. Le proteina chinasi sono un gruppo importante di chinasi che attaccano gruppi fosfato alle proteine Fosfatasi Catalizzano la rimozione idrolitica di un gruppo fosfato da una molecola Ossido-reduttasi Nome generale per enzimi che catalizzano reazioni in cui una molecola è ossidata, mentre l’altra è ridotta. Gli enzimi di questo tipo spesso sono chiamati più specificamente ossidasi, reduttasi o deidrogenasi ATPasi Idrolizzano ATP. Molte proteine con una vasta gamma di ruoli hanno un’attività ATPasica che imbriglia energia come parte della loro funzione, per esempio motori proteici come miosina e proteine di trasporto di membrana come la pompa sodio-potassio GTPasi Idrolizzano GTP. Una grande famiglia di proteine che legano GTP è, ad esempio, quella delle GTPasi che svolgono un ruolo centrale nella regolazione dei processi cellulari I nomi degli enzimi di norma terminano in “-asi”, con l’eccezione di alcuni enzimi, come pepsina, tripsina, trombina e lisozima, che erano stati scoperti e definiti prima che la convenzione divenisse accettata a livello generale alla fine del XIX secolo. Il nome comune di un enzima di solito indica il substrato e la natura della reazione catalizzata. Per esempio, la citrato sintasi catalizza la sintesi di citrato in una reazione fra acetil CoA e ossalacetato. CAPITOLO 3 Le proteine 146 © 978-88-08-62126-9 e in nessun altro punto, e così via. Come abbiamo osservato in dettaglio nel Capitolo 2, gli enzimi lavorano in squadra e il prodotto di un enzima diventa il substrato del successivo. Il risultato è una rete elaborata di vie metaboliche che fornisce alla cellula energia e genera le molte molecole grandi e piccole di cui la cellula ha bisogno (vedi Figura 2.63). ■ Il legame del substrato è il primo passaggio della catalisi enzimatica Per una proteina che catalizza una reazione chimica (un enzima) l’attacco di ciascuna molecola di substrato alla proteina è un preliminare essenziale. Nel caso più semplice, se noi indichiamo l’enzima con E, il substrato con S e il prodotto con P, il percorso della reazione base è E + S n ES n EP n E + P. C’è un limite alla quantità di substrato che una singola molecola enzimatica può processare in un dato tempo. Se la concentrazione del substrato viene aumentata, la velocità a cui si forma il prodotto aumenta a sua volta, fino a un valore massimo (Figura 3.46). A quel punto la molecola dell’enzima è saturata di substrato e la velocità di reazione (Vmax) dipende soltanto da quanto rapidamente l’enzima può processare la molecola di substrato. Questa velocità massima divisa per la concentrazione dell’enzima è chiamata numero di turnover. Il numero di turnover è spesso di circa 1000 molecole di substrato processate per secondo per molecola di enzima, anche se sono noti numeri di turnover compresi fra 1 e 10 000. L’altro parametro cinetico frequentemente usato per caratterizzare un enzima è la sua Km, la concentrazione di substrato che permette alla reazione di procedere a metà della velocità massima (0,5 Vmax) (vedi Figura 3.46). Un basso valore di Km significa che l’enzima raggiunge la sua massima velocità catalitica a una bassa concentrazione di substrato e generalmente indica che l’enzima lega il substrato con molta forza, mentre un alto valore di Km corrisponde a un legame debole. I metodi usati per caratterizzare gli enzimi in questo modo sono spiegati nel Quadro 3.2 (pp. 148-149). ■ Gli enzimi accelerano le reazioni stabilizzando selettivamente gli stati di transizione Vmax velocità di reazione Figura 3.46 Cinetica enzimatica. La velocità di una reazione enzimatica (V) aumenta con la concentrazione del substrato fino a un valore massimo (Vmax). A questo punto tutti i siti per il substrato sulle molecole enzimatiche sono completamente occupati e la velocità della reazione è limitata dalla velocità del processo catalitico sulla superficie dell’enzima. Per la maggior parte degli enzimi la concentrazione del substrato (Km) alla quale la velocità di reazione è metà di quella massima è una misura della forza con cui è legato il substrato, con un elevato valore di Km corrispondente a un legame debole. Gli enzimi raggiungono velocità estremamente alte di reazioni chimiche, molto più alte di qualunque catalizzatore sintetico. Questa efficienza è attribuibile a parecchi fattori. Per prima cosa, l’enzima fa aumentare la concentrazione locale di molecole di substrato a livello del sito catalitico e mantiene tutti gli atomi appropriati nel corretto orientamento per la reazione che deve seguire. Cosa più importante, però, una parte dell’energia di legame contribuisce direttamente alla catalisi. Le molecole di substrato devono passare attraverso una serie di stati intermedi con una geometria e una distribuzione elettronica alterate prima di formare i prodotti finali della reazione. L’energia libera richiesta per raggiungere lo stato di transizione più instabile è detta energia di attivazione della reazione ed è il fattore determinante principale della velocità di reazione. Gli enzimi hanno un’affinità molto più alta per lo stato di transizione del substrato che per la forma stabile. Poiché questo forte legame abbassa di molto le energie dello stato di transizione, l’enzima accelera di molto una particolare reazione abbassando l’energia di attivazione richiesta (Figura 3.47). 0,5Vmax Km concentrazione del substrato CAPITOLO 3 Le proteine 147 © 978-88-08-62126-9 Figura 3.47 Accelerazione enzimatica di reazioni chimiche per diminuzione dell’energia di attivazione. In questo esempio c’è un unico stato di transizione. Tuttavia, spesso sia la reazione non catalizzata (A) che la reazione catalizzata dall’enzima (B) possono passare attraverso una serie di stati di transizione. In quel caso è lo stato di transizione con l’energia più alta (ST ed EST) che determina l’energia di attivazione e limita la velocità della reazione. (S = substrato; P = prodotto della reazione; ES = complesso enzima-substrato; EP = complesso enzima-prodotto.) energia di attivazione della reazione non catalizzata ST A energia EST ■ Gli enzimi possono usare simultaneamente catalisi acida S B ES e basica P EP progresso della reazione energia di attivazione della reazione catalizzata La Figura 3.48 mette a confronto per cinque enzimi le velocità delle reazioni spontanee e le corrispondenti velocità catalizzate da enzimi. Si osservano accelerazioni della velocità di 109-1023 volte. Gli enzimi non solo si legano con forza a uno stato di transizione, ma contengono anche atomi posizionati precisamente che alterano le distribuzioni elettroniche in quegli atomi che partecipano direttamente alla formazione e alla rottura di legami covalenti. I legami peptidici, per esempio, possono essere idrolizzati in assenza di un enzima esponendo un polipeptide a un acido o a una base forte. Gli enzimi sono unici, tuttavia, per la loro capacità di usare catalisi acida e basica simultaneamente, in quanto i residui acidi e basici richiesti non si possono combinare fra loro (come farebbero in soluzione) perché sono legati alla struttura rigida della proteina stessa (Figura 3.49). metà tempo della reazione 6 10 anni 1 anno 1 msec 1 min 1 µsec OMP decarbossilasi nucleasi stafilococcica adenosina deaminasi triosofosfato isomerasi anidrasi carbonica NON CATALIZZATA CATALIZZATA Figura 3.48 L’accelerazione della velocità causata da cinque enzimi diversi. (Adattata da A. Radzicka e R. Wolfenden, Science 267:90-93, 1995.) + N H O O LENTA C N H H O VELOCE O N H H H MOLTO VELOCE VELOCE C H C H O C H C H N H H H C H C H O N H O (B) catalisi acida Figura 3.49 Catalisi acida e catalisi basica. (A) La partenza della reazione non catalizzata che idrolizza un legame peptidico; in azzurro la distribuzione degli elettroni nell’acqua e nei legami carbonilici. (B) Un acido è solito donare un protone (H+) ad altri atomi. Accoppiandosi con l’ossigeno del carbonile, un acido fa allontanare elettroni dal carbonio carbonilico, rendendo questo atomo molto più capace di attrarre l’ossigeno elettronegativo (C) catalisi basica H O C H C H O H H O (A) senza catalisi + N H O O C (D) catalisi sia acida che basica di una molecola d’acqua che attacca. (C) Una base tende ad assumere H+. Accoppiandosi con un idrogeno della molecola d’acqua che attacca, una base fa spostare elettroni verso l’ossigeno dell’acqua, rendendolo un gruppo attaccante più favorevole per il carbonio carbonilico. (D) Avendo atomi posizionati in modo appropriato sulla sua superficie, un enzima può svolgere catalisi acida e basica contemporaneamente. CAPITOLO 3 Le proteine 148 © 978-88-08-62126-9 QUADRO 3.2 Alcuni dei metodi usati per studiare gli enzimi PERCHÉ ANALIZZARE LA CINETICA DEGLI ENZIMI? Gli enzimi sono i catalizzatori noti più selettivi e potenti. Una comprensione dei loro meccanismi dettagliati fornisce uno strumento critico per la scoperta di nuovi farmaci, per la sintesi industriale su larga scala di composti chimici utili e per apprezzare la chimica di cellule e organismi. Uno studio dettagliato della velocità delle reazioni chimiche che sono catalizzate da un enzima purificato – più specificamente il modo in cui queste velocità cambiano con variazioni di condizioni come le concentrazioni dei substrati, dei prodotti, degli inibitori e dei ligandi regolatori – permette ai biochimici di comprendere esattamente il modo in cui funziona ciascun enzima. Per esempio, questo è il modo in cui sono state decifrate le reazioni della glicolisi che producono ATP, mostrate in precedenza nella Figura 2.48, permettendoci di apprezzare la logica di questa via enzimatica cruciale. In questo quadro introduciamo l’importante campo della cinetica enzimatica, che è stato indispensabile per acquisire molte delle conoscenze dettagliate che abbiamo oggi della chimica cellulare. CINETICA ENZIMATICA ALL’EQUILIBRIO Molti enzimi hanno soltanto un substrato, che legano e quindi processano per creare prodotti secondo lo schema raffigurato nella Figura 3.50A. In questo caso la reazione è scritta come k1 E+S ES kcat E+P k –1 Qui abbiamo considerato che la reazione inversa, in cui E + P si ricombinano per formare EP e quindi ES, avvenga così raramente da poterla ignorare. In questo caso si può omettere di rappresentare EP e possiamo esprimere la velocità della reazione, V, come V = kcat [ES] in cui [ES] è la concentrazione del complesso enzima-substrato e kcat è il numero di turnover: una costante di velocità che è uguale al numero di molecole di substrato processate per molecole di enzima ogni secondo. Ma in che modo il valore di [ES] è correlato alle concentrazioni che conosciamo direttamente, che sono la concentrazione totale dell’enzima [Eo] e la concentrazione del substrato [S]? Quando si mescolano all’inizio enzima e substrato, la concentrazione [ES] aumenterà rapidamente da zero a un cosiddetto valore all’equilibrio, come illustrato sotto. A questo stato [ES] è quasi costante, così che velocità di demolizione di ES k–1 [ES] + kcat [ES] velocità di formazione di ES k1 [E][S] = o, poiché la concentrazione dell’enzima libero, [E], è uguale a [Eo] – [ES] k1 [ES] = k1 [E][S] = k–1 + kcat k–1 + kcat [Eo] – [ES] [S] Riordinando, e definendo la costante Km come k–1 + kcat k1 otteniamo [ES] = [Eo][S] Km + [S] o, ricordando che V = kcat [ES], otteniamo la famosa equazione di Michaelis-Menten concentrazioni [S] V = [P] kcat [Eo][S] Km + [S] [Eo] [ES] Poiché [S] aumenta a livelli sempre più alti, essenzialmente tutto l’enzima sarà legato al substrato all’equilibrio; a questo punto verrà raggiunta una velocità massima di reazione, Vmax, a cui V = Vmax = kcat [Eo]. Così è utile riscrivere l’equazione di Michaelis-Menten come [E] 0 stato pre-equilibrio: si sta formando ES tempo equilibrio: ES quasi costante V = Vmax [S] Km + [S] CAPITOLO 3 Le proteine 149 © 978-88-08-62126-9 IL GRAFICO DEI DOPPI RECIPROCI IL SIGNIFICATO DI Km, kcat e kcat /Km Sotto è rappresentato un tipico grafico di V contro [S] per un enzima che segue la cinetica di Michaelis-Menten. Da questo grafico non è immediatamente chiaro né il valore di Vmax né quello di Km. Come spiegato nel testo, Km è una misura approssimativa dell’affinità di un enzima per il substrato: è numericamente uguale alla concentrazione di [S] a V = 0,5 Vmax. In generale un valore più basso di Km significa un legame più forte del substrato. In effetti, in quei casi in cui kcat è molto più piccola di k–1, Km sarà uguale a Kd, la costante di dissociazione per il legame del substrato all’enzima (Kd = 1/Ka; vedi Figura 3.44). Abbiamo visto che kcat è il numero di turnover dell’enzima. A concentrazioni molto basse di substrato, in cui [S] << Km, la maggior parte dell’enzima è libero. Così possiamo pensare che [E] = [Eo], così che l’equazione di Michaelis-Menten diventa V = kcat/Km[E][S]. Quindi il rapporto kcat/Km è equivalente alla costante di velocità per la reazione fra enzima libero e substrato libero. V = velocità all’equilibrio di formazione del prodotto (µmoli/secondo) [S] = 1 2 3 4 5 6 7 8 80 60 Un confronto di kcat/Km per lo stesso enzima con substrati diversi, o per due enzimi con i loro diversi substrati, è molto usato come misura dell’efficienza degli enzimi. 40 20 0 0 4 2 [S] 6 8 mmoli/litro Per ottenere Vmax e Km da questi dati si usa spesso un grafico dei doppi reciproci, in cui l’equazione di Michelis-Menten è stata semplicemente riordinata, in modo che 1/V può essere messo in grafico in relazione a 1/[S]. 1/V Km = 1 [S] Vmax Per semplicità in questo quadro abbiamo esaminato enzimi che hanno soltanto un substrato, come il lisozima descritto nel testo (vedi p. 150). La maggior parte degli enzimi ha due substrati, uno dei quali è spesso una molecola trasportatrice attiva, come NADH o ATP. Un’analisi simile, ma più complessa, viene usata per determinare la cinetica di questi enzimi, permettendo di rivelare l’ordine di attacco del substrato e la presenza di intermedi covalenti lungo la via. + 1/ Vmax ALCUNI ENZIMI SONO LIMITATI DALLA DIFFUSIONE [S] = 8 6 4 3 2 1 I valori di kcat, Km e kcat /Km per alcuni enzimi scelti sono riportati sotto: enzima substrato kcat (sec–1) Km (M) kcat/Km (sec–1M–1) acetilcolinesterasi acetilcolina 1,43104 9310–5 1,63108 1 43107 5310–6 1,63108 1/V (secondo/µmoli) 0,04 – 0,5 – 1 [S] – 0,25 = 1 Km catalasi 0,03 fumarasi 0,02 1 0,01 Vmax 0 0,25 1 [S] 0,5 0,75 litri/mmoli 1,0 H2O2 fumarato 7 4310 83102 Poiché un enzima e il suo substrato devono collidere prima di poter reagire, kcat /Km ha un valore massimo possibile che è limitato dalla frequenza di collisione. Se ogni collisione forma un complesso enzima-substrato, si può calcolare dalla teoria della diffusione che kcat /Km sarà fra 108 e 109 sec–1M–1, nel caso in cui tutti i passaggi successivi procedano immediatamente. Perciò si dice che enzimi come acetilcolinesterasi e fumarasi sono “enzimi perfetti”, in quanto ciascun enzima si è evoluto al punto che quasi ogni collisione con il suo substrato converte il substrato in prodotto. CAPITOLO 3 Le proteine 150 © 978-88-08-62126-9 La corrispondenza fra un enzima e il suo substrato deve essere precisa. Un piccolo cambiamento introdotto mediante ingegneria genetica nel sito attivo di un enzima può avere un effetto profondo. La sostituzione di un acido glutammico con un acido aspartico in un enzima, per esempio, sposta la posizione dello ione carbossilato catalitico soltanto di un Å (circa il raggio di un atomo di idrogeno); eppure ciò è sufficiente a diminuire l’attività dell’enzima di mille volte. ■ Il lisozima illustra il modo in cui funziona un enzima Figura 3.50 La reazione catalizzata dal lisozima. (A) L’enzima lisozima (indicato con E) catalizza il taglio di una catena polisaccaridica, che è il suo substrato (S). L’enzima prima si lega alla catena per formare un complesso enzimasubstrato (ES), quindi catalizza il taglio di un legame covalente specifico nell’ossatura del polisaccaride, dando origine a un complesso enzima-prodotto (EP) che si dissocia rapidamente. Il rilascio della catena tagliata (i prodotti P) lascia l’enzima libero di agire su un’altra molecola di substrato. (B) Un modello a spazio pieno della molecola del lisozima legata a un breve tratto di catena polisaccaridica prima del taglio (Filmato 3.8 ). (B, per gentile concessione di Richard J. Feldmann. Codice PDB: 3AB6.) Per dimostrare il modo in cui gli enzimi catalizzano reazioni chimiche esaminiamo un enzima che agisce da antibiotico naturale nel bianco d’uovo, nella saliva, nelle lacrime e in altre secrezioni. Il lisozima è un enzima che catalizza il taglio di catene polisaccaridiche nelle pareti cellulari dei batteri. Poiché la cellula batterica è sotto pressione per forze osmotiche, il taglio anche di un ridotto numero di catene polisaccaridiche provoca la rottura della parete cellulare e lo scoppio della cellula. Il lisozima è una proteina relativamente piccola e stabile che può essere facilmente isolata in grandi quantità: per queste ragioni è stato il primo enzima di cui la cristallografia ai raggi X ha rivelato i dettagli della struttura atomica (circa a metà degli anni ’60). La reazione catalizzata dal lisozima è un’idrolisi: una molecola d’acqua viene aggiunta a un legame singolo fra due gruppi di zuccheri adiacenti nella catena polisaccaridica, causando così la rottura del legame (vedi Figura 2.9). La reazione è energeticamente favorevole perché l’energia libera della catena polisaccaridica spezzata è minore dell’energia libera della catena intatta.Tuttavia, c’è una barriera energetica alla reazione e una molecola d’acqua che entra in collisione può rompere un legame che lega due zuccheri soltanto se la molecola di polisaccaride è distorta in una forma particolare – lo stato di transizione – in cui gli atomi intorno al legame hanno una geometria e una distribuzione di elettroni alterate. A causa di questa distorsione le collisioni casuali devono fornire una grande quantità di energia di attivazione perché la reazione possa avvenire. In una soluzione acquosa a temperatura ambiente l’energia delle collisioni non supera quasi mai l’energia di attivazione. Quindi il polisaccaride puro può rimanere anni in acqua senza essere idrolizzato in quantità apprezzabili. Questa situazione cambia drasticamente quando il polisaccaride si lega al lisozima. Il sito attivo del lisozima, poiché il suo substrato è un polimero, è una lunga scanalatura che tiene sei zuccheri uniti fra loro contemporaneamente. Non appena il polisaccaride si lega formando un complesso enzima-substrato, l’enzima taglia il polisaccaride aggiungendo una molecola d’acqua a uno dei suoi legami zucchero-zucchero. Le catene prodotte sono quindi rilasciate rapidamente, liberando l’enzima per ulteriori cicli di reazione (Figura 3.50). È possibile un impressionante aumento della velocità di idrolisi perché vengono create condizioni nel microambiente del sito attivo del lisozima che riducono molto l’energia di attivazione necessaria affinché avvenga l’idrolisi. In particolare, il lisozima distorce uno dei due zuccheri uniti dal legame che deve essere rotto rispetto alla sua conformazione normale, più stabile. Inoltre il legame che deve essere rotto è mantenuto vicino a due amminoacidi con catena laterale acida (un acido glutammico e un acido aspartico) che parteci- (B) (A) + + S + E ES EP E+P CAPITOLO 3 Le proteine 151 © 978-88-08-62126-9 SUBSTRATO PRODOTTI Questo substrato è un oligosaccaride di sei zuccheri, marcati A-F. Sono mostrati in dettaglio soltanto gli zuccheri D ed E. R A B C O D R CH2OH E O O CH2OH ES I prodotti finali sono un oligosaccaride di quattro zuccheri (sinistra) e un disaccaride (destra), prodotti per idrolisi. O O R A B C F C D catena laterale sullo zucchero E C Glu35 O O D H H C F C EP O O O O D H O O carbonio C1 CH2OH O HOCH2 EO O O D C R R H H O O Nel complesso enzima-substrato (ES) l’enzima forza lo zucchero D in una conformazione allungata, con la Glu 35 posizionata per servire da acido che attacca il legame adiacente zucchero-zucchero donando un protone (H+) allo zucchero E e la Asp 52 pronta ad attaccare l’atomo di carbonio C1. Asp52 L’Asp 52 ha formato un legame covalente fra l’enzima e l’atomo di carbonio C1 dello zucchero D. La Glu 35 polarizza quindi una molecola d’acqua (rosso), in modo che il suo ossigeno possa attaccare prontamente l’atomo di carbonio C1 e spostare Asp 52. Figura 3.51 Gli eventi in corrispondenza del sito attivo del lisozima. I disegni in alto a sinistra e in alto a destra rappresentano rispettivamente il substrato libero e i prodotti liberi, mentre gli altri tre disegni rappresentano gli eventi sequenziali in corrispondenza del sito attivo dell’enzima. Si noti il cambiamento nella conformazione dello zucchero D nel complesso enzima-substrato; questo cambiamento di forma O O O C Asp52 E R H C C O O CH2OH C R R O O O O C O O HOCH2 EO O C O H CH2OH R E R H HOCH2 O CH2OH Glu35 C O O C O H H CH2OH Glu35 O O H O C Asp52 C La reazione di una molecola d’acqua (rosso) completa l’idrolisi e riporta l’enzima al suo stato originale, formando il complesso enzima-prodotto (EP). stabilizza gli stati di transizione simili a uno ione ossocarbenio necessari per la formazione e l’idrolisi dell’intermedio covalente mostrato nel riquadro centrale. È anche possibile che uno ione carbonio intermedio si formi nel passaggio 2, in quanto l’intermedio covalente mostrato nel riquadro centrale è stato rilevato soltanto con un substrato sintetico (Filmato 3.9 ). (Vedi D.J. Vocadlo et al., Nature 412:835-838, 2001.) pano direttamente alla reazione. La Figura 3.51 mostra i tre passaggi centrali di questa reazione catalizzata enzimaticamente, che avviene milioni di volte più velocemente rispetto all’idrolisi non catalizzata. Meccanismi simili vengono usati da altri enzimi per abbassare le energie di attivazione e accelerare le reazioni che catalizzano. Nelle reazioni che coinvolgono due o più reagenti il sito attivo agisce anche da stampo, o forma, che tiene vicini i substrati nel corretto orientamento affinché fra di essi avvenga una reazione (Figura 3.52A). Come abbiamo visto per il lisozima, il sito attivo di un enzima contiene atomi esattamente posizionati che accelerano una rea- + – – + (A) l’enzima si lega a due molecole di substrato e le orienta precisamente per favorire una reazione fra di loro (B) l’attacco del substrato all’enzima riarrangia elettroni nel substrato, creando parziali cariche negative e positive che favoriscono una reazione (C) l’enzima impone uno stress alla molecola di substrato legata, forzandola verso uno stato di transizione per favorire una reazione Figura 3.52 Alcune strategie generali della catalisi enzimatica. (A) I substrati vengono mantenuti vicini in un allineamento preciso. (B) Stabilizzazione di cariche degli intermedi della reazione. (C) Applicazione di forze che alterano gli angoli di legame nel substrato per aumentare la velocità di una reazione particolare. CAPITOLO 3 Le proteine 152 © 978-88-08-62126-9 zione usando gruppi carichi per alterare la distribuzione di elettroni del substrato (Figura 3.52B). Inoltre, quando un substrato si lega a un enzima, alcuni legami del substrato spesso si piegano, cambiandone la forma. Questi cambiamenti, insieme a forze meccaniche, spingono un substrato verso un particolare stato di transizione (Figura 3.52C). Infine, come il lisozima, molti enzimi partecipano direttamente alla reazione formando brevemente un legame covalente fra il substrato e una catena laterale dell’enzima. I passaggi successivi della reazione riportano la catena laterale al suo stato originale, per cui l’enzima resta immutato dopo la reazione (vedi anche Figura 2.48). ■ Piccole molecole strettamente legate aggiungono ulteriori funzioni alle proteine Anche se abbiamo sottolineato la versatilità degli enzimi (e delle proteine in genere) come catene di amminoacidi che svolgono differenti funzioni, esistono molti esempi in cui gli amminoacidi da soli non bastano. Proprio come gli esseri umani impiegano strumenti per aumentare ed estendere le capacità delle loro mani, gli enzimi spesso usano piccole molecole non proteiche per svolgere funzioni che sarebbe difficile o impossibile svolgere soltanto con gli amminoacidi. Gli enzimi hanno spesso una piccola molecola o un atomo di un metallo strettamente associati al loro sito attivo che coadiuvano la loro funzione catalitica. La carbossipeptidasi, per esempio, un enzima che taglia catene polipeptidiche, ha un atomo di zinco strettamente legato al sito attivo. Durante il taglio di un legame peptidico da parte della carbossipeptidasi lo zinco forma un legame transitorio con uno degli atomi del substrato, fornendo così assistenza alla reazione di idrolisi. In altri enzimi una piccola molecola organica serve a uno scopo simile. Queste molecole organiche sono spesso chiamate coenzimi. Un esempio è la biotina, che si trova in enzimi che trasferiscono un gruppo carbossilato (–COO–) da una molecola a un’altra (vedi Figura 2.40). La biotina partecipa a queste reazioni formando un legame covalente transitorio con il gruppo –COO– da trasferire, essendo più adatta a questa funzione di qualunque amminoacido usato per costruire proteine. Poiché non può essere sintetizzata dagli esseri umani, e deve perciò essere fornita in piccole quantità con la dieta, la biotina è una vitamina. Molti altri coenzimi sono sia vitamine che derivati di vitamine (Tabella 3.2). Anche altre proteine necessitano spesso di piccole molecole specifiche aggiuntive per funzionare in maniera appropriata. Così il recettore proteico del segnale rodopsina, che è prodotto dalle cellule fotorecettrici della retina, rivela la luce per mezzo di una piccola molecola, il retinale, immersa nella proteina (Figura 3.53A). Il retinale, che deriva dalla vitamina A, cambia la sua forma quando assorbe un fotone di luce e questo cambiamento innesca nella proteina una cascata di reazioni enzimatiche che alla fine porta alla trasmissione di un segnale elettrico al cervello. Un altro esempio di una proteina che contiene una porzione non proteica è l’emoglobina (vedi Figura 3.19). Ogni molecola di emoglobina ha quattro TABELLA 3.2 Molte vitamine forniscono coenzimi cruciali per le cellule umane Vitamina Coenzima Reazioni catalizzate da enzimi che richiedono questi coenzimi Tiamina (vitamina B1) Tiamina pirofosfato Attivazione e trasferimento di aldeidi Riboflavina (vitamina B2) FADH Ossidazione-riduzione Niacina NADH, NADPH Ossidazione-riduzione Acido pantotenico Coenzima A Attivazione e trasferimento di un gruppo acilico Piridossina Piridossal fosfato Attivazione di amminoacidi; anche glicogeno fosforilasi Biotina Biotina Attivazione e trasferimento di CO2 Acido lipoico Lipoammide Attivazione di gruppi acilico; ossidazione-riduzione Acido folico Tetraidrofolato Attivazione e trasferimento di gruppi a singolo carbonio Vitamina B12 Coenzimi cobalaminici Isomerizzazione e trasferimento di gruppi metilici CAPITOLO 3 Le proteine 153 © 978-88-08-62126-9 H3C CH3 CH3 H3C COOH COOH CH2 CH2 CH2 CH2 CH3 +N N Fe CH3 H2C H3C CHO (A) H C N+ CH3 (B) N CH3 HC CH2 gruppi eme, molecole a forma di anello con un singolo atomo centrale di ferro (Figura 3.53B). L’eme conferisce all’emoglobina (e al sangue) il suo colore rosso. Legandosi reversibilmente a ossigeno gassoso tramite l’atomo di ferro, l’eme rende l’emoglobina capace di assumere ossigeno nei polmoni e di rilasciarlo nei tessuti. Talvolta queste piccole molecole sono legate covalentemente e permanentemente alla proteina, diventando così parte integrante della proteina stessa. Vedremo nel Capitolo 10 che le proteine sono spesso ancorate alle membrane cellulari tramite molecole lipidiche legate covalentemente. E proteine di membrana esposte sulla superficie della cellula, oltre a proteine secrete al di fuori della cellula, sono spesso modificate dall’aggiunta covalente di zuccheri e di oligosaccaridi. ■ Complessi multienzimatici aiutano ad aumentare la velocità del metabolismo cellulare L’efficienza degli enzimi nell’accelerare le reazioni chimiche è cruciale per il mantenimento della vita. Le cellule, in effetti, devono opporsi agli inevitabili processi di decadimento, che – se non controllati – provocano il precipitare delle macromolecole verso un disordine sempre più grande. Se le velocità delle reazioni desiderabili non fossero maggiori delle velocità delle reazioni collaterali competitive, una cellula morirebbe presto. Si può avere un’idea della velocità con cui procede il metabolismo cellulare misurando la velocità di utilizzo dell’ATP. Una tipica cellula di mammifero “ricicla” (cioè idrolizza e ripristina per fosforilazione) il suo intero pool di ATP ogni minuto o due. Per ciascuna cellula questo turnover rappresenta l’utilizzo di più di 107 molecole di ATP al secondo (o, per il corpo umano, di circa 30 grammi di ATP al minuto). Le velocità delle reazioni nelle cellule sono rapide a causa dell’efficacia della catalisi enzimatica. Alcuni enzimi sono diventati così efficienti che non esiste possibilità di ulteriori miglioramenti utili. Il fattore che limita la velocità della reazione non è più l’intrinseca velocità di azione dell’enzima, ma piuttosto la frequenza con cui l’enzima collide con il suo substrato. Queste reazioni sono dette limitate dalla diffusione (vedi Quadro 3.2, pp. 148-149). La quantità di prodotto ottenuto da un enzima dipenderà dalla concentrazione dell’enzima e del suo substrato. Se una sequenza di reazioni deve avvenire con estrema rapidità, ciascun intermedio metabolico e ciascun enzima coinvolto devono essere presenti in alta concentrazione. Tuttavia, dato il numero enorme di reazioni diverse svolte da una cellula, ci sono dei limiti alle concentrazioni dei substrati che si possono effettivamente raggiungere. Infatti la maggior parte dei metaboliti è presente in concentrazioni micromolari (10–6 M) e la maggior parte degli enzimi ha concentrazioni molto più basse. Com’è possibile, allora, mantenere velocità metaboliche molto alte? La risposta si trova nell’organizzazione spaziale dei componenti cellulari. La cellula può aumentare le velocità delle reazioni senza aumentare le concentrazioni dei substrati combinando i vari enzimi coinvolti in una sequen- Figura 3.53 Retinale ed eme. (A) La struttura del retinale, la molecola sensibile alla luce attaccata alla rodopsina nell’occhio. La struttura mostrata isomerizza quando assorbe luce. (B) La struttura di un gruppo eme. L’anello che contiene carbonio dell’eme è rosso e l’atomo di ferro al centro è arancione. Un gruppo eme è saldamente legato a ciascuna delle quattro catene polipeptidiche dell’emoglobina, la proteina che trasporta ossigeno la cui struttura è mostrata nella Figura 3.19. CAPITOLO 3 Le proteine 154 © 978-88-08-62126-9 SINTETASI DEGLI ACIDI GRASSI dominio trasportatore del gruppo acilico C N 2 1 4 5 3 dominio di terminazione (TE) domini dell’enzima (A) 1 TE 20 nm (D) COMPLESSO DELLA PIRUVATO DEIDROGENASI 1 3 4 2 5 2 3 2 1 4 3 (B) 5 nm (C) Figura 3.54 Come regioni non strutturate di catene polipeptidiche con funzione di guinzagli fanno sì che gli intermedi di reazione passino da un sito attivo all’altro in grandi complessi multienzimatici. (A-C) La sintetasi degli acidi grassi nei mammiferi. (A) La posizione di sette domini proteici con attività differenti in questa proteina di 270 kilodalton. Il numero si riferisce all’ordine in cui ogni dominio enzimatico deve funzionare per completare ciascuno dei passaggi di aggiunta di due carboni. Dopo cicli multipli di addizione di due carboni, il dominio di terminazione rilascia il prodotto finale dopo che è stata raggiunta la lunghezza desiderata dell’acido grasso. (B) La struttura dell’enzima dimerico, con indicata la posizione dei cinque siti attivi in un monomero. (C) Come un guinzaglio flessibile permette al substrato che rimane legato al dominio acilico trasportatore (rosso) di passare da un sito attivo all’altro in ciascun monomero, allungando e modificando sequenzialmente l’intermedio di acido grasso legato (giallo). I cinque passaggi sono ripetuti finché non è stata raggiunta la lunghezza finale dell’acido grasso. ecc. (E) (Qui sono mostrati solo i passaggi da 1 a 4.) (D) Subunità multiple collegate da guinzagli nel complesso gigante della piruvato deidrogenasi (9500 kilodalton, più grande di un ribosoma) che catalizza la conversione del piruvato in acetil CoA. (E) Come in (C), un substrato legato covalentemente tenuto da un guinzaglio flessibile (palle rosse con substrato giallo) è passato sequenzialmente attraverso i siti attivi sulle subunità (qui classificati da 1 a 3) per generare i prodotti finali. Qui la subunità 1 catalizza la decarbossilazione del piruvato accompagnata da un’acetilazione riduttiva di un gruppo lipoilico legato a una delle palle rosse. La subunità 2 trasferisce questo gruppo acetilico al CoA, formando l’acetil CoA, e la subunità 3 ossida nuovamente il gruppo lipoilico per prepararlo al ciclo successivo. Solamente un decimo delle subunità 1 e 3, attaccate al nucleo formato dalle subunità 2, è mostrato qui. Questa importante reazione avviene nel mitocondrio dei mammiferi, come parte della via che ossida gli zuccheri a CO2 e H2O (vedi p. 84). (A-C, adattate da T. Maier et al., Quart. Rev. Biophys. 43:373-422, 2010; D, da J.L.S. Milne et al., J. Biol. Chem. 281:4364-4370, 2006.) za di reazioni per formare un grande complesso proteico noto come complesso multienzimatico (Figura 3.54). Poiché ciò permette al prodotto dell’enzima A di passare direttamente all’enzima B e così via, le velocità di diffusione non sono più limitanti, anche quando le concentrazioni dei substrati nella cellula nel suo insieme sono molto basse. Non è quindi sorprendente che questi complessi enzimatici siano molto comuni e che siano coinvolti in quasi tutti gli aspetti del metabolismo, compresi i processi genetici centrali della sintesi di DNA, di RNA e di proteine. In effetti pochi enzimi nelle cellule eucariotiche diffondono liberamente in soluzione; invece sembra che la maggior parte abbia evoluto siti di legame che li concentrano con altre proteine con CAPITOLO 3 Le proteine 155 © 978-88-08-62126-9 funzione correlata in regioni particolari della cellula, aumentando così la velocità e l’efficienza delle reazioni che catalizzano (vedi p. 348). Le cellule eucariotiche hanno un altro modo ancora per aumentare la velocità delle reazioni metaboliche, usando i loro sistemi di membrane intracellulari. Queste membrane possono segregare substrati particolari e gli enzimi che agiscono su di essi nello stesso compartimento racchiuso da membrana, come il reticolo endoplasmatico o il nucleo cellulare. Se, per esempio, un compartimento occupa un totale del 10% del volume della cellula, la concentrazione dei reagenti nel compartimento può aumentare fino a 10 volte in confronto a una cellula con lo stesso numero di molecole di enzimi e substrati ma senza compartimentazione. Reazioni che altrimenti sarebbero limitate dalla velocità di diffusione possono così essere accelerate fino a un fattore 10. ■ La cellula regola le attività catalitiche dei suoi enzimi Una cellula vivente contiene migliaia di enzimi, molti dei quali operano contemporaneamente e nello stesso piccolo volume del citosol. Con la loro attività catalitica questi enzimi generano una complessa rete di vie metaboliche, ciascuna composta da catene di reazioni chimiche in cui il prodotto di un enzima diventa il substrato del successivo. In questo labirinto di vie sono presenti molti punti di ramificazione (nodi) in cui enzimi diversi competono per lo stesso substrato. Il sistema è così complesso (vedi Figura 2.63) che sono necessari controlli elaborati per regolare quando e quanto rapidamente ciascuna reazione deve verificarsi. La regolazione avviene a molti livelli. A un livello la cellula controlla quante molecole di enzima produce regolando l’espressione del gene che codifica quell’enzima (vedi Capitolo 7). La cellula controlla anche le attività enzimatiche confinando serie di enzimi in compartimenti subcellulari particolari, racchiusi da membrane distinte (vedi i Capitoli 12 e 14) o concentrandoli mediante un’impalcatura proteica (vedi Figura 3.77). Come vedremo più avanti in questo capitolo, gli enzimi sono spesso modificati covalentemente per controllarne l’attività. La velocità della distruzione delle proteine mediante proteolisi mirata rappresenta un altro importante meccanismo di regolazione (vedi Figura 6.86). Ma il processo più rapido e generale che regola le velocità delle reazioni opera tramite un cambiamento diretto e reversibile dell’attività di un enzima in risposta alle molecole specifiche che lega. Il tipo più comune di controllo è quello che si ha quando una molecola diversa da uno dei substrati si lega a un enzima in un sito regolatore speciale fuori dal sito attivo, alterando così la velocità alla quale l’enzima converte i substrati in prodotti. Per esempio, nell’inibizione a feedback un enzima che agisce all’inizio di una via di reazioni viene inibito da un prodotto tardivo di quella via. Quindi, tutte le volte che cominciano ad accumularsi grandi quantità del prodotto finale, questo prodotto si lega al primo enzima e ne rallenta l’azione catalitica, limitando così l’ulteriore ingresso di substrati in quella via di reazioni (Figura 3.55). Dove le vie si ramificano o si incrociano esistono di solito punti di controllo multipli da parte di prodotti finali diversi, ciascuno dei quali regola la propria sintesi (Figura 3.56). L’inibizione a feedback può essere quasi istantanea ed è rapidamente rilasciata quando il livello del prodotto scende. L’inibizione a feedback è una regolazione negativa, che impedisce a un enzima di agire. Gli enzimi possono anche essere soggetti a una regolazione positiva, in cui l’attività enzimatica è stimolata da una molecola regolatrice, anziché essere spenta. La regolazione positiva avviene quando un prodotto di una ramificazione del labirinto metabolico stimola l’attività di un enzima di un’altra via. Per esempio, l’accumulo di ADP attiva parecchi enzimi coinvolti nell’ossidazione di molecole di zuccheri, stimolando così la cellula a convertire più ADP in ATP. A B X regolazione negativa Y Figura 3.55 Inibizione a feedback di una singola via biosintetica. Il prodotto finale Z inibisce il primo enzima specifico per la sua sintesi e così controlla il suo livello nella cellula. Questo è un esempio di regolazione negativa. C Z CAPITOLO 3 Le proteine 156 © 978-88-08-62126-9 Figura 3.56 Inibizione a feedback multipla. In questo esempio, che mostra le vie biosintetiche di quattro amminoacidi diversi nei batteri, le linee rosse indicano le posizioni in cui i prodotti inibiscono gli enzimi mediante feedback. Ciascun amminoacido controlla il primo enzima specifico per la sua sintesi, regolando così il proprio livello ed evitando un dispendioso, e talvolta pericoloso, accumulo di intermedi. I prodotti possono anche inibire separatamente la serie iniziale di reazioni comuni a tutte le sintesi; in questo caso tre enzimi differenti catalizzano la reazione iniziale, ciascuno inibito da un prodotto diverso. aspartato aspartil fosfato aspartato semialdeide omoserina lisina treonina metionina isoleucina ■ Gli enzimi allosterici hanno due o più siti di legame che interagiscono Una caratteristica particolare della regolazione a feedback sia positiva sia negativa consiste nel fatto che la molecola regolatrice spesso ha una forma completamente diversa dalla forma del substrato dell’enzima. Questo è il motivo per cui questa forma di regolazione è chiamata allosteria (dalle parole greche allos, che significa “altro”, e stereos, che significa “solido” o “tridimensionale”). Mano a mano che i biologi approfondivano le conoscenze sull’inibizione a feedback si capì che molti enzimi devono avere almeno due siti di legame diversi sulla loro superficie: un sito attivo che riconosce i substrati e un sito regolatore che riconosce una molecola regolatrice. Questi due siti devono comunicare in qualche modo, tanto da permettere che gli eventi catalitici sul sito attivo siano influenzati dall’attacco della molecola regolatrice al suo sito separato sulla superficie della proteina. Oggi si sa che l’interazione fra siti separati in una molecola proteica dipende da un cambiamento conformazionale della proteina: il legame a un sito provoca uno spostamento da una forma ripiegata a una forma ripiegata leggermente diversa. Durante l’inibizione a feedback, per esempio, il legame di un inibitore a un sito sulla proteina fa in modo che la proteina assuma una conformazione in cui il suo sito attivo – posto altrove nella proteina – diventa inattivo. Si pensa che la maggior parte delle molecole proteiche sia allosterica. Esse possono adottare due o più conformazioni leggermente diverse e uno spostamento da una all’altra, causato dal legame di un ligando, può alterare la loro attività. Ciò è vero non solo per gli enzimi ma anche per molte altre proteine, compresi recettori, proteine strutturali e proteine motrici. In tutti i casi di CAPITOLO regolazione allosterica ciascuna conformazione della proteina ha contorni di superficie un po’ diversi e i siti di legame della proteina per i ligandi vengono alterati quando la proteina cambia forma. Inoltre, come vedremo successivamente, ciascun ligando stabilizza la conformazione che lega con maggior forza e così – a concentrazioni abbastanza alte – tende a “far scattare” la proteina nella forma che preferisce. ■ Due ligandi i cui siti di legame sono accoppiati devono influenzare reciprocamente il loro attacco Gli effetti dell’attacco di un ligando su una proteina derivano da un principio chimico fondamentale noto come linkage (collegamento). Supponiamo, per esempio, che una proteina che lega glucosio leghi anche un’altra molecola, X, a un sito distante sulla superficie della proteina. Se il sito di legame per X cambia forma in conseguenza del cambiamento conformazionale indotto dall’attacco del glucosio, i siti di legame per X e per il glucosio sono detti accoppiati. Tutte le volte che due ligandi preferiscono legarsi alla stessa conformazione di una proteina allosterica ne segue, secondo i principi termodinamici di base, che ciascun ligando deve aumentare l’affinità della proteina per l’altro. Per esempio, se lo spostamento di una proteina alla conformazione che lega meglio il glucosio provocherà anche un migliore adattamento del sito di X a X, allora la proteina legherà il glucosio con più forza quando X è presente rispetto a quando X è assente. In altre parole, X regolerà positivamente il legame della proteina al glucosio (Figura 3.57). Al contrario, il linkage opera in modo negativo se i due ligandi preferiscono legarsi a conformazioni diverse della stessa proteina. In questo caso l’attacco del primo ligando scoraggia l’attacco del secondo ligando. Così, se un cambiamento di forma provocato dall’attacco del glucosio diminuisce l’affinità di una proteina per la molecola X, l’attacco di X deve anche diminuire l’affinità della proteina per il glucosio (Figura 3.58). La relazione di linkage è quantitativamente reciproca, così che, per esempio, se il glucosio ha un effetto molto grande sul legame di X, X a sua volta ha un effetto molto grande sull’attacco del glucosio. Le relazioni mostrate nelle Figure 3.57 e 3.58 si applicano a tutte le proteine e sono alla base di tutta la biologia cellulare: in retrospettiva sembrano così ovvie che oggi le diamo per scontate, ma la loro scoperta negli anni ’50, seguita da una descrizione generale dell’allosteria all’inizio degli anni ’60, ha avuto un effetto rivoluzionario sulla comprensione della biologia. Poiché la INATTIVO molecola X molecola X 3 Le proteine 157 © 978-88-08-62126-9 regolazione positiva glucosio ATTIVO 10% attivo 100% attivo Figura 3.57 Regolazione positiva causata da accoppiamento conformazionale fra due siti di legame separati. In questo esempio sia il glucosio che la molecola X si legano meglio alla conformazione chiusa di una proteina con due domini. Poiché sia il glucosio che la molecola X spingono la proteina verso la sua conformazione chiusa, ciascun ligando aiuta l’altro a legarsi. Si dice perciò che il glucosio e la molecola X si legano cooperativamente alla proteina. CAPITOLO 3 Le proteine 158 Figura 3.58 Regolazione negativa causata da accoppiamento conformazionale fra due siti di legame separati. Lo schema assomiglia a quello della figura precedente, ma qui la molecola X preferisce la conformazione aperta, mentre il glucosio preferisce la conformazione chiusa. Poiché il glucosio e la molecola X spingono la proteina verso conformazioni opposte (rispettivamente chiusa e aperta), la presenza di uno dei due ligandi interferisce con l’attacco dell’altro. © 978-88-08-62126-9 ATTIVO molecola X molecola X regolazione negativa glucosio INATTIVO 100% attivo 10% attivo molecola X in questi esempi si lega a un sito sull’enzima distinto dal sito nel quale avviene la catalisi, essa non deve avere necessariamente una relazione chimica con il substrato che lega il sito attivo. Inoltre, come abbiamo appena visto, per enzimi che sono regolati in questo modo la molecola X può accendere l’enzima (regolazione positiva) o spegnerlo (regolazione negativa). Per mezzo di un tale meccanismo le proteine allosteriche agiscono da interruttori generali che, in linea di principio, permettono a una molecola nella cellula di influenzare il destino di qualunque altra. ■ Complessi simmetrici di proteine producono transizioni allosteriche cooperative Figura 3.59 Attività enzimatica Un enzima a singola subunità che è regolato da feedback negativo può al massimo scendere dal 90% di attività al 10% circa in risposta a un aumento di 100 volte della concentrazione di un ligando inibitore che lo lega (Figura 3.59, linea rossa). Risposte di questo tipo non sono evidentemente abbastanza nette per dare una regolazione cellulare ottimale e la maggior parte degli enzimi che sono accesi o spenti dall’attacco di un ligando consistono di complessi simmetrici di subunità identiche. Con questa disposizione l’attacco di una molecola di ligando a un singolo sito su una subunità può scatenare un cambiamento allosterico dell’intero complesso che aiuta le subunità vicine a legare lo stesso ligando. Come risultato avviene una transizione allosterica cooperativa (Figura 3.59, linea blu), che permette che un cambiamento relativamente modesto della concentrazione del ligando nella cellula faccia scattare l’intero complesso da una forma quasi completamente attiva a una conformazione quasi completamente inattiva (o viceversa). I principi coinvolti in una transizione cooperativa “tutto o niente” sono gli stessi per tutte le proteine, indipendentemente dal fatto che siano enzimi. Perciò essi sono cruciali, per esempio, per un efficiente legame e rilascio di 100 attività enzimatica relativa e concentrazione di un ligando inibitore per enzimi allosterici a subunità singola e a subunità multiple. Per un enzima con una singola subunità (linea rossa) una diminuzione da un’attività del 90% a un’attività del 10% (indicata dai due punti sulla curva) richiede un aumento di 100 volte della concentrazione dell’inibitore. L’attività enzimatica è calcolata dalla semplice relazione di equilibrio K = [IP]/[I][P], in cui P è la proteina attiva, I è l’inibitore e IP è la proteina inattiva legata all’inibitore. Una curva identica si applica a qualunque interazione di legame semplice fra due molecole A e B. Un enzima allosterico multisubunità può invece rispondere come un interruttore a un cambiamento della concentrazione di ligando: la rapida risposta è causata da un legame cooperativo delle molecole del ligando, come spiegato nella Figura 3.60. Qui la linea verde rappresenta il risultato teorico atteso per l’attacco cooperativo di due molecole di ligando a un enzima allosterico con due subunità, mentre la linea blu mostra la risposta teorica di un enzima con quattro subunità. Come indicato dai due punti su ciascuna di queste curve, l’attività degli enzimi più complessi scende dal 90% al 10% in un ambito molto più limitato di concentrazione dell’inibitore rispetto all’enzima composto da una singola subunità. 50 0 1 subunità 2 subunità 4 subunità 5 concentrazione di inibitore 10 CAPITOLO 3 Le proteine 159 © 978-88-08-62126-9 Figura 3.60 Una transizione allosterica cooperativa in un enzima composto da due subunità identiche. Questo disegno illustra come la conformazione di una subunità possa influenzare quella della sua vicina. L’attacco di una singola molecola di un ligando inibitore (giallo) a una subunità dell’enzima avviene con difficoltà perché cambia la conformazione di questa subunità e altera così la simmetria dell’enzima. Una volta che si è verificato questo cambiamento conformazionale, però, l’energia guadagnata ripristinando l’interazione di appaiamento simmetrico fra le due subunità rende particolarmente facile per la seconda subunità legare il ligando inibitore e subire lo stesso cambiamento conformazionale. Poiché l’attacco della prima molecola di ligando aumenta l’affinità con cui l’altra subunità lega lo stesso ligando, la risposta dell’enzima a cambiamenti della concentrazione del ligando è molto più rapida della risposta di un enzima con una sola subunità (vedi Figura 3.59 e Filmato 3.10 ). O2 da parte dell’emoglobina nel sangue, ma sono probabilmente più facili da visualizzare per un enzima che forma un dimero simmetrico. Nell’esempio mostrato nella Figura 3.60, la prima molecola di un ligando inibitore si attacca con grande difficoltà poiché il suo attacco rompe un’interazione energeticamente favorevole fra i due monomeri identici del dimero. Una seconda molecola di ligando inibitore adesso però si lega più facilmente, perché il suo attacco ripristina i contatti monomero-monomero di un dimero simmetrico (e inattiva anche completamente l’enzima). Come alternativa a questo modello dell’adattamento indotto per una transizione allosterica cooperativa, possiamo considerare questo enzima simmetrico come se avesse soltanto due conformazioni possibili, che corrispondono alle strutture dell’“enzima acceso” e dell’“enzima spento” della Figura 3.60. In questo modello l’attacco del ligando altera un equilibrio tutto o niente fra questi due stati, cambiando così la proporzione delle molecole attive. Entrambi i modelli rappresentano concetti reali e utili. ■ Molti cambiamenti delle proteine sono indotti da fosforilazione proteica Le proteine sono regolate in altri modi, oltre che dal legame reversibile di altre molecole. Un secondo metodo usato dalle cellule eucariotiche per regolare la funzione di una proteina è l’aggiunta covalente di una piccola molecola a una o più catene laterali dei suoi amminoacidi. La modificazione regolatrice di questo tipo più comune negli eucarioti superiori è l’aggiunta di un gruppo fosfato. Useremo quindi la fosforilazione delle proteine per illustrare alcuni principi generali coinvolti nel controllo della funzione delle proteine tramite la modificazione delle catene laterali degli amminoacidi. Questi eventi di fosforilazione possono influenzare la proteina che viene modificata in tre modi importanti. Per prima cosa, poiché ciascun gruppo fosfato ha due cariche negative, l’aggiunta catalizzata da un enzima di un gruppo fosfato a una proteina può provocare un importante cambiamento conformazionale nella proteina attraendo, per esempio, un gruppo di catene laterali di amminoacidi carichi positivamente. Ciò può a sua volta influenzare l’attacco di ligandi altrove sulla superficie proteica, provocando cambiamenti drastici nell’attività della proteina. La rimozione del gruppo fosfato da parte di un secondo enzima fa ritornare la proteina alla sua conformazione originaria e ne ripristina l’attività iniziale. In secondo luogo, un gruppo fosfato legato può formare parte di una struttura che viene riconosciuta da siti di legame di altre proteine. Come osservato in precedenza, il dominio SH2 si lega a una breve sequenza peptidica contenente una tirosina fosforilata (vedi Figura 3.40B). Più di dieci altri domini comuni forniscono siti di legame per attaccare le loro proteine a peptidi fosforilati di altre molecole proteiche, ciascuno dei quali riconosce la catena laterale di un amminoacido fosforilato nel contesto di una proteina diversa. Infine, l’aggiunta di un gruppo fosfato può nascondere un sito di legame che altrimenti terrebbe unite due proteine e perciò impedire interazioni proteina-proteina. Come risultato, eventi di fosforilazione e defosforilazione hanno un ruolo importante nell’indurre l’assemblaggio e il disassemblaggio regolati di complessi proteici (vedi, per esempio, Figura 15.11). ENZIMA ACCESO inibitore TRANSIZIONE DIFFICILE substrato TRANSIZIONE FACILE ENZIMA SPENTO CAPITOLO 3 Le proteine 160 © 978-88-08-62126-9 La fosforilazione reversibile delle proteine controlla l’attività, la struttura e la localizzazione cellulare degli enzimi e di molti altri tipi di proteine nelle cellule eucariotiche. In effetti questa regolazione è così estesa che si pensa che più di un terzo delle circa 10 000 proteine presenti in una tipica cellula di mammifero, molte con più di un fosfato, sia fosforilato in ogni dato momento. Come ci si potrebbe aspettare, l’aggiunta e la rimozione di gruppi fosfato da proteine specifiche avviene spesso in risposta a segnali che indicano qualche cambiamento nello stato di una cellula. Per esempio, la cadenza temporale della serie complessa di eventi che avviene quando una cellula eucariotica si divide è controllata in questo modo (vedi Capitolo 17) e molti dei segnali che mediano interazioni cellula-cellula sono trasmessi dalla membrana plasmatica al nucleo da una cascata di eventi di fosforilazione di proteine (vedi Capitolo 15). ■ Una cellula eucariotica contiene numerose proteina chinasi e proteina fosfatasi O ATP OH catena laterale CH2 di serina C O ADP _ P O O CH2 PROTEINA CHINASI C PROTEINA FOSFATASI proteina fosforilata (A) Pi chinasi P OFF ON fosfatasi chinasi ON P OFF fosfatasi (B) _ La fosforilazione delle proteine comporta il trasferimento catalizzato da enzimi del gruppo fosfato terminale di una molecola di ATP al gruppo ossidrilico sulla catena laterale di una serina, treonina o tirosina della proteina (Figura 3.61). Questa reazione è catalizzata da una proteina chinasi ed è essenzialmente unidirezionale a causa della grande quantità di energia libera rilasciata quando si rompe il legame fosfato-fosfato nell’ATP per produrre ADP (vedi Capitolo 2). La reazione inversa di rimozione del fosfato, o defosforilazione, è invece catalizzata da una proteina fosfatasi. Le cellule contengono centinaia di proteina chinasi diverse, ciascuna responsabile della fosforilazione di una proteina o di una serie di proteine. Esistono anche molte proteina fosfatasi diverse; alcune di queste sono altamente specifiche e rimuovono gruppi fosfato soltanto da una o da poche proteine, mentre altre agiscono su una vasta gamma di proteine e sono indirizzate a substrati specifici da subunità regolatrici. Lo stato di fosforilazione di una proteina in ogni momento, e quindi la sua attività, dipende dalle attività relative delle proteina chinasi e fosfatasi che la modificano. Le proteina chinasi che fosforilano proteine nelle cellule eucariotiche appartengono a una famiglia molto grande di enzimi che hanno in comune una sequenza catalitica (chinasi) di circa 290 amminoacidi. I vari membri della famiglia contengono sequenze di amminoacidi diverse su entrambi i lati della sequenza chinasica (per esempio, vedi Figura 3.10) e spesso hanno brevi sequenze amminoacidiche inserite in anse al suo interno. Alcune di queste sequenze addizionali di amminoacidi rendono ciascuna chinasi capace di riconoscere la serie specifica di proteine che fosforila, o di legarsi a strutture che la posizionano in regioni specifiche della cellula. Altre parti della proteina permettono una fine regolazione di ciascun enzima, in modo che questo possa essere acceso o spento in risposta a segnali specifici diversi, come descritto più avanti. Confrontando il numero di differenze nella sequenza di amminoacidi fra i vari membri di una famiglia di proteine si può costruire un “albero evolutivo” che si pensa rifletta lo schema di duplicazione genica e di divergenza che ha dato origine alla famiglia. Un albero evolutivo delle proteina chinasi è riportato nella Figura 3.62. Le chinasi con funzioni correlate sono spesso posizionate su rami vicini dell’albero: le proteina chinasi coinvolte nella segnalazione cellulare che fosforilano catene laterali di tirosina, per esempio, sono tutte raggruppate nell’angolo in alto a sinistra dell’albero. Le altre chinasi Figura 3.61 Fosforilazione di proteine. In una tipica cellula eucariotica molte migliaia di proteine sono modificate dall’aggiunta covalente di un gruppo fosfato. (A) La reazione generale mostrata qui comporta il trasferimento di un gruppo fosfato da ATP alla catena laterale di un amminoacido della proteina bersaglio a opera di una proteina chinasi. La rimozione del gruppo fosfato è catalizzata da un secondo enzima, una proteina fosfatasi. In questo esempio il fosfato è aggiunto a una catena laterale di serina; in altri casi il fosfato è invece unito al gruppo –OH di una treonina o di una tirosina della proteina. (B) La fosforilazione di una proteina da parte di una proteina chinasi può aumentare o diminuire l’attività di una proteina, in base al sito di fosforilazione e alla struttura proteica. CAPITOLO 3 Le proteine 161 © 978-88-08-62126-9 Cdc7 sottofamiglia delle MAP chinasi KSS1 Wee1 recettore del PDGF sottofamiglia delle tirosina chinasi ERK1 recettore dell’EGF Src sottofamiglia delle chinasi dipendenti da ciclina (controllo del ciclo cellulare) Cdk2 Cdc2 chinasi dipendente da AMP ciclico Lck chinasi dipendente da GMP ciclico proteina chinasi C Raf Mos recettore del TGFβ chinasi della catena leggera della miosina chinasi dipendente da Ca2+/calmodulina sottofamiglia dei recettori delle serina chinasi mostrate fosforilano o una serina o una treonina e molte sono organizzate in gruppi che sembrano riflettere la loro funzione (nella trasduzione del segnale transmembrana, nell’amplificazione intracellulare del segnale, nel controllo del ciclo cellulare e così via). Come risultato delle attività combinate delle proteina chinasi e delle proteina fosfatasi i gruppi fosfato sulle proteine vengono continuamente riciclati: aggiunti e rapidamente rimossi. Questi cicli di fosforilazione possono sembrare uno spreco, ma sono importanti perché permettono alle proteine fosforilate di passare rapidamente da uno stato all’altro: più rapido è il ciclo, più velocemente lo stato di fosforilazione di una popolazione di proteine può variare in risposta a un cambiamento improvviso della velocità di fosforilazione (vedi Figura 15.14). L’energia richiesta per spingere il ciclo di fosforilazione è derivata dall’energia libera dell’idrolisi di ATP, che viene consumato in ragione di una molecola per ciascun evento di fosforilazione. ■ La regolazione della proteina chinasi Src mostra come una proteina possa funzionare da microchip Le centinaia di proteina chinasi diverse in una cellula eucariotica sono organizzate in reti complesse di vie di segnalazione che aiutano a coordinare le attività della cellula, a spingere il ciclo cellulare e a trasmettere segnali nella cellula che derivano dall’ambiente esterno. Molti dei segnali extracellulari coinvolti devono essere sia integrati che amplificati dalla cellula. Singole proteine chinasi (e altre proteine di segnalazione) servono da dispositivi input-output, o “microchip”, nel processo di integrazione. Una parte importante dell’input per queste proteine deriva dal controllo che è esercitato dai fosfati aggiunti a esse e rimossi da esse rispettivamente da parte di proteina chinasi e proteina fosfatasi. Un simile comportamento tipo microchip viene manifestato dalla famiglia Src di proteina chinasi (vedi Figura 3.10). La proteina Src (si pronuncia “sarc” e prende il nome da un tipo di tumore, il sarcoma, che può essere causato dalla sua mancata regolazione) è stata la prima tirosina chinasi a essere scoperta e oggi si sa che fa parte di una sottofamiglia di nove proteina chinasi molto simili, che si trovano soltanto negli animali pluricellulari. Come indicato dall’albero evolutivo nella Figura 3.62, confronti di sequenza suggeriscono che le tirosina chinasi come gruppo siano state un’innovazione relativamente tardiva che si è ramificata dalle serina/treonina chinasi; la sottofamiglia Src rappresenta soltanto un sottogruppo delle tirosina chinasi create in questo modo. Figura 3.62 Un albero evolutivo di proteina chinasi selezionate. Una cellula eucariotica superiore contiene centinaia di questi enzimi e il genoma umano ne codifica più di 500. Sono qui rappresentate soltanto alcune chinasi, quelle prese in esame in questo libro. CAPITOLO 3 Le proteine 162 © 978-88-08-62126-9 COOH NH2 SH3 SH2 domini chinasici acido grasso 500 amminoacidi Figura 3.63 La struttura a domini della famiglia delle proteina chinasi Src, mappata lungo la sequenza degli amminoacidi. Per la struttura tridimensionale di Src vedi Figura 3.10. ligando attivatore dominio chinasico P P tirosina SH3 chinasi attiva Pi SH2 P LA RIMOZIONE DEL FOSFATO ALLENTA LA STRUTTURA SPENTA IL LIGANDO ATTIVATORE SI LEGA AL DOMINIO SH3 ADESSO LA CHINASI PUÒ FOSFORILARE LA TIROSINA PER AUTOATTIVARSI P ACCESA Figura 3.64 L’attivazione di una proteina chinasi di tipo Src in seguito a due eventi sequenziali. Come descritto nel testo, la richiesta di eventi multipli a monte per innescare questi processi permette alle chinasi di fungere da integratori del segnale (Filmato 3.11 ). (Adattata da S.C. Harrison et al., Cell 112:737-740, 2003. Con il permesso di Elsevier.) INPUT questo legame è stato spezzato? è stato rimosso questo fosfato? è stato aggiunto questo fosfato? P P l’attività chinasica della proteina Src raggiunge il livello massimo solamente nel caso in cui la risposta a tutte le domande riportate sopra è sì La proteina Src e i suoi omologhi contengono una breve regione N-terminale che viene legata covalentemente a un acido grasso fortemente idrofobico, che trattiene la chinasi sulla faccia citoplasmatica della membrana plasmatica. Quindi nella sequenza lineare degli amminoacidi vengono due moduli che legano peptidi, un dominio di omologia Src 3 (SH3) e un dominio SH2, seguiti dai domini catalitici della chinasi (Figura 3.63). Queste chinasi sono normalmente in una conformazione inattiva, in cui una tirosina fosforilata vicina al C-terminale è legata al dominio SH2 e il dominio SH3 è legato a un peptide interno in un modo che distorce il sito attivo dell’enzima e aiuta a renderlo inattivo. Come mostrato nella Figura 3.64, l’accensione della chinasi comporta almeno due input specifici: rimozione del fosfato C-terminale e attacco del dominio SH3 a una proteina attivatrice specifica. In questo modo l’attivazione della chinasi Src segnala che una particolare serie di eventi separati a monte è stata completata (Figura 3.65). Pertanto la famiglia di proteine Src serve da integratore specifico di segnali, aiutando a generare la complessa rete di eventi che processano quelle informazioni che rendono la cellula capace di applicare risposte logiche a una serie complessa di condizioni. OUTPUT Figura 3.65 Il modo in cui una proteina chinasi di tipo Src agisce come dispositivo integratore. La rottura dell’interazione inibitoria illustrata per il dominio SH3 (verde) avviene quando il suo legame alla regione di collegamento (linker) (in arancione) è sostituito dal suo legame ad alta affinità a un ligando attivatore. ■ Proteine che legano e idrolizzano GTP sono regolatori cellulari ubiquitari Abbiamo spiegato come l’aggiunta, o la rimozione, di gruppi fosfato a una proteina possa essere usata da una cellula per controllare l’attività della proteina stessa. Negli esempi considerati finora il fosfato è trasferito da una molecola di ATP a una catena laterale di un amminoacido di una proteina bersaglio. Le cellule eucariotiche hanno anche un altro modo di controllare l’attività delle proteine mediante aggiunta o rimozione di fosfato. In questo caso il fosfato non è legato direttamente alla proteina ed è invece parte del nucleotide guaninico GTP, che si lega molto strettamente a una classe di CAPITOLO 3 Le proteine 163 © 978-88-08-62126-9 Figura 3.66 Proteine che legano proteina che lega GTP Pi GTP IDROLISI DI GTP GDP GDP GTP LENTO VELOCE GTP ON OFF OFF ON ATTIVA INATTIVA INATTIVA ATTIVA proteine note come proteine che legano GTP. In generale le proteine regolate in questo modo sono nella loro conformazione attiva quando è legato il GTP. La perdita di un gruppo fosfato avviene quando il GTP legato è idrolizzato a GDP in una reazione catalizzata dalla proteina stessa, e nel suo stato con GDP legato la proteina è inattiva. In questo modo le proteine che legano GTP agiscono da interruttori acceso-spento la cui attività è determinata dalla presenza o dall’assenza di un fosfato aggiuntivo su una molecola legata di GDP (Figura 3.66). Le proteine che legano GTP (chiamate anche GTPasi per l’idrolisi del GTP che catalizzano) costituiscono una grande famiglia di proteine che contengono tutte varianti dello stesso dominio globulare che lega GTP. Quando il GTP legato strettamente viene idrolizzato a GDP, questo dominio subisce un cambiamento conformazionale che inattiva la proteina. La struttura tridimensionale di un membro prototipo di questa famiglia, la GTPasi monomerica chiamata Ras, è mostrata nella Figura 3.67. La proteina Ras ha un ruolo importante nella segnalazione cellulare (vedi Capitolo 15): nella sua forma legata a GTP, è attiva e stimola una cascata di fosforilazioni di proteine nella cellula. La maggior parte del tempo, però, la proteina è nella sua forma inattiva con GDP legato e diventa attiva quando scambia il suo GDP per un GTP in risposta a segnali extracellulari, come fattori di crescita, che si legano a recettori nella membrana plasmatica (vedi Figura 15.47). GTP come interruttori molecolari. L’attività di una proteina che lega GTP (chiamata anche GTPasi) richiede la presenza di una molecola di GTP legata saldamente (interruttore “on”). L’idrolisi di questa molecola di GTP a opera della proteina che lega GTP produce GDP e fosfato inorganico (Pi) e fa convertire la proteina in una conformazione diversa, di solito inattiva (interruttore “off”). Il ripristino (resettaggio) dell’interruttore richiede che il GDP strettamente legato si dissoci, un passaggio lento che è accelerato di molto da segnali specifici; una volta che il GDP si è dissociato, si riattacca rapidamente una molecola di GTP. ■ Le proteine regolatrici GAP e GEF controllano l’attività di proteine che legano GTP determinando se è legato GTP o GDP Le proteine che legano GTP sono controllate da proteine regolatrici che determinano se è legato GTP o GDP, proprio come le proteine fosforilate sono accese e spente da proteina chinasi e proteina fosfatasi. Così Ras è inattivato da una proteina che attiva la GTPasi (GAP), che si lega alla proteina Ras e la induce a idrolizzare la sua molecola di GTP legata a GDP – che rimane legato strettamente – e a fosfato inorganico (Pi), che è rapidamente rilasciato. La proteina Ras resta nella sua conformazione inattiva legata a GDP fino a che incontra un fattore di scambio del nucleotide guaninico (GEF), che si lega a GDPRas e lo induce a rilasciare il GDP. Poiché il sito che lega il nucleotide vuoto è immediatamente riempito da una molecola di GTP (il GTP è presente in largo eccesso rispetto al GDP nelle cellule), il GEF attiva Ras aggiungendo di nuovo indirettamente il fosfato rimosso dall’idrolisi del GTP. Così, in un certo senso, i ruoli di GAP e GEF sono rispettivamente analoghi a quelli di una proteina fosfatasi e di una proteina chinasi (Figura 3.68). ■ Le proteine possono essere regolate da un’aggiunta covalente di altre proteine Le cellule contengono una speciale famiglia di piccole proteine i cui membri vengono attaccati covalentemente a molte altre proteine per determinarne l’attività o il destino. In ogni caso, il terminale carbossilico della piccola proteina viene legato al gruppo amminico della catena laterale di una lisina di una proteina “bersaglio” attraverso un legame isopeptidico. La prima proteina scoperta di questo tipo, e la più abbondantemente usata, è COOH NH2 GTP P P P elica interruttore sito di idrolisi del GTP Figura 3.67 La struttura della proteina Ras nella forma legata a GTP. Questa GTPasi monomerica illustra la struttura di un dominio che lega GTP, che è presente in una grande famiglia di proteine che legano GTP. Le regioni rosse cambiano la loro conformazione quando la molecola di GTP è idrolizzata a GDP e a fosfato inorganico dalla proteina; il GDP resta legato alla proteina, mentre il fosfato inorganico è rilasciato. Il ruolo specifico dell’“elica interruttore” in proteine correlate a Ras è spiegato più avanti (vedi Figura 3.72 e Filmato 15.7). CAPITOLO 3 Le proteine 164 © 978-88-08-62126-9 Figura 3.68 Un confronto dei SEGNALE IN INGRESSO due principali meccanismi di segnalazione intracellulare nelle cellule eucariotiche. In entrambi i casi una proteina di segnalazione è attivata dall’aggiunta di un gruppo fosfato e inattivata dalla rimozione di questo fosfato. Si noti che l’aggiunta di un gruppo fosfato a una proteina può essere anche un meccanismo inibitorio. (Adattata da E.R. Kantrowiz e W.N. Lipscomb, Trends Biochem. Sci. 15:53-59, 1990.) SEGNALE IN INGRESSO PROTEINA CHINASI GDP GEF ATP GDP OFF Pi ADP OFF Pi GTP ON ON GAP PROTEINA FOSFATASI P GTP SEGNALE IN USCITA SEGNALAZIONE DA PARTE DI UNA PROTEINA FOSFORILATA SEGNALE IN USCITA SEGNALAZIONE DA PARTE DI UNA PROTEINA CHE LEGA IL GTP l’ubiquitina (Figura 3.69A). L’ubiquitina può essere attaccata covalentemente a proteine bersaglio in una varietà di modi, ciascuno dei quali ha un significato diverso per la cellula. La forma più comune di aggiunta di ubiquitina produce catene di poliubiquitina in cui – una volta che la prima molecola di ubiquitina è attaccata al bersaglio – ogni molecola di ubiquitina seguente è attaccata alla Lys48 della molecola di ubiquitina precedente, creando una catena di ubiquitine legata mediante Lys48 che sono attaccate a una singola catena laterale di lisina della proteina bersaglio. Questa forma di poliubiquitina dirige la proteina bersaglio all’interno di un proteasoma, dove viene digerita in piccoli peptidi (vedi Figura 6.84). In altre circostanze solo singole molecole di ubiquitina sono attaccate a proteine. Inoltre alcune proteine bersaglio sono modificate con un tipo diverso di catena di poliubiquitina. Queste modifiche hanno, per la proteina che ne è bersaglio, conseguenze funzionali diverse (Figura 3.69B). N MONOUBIQUITINAZIONE Lys63 MULTIUBIQUITINAZIONE POLIUBUQUITINAZIONE ubiquitina Lys48 Lys63 Lys48 C catena laterale della lisina della proteina bersaglio (A) HN O legame isopeptidico regolazione degli istoni HC (B) Figura 3.69 Come l’ubiquitina contrassegna le proteine. (A) La struttura tridimensionale dell’ubiquitina, una piccola proteina di 76 amminoacidi. Una famiglia di enzimi specifici accoppia il suo terminale carbossilico al gruppo amminico della catena laterale di una lisina nella molecola proteica bersaglio, formando un legame isopeptidico. (B) Alcuni schemi di modificazione che hanno significati specifici per la cellula. endocitosi degradazione per mezzo del proteasoma riparazione del DNA Si noti che i due tipi di poliubiquitinazione differiscono per il modo in cui le molecole di ubiquitina sono legate tra loro. Il legame attraverso la Lys48 significa degradazione per mezzo del proteasoma (vedi Figura 6.84), mentre quello attraverso la Lys63 ha altri significati. La marcatura mediante ubiquitina è letta da proteine che riconoscono specificamente ogni tipo di modificazione. CAPITOLO 3 Le proteine 165 © 978-88-08-62126-9 Quando un membro differente della famiglia delle ubiquitine, per esempio SUMO (small ubiquitin-related modifier, piccolo modificatore correlato all’ubiquitina), è attaccato covalentemente alla catena laterale di una lisina delle proteine bersaglio si formano strutture simili. Non sorprende che tutte queste modificazioni siano reversibili. Le cellule contengono serie di enzimi che ubiquitinano e deubiquitinano (e sumoilano e desumoilano), che quindi manipolano queste aggiunte covalenti, svolgendo perciò un ruolo analogo alle proteina chinasi e fosfatasi che aggiungono e rimuovono gruppi fosfato dalle catene laterali delle proteine. ■ Per contrassegnare le proteine viene usato un elaborato sistema che coniuga molecole di ubiquitina Come fanno le cellule a scegliere le proteine bersaglio a cui attaccare le molecole di ubiquitina? Come passaggio iniziale, il terminale carbossilico dell’ubiquitina deve essere attivato. Questo passaggio viene effettuato quando una proteina chiamata enzima che attiva l’ubiquitina (E1) usa l’energia di idrolisi dell’ATP per attaccare un’ubiquitina a se stessa mediante un legame covalente ad alta energia (un tioestere). E1 passa questa ubiquitina attivata a uno di una serie di enzimi che coniugano l’ubiquitina (E2), ognuno dei quali agisce in concerto con una serie di proteine accessorie (E3) chiamate ubiquitina ligasi. Nei mammiferi ci sono circa 30 enzimi E2 diversi ma strutturalmente simili e centinaia di proteine E3 differenti che formano complessi con specifici enzimi E2. La Figura 3.70 illustra il processo usato per contrassegnare le proteine per la degradazione nel proteasoma. [Meccanismi simili sono usati per attaccare l’ubiquitina (e SUMO) ad altri tipi di proteine bersaglio.] Qui l’ubiquitina ligasi si lega a specifici segnali di degradazione, chiamati degron, presenti nelle proteine substrato, aiutando quindi E2 a formare una catena di poliubiquitina legata a una lisina di una proteina substrato. Questa catena di poliubiquitina presente sulla proteina bersaglio verrà riconosciuta da un recettore specifico ubiquitina E1 SH COO– SH E1 enzima che attiva l’ubiquitina E1 ATP (A) S C O legame all’enzima che coniuga l’ubiquitina AMP + P P E1 S E2 SH C O E2 S C O all’enzima che coniuga l’ubiquitina attivato con l’ubiquitina gruppo amminico ε sulla catena laterale della lisina NH2 NH2 E2 E3 segnale di degradazione sulla proteina bersaglio proteina bersaglio legata all’ubiquitina ligasi (B) E2 E3 prima ubiquitina della catena aggiunta alla proteina bersaglio Figura 3.70 La marcatura delle proteine con ubiquitina. (A) Il C-terminale dell’ubiquitina è inizialmente attivato mediante legame tioestere ad alta energia alla cisteina di una catena laterale sulla proteina E1. Questa reazione richiede ATP e procede mediante un intermedio covalente AMP-ubiquitina. L’ubiquitina attivata su E1, conosciuta anche come enzima che attiva l’ubiquitina, viene proteina bersaglio con la catena di poliubiquitina poi trasferita alla cisteina sulla molecola E2. (B) L’aggiunta di una catena di poliubiquitina alla proteina bersaglio. In una cellula di mammifero ci sono diverse centinaia di singoli complessi E2-E3. Le molecole E2 sono chiamate enzimi che coniugano l’ubiquitina. Le molecole E3 sono definite ubiquitina ligasi. (Adattata da D.R. Knighton et al., Science 253:407-414, 1991.) CAPITOLO 3 Le proteine 166 © 978-88-08-62126-9 nel proteasoma, facendo sì che la proteina bersaglio venga distrutta. Ubiquitina ligasi diverse riconoscono segnali di degradazione differenti, indirizzando quindi gruppi distinti di proteine intracellulari alla distruzione, spesso in risposta a segnali specifici (vedi Figura 6.86). ■ Complessi proteici con parti intercambiabili fanno un uso efficiente dell’informazione genetica L’ubiquitina ligasi SCF è un complesso proteico che lega “proteine bersaglio” diverse in momenti diversi del ciclo cellulare e aggiunge covalentemente molteplici catene di ubiquitina a queste proteine. La sua struttura a forma di C è costituita da cinque subunità proteiche, la più grande delle quali è una molecola che serve da impalcatura proteica su cui si assembla il resto della struttura. La struttura sottende un meccanismo notevole (Figura 3.71). A un’estremità della C si trova un enzima che coniuga ubiquitina E2. All’altra estremità si trova un braccio che lega il substrato, una subunità nota come proteina F-box. Queste due subunità sono separate da uno spazio di circa 5 nm. Quando questo complesso proteico è attivato, la proteina F-box si lega a un sito specifico di una proteina bersaglio e posiziona la proteina nello spazio che separa le due subunità in modo che alcune delle catene late- proteina F-box (braccio che lega il substrato) proteina adattatrice 2 enzima che coniuga il substrato E2 proteina bersaglio APC/C ubiquitina proteina adattatrice 1 LA PROTEINA BERSAGLIO SI LEGA (A) proteina impalcatura (cullina) che lega il substrato due possibili bracci che legano il substrato (B) proteina poliubiquitinata indirizzata alla distruzione (C) Figura 3.71 La struttura e la modalità di azione di un’ubiquitina SCF. (A) La struttura del complesso formato da cinque proteine ubiquitina ligasi che contiene un enzima che coniuga l’ubiquitina E2. Quattro proteine formano la porzione E3. La proteina qui indicata come proteina adattatrice 1 è la proteina Rbx1/Hrt1, la proteina adattatrice 2 è la proteina Skp1 e la cullina è la proteina Cul1. Una delle tante proteine F-box completa il complesso. (B) Confronto dello stesso complesso con due bracci che legano il substrato diversi, rispettivamente le proteine F-box Skp2 (in alto) e b–trCP1 (in basso). (C) Il legame e l’ubiquitinazione di una proteina bersaglio da parte dell’ubiquitina ligasi SCF. Se, come indicato, una catena di molecole di ubiquitina è aggiunta alla stessa lisina sulla proteina bersaglio, quella proteina è contrassegnata per una rapida distruzione da parte del proteasoma. ubiquitina ligasi SCF che lega E2 10 nm (D) (D) Confronto di SCF (in basso) con la struttura a bassa risoluzione ottenuta mediante microscopia elettronica di un’ubiquitina ligasi chiamata complesso che promuove l’anafase (APC/C, in alto) alla stessa scala. L’APC/C è un grande complesso formato da 15 proteine. Come vedremo nel Capitolo 17, le sue ubiquitinazioni controllano le ultime fasi della mitosi. Esso è correlato alla lontana a SCF e contiene una subunità di cullina (in verde) che si trova lungo il lato del complesso a destra, in questa immagine solo parzialmente visibile. Le proteine E2 qui non sono mostrate, ma i loro siti di legame sono indicati in arancione, insieme con i siti di legame del substrato in viola. (A e B, adattate da G. Wu et al., Mol. Cell 11:14451456, 2003. Per gentile concessione di Elsevier; D, adattata da P. da Fonseca et al., Nature 470:274-278, 2011. Per gentile concessione di Macmillan Publishers Ltd.) CAPITOLO © 978-88-08-62126-9 rali delle sue lisine entrino in contatto con l’enzima che coniuga l’ubiquitina. Questo enzima può quindi catalizzare l’aggiunta ripetuta di ubiquitina a queste lisine (vedi Figura 3.71C), producendo una catena di poliubiquitina che marca la proteina bersaglio per la distruzione rapida in un proteasoma. In questo modo proteine specifiche sono indirizzate alla distruzione rapida in risposta a segnali specifici, aiutando così a far avanzare il ciclo cellulare (vedi Capitolo 17). Il momento della distruzione spesso è determinato dalla creazione di uno schema specifico di fosforilazione sulla proteina bersaglio necessario per il riconoscimento da parte della subunità F-box, e richiede anche l’attivazione di un’ubiquitina ligasi SCF con il braccio appropriato che lega il substrato. Molti di questi bracci (le subunità F-box) sono intercambiabili nel complesso proteico (vedi Figura 3.71B) e ci sono più di 70 geni umani che li codificano. Come abbiamo sottolineato in precedenza, una volta che una proteina si è evoluta con successo, la sua informazione genetica tende a essere duplicata per produrre una famiglia di proteine correlate. Così, per esempio, non soltanto ci sono molte proteine F-box – che rendono possibile il riconoscimento di serie diverse di proteine bersaglio – ma esiste anche una famiglia di proteine impalcatura (note come culline) che dà origine a una famiglia di ubiquitina ligasi simile a SCF. Una macchina proteica come la proteina ligasi SCF, con le sue parti intercambiabili, fa un uso parsimonioso dell’informazione genetica delle cellule; inoltre crea opportunità per una “rapida” evoluzione, considerando che nuove funzioni per l’intero complesso possono evolvere semplicemente producendo una versione alternativa di una delle sue subunità. Le ubiquitina ligasi formano una famiglia variegata di complessi proteici. Alcuni di questi complessi sono molto più grandi e compositi dell’SCF, ma le loro funzioni enzimatiche di base sono le stesse (Figura 3.71D). ■ Una proteina che lega GTP mostra come possano generarsi grandi movimenti di proteine La struttura dettagliata ottenuta per uno dei membri della famiglia di proteine che legano GTP, la proteina EF-Tu, fornisce un valido esempio di come cambiamenti allosterici nella conformazione di una proteina possano produrre grandi movimenti per mezzo dell’amplificazione di cambiamenti conformazionali piccoli e localizzati. EF-Tu è una molecola abbondante che serve da fattore di allungamento (da cui EF, elongation factor) nella sintesi proteica (vedi Capitolo 6), caricando ciascuna molecola di amminoacil-tRNA sul ribosoma. EF-Tu contiene un dominio simile a Ras (vedi Figura 3.67) e la molecola di tRNA forma un complesso forte con la forma legata a GTP. Questa molecola di tRNA può trasferire il suo amminoacido alla catena polipeptidica crescente soltanto dopo che il GTP legato a EF-Tu è stato idrolizzato, permettendo la dissociazione di EF-Tu. Poiché l’idrolisi di GTP è scatenata da un adattamento corretto del tRNA alla molecola di mRNA sul ribosoma, EF-Tu serve da fattore di assemblaggio che distingue fra accoppiamenti mRNA-tRNA corretti e non corretti (vedi Figura 6.65). Il confronto della struttura tridimensionale di EF-Tu nella forma legata a GTP con quella legata a GDP rivela come avviene il riposizionamento del tRNA. La dissociazione del gruppo fosfato inorganico (Pi), che segue la reazione GTP → GDP + Pi, provoca uno spostamento di pochi decimi di nanometro nel sito che lega GTP, proprio come fa la proteina Ras. Questo minuscolo movimento, equivalente a pochi diametri di un atomo di idrogeno, provoca la propagazione di un cambiamento conformazionale lungo un tratto cruciale di a elica, chiamato elica interruttore, nel dominio simile a Ras della proteina. L’elica interruttore sembra agire come un “chiavistello” che aderisce a un sito specifico in un altro dominio della molecola, mantenendo la proteina in una conformazione “chiusa”. Il cambiamento conformazionale innescato dall’idrolisi di GTP provoca il distacco dell’elica interruttore, permettendo a domini separati della proteina di ruotare allontanandosi di una distanza di circa 4 nm (Figura 3.72). Ciò rilascia la molecola legata di tRNA, permettendo all’amminoacido legato di essere usato (Figura 3.73). 3 Le proteine 167 CAPITOLO 3 Le proteine 168 © 978-88-08-62126-9 sito di legame del tRNA GTP NH2 dominio 1 tRNA rilasciato G P elica interruttore dominio 2 HOOC (A) (B) Figura 3.72 Il grande cambiamento conformazionale in EF-Tu causato dall’idrolisi di GTP. (A e B) La struttura tridimensionale di EF-Tu con GTP legato. Il dominio in alto ha una struttura simile alla proteina Ras e l’a elica rossa è l’elica interruttore, che si sposta dopo l’idrolisi del GTP. (C) Il cambiamento nella conformazione dell’elica interruttore nel dominio 1 provoca la rotazione dei domini 2 e 3 come EF-Tu amminoacido legato al tRNA GTP G P P idrolisi del GTP P P GDP legato sito di legame per il GTP elica interruttore dominio 3 (C) singola unità di circa 90° verso l’osservatore, causando il rilascio del tRNA che era legato a questa struttura (vedi anche Figura 3.73). (A, adattata da H. Berchtold et al., Nature 365: 126-132, 1993. Con il permesso di Macmillan Publishers Ltd. B, per gentile concessione di Mathias Sprinzl e Rolf Hilgenfeld. Codice PDB: 1EFT.) Da questo esempio si può vedere come le cellule abbiano approfittato di un semplice cambiamento chimico che avviene sulla superficie di un piccolo dominio proteico per creare un movimento 50 volte più grande. Cambiamenti drastici di forma di questo tipo provocano anche i grandi movimenti che avvengono nei motori proteici, come vedremo adesso. ■ Motori proteici producono grandi movimenti nelle cellule tRNA Figura 3.73 Una molecola di amminoacil-tRNA legata a EF-Tu. Si noti come la proteina legata impedisca l’uso dell’amminoacido legato al tRNA (verde) per la sintesi proteica finché l’idrolisi del GTP non innesca i cambiamenti conformazionali mostrati nella Figura 3.72C, dissociando il complesso tRNA-proteina. EF-Tu è una proteina batterica; tuttavia una proteina molto simile esiste anche negli eucarioti, dove viene chiamata EF-1 (Filmato 3.12 ). (Coordinate determinate da P. Nissen et al., Science 270:1464-1472, 1995. Codice PDB: 1B23.) Abbiamo visto come i cambiamenti conformazionali delle proteine abbiano un ruolo centrale nella regolazione degli enzimi e nella segnalazione cellulare. Adesso parleremo di proteine la cui funzione principale è quella di muovere altre molecole. Questi motori proteici generano le forze che provocano la contrazione muscolare e che permettono alle cellule di strisciare e di nuotare. I motori proteici sono anche responsabili di movimenti intracellulari su scala più piccola: aiutano a muovere i cromosomi a estremità opposte della cellula durante la mitosi (vedi Capitolo 17), a muovere organelli lungo binari molecolari all’interno della cellula (vedi Capitolo 16) e a spostare enzimi lungo un filamento di DNA durante la sintesi di una nuova molecola di DNA (vedi Capitolo 5).Tutti questi processi fondamentali dipendono da proteine con parti in movimento che agiscono come macchine che generano forza. Come funzionano queste macchine? In altre parole, in che modo i cambiamenti di forma delle proteine sono usati per generare movimenti diretti nelle cellule? Se, per esempio, una proteina deve “camminare” lungo un filo sottile come una molecola di DNA, può farlo subendo una serie di cambiamenti conformazionali, come quelli mostrati nella Figura 3.74. Ma, se non ci fosse qualcosa che spinge questi cambiamenti in una sequenza ordinata, essi sarebbero perfettamente reversibili e la proteina vagherebbe a caso avanti e indietro lungo il filo. Possiamo vedere questa situazione in un altro modo. Poiché il movimento direzionale di una proteina rappresenta un lavoro, le leggi della termodinamica (vedi Capitolo 2) richiedono che questo movimento utilizzi energia libera proveniente da qualche altra fonte (altrimenti la proteina potrebbe essere usata per produrre una macchina del moto perpetuo). Perciò senza un input di energia la molecola proteica può soltanto vagare senza scopo. In che modo allora si può rendere unidirezionale la serie di cambiamenti conformazionali? Per indurre l’intero ciclo a procedere in una direzione è sufficiente rendere irreversibile uno qualunque dei cambiamenti di forma. La maggior parte delle proteine che sono capaci di camminare in una direzione per lunghe distanze ottiene questo movimento accoppiando uno dei cambiamenti conformazionali all’idrolisi di una molecola di ATP legata alla protei- CAPITOLO 3 Le proteine 169 © 978-88-08-62126-9 Figura 3.74 Una proteina allosterica che “cammina”. Sebbene le sue tre diverse conformazioni le permettano di vagare a caso avanti e indietro attaccata a un filo o a un filamento, la proteina non può muoversi uniformemente in un’unica direzione. na. Il meccanismo è simile a quello appena discusso che determina cambiamenti di forma delle proteine allosteriche mediante idrolisi di GTP. Poiché una grande quantità di energia libera viene rilasciata quando viene idrolizzato ATP (o GTP), è molto improbabile che la proteina che lega il nucleotide subisca il cambiamento di forma inverso necessario per muoversi all’indietro, poiché questo richiederebbe di invertire anche l’idrolisi di ATP aggiungendo un fosfato ad ADP per formare ATP. Nel modello mostrato nella Figura 3.75A l’attacco di ATP sposta un motore proteico dalla conformazione 1 alla conformazione 2. L’ATP legato viene quindi idrolizzato per produrre ADP e fosfato inorganico (Pi), provocando un cambiamento dalla conformazione 2 alla conformazione 3. Infine il rilascio dell’ADP legato e del Pi spinge la proteina di nuovo nella conformazione 1. Poiché la transizione 2 → 3 è prodotta dall’energia fornita dall’idrolisi di ATP, questa serie di cambiamenti conformazionali è effettivamente irreversibile. Così l’intero ciclo va solo in una direzione, in questo esempio facendo camminare la proteina continuamente verso destra. Molti motori proteici generano movimento direzionale tramite l’uso di un ingranaggio di arresto unidirezionale simile, come la proteina muscolare miosina, che cammina lungo i filamenti di actina (Figura 3.75B), e le chinesine, che camminano lungo i microtubuli (entrambe trattate nel Capitolo 16). Questi movimenti possono essere rapidi: alcuni dei motori proteici coinvolti nella replicazione del DNA (le DNA elicasi) si spingono lungo un filamento di DNA con velocità fino a 1000 nucleotidi al secondo. 1 2 3 miosina V actina 1 LEGAME DI ATP P P A P 2 Figura 3.75 Come una proteina IDROLISI P A P 50 nm (B) P 3 RILASCIO A P P ADP P 1 (A) direzione del movimento può muoversi in una sola direzione. (A) Una proteina motrice allosterica spinta dall’idrolisi di ATP. La transizione fra tre diverse conformazioni comprende un passaggio prodotto dall’idrolisi di una molecola legata di ATP; si crea un “ingranaggio unidirezionale” che rende l’intero ciclo essenzialmente irreversibile. Mediante cicli ripetuti, la proteina si muove perciò continuamente verso destra lungo il filo. (B) Visualizzazione diretta per mezzo di un microscopio a forza atomica ad alta velocità di una proteina motrice miosina mentre cammina; il tempo trascorso tra i diversi passaggi è meno di 0,5 secondi (vedi Filmato 16.3). (B, adattata da N. Kodera et al., Nature 468:72-76, 2010. Per gentile concessione di Macmillan Publishers Ltd.) CAPITOLO 3 Le proteine 170 © 978-88-08-62126-9 ■ Trasportatori legati a membrane imbrigliano energia per pompare molecole attraverso le membrane Figura 3.76 Il trasportatore ABC (ATP-binding cassette), una macchina proteica che pompa grandi molecole attraverso una membrana. (A) Come questa grande famiglia di trasportatori pompa molecole all’interno della cellula batterica. Come indicato, il legame di due molecole di ATP pinza insieme le due subunità che legano ATP, aprendo il canale all’esterno della cellula. Il legame di una molecola di substrato nella parte extracellulare del complesso proteico innesca poi l’idrolisi di ATP seguita da rilascio di ADP, che apre il varco citoplasmatico; la pompa è quindi resettata per un altro ciclo. (B) Come vedremo nel Capitolo 11, negli eucarioti avviene il processo inverso, in cui molecole di substrato selezionate vengono pompate fuori dalla cellula. (C) La struttura di un trasportatore ABC batterico (vedi Filmato 11.5). (C, da R.J. Dawson e K.P. Locher, Nature 443:180-185, 2006. Per gentile concessione di Macmillan Publishers Ltd. Codice PDB: 2HYD.) (A) Finora abbiamo visto come proteine che vanno incontro a cambiamenti di forma allosterici possano agire come microprocessori (le chinasi della famiglia Src), come fattori di assemblaggio (EF-Tu) e come generatori di forza meccanica e di movimento (motori proteici). Le proteine allosteriche possono anche imbrigliare energia derivata dall’idrolisi di ATP, da gradienti ionici o da processi di trasporto di elettroni per pompare ioni specifici o piccole molecole attraverso una membrana. Consideriamo qui un esempio che sarà affrontato in maggior dettaglio nel Capitolo 11. I trasportatori ABC (ATP-binding cassette transporters, trasportatori a cassetta che legano ATP) costituiscono una classe importante di pompe proteiche legate a membrane; negli esseri umani sono codificati da almeno 48 geni diversi. Questi trasportatori funzionano per la maggior parte per esportare molecole idrofobiche dal citoplasma e servono a rimuovere molecole tossiche sulla superficie della mucosa del tratto intestinale, per esempio, o sulla barriera ematoencefalica. Lo studio dei trasportatori ABC è di grande interesse nella medicina clinica, in quanto la sovrapproduzione di proteine di questa classe contribuisce alla resistenza delle cellule tumorali agli agenti chemioterapici. Nei batteri lo stesso tipo di proteine funziona soprattutto per importare nutrienti essenziali nella cellula. Un tipico trasportatore ABC contiene una coppia di domini che attraversano la membrana uniti a una coppia di domini che legano ATP posti appena sotto la membrana plasmatica. Come in altri esempi che abbiamo osservato, l’idrolisi delle molecole di ATP legate induce cambiamenti conformazionali della proteina, trasmettendo forze che fanno sì che il trasportatore sposti la sua molecola legata attraverso il doppio strato lipidico (Figura 3.76). Gli esseri umani hanno inventato molti tipi diversi di pompe meccaniche e non dovrebbe sorprendere che anche le cellule contengano pompe legate a membrane che funzionano in altri modi. Le più notevoli sono le pompe rotanti che accoppiano l’idrolisi di ATP al trasporto di ioni H+ (protoni). Queste UN TRASPORTATORE ABC BATTERICO (C) piccola molecola CITOSOL ATP domini ad attività ATPasica (B) ATP 2 ADP + Pi 2 ATP UN TRASPORTATORE ABC EUCARIOTICO CITOSOL domini ad attività ATPasica piccola molecola ATP 2 ATP ATP 2 ADP + Pi CAPITOLO 3 Le proteine 171 © 978-88-08-62126-9 pompe assomigliano a turbine in miniatura e sono usate per acidificare l’interno dei lisosomi e di altri organelli eucariotici. Come altre pompe ioniche che creano gradienti ionici, esse possono funzionare in senso contrario per catalizzare la reazione ADP + Pi → ATP, se esiste un gradiente abbastanza ripido attraverso la membrana dello ione che trasportano. Una di queste pompe, l’ATP sintasi, imbriglia un gradiente di concentrazione di protoni originato da processi di trasporto di elettroni per produrre la maggior parte dell’ATP usato nel mondo vivente. Questa pompa ubiquitaria ha un ruolo centrale nella conversione dell’energia; tratteremo la sua struttura tridimensionale e il suo meccanismo nel Capitolo 14. ■ Le proteine spesso formano grandi complessi che funzionano come macchine proteiche Le grandi proteine formate da molti domini sono in grado di svolgere funzioni più elaborate delle proteine piccole a singolo dominio. I compiti più importanti, tuttavia, sono eseguiti da grandi complessi proteici formati da molte molecole proteiche. Ora che è possibile ricostruire la maggior parte dei processi biologici in sistemi acellulari in laboratorio è chiaro che tutti i processi centrali di una cellula – come replicazione del DNA, sintesi proteica, gemmazione di vescicole o segnalazione transmembrana – sono catalizzati da una serie connessa e altamente coordinata di dieci o più proteine. Nella maggior parte di queste macchine proteiche una reazione energeticamente favorevole come l’idrolisi di nucleosidi trifosfato legati (ATP o GTP) induce una serie ordinata di cambiamenti conformazionali in una o più subunità proteiche singole, rendendo l’insieme di proteine capace di muoversi in modo coordinato. Pertanto ciascuno degli enzimi appropriati può essere posto direttamente nella posizione in cui è necessario per svolgere reazioni successive in serie (Figura 3.77). È questo che avviene, per esempio, nella sintesi proteica su un ribosoma (vedi Capitolo 6), o nella replicazione del DNA, dove un grande complesso multiproteico si muove rapidamente lungo il DNA (vedi Capitolo 5). Le cellule hanno evoluto macchine proteiche per la stessa ragione per cui gli esseri umani hanno inventato macchine meccaniche ed elettroniche. Per eseguire pressoché ogni compito, manipolazioni coordinate temporalmente e spazialmente sono molto più efficienti dell’uso sequenziale di singoli utensili. ATP ATP ATP ATP ■ Impalcature proteiche concentrano gruppi di proteine che interagiscono tra loro Man mano che sono diventati noti sempre più dettagli della biologia cellulare, i ricercatori hanno riconosciuto gradi di complessità sempre maggiore della chimica cellulare. Quindi oggi non soltanto sappiamo che le macchine proteiche svolgono un ruolo predominante, ma di recente è diventato chiaro che la maggior parte di queste macchine si forma in siti cellulari specifici e viene assemblata e attivata soltanto dove e quando è necessario. Per esempio, quando molecole di segnale extracellulari si legano a recettori proteici nella membrana plasmatica, i recettori attivati spesso reclutano un gruppo di altre proteine sulla faccia interna della membrana plasmatica per formare un grande complesso proteico che trasmette oltre il segnale (vedi Capitolo 15). Questi meccanismi spesso coinvolgono proteine impalcatura. Queste sono proteine con siti di legame per molte altre proteine e servono sia per legare insieme specifici gruppi di proteine che interagiscono tra di loro sia per ADP Pi ADP + Pi Pi ADP ADP + Pi Figura 3.77 Come “macchine proteiche” svolgono funzioni complesse. Queste macchine sono formate da singole proteine che collaborano per eseguire un compito ). Il movimento di queste proteine è spesso coordinato specifico (Filmato 3.13 dall’idrolisi di un nucleotide legato come l’ATP o il GTP. Cambiamenti conformazionali allosterici direzionali di proteine che sono indotti in questo modo si verificano spesso in grandi raggruppamenti proteici in cui le attività di numerose proteine differenti sono coordinate da tali movimenti all’interno del complesso. CAPITOLO 3 Le proteine 172 © 978-88-08-62126-9 regione non strutturata proteina impalcatura collisioni rapide dominio strutturato Figura 3.78 La vicinanza creata da proteine impalcatura può rendere molto più veloci le reazioni in una cellula. In questo esempio lunghe regioni non strutturate di catena polipeptidica in una grande proteina impalcatura collegano una serie di domini strutturati che legano una serie di proteine che reagiscono tra di loro. Le regioni non strutturate servono da “guinzagli” flessibili che aumentano molto la velocità di reazione, causando una rapida collisione casuale di tutte le proteine che sono legate all’impalcatura. (Per esempi specifici di proteine guinzaglio, vedi Figura 3.54 e Figura 16.18; per molecole impalcatura di RNA vedi Figura 7.49B.) + prodotto proteine reagenti impalcatura pronta per il riutilizzo posizionarle in specifici siti all’interno della cellula. A un estremo ci sono impalcature rigide, come la cullina nell’ubiquitina chinasi SCF (vedi Figura 3.71), all’estremo opposto ci sono grandi e flessibili proteine impalcatura che spesso si trovano in corrispondenza di regioni specializzate della membrana plasmatica. Queste comprendono la Discs-large protein (Dlg), una proteina di circa 900 amminoacidi che è concentrata in regioni specifiche al di sotto della membrana nelle cellule epiteliali e nelle sinapsi. Dlg contiene siti di legame per almeno altre sette proteine, intervallati da regioni di catena polipeptidica più flessibile. Dlg è una proteina antica, conservata in organismi molto diversi, come spugne, vermi, mosche ed esseri umani; il suo nome deriva dal fenotipo mutante dell’organismo in cui è stata scoperta. Le cellule nei dischi immaginali di un embrione di Drosophila con una mutazione nel gene Dlg non smettono di proliferare quando dovrebbero, producendo dischi insolitamente grandi le cui cellule epiteliali possono formare tumori. Sebbene siano state studiate solo parzialmente, si pensa che Dlg e numerose proteine impalcatura simili funzionino come la proteina che è illustrata schematicamente nella Figura 3.78. Legando un gruppo specifico di proteine che interagiscono, queste impalcature possono aumentare la velocità di reazioni cruciali e allo stesso tempo confinarle nella particolare regione della cellula in cui si trova l’impalcatura. Per ragioni simili le cellule fanno largo uso anche di molecole impalcatura di RNA, come vedremo nel Capitolo 7. ■ Molte proteine sono controllate da modificazioni covalenti che le indirizzano in siti specifici all’interno della cellula Finora abbiamo descritto soltanto un tipo di modificazione post-traduzionale delle proteine, ma esiste un numero elevato di altre modificazioni di questo genere; al momento se ne conoscono più di 200 tipi distinti. Per dare un senso a questa varietà la Tabella 3.3 presenta una sottoserie di gruppi modificatori con ruoli regolatori noti. Come nel caso dell’aggiunta di fosfato e di ubiquitina, questi gruppi sono aggiunti e rimossi dalle proteine secondo le necessità della cellula. TABELLA 3.3 Alcune molecole attaccate covalentemente alle proteine che regolano la funzione proteica Gruppo modificatore Alcune funzioni rilevanti Fosfato su Ser, Thr o Tyr Induce l’assemblaggio di una proteina in complessi più grandi (vedi Figura 15.11) Metile su Lys Aiuta a creare il codice istonico nella cromatina formando mono-, di- o trimetil lisina negli istoni (vedi Figura 4.36) Acetile su Lys Aiuta ad attivare i geni nella cromatina modificando gli istoni (vedi Figura 4.33) Gruppo palmitile su Cys Questa aggiunta di un acido grasso determina l’associazione della proteina con la membrana (vedi Figura 10.18) N-Acetilglucosammina su Ser o Thr Controlla l’attività enzimatica e l’espressione genica nell’omeostasi del glucosio Ubiquitina su Lys L’aggiunta di monoubiquitina regola il trasporto di proteine di membrana nelle vescicole (vedi Figura 13.50) Una catena di poliubiquitina indirizza una proteina per la degradazione (vedi Figura 3.70) L’ubiquitina è un polipeptide di 76 amminoacidi; esistono almeno altre 10 proteine correlate all’ubiquitina nelle cellule di mammifero. CAPITOLO 3 Le proteine 173 © 978-88-08-62126-9 (A) UNA SERIE DI MODIFICAZIONI COVALENTI PRODUCE UN CODICE REGOLATORE PROTEICO SEGNALI MOLECOLARI DETERMINANO L’AGGIUNTA DI MODIFICAZIONI COVALENTI e/o e/o N e/o e/o C PROTEINA X LETTURA DEL CODICE LEGAME ALLE PROTEINE YEZ (B) o SPOSTAMENTO o NEL NUCLEO SPOSTAMENTO SPOSTAMENTO NEL PROTEASOMA o NELLA PER MEMBRANA LA DEGRADAZIONE PLASMATICA ALCUNE MODIFICAZIONI CONOSCIUTE DELLA PROTEINA p53 C N 50 amminoacidi P fosfato Ac acetile U ubiquitina Oggi conosciamo moltissime proteine che sono modificate su più di una catena laterale di un amminoacido, in cui eventi regolatori diversi producono uno schema diverso di modificazioni. Un esempio notevole è la proteina p53, che ha un ruolo centrale nel controllo della risposta di una cellula a circostanze avverse (vedi Figura 17.62). Tramite uno di quattro tipi diversi di aggiunte molecolari, questa proteina può essere modificata in 20 siti differenti. Poiché è possibile un numero altissimo di combinazioni diverse di queste 20 modificazioni, in linea di principio il comportamento della proteina può essere alterato in molteplici modi. Spesso queste modificazioni creano un sito nella proteina modificata che ne permette il legame a una proteina impalcatura in una regione specifica della cellula, connettendola quindi – per mezzo dell’impalcatura – ad altre proteine necessarie per una certa reazione in quel sito. La serie di modificazioni covalenti a cui va incontro ciascuna proteina può essere vista come un codice regolatore combinatorio. Gruppi modificatori specifici sono rimossi o aggiunti a una proteina in risposta a segnali e questo codice successivamente altera i comportamenti della proteina, cambiando l’attività o la stabilità della proteina, i suoi partner di legame e/o la sua posizione specifica all’interno della cellula (Figura 3.79). Come risultato, la cellula è in grado di rispondere rapidamente e con grande versatilità ai cambiamenti delle sue condizioni o a quelli dell’ambiente. ■ Una rete complessa di interazioni fra proteine è alla base del funzionamento della cellula Esistono molte sfide per i biologi in questa era ricca di informazioni, in cui sono note le sequenze complete di molti genomi. Una è la necessità di sezionare e ricostruire ciascuna delle migliaia di macchine proteiche presenti in un organismo come il nostro. Per comprendere questi notevoli complessi proteici ognuno di essi deve essere ricostituito dalle sue parti purificate, così da poter studiare i dettagli del suo modo di operare in condizioni controllate in provetta, libero da altri componenti cellulari. Già questa è da sola un’impresa imponente. Ma oggi sappiamo che ciascuno di questi subcomponenti di una cellula interagisce anche con altre serie di macromolecole, creando una grande rete di interazioni proteina-proteina e proteina-acido nucleico nella cel- SUMO Figura 3.79 Modificazioni in siti multipli delle proteine e loro effetti. (A) Si può considerare che una proteina con un’aggiunta posttraduzionale a più di una catena laterale dei suoi amminoacidi abbia un codice regolatore combinatorio. Modificazioni in siti multipli sono aggiunte a (e rimosse da) una proteina attraverso reti di segnalazione: il risultante codice regolatore combinatorio sulla proteina viene letto per alterare il suo comportamento nella cellula. (B) Lo schema di alcune modificazioni covalenti della proteina p53. CAPITOLO 3 Le proteine 174 Figura 3.80 Una rete di interazioni di legame fra proteine in una cellula di lievito. Ciascuna linea che connette una coppia di punti (proteine) indica un’interazione proteina-proteina. (Da A. Guimerá e M. Sales-Pardo, Mol. Syst. Biol. 2:42, 2006. Con il permesso di Macmillan Publishers Ltd.) © 978-88-08-62126-9 lula. Per comprendere la cellula, perciò, bisogna analizzare anche la maggior parte di queste altre interazioni. Un’idea della complessità delle reti di proteine intracellulari può essere ottenuta da un esempio particolarmente ben studiato descritto nel Capitolo 16: le molte proteine che interagiscono con il citoscheletro di actina per controllare il comportamento del filamento di actina (vedi Quadro 16.3, p. 963). Il grado di queste interazioni proteina-proteina può essere stimato anche in modo più generale. Un’enorme quantità di informazioni preziose è oggi disponibile liberamente nei database delle proteine consultabili in Internet: decine di migliaia di strutture tridimensionali di proteine più decine di milioni di sequenze proteiche derivate dalle sequenze nucleotidiche dei geni. I ricercatori stanno sviluppando nuovi metodi per attingere a questa grande risorsa e aumentare la conoscenza delle cellule. In particolare, si stanno combinando strumenti bioinformatici basati su computer con tecnologie robotiche e altre tecnologie per permettere di studiare in una singola serie di esperimenti migliaia di proteine. Proteomica è un termine usato spesso per indicare questa ricerca che si concentra sull’analisi su larga scala delle proteine, in analogia con il termine genomica, che indica l’analisi su larga scala di sequenze di DNA e di geni. Un metodo biochimico basato sulla marcatura di affinità e sulla spettrometria di massa si è dimostrato particolarmente efficace nel determinare le interazioni di legame diretto tra le molte diverse proteine presenti all’interno di una cellula (vedi Capitolo 8). I risultati sono stati tabulati e organizzati in database disponibili in Internet. Ciò permette a un biologo che studia una piccola serie di proteine di scoprire facilmente a quali altre proteine della stessa cellula si pensa che si leghi, e quindi interagisca, quella serie di proteine. I dati vengono rappresentati graficamente in una mappa di interazione fra proteine, in cui ciascuna proteina è indicata da un punto o da un quadrato in una rete bidimensionale, con linee rette che connettono quelle proteine di cui è stata dimostrata l’interazione diretta. Quando sulla stessa mappa sono mostrate centinaia o migliaia di proteine, il diagramma a rete diventa straordinariamente complicato e serve a illustrare le enormi sfide che si trovano davanti gli scienziati che cercano di capire il funzionamento della cellula (Figura 3.80). Sono più utili sottosezioni di queste mappe, incentrate su poche proteine di interesse. Abbiamo precedentemente descritto la struttura e la modalità d’azione dell’ubiquitina ligasi SCF, usandola per illustrare il modo in cui i complessi proteici sono costruiti a partire da parti intercambiabili (vedi Figura 3.71). La Figura 3.81 mostra una rete di interazioni proteina-proteina per le cinque proteine che formano l’ubiquitina ligasi SCF in una cellula di lievito. Quattro subunità di questa ligasi sono poste in fondo a destra in questa figura, mentre la subunità rimanente, la proteina F-box che serve da braccio che lega il substrato, compare come una serie di 15 prodotti genici diversi che si legano alla proteina adattatrice 2 (la proteina Skp1). Lungo la parte in alto a sinistra della figura si trovano serie di ulteriori interazioni fra proteine marcate con un’ombreggiatura gialla e verde: come indicato, queste serie di proteine funzionano in corrispondenza dell’origine di replicazione del DNA, nella regolazione del ciclo cellulare, nella sintesi della metionina, nel cinetocore e nel complesso della H+-ATPasi vacuolare. Useremo questa figura per spiegare il modo in cui si utilizzano queste mappe di interazioni fra proteine, che cosa significano e che cosa non significano. 1. Le mappe di interazioni fra proteine sono utili per identificare la funzione probabile di proteine non caratterizzate in precedenza. Esempi sono i prodotti dei geni la cui esistenza è stata postulata finora soltanto in base alla sequenza del genoma di lievito, che sono le sei proteine nella figura prive di una semplice abbreviazione a tre lettere (lettere bianche che iniziano con Y). Le tre nel diagramma sono proteine F-box che si legano a Skp1; è quindi probabile che queste funzionino come parte dell’ubiquitina ligasi, servendo da bracci che legano il substrato che riconoscono proteine bersaglio diverse. Tuttavia, come vedremo adesso, nessuna delle due assegnazioni può essere considerata certa senza ulteriori dati. CAPITOLO 3 Le proteine 175 © 978-88-08-62126-9 ORIGINE DI REPLICAZIONE REGOLATORI DEL CICLO CELLULARE Orc2 Orc1 Swe1 Orc3 Cdc28 Orc6 Cks1 SINTESI DELLA METIONINA Orc5 Sic1 Cdc5 Cli1 Met31 Orc4 Cli2 Met32 Rpt1 Erd3 Met4 Met28 Yak1 Dla2 CINETOCORE Ufb1 Rcy1 Grr1 Cdc4 Cdc34 YLR224W Okp1 enzima che coniuga l’ubiquitina E2 Hrt3 Mit2 Ctf19 Cbf1 Cep3 Cbf2 Skp2 proteine F-box YDR131 Me130 YDR306 Mdm30 Mcm21 Mck1 Das1 Ctfl3 Hrt1 proteina adattatrice 1 Vma4 Vma8 Tfp1 Ram2 Skp1 Ram1 Vma2 COMPLESSO DELLA H -ATPasi VACUOLARE proteina adattatrice 2 Cdc53 proteina impalcatura (cullina) + 2. Le reti di interazioni fra proteine devono essere interpretate con cautela perché, come risultato dell’uso efficiente dell’informazione genetica di ciascun organismo prodotto dall’evoluzione, la stessa proteina può essere usata come parte di due complessi proteici diversi che hanno tipi diversi di funzioni. Così, anche se la proteina A si lega alla proteina B e la proteina B si lega alla proteina C, non è detto che le proteine A e C funzionino nello stesso processo. Per esempio, sappiamo da studi biochimici dettagliati che le funzioni di Skp1 nel cinetocore e nel complesso della H+-ATPasi vacuolare (ombreggiatura gialla) sono separate dalla sua funzione nell’ubiquitina ligasi SCF. In effetti soltanto le tre funzioni rimanenti di Skp1 illustrate nello schema – sintesi della metionina, regolazione del ciclo cellulare e origine di replicazione (ombreggiatura verde) – comportano ubiquitinazione. 3. Nei confronti fra specie quelle proteine che mostrano schemi simili di interazioni nelle due mappe di interazioni fra proteine hanno probabilmente la stessa funzione nella cellula. Così, man mano che i ricercatori produrranno mappe sempre più dettagliate per organismi multipli, i risultati diventeranno sempre più utili per dedurre la funzione delle proteine. Questi confronti fra mappe sono uno strumento particolarmente utile per decifrare le funzioni delle proteine umane. Esiste una grande quantità di informazioni dirette sulla funzione delle proteine che si possono ottenere dalle analisi d’ingegneria genetica, mutazionali e genetiche in organismi modello – come lievito, vermi e mosche – che non è disponibile per gli esseri umani. Che cosa ci riserverà il futuro? In una tipica cellula umana molto probabilmente il numero delle differenti proteine presenti è dell’ordine di 10 000: ciascuna di esse interagisce con un numero di partner diversi che va da 5 a 10. Figura 3.81 Una mappa di alcune interazioni proteina-proteina dell’ubiquitina ligasi SCF e di altre proteine nel lievito S. cerevisiae. I simboli e/o i colori usati per le cinque proteine della ligasi sono quelli della Figura 3.71. Si noti che sono mostrate 15 diverse proteine F-box (viola); quelle con lettere bianche (che iniziano con Y) sono note soltanto dalla sequenza del genoma come quadri di lettura aperti. Per ulteriori dettagli vedi il testo. (Per gentile concessione di Peter Bowers e David Eisenberg, UCLA-DOE Institute for Genomics and Proteomics, UCLA.) CAPITOLO 3 Le proteine 176 © 978-88-08-62126-9 Nonostante l’enorme progresso fatto negli ultimi anni non possiamo affermare di aver compreso il funzionamento anche della più semplice cellula conosciuta, come il piccolo batterio Mycoplasma formato soltanto da circa 500 prodotti genici (vedi Figura 1.10). Come pensiamo allora di poter comprendere un essere umano? Ovviamente sarà essenziale una gran mole di esperimenti biochimici affinché ogni proteina di un particolare gruppo di proteine che interagiscono tra loro sia purificata, e le caratteristiche chimiche e le interazioni possano essere analizzate in provetta. Inoltre saranno necessari sistemi più potenti per analizzare le reti, basati su metodi matematici e computazionali non ancora inventati, come metteremo in evidenza nel Capitolo 8. Chiaramente ci sono molte meravigliose sfide che attendono le generazioni future di biologi cellulari. QUELLO CHE NON SAPPIAMO • Quali sono le funzioni della catena polipeptidica non ripiegata presente nelle proteine in quantità sorprendentemente elevata? • Quanti tipi di funzioni proteiche restano da scoprire? Quali sono gli approcci più promettenti per scoprirle? • Quando gli scienziati saranno in grado di prevedere accuratamente sia le conformazioni tridimensionali di una proteina che le sue proprietà chimiche a partire da una qualsiasi sequenza di amminoacidi? Quale passo avanti fondamentale è necessario per raggiungere questo obiettivo? • Ci sono modi per rivelare i dettagli dei meccanismi di funzionamento di una macchina proteica che non richiedano la purificazione in grande quantità di ognuna delle sue parti componenti, in modo tale che le funzioni della macchina possano essere ricostituite ed esaminate usando tecniche chimiche in una provetta? • Quali sono i ruoli delle decine di tipi diversi di modificazioni covalenti di proteine che sono stati trovati in aggiunta a quelli elencati nella Tabella 3.3? Quali sono cruciali per la funzione della cellula e perché? • Perché l’amiloide è tossico per le cellule e come contribuisce alle patologie neurodegenerative come la malattia di Alzheimer? SOMMARIO Le proteine possono formare dispositivi chimici estremamente sofisticati, le cui funzioni dipendono in gran parte dalle proprietà chimiche dettagliate delle loro superfici. I siti di legame per i ligandi si formano come cavità della superficie in cui catene laterali di amminoacidi precisamente posizionate vengono a trovarsi vicine per il ripiegamento della proteina. In questo modo catene laterali di amminoacidi normalmente non reattive possono essere indotte a formare e a rompere legami covalenti. Gli enzimi sono proteine catalitiche che accelerano di molto le velocità di reazione legando gli stati di transizione ad alta energia di una specifica via di reazione; essi svolgono simultaneamente anche catalisi acida e catalisi basica. Le velocità delle reazioni enzimatiche sono spesso così alte che sono limitate soltanto dalla diffusione; le velocità possono essere ulteriormente aumentate se gli enzimi che agiscono sequenzialmente su un substrato sono uniti in un singolo complesso multienzimatico, o se gli enzimi e i loro substrati attaccati a impalcature proteiche sono confinati nello stesso compartimento della cellula. Le proteine cambiano reversibilmente forma quando dei ligandi si legano alla loro superficie. I cambiamenti allosterici nella conformazione di una proteina prodotti da un ligando influenzano l’attacco di un secondo ligando; questo linkage fra due siti per ligandi fornisce un meccanismo cruciale per regolare processi cellulari. Le vie metaboliche, per esempio, sono controllate da regolazione a feedback: alcune piccole molecole inibiscono e altre piccole molecole attivano enzimi all’inizio di una via. Gli enzimi controllati in questo modo formano generalmente complessi simmetrici, permettendo a cambiamenti cooperativi di conformazione di creare una risposta rapida a cambiamenti nelle concentrazioni dei ligandi che li regolano. Cambiamenti nella forma di una proteina possono essere indotti in maniera unidirezionale dalla spesa di energia chimica. Accoppiando cambiamenti allosterici di forma all’idrolisi di ATP, per esempio, le proteine possono svolgere un lavoro utile, come generare una forza meccanica o muoversi per lunghe distanze in una singola direzione. Le strutture tridimensionali delle proteine hanno rivelato come un piccolo cambiamento locale causato dall’idrolisi di un nucleoside trifosfato venga amplificato per creare cambiamenti importanti altrove nella proteina. Con questi mezzi, queste proteine possono servire da dispositivi input-output che trasmettono informazioni, come fattori di assemblaggio, come motori o come pompe legate a membrane. Macchine proteiche altamente efficienti si formano incorporando molte proteine diverse in complessi più grandi in cui i movimenti allosterici dei singoli componenti sono coordinati. Oggi si sa che queste macchine svolgono molte delle reazioni più importanti nelle cellule. Le proteine sono sottoposte a molte modificazioni post-traduzionali reversibili, come l’aggiunta covalente di un fosfato o di un gruppo acetilico alla catena laterale di un amminoacido. L’aggiunta di questi gruppi modificatori è usata per regolare l’attività di una proteina, cambiandone la conformazione, il legame ad altre proteine e la posizione all’interno della cellula. In una cellula una tipica proteina interagisce con più di cinque partner diversi. Usando la proteomica i biologi possono analizzare migliaia di proteine in una serie di esperimenti. Un risultato importante è la produzione di mappe dettagliate di interazioni fra proteine, che permetteranno di descrivere tutte le interazioni di legame fra le migliaia di proteine diverse presenti in una cellula. Tuttavia, conoscere queste reti richiederà nuove indagini biochimiche in cui piccoli gruppi di proteine che interagiscono tra loro possano essere purificati e la loro chimica possa essere analizzata in dettaglio. Inoltre saranno necessarie nuove tecniche computazionali per poter gestire questa enorme complessità di dati. ● CAPITOLO 3 Le proteine 177 © 978-88-08-62126-9 PROBLEMI Quali affermazioni sono vere? Spiegate perché sì o perché no. 3.1 Ciascun filamento di un foglietto b è un’elica con due amminoacidi per giro. ra nota come elica b. Di solito essa si trova ripetuta da quattro a sette volte, formando un dominio di ripetizioni kelch in una proteina multidominio. Uno di questi domini di ripetizioni kelch è mostrato nella Figura P3.1. Classifichereste questo dominio come “in linea” o come “a spina”? 3.2 Le regioni intrinsecamente non strutturate delle β7 proteine possono essere identificate usando metodi bioinformatici per cercare geni che codificano sequenze amminoacidiche che hanno un’idrofobicità alta e una carica netta bassa. C β6 N β1 β5 3.3 Le anse polipeptidiche che sporgono dalla super- ficie di una proteina formano spesso siti di legame per altre molecole. β2 3.4 Un enzima raggiunge una velocità massima ad alta β4 concentrazione di substrato perché ha un numero fisso di siti attivi a cui si lega il substrato. β3 un numero di turnover maggiore. Figura P3.1 Il dominio ripetuto kelch della galattosio ossidasi di D. dendroides (Problema 3.10). Le sette eliche b sono contraddistinte in colore ed etichettate. L’N- e il C-terminale sono indicati con N e C. 3.6 Gli enzimi che subiscono transizioni allosteriche 3.11 La titina, che ha un peso molecolare di 3 3 106, è cooperative sono costituiti invariabilmente da assemblaggi simmetrici di subunità multiple. il polipeptide più grande descritto finora. Le molecole di titina si estendono dai filamenti spessi del muscolo fino al disco Z; si pensa che esse agiscano da molle per mantenere i filamenti spessi centrati nel sarcomero. La titina è composta da numerose sequenze immunoglobuliniche (Ig) ripetute di 89 amminoacidi, ciascuna delle quali è ripiegata in un dominio lungo circa 4 nm (Figura P3.2A). 3.5 Concentrazioni più alte di enzima danno origine a 3.7 L’aggiunta e la rimozione continua di fosfati da par- te di proteina chinasi e proteina fosfatasi rappresentano uno spreco di energia – poiché la loro azione combinata consuma ATP – ma si tratta di una conseguenza necessaria dell’efficace regolazione mediante fosforilazione. Discutete i seguenti problemi. (A) N C 3.8 Considerate la seguente affermazione:“Per produrre 3.9 Una strategia comune per identificare proteine cor- relate a distanza è quella di cercare nel database usando una breve sequenza firma indicativa della funzione della particolare proteina. Perché è meglio cercare con una sequenza breve anziché con una sequenza lunga? Non ci sarebbero più probabilità di “fare centro” nel database con una sequenza lunga? 3.10 Il cosiddetto motivo kelch è costituito da un fo- glietto b a quattro filamenti, che forma una struttu- (B) 400 forza (pN) una molecola di ciascuna specie possibile di catena polipeptidica, lunga 300 amminoacidi, ci vorrebbero più atomi di quanti ne esistano nell’universo”. Date le dimensioni dell’universo, supponete che questa affermazione possa essere corretta? Poiché non è facile contare gli atomi, considerate il problema dal punto di vista della massa. La massa dell’universo osservabile è stimata intorno a 1080 grammi, un ordine di grandezza in più o in meno. Considerando che la massa media di un amminoacido è 110 dalton, quale sarebbe la massa di una molecola di ciascun tipo possibile di catena polipeptidica lunga 300 amminoacidi? È maggiore della massa dell’universo? 300 200 100 0 0 50 100 150 200 estensione (nm) Figura P3.2 Il comportamento a molla della titina (Problema 3.11). (A) La struttura di un singolo dominio Ig. (B) Forza in piconewton in rapporto all’estensione in nanometri ottenuta tramite il microscopio a forza atomica. Supponete che il comportamento a molla della titina sia causato dall’estensione (e dal ripiegamento) sequenziale di singoli domini Ig. Controllate questa ipotesi usando il microscopio a forza atomica, che vi permette di afferrare un’estremità di una molecola proteica e di tirarla con una forza misurata accuratamente. Per un frammento di titina contenente sette ripetizioni del CAPITOLO 3 Le proteine 178 3.12 Il virus del sarcoma di Rous (RSV) contiene un oncogene chiamato Src, che codifica una proteina chinasi continuamente attiva che causa proliferazione cellulare incontrollata. Normalmente Src ha un acido grasso (miristilato) attaccato che le permette di legarsi al lato citoplasmatico della membrana plasmatica. Una versione mutante di Src che non permette l’attacco del miristilato non si lega alla membrana. L’infezione di cellule con RSV che codifica la forma normale o quella mutante di Src porta allo stesso alto livello di attività tirosina chinasica, ma Src mutante non provoca proliferazione cellulare. A. Considerando che Src normale sia tutta legata alla membrana plasmatica e che la forma mutante di Src sia distribuita in tutto il citoplasma, calcolate le loro concentrazioni relative nelle vicinanze della membrana plasmatica. Per questo calcolo, considerate che la cellula sia una sfera con un raggio (r) di 10 mm e che Src mutante sia distribuita ovunque, mentre Src normale sia confinata in uno strato spesso 4 nm immediatamente sotto la membrana. [Per questo problema assumete che la membrana non abbia spessore. Il volume di una sfera è (4/3)pr3.] B. Il bersaglio (X) della fosforilazione da parte di Src si trova nella membrana. Spiegate perché Src mutante non provoca proliferazione cellulare. 3.13 Un anticorpo si lega a un’altra proteina con una costante di equilibrio, K, di 5 3 109 M–1. Quando si lega a una seconda proteina correlata, esso forma tre legami idrogeno in meno, riducendo la sua affinità di legame di 11,9 kJ/mole. Qual è la K per il legame alla seconda proteina? (Il cambiamento in energia libera è correlato alla costante di equilibrio dall’equazione ∆G° = –2,3 RT log K, in cui R è 8,3 3 10–3 kJ/(mole K) e T è 310 K.) Figura P3.3 1,0 frazione legata dominio Ig, questo esperimento dà la curva a forma di denti di sega, forza in rapporto a estensione, mostrata nella Figura P3.2B. Quando l’esperimento è ripetuto in una soluzione di urea 8 M (un denaturante delle proteine), i picchi scompaiono e l’estensione misurata diventa molto maggiore per una data forza. Se l’esperimento è ripetuto dopo che nella proteina sono stati prodotti legami crociati mediante trattamento con glutaraldeide, di nuovo i picchi scompaiono, ma l’estensione diventa molto minore per una data forza. A. I dati sono in accordo con la vostra ipotesi che il comportamento a molla della titina sia dovuto all’estensione sequenziale di singoli domini Ig? Spiegate il vostro ragionamento. B. L’estensione per ciascun evento putativo di svolgimento è della grandezza attesa? (In una catena polipeptidica estesa gli amminoacidi si trovano spaziati di 0,34 nm.) C. Perché ogni picco successivo della Figura P3.2B è leggermente più alto del precedente? D. Perché la forza collassa così bruscamente dopo ciascun picco? © 978-88-08-62126-9 Frazione di tmRNA legato contro concentrazione di SmpB (Problema 3.14). 0,75 0,5 0,25 0 10–11 10–9 10–7 concentrazione di SmpB (M) 10–5 plete prodotte da mRNA tronchi nei batteri. Se il legame di SmpB al tmRNA è messo in grafico come la frazione di tmRNA legato in rapporto alla concentrazione di SmpB, si ottiene una curva simmetrica a forma di S come mostrato nella Figura P3.3. Questa curva è la visualizzazione di una relazione molto utile fra Kd e concentrazione, che ha una vasta applicabilità. L’espressione generale per la frazione di ligando legato è derivata dall’equazione per Kd (Kd = [Pr][L]/[Pr-L]) sostituendo ([L]TOT – [L]) a [Pr-L] e riordinando. Poiché la concentrazione totale di ligando ([L]TOT) è uguale al ligando libero ([L]) più il ligando legato ([Pr-L]), la frazione legata = [Pr-L]/[L]TOT = [Pr]/([Pr] + Kd) Per SmpB e tmRNA, la frazione legata = [SmpBtmRNA]/[tmRNA]TOT = [SmpB]/([SmpB] + Kd). Usando questa relazione, calcolate la frazione di tmRNA legato per concentrazioni di SmpB uguali a 104, 103, 102, 101, 1, 10–1,10–2, 10–3 e 10–4 Kd. 3.15 Molti enzimi obbediscono alla cinetica semplice di Michaelis-Menten, riassunta dall’equazione velocità = Vmax [S]/([S] + Km) in cui Vmax = velocità massima, [S] = concentrazione del substrato e Km = costante di Michaelis. È istruttivo inserire qualche valore di [S] nell’equazione per vedere come viene influenzata la velocità. Quali sono le velocità per [S] uguale a zero, uguale a Km e uguale a concentrazione infinita? 3.16 L’enzima esochinasi aggiunge un fosfato a d-glu- cosio ma ignora la sua immagine speculare, l-glucosio. Supponete di riuscire a sintetizzare completamente un’esochinasi da d-amminoacidi, che sono l’immagine speculare dei normali l-amminoacidi. A. Supponendo che l’enzima “D” si ripieghi in una conformazione stabile, quale relazione vi aspettereste che possa avere con l’enzima normale “L”? B. Ritenete che l’enzima “D” aggiungerebbe un fosfato a l-glucosio e ignorerebbe d-glucosio? 3.17 In che modo supponete che una molecola di emoglobina sia capace di legare ossigeno ad alta efficienza nei polmoni e di rilasciarlo ad alta efficienza nei tessuti? 3.14 La proteina SmpB si lega a una specie particolare 3.18 La sintesi dei nucleotidi purinici AMP e GMP di tRNA, il tmRNA, per eliminare le proteine incom- procede in una via ramificata che inizia con ribosio CAPITOLO 3 Le proteine 179 © 978-88-08-62126-9 5-fosfato (R5P), come mostrato schematicamente nella Figura P3.4. Usando i principi dell’inibizione a feedback, proponete una strategia di regolazione di questa via che assicuri un rifornimento adeguato sia di AMP sia di GMP e riduca al minimo l’accumulo degli intermedi (A-I) quando le scorte di AMP e GMP sono adeguate. R5P A B C D F G AMP H I GMP E Figura P3.4 Disegno schematico della via metabolica della sintesi di AMP e di GMP da R5P (Problema 3.18). BIBLIOGRAFIA Generale Berg JM, Tymoczko JL e Stryer L (2011) Biochemistry, 7a ed. New York: WH Freeman. [Trad. it.: Biochimica, Zanichelli, Bologna 2012.] Branden C e Tooze J (1999) Introduction to Protein Structure, 2a ed. New York: Garland Science. [Trad. it.: Introduzione alla struttura delle proteine, Zanichelli, Bologna 2001.] Dickerson RE (2005) Present at the Flood: How Structural Molecular Biology Came About. Sunderland, MA: Sinauer. Kuriyan J, Konforti B e Wemmer D (2013) The Molecules of Life: Physical and Chemical Principles. New York: Garland Science. Perutz M (1992) Protein Structure: New Approaches to Disease and Therapy. New York: WH Freeman. Petsko GA e Ringe D (2004) Protein Structure and Function. London: New Science Press. [Trad. it.: Struttura e funzione delle proteine, Zanichelli, Bologna 2006.] Williamson M (2011) How Proteins Work. New York: Garland Science. [Trad. it.: Come funzionano le proteine, Zanichelli, Bologna 2013.] La forma e la struttura delle proteine Anfinsen CB (1973) Principles that govern the folding of protein chains. Science 181, 223-230. Caspar DLD e Klug A (1962) Physical principles in the construction of regular viruses. Cold Spring Harb. Symp. Quant. Biol. 27, 1-24. Dill KA e MacCallum JL (2012) The protein-folding problem, 50 years on. Science 338, 1042-1046. Eisenberg D (2003) The discovery of the alpha-helix and betasheet, the principal structural features of proteins. Proc. Natl Acad. Sci. USA 100, 11207-11210. Fraenkel-Conrat H e Williams RC (1955) Reconstitution of active tobacco mosaic virus from its inactive protein and nucleic acid components. Proc. Natl Acad. Sci. USA 41, 690-698. Goodsell DS e Olson AJ (2000) Structural symmetry and protein function. Annu. Rev. Biophys. Biomol. Struct. 29, 105-153. Greenwald J e Riek R (2010) Biology of amyloid: structure, function, and regulation. Structure 18, 1244-1260. Harrison SC (1992) Viruses. Curr. Opin. Struct. Biol. 2, 293-299. Hudder A, Nathanson L e Deutscher MP (2003) Organization of mammalian cytoplasm. Mol. Cell. Biol. 23, 9318-9326. Kato M, Han TW, Xie S et al. (2012) Cell-free formation of RNA granules: low complexity sequence domains form dynamic fibers within hydrogels. Cell 149, 753-767. Koga N, Tatsumi-Koga R, Liu G et al. (2012) Principles for designing ideal protein structures. Nature 491, 222-227. Li P, Banjade S, Cheng H-C et al. (2012) Phase transitions in the assembly of multivalent signalling proteins. Nature 483, 336340. Lindquist SL e Kelly JW (2011) Chemical and biological approaches for adapting proteostasis to ameliorate protein misfolding and aggregation diseases – progress and prognosis. Cold Spring Harb. Perspect. Biol. 3, a004507. Maji SK, Perrin MH, Sawaya MR et al. (2009) Functional amyloids as natural storage of peptide hormones in pituitary secretory granules. Science 325, 328-332. Nelson R, Sawaya MR, Balbirnie M et al. (2005) Structure of the cross-β spine of amyloid-like fibrils. Nature 435, 773-778. Nomura M (1973) Assembly of bacterial ribosomes. Science 179, 864-873. Oldfield CJ e Dunker AK (2014) Intrinsically disordered proteins and intrinsically disordered protein regions. Annu. Rev. Biochem. 83, 553-584. Orengo CA e Thornton JM (2005) Protein families and their evolution – a structural perspective. Annu. Rev. Biochem. 74, 867-900. Pauling L e Corey RB (1951) Configurations of polypeptide chains with favored orientations around single bonds: two new pleated sheets. Proc. Natl Acad. Sci. USA 37, 729-740. Pauling L, Corey RB e Branson HR (1951) The structure of proteins: two hydrogen-bonded helical configurations of the polypeptide chain. Proc. Natl Acad. Sci. USA 37, 205-211. Prusiner SB (1998) Prions. Proc. Natl Acad. Sci. USA 95, 1336313383. Toyama BH e Weissman JS (2011) Amyloid structure: conformational diversity and consequences. Annu. Rev. Biochem. 80, 557-585. Zhang C e Kim SH (2003) Overview of structural genomics: from structure to function. Curr. Opin. Chem. Biol. 7, 28-32. Funzione delle proteine Alberts B (1998) The cell as a collection of protein machines: preparing the next generation of molecular biologists. Cell 92, 291-294. Benkovic SJ (1992) Catalytic antibodies. Annu. Rev. Biochem. 61, 29-54. Berg OG e von Hippel PH (1985) Diffusion-controlled macromolecular interactions. Annu. Rev. Biophys. Biophys. Chem. 14, 131-160. Bourne HR (1995) GTPases: a family of molecular switches and clocks. Philos. Trans. R. Soc. Lond. B Biol. Sci. 349, 283-289. Costanzo M, Baryshnikova A, Bellay J et al. (2010) The genetic landscape of a cell. Science 327, 425-431. Deshaies RJ e Joazeiro CAP (2009) RING domain E3 ubiquitin ligases. Annu. Rev. Biochem. 78, 399-434. Dickerson RE e Geis I (1983) Hemoglobin: Structure, Function, Evolution, and Pathology. Menlo Park, CA: Benjamin Cummings. Fersht AR (1999) Structure and Mechanism in Protein Science: A Guide to Enzyme Catalysis and Protein Folding. New York: WH Freeman. Haucke V, Neher E e Sigrist SJ (2011) Protein scaffolds in the coupling of synaptic exocytosis and endocytosis. Nat. Rev. Neurosci. 12, 127-138. Hua Z e Vierstra RD (2011) The cullin-RING ubiquitin-protein ligases. Annu. Rev. Plant Biol. 62, 299-334. Hunter T (2012) Why nature chose phosphate to modify proteins. Philos. Trans. R. Soc. Lond. B Biol. Sci. 367, 2513-2516. Johnson LN e Lewis RJ (2001) Structural basis for control by phosphorylation. Chem. Rev. 101, 2209-2242. Kantrowitz ER e Lipscomb WN (1988) Escherichia coli aspartate transcarbamylase: the relation between structure and function. Science 241, 669-674. CAPITOLO 3 Le proteine 180 Kerscher O, Felberbaum R e Hochstrasser M (2006) Modification of proteins by ubiquitin and ubiquitin-like proteins. Annu. Rev. Cell Dev. Biol. 22, 159-180. Kim E e Sheng M (2004) PDZ domain proteins of synapses. Nat. Rev. Neurosci. 5, 771-781. Koshland DE Jr (1984) Control of enzyme activity and metabolic pathways. Trends Biochem. Sci. 9, 155-159. Krogan NJ, Cagney G, Yu H et al. (2006) Global landscape of protein complexes in the yeast Saccharomyces cerevisiae. Nature 440, 637-643. Lichtarge O, Bourne HR e Cohen FE (1996) An evolutionary trace method defines binding surfaces common to protein families. J. Mol. Biol. 257, 342-358. Maier T, Leibundgut M e Ban N (2008) The crystal structure of a mammalian fatty acid synthase. Science 321, 1315-1322. Monod J, Changeux JP e Jacob F (1963) Allosteric proteins and cellular control systems. J. Mol. Biol. 6, 306-329. © 978-88-08-62126-9 Perutz M (1990) Mechanisms of Cooperativity and Allosteric Regulation in Proteins. Cambridge: Cambridge University Press. Radzicka A e Wolfenden R (1995) A proficient enzyme. Science 267, 90-93. Schramm VL (2011) Enzymatic transition states, transition-state analogs, dynamics, thermodynamics, and lifetimes. Annu. Rev. Biochem. 80, 703-732. Scott JD e Pawson T (2009) Cell signaling in space and time: where proteins come together and when they’re apart. Science 326, 1220-1224. Taylor SS, Keshwani MM, Steichen JM e Kornev AP (2012) Evolution of the eukaryotic protein kinases as dynamic molecular switches. Philos. Trans. R. Soc. Lond. B Biol. Sci. 367, 2517-2528. Vale RD e Milligan RA (2000) The way things move: looking under the hood of molecular motor proteins. Science 288, 88-95. Wilson MZ e Gitai Z (2013) Beyond the cytoskeleton: mesoscale assemblies and their function in spatial organization. Curr. Opin. Microbiol. 16, 177-183. PARTE 2 MECCANISMI GENETICI DI BASE 4 DNA, cromosomi e genomi 5 Replicazione, riparazione e ricombinazione del DNA 6 Il modo in cui le cellule leggono il genoma: dal DNA alle proteine 7 Controllo dell’espressione dei geni CAPITOLO 4 • La struttura e la funzione del DNA • Il DNA cromosomico e il suo compattamento nella fibra di cromatina • Struttura e funzione della cromatina • La struttura globale dei cromosomi • Il modo in cui evolvono i genomi (A) cellula che si divide cellula che non si divide DNA, cromosomi e genomi L a vita dipende dalla capacità delle cellule di conservare, estrarre e tradurre le istruzioni genetiche necessarie per creare e mantenere un organismo vivente. Questa informazione ereditaria è trasmessa da una cellula alle cellule figlie durante la divisione cellulare e da una generazione di un organismo alla successiva attraverso le cellule riproduttive dell’organismo. Queste istruzioni sono conservate in ogni cellula vivente come geni, gli elementi che contengono informazioni che determinano le caratteristiche di una specie nel suo insieme e degli individui che la compongono. Non appena la genetica emerse come scienza all’inizio del XX secolo, i ricercatori cominciarono a domandarsi quale fosse la struttura chimica dei geni. L’informazione contenuta nei geni viene copiata e trasmessa da una cellula alle cellule figlie milioni di volte durante la vita di un organismo pluricellulare e sopravvive a questo processo essenzialmente immutata. Quale forma di molecola può essere capace di una replicazione così accurata e quasi illimitata ed essere anche capace di dirigere lo sviluppo di un organismo e la vita quotidiana di una cellula? Quale tipo di istruzioni è contenuto nell’informazione genetica? In che modo queste istruzioni sono organizzate fisicamente affinché l’enorme quantità di informazioni richieste per lo sviluppo e il mantenimento di un organismo possa essere contenuta nel minuscolo spazio di una cellula? Le risposte ad alcune di queste domande cominciarono a emergere negli anni ’40, quando alcuni ricercatori scoprirono, da studi su semplici funghi, che l’informazione genetica consiste primariamente di istruzioni per produrre proteine. Le proteine sono le macromolecole incredibilmente versatili che svolgono la maggior parte delle funzioni cellulari. Come abbiamo visto nel Capitolo 3, esse servono da unità da costruzione per strutture cellulari e formano gli enzimi che catalizzano la maggior parte delle reazioni chimiche della cellula. Inoltre, le proteine regolano l’espressione dei geni (Capitolo 7) e rendono le cellule capaci di comunicare fra loro (Capitolo 15) e di muoversi (Capitolo 16). Le proprietà e le funzioni di una cellula sono determinate in gran parte dalle proteine che essa è capace di produrre. Osservazioni meticolose di cellule ed embrioni eseguite verso la fine del XIX secolo avevano reso possibile la scoperta che l’informazione ereditaria è trasportata dai cromosomi, strutture filamentose presenti nel nucleo di una cellula eucariotica che diventano visibili quando la cellula inizia a dividersi (Figura 4.1). Più tardi, quando divenne possibile un’analisi biochimica, si scoprì che i cromosomi consistevano sia di acido desossiribonucleico (DNA) che di proteine, entrambi presenti circa in uguale quantità. Per molti anni si pensò che il DNA fosse soltanto un elemento strutturale. L’altro progresso cruciale fatto negli anni ’40 è stato l’identificazione del DNA come il probabile trasportatore dell’informazione genetica. Questa scoperta fondamentale per la comprensione delle cellule derivò da studi sull’ereditarietà nei bat- Figura 4.1 I cromosomi nelle cellule. (A) Due cellule vegetali adiacenti fotografate al (B) 10 μm microscopio ottico. Il DNA è stato colorato con un colorante fluorescente (DAPI) che si lega a esso. Il DNA è presente nei cromosomi, che sono visibili come strutture distinte al microscopio ottico soltanto quando diventano strutture compatte in preparazione per la divisione cellulare, come mostrato a sinistra. La cellula a destra, che non si sta dividendo, contiene cromosomi identici, ma questi non possono essere distinti chiaramente al microscopio ottico in questa fase del ciclo cellulare perché sono in una conformazione più estesa. (B) Disegno schematico dei contorni delle due cellule con i loro cromosomi. (A, per gentile concessione di Peter Shaw.) CAPITOLO ceppo S batterio patogeno liscio che provoca la polmonite cellule del ceppo S FRAZIONAMENTO DI ESTRATTI ACELLULARI IN CLASSI DI MOLECOLE PURIFICATE MUTAZIONE CASUALE ceppo R batterio mutante ruvido non patogeno cellule vive del ceppo R cresciute in presenza di cellule del ceppo S uccise al calore o di estratti acellulari di cellule del ceppo S RNA proteine DNA lipidi carboidrati molecole controllate per la trasformazione di cellule del ceppo R TRASFORMAZIONE ceppo S alcune cellule del ceppo R sono trasformate in cellule del ceppo S, le cui figlie sono patogene e provocano la polmonite CONCLUSIONE: molecole che possono portare informazioni ereditarie sono presenti nelle cellule del ceppo S. (A) 4 DNA, cromosomi e genomi 183 © 978-88-08-62126-9 ceppo R ceppo R ceppo S ceppo R ceppo R CONCLUSIONE: la molecola che porta le informazioni ereditarie è il DNA. (B) teri (Figura 4.2). Ma ancora all’inizio degli anni ’50 il modo in cui le proteine possono essere specificate da istruzioni contenute nel DNA e il modo in cui l’informazione ereditaria viene copiata per essere trasmessa da cellula a cellula rimanevano completamente misteriosi. Improvvisamente, nel 1953, il mistero venne risolto quando la struttura del DNA fu postulata correttamente da James Watson e Francis Crick. Come accennato nel Capitolo 1, la struttura del DNA risolse immediatamente il problema del modo in cui l’informazione in questa molecola poteva essere copiata, o replicata, e fornì anche i primi indizi sul modo in cui una molecola di DNA poteva usare le sue subunità per codificare le istruzioni per produrre proteine. Oggi la nozione che il DNA è il materiale genetico è così fondamentale per il pensiero biologico che è difficile rendersi conto di quale enorme vuoto intellettuale venne riempito da questa scoperta. In questo capitolo iniziamo descrivendo la struttura del DNA. Vedremo come, nonostante la sua semplicità chimica, la struttura e le proprietà chimiche lo rendano ideale come materiale grezzo dei geni. Considereremo quindi il modo in cui le molte proteine presenti nei cromosomi dispongono e compattano questo DNA. Il compattamento deve essere eseguito con ordine, in modo che i cromosomi possano essere replicati e divisi correttamente fra le due cellule figlie in ciascuna divisione cellulare; deve anche permettere l’accesso al DNA cromosomico degli enzimi che lo riparano quando è danneggiato e delle proteine specializzate che dirigono l’espressione dei suoi molti geni. Negli ultimi due decenni c’è stata una rivoluzione nella nostra capacità di determinare la sequenza esatta di subunità presenti nelle molecole di DNA. Come risultato oggi conosciamo la sequenza dei 3,2 miliardi di coppie di nucleotidi che forniscono l’informazione per lo sviluppo di un essere umano adulto da un uovo fecondato, oltre alle sequenze del DNA di migliaia di altri organismi. Analisi dettagliate di queste sequenze hanno fornito informazioni molto interessanti sul processo dell’evoluzione ed è con questo argomento che termina il capitolo. Questo è il primo di quattro capitoli che trattano i meccanismi genetici di base, i modi in cui la cellula mantiene, replica, esprime e occasionalmente migliora l’informazione genetica trasportata dal suo DNA. Nel capitolo successivo (Capitolo 5) discuteremo i meccanismi tramite i quali la cellula replica e ripara accuratamente il DNA; descriveremo anche il modo in cui sequen- Figura 4.2 La prima dimostrazione sperimentale che il DNA • il materiale genetico. Questi esperimenti, eseguiti negli anni ’20 (A) e negli anni ’40 (B), dimostrarono che l’aggiunta di DNA purificato a un batterio ne modificava le proprietà e che questo cambiamento era trasmesso fedelmente alle successive generazioni. Due ceppi strettamente correlati del batterio Streptococcus pneumoniae differiscono l’uno dall’altro sia per l’aspetto al microscopio che per la patogenicità. Un ceppo appare liscio (S) e provoca la morte quando viene iniettato nei topi, mentre l’altro appare ruvido (R) e non è letale. (A) Un esperimento iniziale dimostra che una sostanza presente nel ceppo S può cambiare (o trasformare) il ceppo R nel ceppo S e che questo cambiamento è ereditato da generazioni successive di batteri. (B) Questo esperimento, in cui il ceppo R è stato incubato con varie classi di molecole biologiche ottenute dal ceppo S, identifica la sostanza come DNA. CAPITOLO 4 DNA, cromosomi e genomi 184 © 978-88-08-62126-9 ze di DNA possono essere riarrangiate mediante il processo della ricombinazione genetica. L’espressione dei geni – il processo nel quale l’informazione genetica codificata nel DNA viene interpretata dalla cellula per guidare la sintesi proteica – è l’argomento principale del Capitolo 6. Nel Capitolo 7 vedremo come l’espressione genica sia controllata dalla cellula per assicurare che ciascuna delle molte migliaia di proteine e di molecole di RNA codificate nel DNA venga prodotta soltanto al momento giusto e al posto giusto durante la vita della cellula. La struttura e la funzione del DNA Negli anni ’40 i biologi ebbero difficoltà ad accettare il DNA come materiale genetico. La molecola sembrava troppo semplice: un lungo polimero composto da quattro tipi soltanto di subunità, che si assomigliano chimicamente. All’inizio degli anni ’50 il DNA venne esaminato per la prima volta mediante analisi di diffrazione ai raggi X, una tecnica per determinare la struttura atomica tridimensionale di una molecola (vedi Capitolo 8). I primi risultati della diffrazione ai raggi X indicarono che il DNA era composto da due filamenti del polimero avvolti in un’elica. L’osservazione che il DNA era a doppio filamento aveva un significato cruciale e fornì uno degli indizi principali che portarono al modello di Watson e Crick per la struttura del DNA. Soltanto nel 1953, quando fu proposto questo modello, divenne evidente il potenziale del DNA per la replicazione e la codificazione di informazioni. ■ Una molecola di DNA consiste di due catene complementari di nucleotidi Una molecola di acido deossiribonucleico (DNA) consiste di due lunghe catene polinucleotidiche composte da quattro tipi di subunità. Ciascuna di queste catene è nota come catena di DNA o filamento di DNA. Le due catene corrono antiparallele una rispetto all’altra e legami idrogeno fra le basi dei nucleotidi tengono insieme le due catene (Figura 4.3). Come abbiamo visto nel Capitolo 2 (Quadro 2.6, pp. 104-105), i nucleotidi sono composti da uno zucchero a cinque atomi di carbonio al quale sono attaccati uno o più gruppi fosfato e una base che contiene azoto. Nel caso dei nucleotidi del DNA lo zucchero è deossiribosio attaccato a un singolo gruppo fosfato (da cui il nome acido deossiribonucleico) e la base può essere adenina (A), citosina (C), guanina (G) o timina (T). I nucleotidi sono uniti covalentemente fra loro in una catena tramite gli zuccheri e i fosfati, che formano così un’“ossatura” di zucchero-fosfato-zucchero-fosfato, alternati. Poiché soltanto la base differisce in ciascun tipo di subunità, una catena polinucleotidica di DNA è analoga a una collana (l’ossatura) composta da quattro tipi di perline (le quattro basi A, C, G e T). Questi stessi simboli (A, C, G e T) sono anche usati comunemente per indicare i quattro nucleotidi diversi, cioè le basi con attaccati zucchero e gruppo fosfato. Il modo in cui i nucleotidi sono allineati insieme dà al filamento di DNA una polarità chimica. Se pensiamo a ciascuno zucchero come a un blocco con una sporgenza (il fosfato 5′) su un lato e un buco (l’ossidrile 3′) sull’altro (vedi Figura 4.3), ciascuna catena completa, formata da sporgenze incastrate nei buchi, avrà tutte le sue subunità allineate nello stesso orientamento. Inoltre le due estremità della catena saranno facilmente distinguibili, perché una ha un buco (l’ossidrile 3′) e l’altra una sporgenza (il fosfato 5′) al suo terminale. Questa polarità in una catena di DNA viene indicata riferendosi a un’estremità come estremità 3′ e all’altra come estremità 5′, termini derivati dall’orientamento dello zucchero deossiribosio. Rispetto alla capacità di immagazzinamento dell’informazione, la catena di nucleotidi in un filamento di DNA, essendo sia direzionale che lineare, può essere letta in maniera molto simile alle lettere su questa pagina. La struttura tridimensionale del DNA – la doppia elica del DNA – deriva dalle caratteristiche chimiche e strutturali delle sue due catene polinucleotidiche. Poiché queste due catene sono tenute insieme da legami idrogeno fra CAPITOLO unità che compongono il DNA filamento di DNA zucchero fosfato + zuccherofosfato 5′ G base (guanina) 3′ G doppia elica di DNA 3′ 5′ C T A A T A T C G C T A C G A 5′ C G T A A T A ossatura di zucchero-fosfato G G T A nucleotide 3′ G C G DNA a doppio filamento C 4 DNA, cromosomi e genomi 185 © 978-88-08-62126-9 G C C G C G A C A T G T 5′ 5′ 3′ 3′ coppie di basi legate da legami idrogeno Figura 4.3 Il DNA e le unità da cui è costituito. Il DNA è costituito da quattro tipi di nucleotidi, che sono uniti covalentemente in una catena polinucleotidica (un filamento di DNA) con un’ossatura di zucchero-fosfato da cui sporgono le basi (A, C, G e T). Una molecola di DNA è composta da due filamenti di DNA tenuti insieme da legami idrogeno fra le basi appaiate. Le frecce alle estremità dei filamenti di DNA indicano la polarità dei due filamenti, che corrono antiparalleli nella molecola del DNA. Nel disegno in basso a sinistra nella figura, la molecola del DNA è mostrata raddrizzata; in realtà è avvolta in una doppia elica, come mostrato a destra. Per i dettagli vedi la Figura 4.5 e il Filmato 4.1 . le basi sui differenti filamenti, tutte le basi sono all’interno della doppia elica e le ossature di zucchero-fosfato sono all’esterno (vedi Figura 4.3). In tutti i casi una base a due anelli più voluminosa (una purina; vedi Quadro 2.6, pp. 104105) è appaiata a una base a singolo anello (una pirimidina); A si appaia sempre con T e G con C (Figura 4.4). Questo appaiamento complementare delle basi permette alle coppie di basi di compattarsi nel modo energeticamente più favorevole all’interno della doppia elica. In questa disposizione ciascuna coppia di basi ha una larghezza simile e tiene così le ossature di zucchero-fosfato distanziate in modo uguale lungo la molecola del DNA. Per massimizzare l’efficienza del compattamento delle coppie di basi, le due ossature di zucchero-fosfato si avvolgono l’una sull’altra formando una doppia elica, con un giro completo ogni dieci coppie di basi (Figura 4.5). I membri di ciascuna coppia di basi possono adattarsi insieme dentro la doppia elica soltanto se i due filamenti dell’elica sono antiparalleli, cioè soltanto se la polarità di un filamento è orientata in senso opposto a quella dell’altro filamento (vedi Figure 4.3 e 4.4). Una conseguenza di questi requisiti è che ciascun filamento di una molecola di DNA contiene una sequenza di nucleotidi che è esattamente complementare alla sequenza nucleotidica dell’altro filamento. CAPITOLO 4 DNA, cromosomi e genomi 186 © 978-88-08-62126-9 3′ Figura 4.4 Coppie complementari di basi nella doppia elica del DNA. Le forme e la struttura chimica delle basi permettono di formare legami idrogeno in modo efficiente soltanto fra A e T e fra G e C, dove gli atomi che sono capaci di formare legami idrogeno (vedi Quadro 2.3, pp. 98-99) possono essere avvicinati senza distorcere la doppia elica. Come indicato, fra A e T si formano due legami idrogeno, mentre fra G e C se ne formano tre. Le basi si possono appaiare in questo modo soltanto se le due catene polinucleotidiche che le contengono sono antiparallele. 5′ H N N C C N H H H N N N C N H C N H O guanina H N citosina H legame idrogeno _ estremità 59 O P O basi O _ O O _ O P O O O P _ O O 5′ O _ O P O 2 nm (A) C O 5′ O O P O _ O O estremità 39 solco maggiore 5′ 1 nm (A) solco minore H C C C H 3′ N C G C O C C C CH3 timina H ossatura di zucchero-fosfato C O H H C C N adenina N T N C N H N C A C O C O G 3′ O P O O O C O O O O 0,34 nm O G T O O O C legame idrogeno estremità 59 3′ O _ O O zucchero A G P O_ P O O legame fosfodiesterico estremità 39 (B) Figura 4.5 La doppia elica del DNA. (A) Modello a spazio pieno di 1,5 giri della doppia elica del DNA. Ciascun giro del DNA è composto da 10,4 coppie di nucleotidi e la distanza centro-centro fra nucleotidi adiacenti è di 0,34 nm. L’avvolgimento dei due filamenti l’uno sull’altro crea due solchi nella doppia elica: il solco più largo è chiamato solco maggiore e il più piccolo solco minore, come indicato. (B) Una breve sezione della doppia elica vista lateralmente, che mostra quattro coppie di basi. I nucleotidi sono uniti insieme covalentemente da legami fosfodiesterico tramite il gruppo 3’-ossidrilico (–OH) di uno zucchero e il 5’-fosfato (P) del successivo. Così ciascun filamento polinucleotidico ha una polarità chimica; le sue due estremità sono quindi chimicamente diverse. Per convenzione l’estremità 5’ del polimero di DNA è spesso illustrata con un gruppo fosfato, mentre l’estremità 3’ è mostrata con un ossidrile. ■ La struttura del DNA fornisce un meccanismo per lÕereditarietˆ La scoperta della struttura del DNA ha immediatamente suggerito delle risposte riguardo alle due domande più importanti concernenti l’ereditarietà. Primo, in che modo l’informazione che specifica un organismo può essere CAPITOLO 4 DNA, cromosomi e genomi 187 © 978-88-08-62126-9 Figura 4.6 Il DNA come stampo filamento S stampo 5′ nuovo filamento S′ 3′ nuovo filamento S 5′ 3′ filamento S′ 5′ 3′ filamento S 5′ 3′ 5′ 3′ doppia elica di DNA parentale per la propria duplicazione. Poiché il nucleotide A si appaia con successo soltanto con T, e G con C, ciascun filamento del DNA può specificare la sequenza di nucleotidi nel suo filamento complementare. In questo modo il DNA a doppia elica può essere copiato con precisione in un processo in cui l’elica parentale di DNA produce due eliche figlie di DNA identiche. 5′ 3′ filamento S′ stampo doppie eliche figlie di DNA portata in forma chimica? Secondo, in che modo questa informazione viene duplicata e copiata di generazione in generazione? La risposta alla prima domanda venne dalla scoperta che il DNA è un polimero lineare di quattro diversi tipi di monomero allineati in una sequenza definita, come le lettere di un documento scritte in caratteri alfabetici. La risposta alla seconda domanda venne dalla natura a doppia elica della struttura: poiché ogni filamento di DNA contiene una sequenza di nucleotidi che è esattamente complementare alla sequenza nucleotidica del suo filamento partner, ogni filamento può agire da stampo per la sintesi di un nuovo filamento complementare. In altre parole, se noi chiamiamo i due filamenti S e S9, il filamento S può servire da stampo per fare un nuovo filamento S9, mentre il filamento S9 può servire da stampo per fare un nuovo filamento S (Figura 4.6). Quindi l’informazione genetica presente nel DNA può essere copiata accuratamente con il processo semplice ed elegante in cui il filamento S si separa dal filamento S9; ogni filamento separato serve da stampo per la sintesi di un nuovo partner complementare che sia identico al partner precedente. La capacità di ogni filamento di una molecola di DNA di funzionare da stampo per la produzione di un filamento complementare fa sì che la cellula possa copiare, o replicare, il suo genoma prima di trasmetterlo alla sua discendenza. Nel Capitolo 5 descriveremo l’elegante macchinario che la cellula usa per svolgere questo compito. Gli organismi differiscono l’uno dall’altro perché le loro rispettive molecole di DNA hanno sequenze nucleotidiche diverse e, di conseguenza, portano messaggi biologici diversi. Ma in che modo l’alfabeto dei nucleotidi è usato per produrre messaggi e che cosa dicono questi messaggi? Come abbiamo detto, molto prima della determinazione della struttura del DNA si sapeva che i geni contenevano le istruzioni per produrre proteine. Se i geni sono fatti di DNA, il DNA deve in qualche modo codificare le proteine (Figura 4.7). Come abbiamo visto nel Capitolo 3, le proprietà di una proteina, che sono responsabili della sua funzione biologica, sono determinate dalla sua struttura tridimensionale, che è determinata a sua volta dalla sequenza lineare degli amminoacidi di cui è composta. La sequenza lineare dei nucleotidi di un gene deve perciò codificare in qualche modo la sequenza lineare di amminoacidi di una proteina. La corrispondenza esatta fra l’alfabeto a quattro lettere dei nucleotidi del DNA e l’alfabeto a venti lettere degli amminoacidi delle proteine – il codice genetico – non è intuibile in modo ovvio dalla struttura del DNA e ci vollero più di dieci anni dopo la scoperta della doppia elica per decifrarla. Nel Capitolo 6 descriveremo questo codice in dettaglio nel corso dell’elaborazione del processo noto come espressione genica, tramite il quale una cellula traduce la sequenza nucleotidica di un gene nella sequenza di amminoacidi di una proteina. La serie completa di informazioni nel DNA di un organismo si chiama genoma e contiene le informazioni per tutte le molecole di RNA e per le proteine che l’organismo dovrà sintetizzare. (Il termine genoma è usato anche per descrivere il DNA che porta queste informazioni.) La quantità di informazioni contenuta nei genomi è strabiliante. Scritta nell’alfabeto a quat- gene A gene B doppia elica del DNA proteina A gene C ESPRESSIONE DEI GENI proteina B proteina C Figura 4.7 La relazione fra l’informazione genetica portata nel DNA e le proteine. (Vedi Capitolo 1). CAPITOLO 188 4 DNA, cromosomi e genomi © 978-88-08-62126-9 Figura 4.8 La sequenza nucleotidica del gene umano della b-globina. Per convenzione una sequenza nucleotidica è scritta dalla sua estremità 5’ a quella 3’ e dovrebbe essere letta da sinistra a destra in righe successive come se fosse normale testo italiano. Questo gene porta l’informazione per la sequenza di amminoacidi di uno dei due tipi di subunità della molecola di emoglobina. Un gene diverso, il gene dell’a-globina, porta l’informazione per l’altro tipo di subunità dell’emoglobina. (L’emoglobina, la proteina che trasporta l’ossigeno nel sangue, ha quattro subunità, due di ciascun tipo.) Soltanto uno dei due filamenti della doppia elica del DNA che contiene il gene della b-globina è rappresentato; l’altro filamento ha una sequenza esattamente complementare. Le sequenze di DNA evidenziate in giallo mostrano le tre regioni del gene che specificano la sequenza di amminoacidi della b-globina. Vedremo nel Capitolo 6 come la cellula connette queste tre sequenze a livello dell’RNA messaggero per sintetizzare una b-globina completa. tro lettere dei nucleotidi, la sequenza nucleotidica di un gene umano molto piccolo occupa un quarto di pagina di testo (Figura 4.8), mentre la sequenza completa dei nucleotidi del genoma umano riempirebbe più di mille libri delle dimensioni di questo. Oltre ad altre informazioni cruciali, essa comprende circa 21 000 geni che codificano proteine e che (attraverso il meccanismo dello splicing alternativo, vedi p. 437) danno origine a un numero molto più elevato di proteine. ■ Negli eucarioti il DNA • racchiuso in un nucleo cellulare Come abbiamo visto nel Capitolo 1, quasi tutto il DNA di una cellula eucariotica è confinato in un nucleo, che in molte cellule occupa circa il 10% del volume cellulare totale. Questo compartimento è delimitato da un involucro nucleare formato da due doppi strati lipidici concentrici (Figura 4.9), che sono perforati a intervalli da grandi pori nucleari che trasportano molecole fra il nucleo e il citosol. L’involucro nucleare è connesso direttamente a un ampio sistema di membrane intracellulari, il reticolo endoplasmatico, che si estendono nel citosol. Esso è supportato meccanicamente da un reticolo di filamenti intermedi chiamato lamina nucleare, che dà origine a una rete fitta e sottile a forma di foglio all’interno del nucleo, appena sotto la membrana nucleare interna (Figura 4.9B). L’involucro nucleare permette alle molte proteine che agiscono sul DNA di concentrarsi dove sono necessarie nella cellula e, come vedremo nei capitoli successivi, mantiene anche separati gli enzimi nucleari da quelli citosolici, un aspetto che è cruciale per il funzionamento appropriato delle cellule eucariotiche. SOMMARIO L’informazione genetica è contenuta nella sequenza lineare di nucleotidi del DNA. Ciascuna molecola di DNA è una doppia elica formata da due filamenti complementari antiparalleli di nucleotidi uniti da legami idrogeno fra coppie di basi G-C e A-T. La duplicazione dell’informazione genetica avviene mediante l’uso di un filamento di DNA che serve da stampo per la formazione di un filamento complementare. L’informazione genetica conservata nel DNA di un organismo contiene le istruzioni per tutte le molecole di RNA e per tutte le proteine che l’organismo dovrà sintetizzare e ne costituisce il genoma. Negli eucarioti il DNA è contenuto nel nucleo cellulare, un grande compartimento circondato da membrana. ● Il DNA cromosomico e il suo compattamento nella fibra di cromatina La funzione più importante del DNA è quella di portare i geni, l’informazione che specifica tutte le proteine e le molecole di RNA che costituiscono un organismo, compresa l’informazione che indica quando, in quale tipo di cellule e in quale quantità ciascuna proteina e ciascuna molecola di RNA devono essere prodotte. Il DNA nucleare degli eucarioti è diviso in cromosomi e in questa sezione vedremo come i geni sono di norma disposti su ciascun cromosoma. Inoltre descriveremo le sequenze specializzate di DNA che permettono ai cromosomi di essere duplicati accuratamente e trasmessi da una generazione a quella successiva. CAPITOLO 4 DNA, cromosomi e genomi 189 © 978-88-08-62126-9 reticolo endoplasmatico eterocromatina eterocromatina DNA e proteine associate (cromatina), più molte molecole di RNA e proteine involucro nucleare nucleolo centrosoma nucleolo microtubulo lamina nucleare poro nucleare membrana nucleare esterna (A) 2 µm (B) Figura 4.9 Sezione di un tipico nucleo cellulare. (A) Micrografia elettronica di una sezione sottile del nucleo di un fibroblasto umano. (B) Disegno schematico che mostra che l’involucro nucleare consiste di due membrane; quella esterna è in continuità con la membrana del reticolo endoplasmatico (vedi anche Figura 12.7). Lo spazio interno del reticolo endoplasmatico (il lume del RE) è colorato in giallo ed è in continuità con lo spazio fra le due membrane nucleari. I doppi strati lipidici delle involucro nucleare membrana nucleare interna membrane nucleari esterna e interna sono connessi a ciascun poro nucleare. Una rete piatta di filamenti intermedi (marrone) all’interno del nucleo fornisce supporto meccanico all’involucro nucleare formando una speciale struttura di supporto chiamata lamina nucleare (per i dettagli vedi Capitolo 12). L’eterocromatina, con la colorazione più scura, contiene regioni particolarmente condensate che verranno discusse più avanti. (A, per gentile concessione di E.G. Jordan e J. McGovern.) Ci confronteremo anche con la dura sfida del compattamento del DNA. Se le doppie eliche che costituiscono tutti i 46 cromosomi di una cellula umana fossero stese una dopo l’altra, raggiungerebbero approssimativamente una lunghezza di 2 metri; eppure il nucleo di una cellula umana, che contiene il DNA, ha un diametro di soli 6 mm. Ciò è geometricamente equivalente a compattare 40 km di filo molto sottile in una palla da tennis! Il compito complesso di compattare il DNA è eseguito da proteine specializzate che lo legano e lo ripiegano, generando una serie di avvolgimenti e anse che forniscono livelli sempre più alti di organizzazione, impedendo che il DNA diventi un groviglio impossibile da maneggiare. È stupefacente che, sebbene sia ripiegato strettamente, il DNA sia compattato in un modo che gli permette di essere facilmente disponibile per i molti enzimi della cellula che lo replicano, lo riparano e usano i suoi geni per produrre proteine e molecole di RNA. ■ Il DNA eucariotico • compattato in una serie di cromosomi Ogni cromosoma in una cellula eucariotica consiste di una singola molecola di DNA estremamente lunga associata a proteine che ripiegano e impacchettano il sottile filamento di DNA in una struttura più compatta. Oltre alle proteine coinvolte nel compattamento del DNA, i cromosomi sono anche associati a molte proteine (così come a numerose molecole di RNA) necessarie per i processi di espressione genica, di replicazione del DNA e di riparazione del DNA. Il complesso di DNA e proteine strettamente associate è detto cromatina (dal greco chroma, “colore”, per le sue caratteristiche di colorazione). I batteri, che non dispongono di un compartimento nucleare specializzato, portano i loro geni su una singola molecola di DNA, che è di solito circolare (vedi Figura 1.24). Questo DNA è associato a proteine che compattano e condensano il DNA, diverse tuttavia dalle proteine che svolgono queste funzioni negli eucarioti. Sebbene quello batterico sia spesso definito “cromosoma”, non ha la stessa struttura dei cromosomi eucariotici e poco si sa del modo in cui esso viene compattato. Perciò la nostra analisi della struttura dei cromosomi si concentrerà quasi interamente sui cromosomi eucariotici. CAPITOLO 4 DNA, cromosomi e genomi 190 Figura 4.10 La serie completa dei cromosomi umani. Questi cromosomi femminili sono stati isolati da una cellula che stava subendo una divisione cellulare (mitosi) e sono perciò altamente compattati. Ciascun cromosoma è stato “dipinto” di un colore diverso per permettere la sua identificazione non ambigua al microscopio ottico, una tecnica chiamata “cariotipizzazione spettrale”. Questa tecnica di colorazione viene eseguita esponendo i cromosomi a una grande collezione di molecole di DNA la cui sequenza si appaia a sequenze conosciute del genoma umano. Il gruppo di sequenze corrispondente per ciascun cromosoma è stato accoppiato a una combinazione diversa di coloranti fluorescenti. Le molecole di DNA derivate dal cromosoma 1 sono marcate con una combinazione specifica di coloranti, quelle derivate dal cromosoma 2 con un’altra e così via. Poiché il DNA marcato può formare coppie di basi, o ibridare, soltanto con il cromosoma da cui deriva, ciascun cromosoma è marcato con una combinazione diversa di coloranti. Per questi esperimenti i cromosomi sono soggetti a trattamenti che separano il DNA a doppia elica in filamenti singoli in un modo che permette l’appaiamento di basi con il DNA marcato a singolo filamento, mantenendo relativamente intatta la struttura dei cromosomi. (A) I cromosomi visualizzati così come escono dalla cellula lisata. (B) Gli stessi cromosomi allineati artificialmente nel loro ordine numerico. Questa disposizione dell’intera serie dei cromosomi si chiama cariotipo. (Adattata da N. McNeil e T. Ried, Expert Rev. Mol. Med. 2:1-14, 2000. Con il permesso di Cambridge University Press.) © 978-88-08-62126-9 2 1 (A) 3 6 7 8 13 14 15 19 20 9 10 16 21 22 4 5 11 12 17 18 X X (B) 10 µm Con l’eccezione delle cellule germinali (uova e spermatozoi) e di pochi tipi cellulari altamente specializzati che non possono moltiplicarsi e sono completamente privi di DNA (per esempio, i globuli rossi) o che hanno replicato il loro DNA senza completare la divisione cellulare (per esempio, i megacariociti), ciascuna cellula umana contiene due copie di ciascun cromosoma, una ereditata dalla madre e una dal padre. I cromosomi materno e paterno di una coppia sono chiamati cromosomi omologhi (omologhi). L’unica coppia di cromosomi non omologhi è composta dai cromosomi sessuali nei maschi, in cui un cromosoma Y è ereditato dal padre e un cromosoma X dalla madre. Così ciascuna cellula umana contiene un totale di 46 cromosomi: 22 coppie comuni a maschi e femmine, più due cosiddetti cromosomi sessuali (X e Y nei maschi, due X nelle femmine). Questi cromosomi umani possono essere facilmente distinti “dipingendoli” di colori diversi mediante una tecnica basata sull’ibridazione del DNA (Figura 4.10). In questa metodica (descritta in dettaglio nel Capitolo 8) un corto filamento di acido nucleico etichettato con un colorante fluorescente serve come “sonda” per riconoscere il suo DNA complementare, rendendo fluorescente il cromosoma bersaglio in tutti i siti a cui si lega. La colorazione dei cromosomi si esegue di norma nella fase del ciclo cellulare chiamata mitosi, in cui i cromosomi sono particolarmente compattati e facili da visualizzare (vedi più avanti). Un altro modo più tradizionale di distinguere un cromosoma dall’altro è quello di usare coloranti che producono uno schema sorprendente e riproducibile di bande lungo ciascun cromosoma mitotico (Figura 4.11). Questi schemi di bande presumibilmente riflettono variazioni nella struttura della cromatina, ma le loro basi non sono ben comprese. Nonostante ciò, lo schema di bande su ciascun tipo di cromosoma è unico e sono questi schemi che hanno inizialmente permesso di identificare e numerare ciascun cromosoma umano in maniera affidabile. L’immagine dei 46 cromosomi umani durante la mitosi è detta cariotipo umano. Se parti di cromosomi vengono perse o scambiate fra cromosomi, questi cambiamenti possono essere rivelati da cambiamenti negli schemi di bandeggio o - con maggiore sensibilità - da cambiamenti nello schema di colorazione dei cromosomi (Figura 4.12). I citogenetisti usano queste alterazioni per individuare anomalie cromosomiche associate a difetti ereditari e individuare i riarrangiamenti cromosomici che avvengono nelle cellule tumorali mentre progrediscono verso un fenotipo maligno (vedi Capitolo 20). ■ I cromosomi contengono lunghe stringhe di geni I cromosomi portano i geni, le unità funzionali dell’ereditarietà. Un gene è di solito definito come un segmento di DNA che contiene le istruzioni per produrre una particolare proteina (o una serie di proteine strettamente correlate), ma questa definizione è troppo stretta. I geni che codificano proteine sono effettivamente la maggioranza e molti dei geni con fenotipi mutanti molto chiari appartengono a questa categoria.Tuttavia ci sono anche molti “geni a RNA”, segmenti di DNA che generano come loro prodotto finale, invece CAPITOLO 4 DNA, cromosomi e genomi 191 © 978-88-08-62126-9 7 3 4 5 8 9 10 11 12 6 1 2 19 16 13 14 15 18 17 Y 21 20 50 milioni di coppie nucleotidiche Figura 4.11 Gli schemi di bandeggio dei cromosomi umani. I cromosomi 1-22 sono numerati in ordine approssimativo di grandezza. Una tipica cellula umana contiene due di questi cromosomi, più due cromosomi sessuali: due cromosomi X in una femmina, un X e un Y in un maschio. I cromosomi usati per queste mappe sono stati colorati in una fase precoce della mitosi, quando i cromosomi non sono compattati completamente. La linea orizzontale rossa rappresenta la posizione del centromero (vedi Figura 4.19), che appare come una costrizione sui cromosomi mitotici; i pomoli rossi sui cromosomi 13, 14, 15, 21 e 22 indicano le posizioni dei geni che codificano i grandi RNA ribosomiali (trattati nel Capitolo 6). Questi schemi di bandeggio sono ottenuti colorando i cromosomi con il colorante Giemsa e si possono osservare al microscopio ottico. (Adattata da U. Francke, Cytogenet. Cell Genet. 31:24-32, 1981. Con il permesso dell’autore.) 22 1 µm X di una proteina, una molecola di RNA funzionalmente rilevante. Diremo di più riguardo ai geni a RNA e ai loro prodotti più avanti. Come ci si potrebbe aspettare, esiste una correlazione fra la complessità di un organismo e il numero di geni nel suo genoma (vedi Tabella 1.2, p. 30). Per esempio, alcuni batteri semplici hanno soltanto 500 geni, in confronto ai circa 30 000 degli esseri umani. I batteri, gli archei e alcuni eucarioti unicellulari hanno genomi particolarmente compatti, costituiti da poco più di stringhe di geni compattati strettamente.Tuttavia, i cromosomi di piante e animali pluricellulari, così come di molti altri eucarioti, contengono, oltre ai geni, una grande quantità di DNA in eccesso intercalato fra i geni, la cui funzione non è chiara (Figura 4.13). Una parte di questo DNA è cruciale per l’espressione corretta dei geni e questo può in una certa misura spiegare perché ce n’è così tanto negli organismi pluricellulari, i cui geni devono essere accesi e spenti durante lo sviluppo, secondo regole complicate (vedi Capitoli 7 e 21). Figura 4.12 Cromosomi umani aberranti. (A) Due cromosomi umani normali, 4 e 6. (B) In un individuo con una traslocazione cromosomica bilanciata, la doppia elica di DNA in un cromosoma a un certo punto continua con la doppia elica di DNA dell’altro cromosoma in seguito a un evento anomalo di ricombinazione tra il DNA dei due cromosomi. La tecnica di chromosome painting (pittura dei cromosomi) usata sui cromosomi in ciascuna serie permette l’identificazione anche di brevi tratti di cromosoma che sono stati traslocati, evento frequente nelle cellule tumorali. (Per gentile concessione di Zhenya Tang e del NIGMS Human Genetic Cell Repository presso il Coriell Institute for Medical Research: GM21880.) (A) (B) cromosoma 6 cromosoma 4 traslocazione cromosomica reciproca CAPITOLO 4 DNA, cromosomi e genomi 192 © 978-88-08-62126-9 Figura 4.13 La disposizione dei geni nel genoma di S. cerevisiae e quella dellÕuomo. (A) S. cerevisiae è un lievito gemmante usato diffusamente per la produzione della birra e del pane. Il genoma di questo eucariote unicellulare è distribuito su 16 cromosomi. Una piccola regione di un cromosoma è stata scelta arbitrariamente per mostrare l’alta densità di geni. (B) Una regione del genoma umano di uguale lunghezza del segmento di lievito mostrato in (A). I geni umani sono disposti in maniera molto meno densa e la quantità di sequenze di DNA interposte è molto più grande. In questo campione di DNA umano non è mostrato il fatto che i geni umani sono per la maggior parte molto più lunghi di quelli del lievito (vedi Figura 4.15). (A) Saccharomyces cerevisiae 0 10 20 30 kilobasi 10 20 30 kilobasi (B) uomo 0 gene ripetizioni di tratti del genoma Le differenze nella quantità di DNA intercalato fra i geni, molto più che il numero di geni, sono responsabili delle incredibili variazioni di grandezza del genoma che osserviamo quando confrontiamo una specie con un’altra (vedi Figura 1.32). Per esempio, il genoma umano è 200 volte più grande di quello del lievito S. cerevisiae, ma 30 volte più piccolo di quello di alcuni vegetali e anfibi e 200 volte più piccolo di quello di una specie di ameba. Inoltre, a causa di differenze nella quantità di DNA non codificante, i genomi di organismi simili (pesci ossei, per esempio) possono variare di centinaia di volte nel loro contenuto di DNA, anche se hanno più o meno lo stesso numero di geni. Qualunque sia il ruolo del DNA in eccesso, sembra chiaro che non è un grave handicap per una cellula eucariotica portarne una grande quantità. La divisione del genoma in cromosomi differisce anch’essa da una specie eucariotica all’altra. Per esempio, in confronto con i 46 cromosomi umani, le cellule somatiche di una specie di piccolo cervo contengono soltanto 6 cromosomi, mentre quelle di una specie di carpa ne contengono più di 100. Anche specie strettamente correlate con genomi di dimensioni simili possono avere numeri e dimensioni di cromosomi molto diversi (Figura 4.14). Pertanto non c’è una relazione semplice fra numero dei cromosomi, complessità della specie e dimensioni totali del genoma. Piuttosto, i genomi e i cromosomi delle specie attuali sono il frutto di una storia unica di eventi genetici a quanto pare casuali, su cui ha agito una pressione selettiva non ancora ben compresa per un lungo periodo evolutivo. ■ La sequenza nucleotidica del genoma umano mostra come Figura 4.14 Due specie strettamente correlate di cervo con numeri di cromosomi molto diversi. Nell’evoluzione del muntjac indiano cromosomi inizialmente separati si sono fusi, senza avere un effetto importante sull’animale. Queste due specie contengono un numero simile di geni. (Foto del muntjac cinese per gentile concessione di Deborah Carreno, Natural Wonders Photography.) sono disposti i geni La pubblicazione della sequenza completa di DNA del genoma umano nel 2004 ha reso possibile vedere in dettaglio in che modo i geni sono disposti lungo ciascuno dei nostri cromosomi (Figura 4.15). Ci vorranno molti decenni prima di poter analizzare completamente le informazioni contenute nel genoma umano, ma queste hanno già stimolato nuovi esperimenti che hanno influenzato profondamente il contenuto di tutti i capitoli di questo testo. Il primo aspetto sorprendente del genoma umano è quanto poco (soltanto una piccola percentuale) codifichi proteine (Tabella 4.1 e Figura 4.16). Y2 X Y1 X Y muntjac cinese muntjac indiano CAPITOLO (A) il cromosoma umano 22 nella sua conformazione mitotica, composto da due molecole di DNA a doppio filamento, ciascuna lunga 48 3 106 coppie di nucleotidi eterocromatina 310 10% del braccio del cromosoma circa 40 geni (B) 310 1% del braccio del cromosoma contenente 4 geni (C) 310 un gene di 3,4 3 104 coppie di nucleotidi (D) sequenze regolatrici di DNA 4 DNA, cromosomi e genomi 193 © 978-88-08-62126-9 esone introne espressione del gene RNA proteina proteina ripiegata TABELLA 4.1 Statistiche vitali del genoma umano Genoma umano Lunghezza del DNA 3,2 3 109 coppie di nucleotidi* Numero di geni che codifica proteine approssimativamente 21 000 Gene più grande che codifica proteine 2,4 3 106 coppie di nucleotidi Dimensioni medie di un gene che codifica proteine 27 000 coppie di nucleotidi Numero più piccolo di esoni per gene 1 Numero più alto di esoni per gene 178 Numero medio di esoni per gene 10,4 Dimensioni dell’esone più grande 17 106 coppie di nucleotidi Dimensioni medie di un esone 145 coppie di nucleotidi Numero di geni a RNA non codificanti approssimativamente 9000** Numero di pseudogeni*** più di 20 000 Percentuale di sequenza di DNA negli esoni (sequenze che codificano proteine) 1,5% Percentuale di DNA in altre sequenze altamente conservate**** 3,5% Percentuale di DNA in elementi altamente ripetuti approssimativamente 50% * È nota la sequenza nucleotidica precisa di 2,85 miliardi di nucleotidi (frequenza di errore di un solo nucleotide su 100 000). Il resto del DNA consiste soprattutto di brevi sequenze altamente ripetute in tandem, con numeri di ripetizioni che variano da un individuo all’altro. È molto difficile sequenziare accuratamente questi blocchi altamente ripetitivi. ** Questo numero è una stima molto imprecisa. *** Uno pseudogene è una sequenza nucleotidica di DNA che assomiglia molto a un gene funzionale, ma che contiene numerose mutazioni che ne impediscono l’espressione appropriata. La maggior parte degli pseudogeni deriva dalla duplicazione di un gene funzionale seguita dall’accumulo di mutazioni dannose in una copia. **** Queste regioni funzionali conservate comprendono DNA che codifica UTR 5’ e 3’ (regioni non tradotte di mRNA), DNA che codifica RNA strutturali e funzionali e DNA con siti conservati che legano proteine. Figura 4.15 L’organizzazione dei geni su un cromosoma umano. (A) Il cromosoma 22, uno dei cromosomi umani più piccoli, contiene 48 3 106 coppie di nucleotidi e corrisponde approssimativamente all’1,5% dell’intero genoma umano. La maggior parte del braccio sinistro del cromosoma 22 consiste di brevi sequenze ripetute di DNA che sono organizzate in una forma particolarmente compatta di cromatina (eterocromatina), che verrà trattata più avanti in questo capitolo. (B) Un ingrandimento di dieci volte di una porzione del cromosoma 22, con circa 40 geni indicati. Quelli marrone scuro sono geni noti e quelli rossi sono geni attesi. (C) Una porzione ingrandita di (B) che mostra quattro geni. (D) La disposizione introni-esoni di un gene tipico è mostrata dopo un ulteriore ingrandimento di dieci volte. Ciascun esone (rosso) codifica una porzione della proteina, mentre la sequenza di DNA degli introni (grigio) è relativamente priva di importanza, come vedremo in dettaglio nel Capitolo 6. Il genoma umano (3,2 3 109 coppie di nucleotidi) è la totalità dell’informazione genetica che appartiene alla nostra specie. Quasi tutto questo genoma è distribuito in 22 autosomi e 2 cromosomi sessuali (vedi Figure 4.10 e 4.11) presenti nel nucleo. Una minuscola frazione del genoma umano (16 569 coppie di nucleotidi in copie multiple per cellula) si trova nei mitocondri (vedi Capitolo 1 e, più in dettaglio, Capitolo 14). L’espressione sequenza del genoma umano si riferisce alla sequenza nucleotidica completa del DNA dei 24 cromosomi nucleari e dei mitocondri. Essendo diploide, una cellula somatica umana contiene perciò circa il doppio di questa quantità di DNA, o 6,4 3 109 coppie di nucleotidi, quando non sta duplicando i suoi cromosomi in preparazione alla divisione. (Adattata da International Human Genome Sequencing Consortium, Nature 409:860-921, 2001. Con il permesso di Macmillan Publishers Ltd.) CAPITOLO 4 DNA, cromosomi e genomi 194 (A) (B) Figura 4.16 La scala del genoma umano. Se ciascuna coppia di nucleotidi fosse disegnata con uno spazio di 1 mm fra ciascun nucleotide come in (A), allora il genoma umano si estenderebbe per 3200 km, abbastanza da attraversare il centro dell’Africa, il sito delle origini dell’uomo (linea rossa in B). A questa scala ci sarebbe, in media, un gene che codifica proteine ogni 150 m. Un gene medio si estenderebbe per 30 m, ma le sequenze codificanti in questo gene occuperebbero soltanto poco più di un metro. © 978-88-08-62126-9 Si noti anche che circa la metà del DNA cromosomico è composta da brevi tratti mobili di DNA che si sono gradualmente inseriti nel cromosoma durante l’evoluzione, moltiplicandosi nel genoma come parassiti (vedi Figura 4.62). Analizzeremo questi elementi trasponibili in dettaglio nei capitoli successivi. Un secondo aspetto notevole del genoma umano è rappresentato dalle grandi dimensioni medie dei geni, circa 27 000 coppie di nucleotidi. Come discusso sopra, un gene tipico porta nella sua sequenza lineare di nucleotidi l’informazione per la sequenza lineare degli amminoacidi di una proteina. Soltanto 1300 coppie circa di nucleotidi sono necessarie per codificare una proteina di dimensioni medie (circa 430 amminoacidi nell’uomo). La maggior parte del DNA rimanente in un gene consiste di lunghi tratti di DNA non codificante che interrompono i segmenti relativamente brevi di DNA che codificano la proteina. Come vedremo in dettaglio nel Capitolo 6, le sequenze codificanti sono chiamate esoni; le sequenze intercalate (non codificanti) sono chiamate introni (vedi Figura 4.15 e Tabella 4.1). La maggioranza dei geni umani consiste così di una lunga fila di esoni e introni alternati, con la maggior parte del gene composta da introni. La maggioranza dei geni degli organismi con genomi compatti è invece priva di introni. Questo rende conto delle dimensioni molto minori dei loro geni (circa un ventesimo dei geni umani), oltre che della frazione molto maggiore di DNA codificante nei loro cromosomi. Oltre a introni ed esoni, ciascun gene è associato a sequenze regolatrici di DNA, che sono responsabili del fatto che il gene sia acceso o spento al momento opportuno, espresso al livello appropriato alle necessità e soltanto nel tipo corretto di cellula. Negli esseri umani le sequenze regolatrici di un gene tipico sono sparse in decine di migliaia di coppie di nucleotidi. Come ci si aspetterebbe, queste sequenze regolatrici sono molto più compresse in organismi con genomi compatti. Vedremo nel Capitolo 7 come funzionano le sequenze regolatrici di DNA. Nell’ultimo decennio la ricerca ha sorpreso i biologi con la scoperta che, oltre a 21 000 geni codificanti proteine, il genoma umano contiene molte migliaia di geni che codificano molecole di RNA che non producono proteine ma che invece svolgono una gran quantità di altre funzioni importanti. Quello che si sa finora riguardo a queste molecole sarà trattato nei Capitoli 6 e 7. Infine la sequenza nucleotidica del genoma umano ha rivelato che le informazioni cruciali necessarie per lo sviluppo di un essere umano sembrano essere in uno stato allarmante di disordine. Ecco come un commentatore ha descritto il nostro genoma: “In un certo qual modo assomiglia al vostro garage/camera da letto/frigorifero/vita: altamente individualistico, ma maltenuto; pochi i segni di organizzazione; molte cianfrusaglie accumulate (chiamate dai non iniziati ‘spazzatura’); praticamente non viene mai scartato niente e i pochi articoli chiaramente di valore sono sparsi in giro indiscriminatamente, apparentemente senza cura”. Parleremo di come ciò possa essere successo nella parte finale di questo capitolo, intitolata “Il modo in cui si evolvono i genomi”. ■ Ogni molecola di DNA che forma un cromosoma lineare deve contenere un centromero, due telomeri e origini di replicazione Una molecola di DNA, per formare un cromosoma funzionante, deve essere in grado di fare di più che portare semplicemente dei geni: deve essere capace di replicarsi e le copie replicate devono essere separate e divise correttamente nelle cellule figlie a ogni divisione. Questo processo avviene attraverso una serie ordinata di fasi, conosciute nel loro insieme come ciclo cellulare, che forniscono una separazione temporale tra la duplicazione dei cromosomi e la loro segregazione in due cellule figlie. Il ciclo cellulare è brevemente riassunto nella Figura 4.17 ed è trattato in dettaglio nel Capitolo 17. Brevemente, durante una lunga interfase i geni sono espressi e i cromosomi vengono replicati; le due repliche rimangono insieme come coppia di cromatidi fratelli. Per tutto questo tempo i cromosomi sono distesi e molta della loro cromatina è presente all’interno del nucleo come lunghi filamenti, per cui i singoli cromoso- CAPITOLO 4 DNA, cromosomi e genomi 195 © 978-88-08-62126-9 cromosoma paterno in interfase fuso mitotico cromosoma materno in interfase ESPRESSIONE GENICA E REPLICAZIONE DEI CROMOSOMI involucro nucleare che circonda il nucleo MITOSI DIVISIONE CELLULARE cromosoma mitotico INTERFASE Figura 4.17 Una visione semplificata del ciclo della cellula eucariotica. Durante l’interfase la cellula sta esprimendo attivamente i suoi geni e sta perciò sintetizzando proteine. Durante l’interfase e prima della divisione cellulare viene anche replicato il DNA e i cromosomi vengono duplicati per produrre due molecole di DNA figlie strettamente appaiate (chiamati cromatidi fratelli). Qui è illustrata una cellula con un solo tipo di cromosoma, presente con la copia paterna e materna. Una volta che la replicazione del DNA è completa, la cellula può entrare nella fase M, quando avviene la mitosi e il nucleo si divide in due nuclei figli. Durante questa fase FASE M INTERFASE i cromosomi si condensano, l’involucro nucleare si rompe e si forma il fuso mitotico dai microtubuli e da altre proteine. I cromosomi mitotici condensati vengono catturati dal fuso mitotico e una serie completa di cromosomi viene quindi tirata a ciascuna estremità della cellula, separando ciascuna coppia di cromosomi figli. Intorno a ciascuna serie di cromosomi si riforma un involucro nucleare e, nello stadio finale della fase M, la cellula si divide per produrre due cellule figlie. La maggior parte del tempo del ciclo cellulare è costituita dall’interfase; la fase M è in confronto breve e in molte cellule di mammifero occupa soltanto un’ora circa. mi non possono essere distinti. Ogni cromosoma si condensa durante il breve spazio di tempo della mitosi, cosicché i due cromatidi fratelli si possono separare e possono essere distribuiti nei due nuclei figli. I cromosomi altamente condensati presenti in una cellula in divisione sono noti come cromosomi mitotici (Figura 4.18). Questa è la forma in cui i cromosomi sono più facilmente visualizzabili; infatti le immagini di cromosomi mostrate finora nel capitolo sono quelle di cromosomi durante la mitosi. Un cromosoma opera come unità strutturale distinta: affinché una copia venga passata a ciascuna cellula figlia durante la divisione ciascun cromosoma deve essere capace di replicarsi e le copie appena replicate devono successivamente separarsi e dividersi correttamente nelle due cellule figlie. Queste funzioni basilari sono controllate da tre tipi di sequenze nucleotidiche specializzate nel DNA, ciascuna delle quali lega proteine specifiche che guidano il macchinario che replica e segrega i cromosomi (Figura 4.19). Esperimenti sui lieviti, i cui cromosomi sono relativamente piccoli e facili da manipolare, hanno identificato gli elementi minimi di sequenza del DNA responsabili di ciascuna di queste funzioni. Un tipo di sequenza nucleotidica agisce da origine di replicazione del DNA, la posizione in cui inizia la duplicazione del DNA. I cromosomi eucariotici contengono molte origini di replicazione per assicurare che l’intero cromosoma possa essere replicato rapidamente, come vedremo in dettaglio nel Capitolo 5. Dopo la replicazione i due cromosomi figli restano attaccati l’uno all’altro e, se il ciclo cellulare procede, sono ulteriormente condensati per produrre cromosomi mitotici. La presenza di una seconda sequenza specializzata di DNA, chiamata centromero, permette a una copia di ciascun cromosoma duplicato e condensato di essere tirata in ciascuna cellula figlia quando una cellula si divide. Un complesso proteico chiamato cinetocore si forma sul centromero e attacca i cromosomi duplicati al fuso mitotico, permettendone la separazione (vedi Capitolo 17). La terza sequenza specializzata di DNA forma i telomeri, le estremità di un cromosoma. I telomeri contengono sequenze nucleotidiche ripetute che Figura 4.18 Un cromosoma mitotico. Un cromosoma mitotico è un cromosoma condensato duplicato in cui i due nuovi cromosomi, chiamati cromatidi fratelli, sono ancora uniti insieme (vedi Figura 4.17). La regione di costrizione indica la posizione del centromero. (Per gentile concessione di Terry D. Allen.) 1 µm CAPITOLO 4 DNA, cromosomi e genomi 196 © 978-88-08-62126-9 Figura 4.19 Le tre sequenze di DNA necessarie per produrre un cromosoma eucariotico che si possa replicare e quindi segregare durante la mitosi. Ciascun cromosoma ha origini di replicazione multiple, un centromero e due telomeri. Qui è mostrata la sequenza di eventi che un tipico cromosoma segue durante il ciclo cellulare. Il DNA si replica in interfase, iniziando dalle origini di replicazione e procedendo bidirezionalmente dalle origini lungo il cromosoma. Nella fase M il centromero attacca i cromosomi duplicati al fuso mitotico, cosicché una copia viene distribuita a ciascuna cellula figlia durante la mitosi; la speciale struttura che unisce il centromero al fuso è un complesso proteico chiamato cinetocore (verde scuro). Il centromero aiuta anche a tenere insieme i cromosomi duplicati fino a che sono pronti a essere separati. I telomeri formano cappucci speciali a ciascuna estremità del cromosoma. INTERFASE MITOSI INTERFASE telomero origine di replicazione DIVISIONE CELLULARE + centromero cromosoma replicato porzione di fuso mitotico cromosomi duplicati in cellule separate permettono la replicazione efficiente delle estremità dei cromosomi. I telomeri svolgono anche un’altra funzione: le sequenze ripetute di DNA telomerico, insieme con le regioni adiacenti, formano strutture che proteggono l’estremità del cromosoma dall’eventualità di essere riconosciuta dalla cellula come una molecola di DNA spezzato che ha bisogno di essere riparata. Discuteremo questo tipo di riparazione e gli altri aspetti dei telomeri nel Capitolo 5. Nelle cellule di lievito i tre tipi di sequenza richiesti per propagare un cromosoma sono relativamente brevi (di norma meno di 1000 coppie di basi ciascuna) e perciò usano soltanto una minuscola frazione della capacità di portare informazioni di un cromosoma. Sebbene le sequenze telomeriche siano abbastanza semplici e brevi in tutti gli eucarioti, le sequenze di DNA che specificano i centromeri e le origini di replicazione negli organismi più complessi sono molto più lunghe dei loro corrispettivi nel lievito. Per esempio, alcuni esperimenti suggeriscono che i centromeri umani possano contenere fino a un milione di coppie di nucleotidi e che non richiedano neppure un tratto di DNA con una sequenza nucleotidica definita. Invece, come discuteremo più avanti in questo capitolo, sembra che essi consistano di una grande struttura ripetuta regolarmente di proteine e acido nucleico, che può essere ereditata quando un cromosoma si replica. ■ Le molecole di DNA sono altamente condensate nei cromosomi Tutti gli organismi eucariotici hanno modi elaborati per compattare il DNA nei cromosomi. Per esempio, se i 48 milioni di coppie di nucleotidi che formano il cromosoma 22 umano fossero stesi da un’estremità all’altra come una lunga doppia elica perfetta, il DNA sarebbe lungo circa 1,5 cm. Eppure in mitosi il cromosoma 22 misura soltanto circa 2 mm di lunghezza (vedi Figure 4.10 e 4.11), con un rapporto di compattamento nel senso della lunghezza di più di 7000 volte. Questa notevole attività di compressione è eseguita da proteine che avvolgono e piegano il DNA in livelli successivi di organizzazione sempre più alti. Sebbene meno condensato dei cromosomi mitotici, il DNA dei cromosomi interfasici è ancora molto compatto. Leggendo queste sezioni è importante tenere in mente che la struttura dei cromosomi è dinamica. Abbiamo visto che i cromosomi si condensano in modo estremo nella fase M del ciclo cellulare. Molto meno visibile, ma di enorme interesse e importanza, è il fatto che regioni specifiche dei cromosomi interfasici si decondensano quando le cellule accedono a sequenze specifiche di DNA per esprimere geni, per riparare il DNA e per replicarlo, e si ricondensano quando questi processi sono stati completati. Il compattamento dei cromosomi è perciò compiuto in modo da permettere un rapido accesso lo- CAPITOLO 4 DNA, cromosomi e genomi 197 © 978-88-08-62126-9 calizzato, secondo la necessità, al DNA. Nelle sezioni successive discuteremo le proteine specializzate che rendono possibile questo tipo di compattamento. ■ I nucleosomi sono l’unità base della struttura dei cromosomi eucariotici Le proteine che si legano al DNA per formare i cromosomi eucariotici sono tradizionalmente divise in due classi generali: gli istoni e le proteine cromosomiche non istoniche; ognuna contribuisce al cromosoma con una massa pari a quella del DNA. Il complesso di entrambe le classi di proteine con il DNA nucleare delle cellule eucariotiche è noto come cromatina (Figura 4.20). Gli istoni sono responsabili del primo livello di base dell’organizzazione dei cromosomi, il nucleosoma, un complesso DNA-proteine che venne scoperto nel 1974. Quando si aprono molto delicatamente i nuclei interfasici e se ne esamina il contenuto al microscopio elettronico, la maggior parte della cromatina è sotto forma di una fibra con un diametro di circa 30 nm (Figura 4.21A). Se questa cromatina viene sottoposta a trattamenti che la fanno svolgere parzialmente, appare al microscopio elettronico come una serie di “perline su un filo” (Figura 4.21B). Il filo è il DNA e ciascuna perlina è una “particella centrale del nucleosoma”, costituita da DNA avvolto intorno a un nucleo proteico formato da istoni (Filmato 4.2 ). L’organizzazione strutturale dei nucleosomi è stata determinata dopo averli prima isolati da cromatina svolta per digestione con enzimi particolari (chiamati nucleasi) che spezzano il DNA tagliandolo fra i nucleosomi. In seguito a digestione per breve tempo il DNA esposto fra le particelle centrali dei nucleosomi, il DNA linker, viene degradato. Ciascuna singola particella centrale del nucleosoma consiste di un complesso di otto proteine istoniche – due molecole degli istoni H2A, H2B, H3 e H4 – e di DNA a doppio filamento che è lungo 147 coppie di nucleotidi. L’ottamero di istoni forma un nucleo proteico intorno al quale è avvolto il DNA a doppio filamento (Figura 4.22). cromatina DNA istone Figura 4.20 La cromatina. Come illustrato, la cromatina consiste di DNA legato sia agli istoni sia a proteine non istoniche. La massa delle proteine istoniche presenti è più o meno uguale alla massa totale delle proteine non istoniche ma, come indicato schematicamente qui, queste ultime sono composte da un enorme numero di differenti specie proteiche. In totale la massa di un cromosoma è formata per circa un terzo da DNA e per due terzi da proteine. proteine non istoniche Figura 4.21 Nucleosomi visti (A) al microscopio elettronico. (A) La cromatina isolata direttamente da un nucleo interfasico appare al microscopio elettronico come un filo spesso 30 nm. (B) Questa micrografia elettronica mostra un tratto di cromatina che è stata decompattata sperimentalmente, o decondensata, dopo l’isolamento per mostrare i nucleosomi. (A, per gentile concessione di Barbara Hamkalo; B, per gentile concessione di Victoria Foe.) (B) 50 nm CAPITOLO 4 DNA, cromosomi e genomi 198 © 978-88-08-62126-9 DNA linker forma di cromatina a “perline su un filo” LA NUCLEASI DIGERISCE IL DNA LINKER particella centrale del nucleosoma rilasciata istoni del nucleo del nucleosoma il nucleosoma comprende circa 200 coppie di nucleotidi di DNA Figura 4.22 Organizzazione strutturale del nucleosoma. Un nucleosoma contiene un nucleo proteico composto da otto molecole di istoni. Negli esperimenti biochimici la particella centrale del nucleosoma può essere rilasciata dalla cromatina per digestione del DNA linker con una nucleasi, un enzima che spezza il DNA. (La nucleasi può degradare il DNA linker esposto ma non può attaccare il DNA avvolto strettamente intorno al nucleo del nucleosoma.) Dopo la dissociazione del nucleosoma isolato nel nucleo proteico e nel DNA, può essere determinata la lunghezza del tratto di DNA che era avvolto intorno al nucleo. Questa lunghezza di 147 coppie di nucleotidi è sufficiente per un avvolgimento di 1,7 volte intorno al nucleo istonico. Ciascuna particella centrale del nucleosoma è separata dalla successiva da una regione di DNA linker, che può variare in lunghezza da poche coppie di nucleotidi fino a circa 80. (Il termine nucleosoma tecnicamente si riferisce a una particella centrale del nucleosoma più uno dei DNA linker adiacenti, ma spesso è usato come sinonimo della particella centrale del nucleosoma.) In media perciò i nucleosomi si ripetono a intervalli di circa 200 coppie di nucleotidi. Per esempio, una cellula umana diploide con 6,4 3 109 coppie di nucleotidi contiene approssimativamente 30 milioni di nucleosomi. La formazione dei nucleosomi converte una molecola di DNA in un filo di cromatina la cui dimensione è circa un terzo della lunghezza iniziale. 11 nm DISSOCIAZIONE CON ALTA CONCENTRAZIONE DI SALI ■ La struttura della particella centrale del nucleosoma rivela il nucleo ottamerico di istoni DNA a doppia elica di 147 coppie di nucleotidi DISSOCIAZIONE H2A H2B H3 H4 modo in cui il DNA • compattato La struttura ad alta risoluzione di una particella centrale di un nucleosoma, ottenuta nel 1997, ha rivelato un nucleo di istoni a forma di disco intorno al quale è strettamente avvolto il DNA per 1,7 giri in un avvolgimento sinistrorso (Figura 4.23). Tutti e quattro gli istoni che compongono il nucleo del nucleosoma sono proteine relativamente piccole (102-135 amminoacidi) e hanno un motivo strutturale comune, noto come ripiegamento istonico, formato da tre a eliche connesse da due anse (Figura 4.24). Nell’assemblaggio di un nucleosoma i ripiegamenti istonici per prima cosa si legano fra loro formando dimeri H3-H4 e H2A-H2B; i dimeri H3-H4 si combinano formando tetrameri. Un tetramero H3-H4 si combina poi con due dimeri H2A-H2B per formare il nucleo compatto dell’ottamero, intorno al quale si avvolge il DNA. L’interfaccia fra il DNA e l’istone è estesa: in ciascun nucleosoma si formano 142 legami idrogeno fra il DNA e il nucleo degli istoni. Quasi metà di questi legami si forma fra l’ossatura degli amminoacidi degli istoni e l’ossatura fosfodiesterica del DNA. Anche numerosi legami salini e numerose in- Figura 4.23 La struttura di una particella centrale di un nucleosoma, determinata mediante analisi di diffrazione ai raggi X di cristalli. Ciascun istone è colorato secondo lo schema della Figura 4.22, con la doppia elica del DNA in grigio chiaro. (Adattata da K. Luger et al., Nature 389:251-260, 1997. Con il permesso di Macmillan Publishers Ltd.) doppia elica del DNA vista laterale istone H2A vista dal basso istone H2B istone H3 istone H4 CAPITOLO 4 DNA, cromosomi e genomi 199 © 978-88-08-62126-9 Figura 4.24 L’organizzazione (A) H2A C N H2B N C H3 N C N H4 C ripiegamento istonico coda N-terminale (B) N (D) N C N ottamero di istoni (C) N C C N N strutturale generale degli istoni del nucleo. (A) Ciascun istone del nucleo contiene una coda N-terminale, che è soggetta a diverse modificazioni covalenti, e una regione di ripiegamento istonico, come indicato. (B) La struttura del ripiegamento istonico, che è formato da tutti e quattro gli istoni del nucleo. (C) Gli istoni 2A e 2B formano un dimero tramite un’interazione nota come “stretta di mano”. Gli istoni H3 e H4 formano un dimero tramite lo stesso tipo di interazione. (D) L’ottamero istonico finale con avvolto il DNA. Si noti che le otto code N-terminali degli istoni protrudono dalla struttura a forma di disco del nucleo. Queste code, la cui conformazione è molto flessibile, servono come sito di legame per gruppi di altre proteine. N N N N N terazioni idrofobiche tengono insieme DNA e proteine nel nucleosoma. Per esempio, più di un quinto degli amminoacidi di tutti gli istoni del nucleo è costituito da lisina o arginina (due amminoacidi con catene laterali basiche) e le loro cariche positive possono neutralizzare efficacemente l’ossatura del DNA carica negativamente. Queste numerose interazioni spiegano in parte perché il DNA praticamente di qualunque sequenza può essere legato a un nucleo ottamerico di istoni. Il percorso del DNA intorno al nucleo istonico non è rettilineo; si osservano invece parecchie pieghe nel DNA, come ci si aspetta dalla superficie non uniforme del nucleo. Queste curve richiedono una compressione sostanziale del solco minore dell’elica del DNA. Certi dinucleotidi nel solco minore sono particolarmente facili da comprimere e alcune sequenze nucleotidiche legano il nucleosoma con maggiore forza di altre (Figura 4.25). Ciò spiega probabilmente alcuni casi sorprendenti, ma non insoliti, di posizionamento molto preciso dei nucleosomi lungo un tratto di DNA. La preferenza di sequenza dei nucleosomi deve però essere abbastanza bassa da permettere ad altri fattori di dominare, in quanto i nucleosomi possono occupare numerose posizioni rispetto alla sequenza di DNA nella maggior parte delle regioni cromosomiche. Oltre al ripiegamento istonico, ciascun istone del nucleo ha una lunga “coda” amminoacidica N-terminale, che si estende fuori dal nucleo DNA-istoni (vedi Figura 4.24D). Queste code istoniche sono soggette a parecchi tipi diversi di modificazioni covalenti, che a loro volta controllano aspetti cruciali della struttura e della funzione della cromatina, come vedremo fra breve. Coerentemente con il loro ruolo fondamentale nella funzione del DNA tramite il controllo della struttura della cromatina, gli istoni sono fra le proteine eucariotiche più conservate. Per esempio, le sequenze degli amminoacidi dell’istone H4 di un pisello e di una mucca differiscono soltanto in 2 su 102 posizioni. Questa forte conservazione evolutiva suggerisce che le funzioni degli istoni coinvolgano quasi tutti i loro amminoacidi, così che un cambiamento in qualunque posizione è deleterio per la cellula. Nonostante l’alta conservazione degli istoni, molti organismi eucariotici producono anche varianti specializzate di questi istoni che differiscono nella sequenza degli amminoacidi. Come vedremo, queste varianti, combinate con una gamma sorprendentemente ampia di modificazioni covalenti che possono essere aggiunte agli istoni nei nucleosomi, rendono possibili le molte diverse strutture della cromatina nelle cellule. G-C preferita qui (solco minore all’esterno) dinucleotidi AA, TT e TA preferiti qui (solco minore nucleo istonico all’interno) DNA del del nucleosoma nucleosoma (ottamero di istoni) Figura 4.25 La curvatura del DNA in un nucleosoma. L’elica del DNA gira strettamente 1,7 volte intorno all’ottamero di istoni. Questo disegno mostra il modo in cui il solco minore è compresso all’interno dell’avvolgimento. A causa di certi aspetti strutturali della molecola del DNA, i dinucleotidi indicati si trovano di preferenza in questo solco minore stretto, il che aiuta a spiegare perché certe sequenze di DNA si leghino più strettamente di altre al nucleo del nucleosoma. CAPITOLO 4 DNA, cromosomi e genomi 200 © 978-88-08-62126-9 ■ I nucleosomi hanno una struttura dinamica e sono spesso soggetti a cambiamenti catalizzati da complessi di rimodellamento della cromatina dipendenti da ATP Per molti anni i biologi hanno pensato che, una volta formato in una particolare posizione sul DNA, un nucleosoma rimanesse fisso a causa della stretta associazione fra gli istoni del nucleo e il DNA. Se ciò fosse vero, sorgerebbero problemi per i meccanismi di lettura genetici, che in linea di principio richiedono un rapido accesso a molte sequenze specifiche di DNA, oltre che per il rapido passaggio del macchinario di trascrizione e di replicazione del DNA attraverso la cromatina. Ma esperimenti cinetici mostrano che il DNA di un nucleosoma isolato si svolge a partire da ciascuna estremità circa quattro volte al secondo, rimanendo esposto per 10-50 millisecondi prima che la struttura parzialmente svolta si richiuda. Quindi la maggior parte del DNA di un nucleosoma isolato è in linea di principio disponibile per il legame ad altre proteine. Per la cromatina in una cellula è chiaramente richiesto un ulteriore allentamento dei contatti DNA-istoni, perché le cellule eucariotiche contengono una grande varietà di complessi di rimodellamento della cromatina dipendenti da ATP. Questi complessi comprendono una subunità che idrolizza ATP (una ATPasi evolutivamente correlata alle DNA elicasi trattate nel Capitolo 5). La subunità di questi complessi si lega sia al nucleo proteico del nucleosoma che al DNA a doppio filamento avvolto intorno a esso. Usando l’energia di idrolisi dell’ATP per spostare questo DNA rispetto al nucleo questa subunità cambia temporaneamente la struttura di un nucleosoma, rendendo il DNA legato meno strettamente al nucleo di istoni.Tramite cicli ripetuti di idrolisi di ATP i complessi di rimodellamento possono catalizzare lo scorrimento dei nucleosomi e, tirando il nucleo del nucleosoma lungo la doppia elica del DNA in questo modo, rendono il DNA del nucleosoma disponibile per altre proteine cellulari (Figura 4.26). Inoltre, cooperando con proteine che legano gli istoni che servono da chaperoni degli istoni, alcuni complessi di rimodellamento sono caFigura 4.26 Lo scorrimento dei nucleosomi catalizzato da complessi di rimodellamento della cromatina dipendenti da ATP. (A) Si pensa che il complesso di rimodellamento, usando l’energia di idrolisi dell’ATP, spinga sul DNA del nucleosoma legato e ne allenti l’attacco sul nucleo del nucleosoma. In questo disegno ciascun ciclo di legame di ATP, idrolisi di ATP e rilascio dei prodotti ADP e Pi sposta così il DNA rispetto all’ottamero di istoni nella direzione della freccia. Per produrre lo scorrimento del nucleosoma mostrato sono necessari molti di questi cicli. (B) La struttura di un dimero legato al nucleosoma delle due identiche subunità di ATPasi (verde) che fanno scorrere avanti e indietro i nucleosomi nei complessi di rimodellamento della cromatina della famiglia ISW1. (C) La struttura di un grande complesso di rimodellamento della cromatina che mostra come si pensa sia avvolto intorno a un nucleosoma. Il complesso di lievito RSC è modellato in verde. Questo complesso contiene 15 subunità, compresa un’ATPasi e almeno quattro subunità con domini che riconoscono specifici istoni modificati covalentemente. (B, da L.R. Racki et al., Nature 462:1016-1021, 2009. Con il permesso di Macmillan Publishers Ltd.; C, modificata da A.E. Leschziner et al., Proc. Natl. Acad. Sci. USA 104:4913-4918, 2007.) complesso di rimodellamento della cromatina dipendente da ATP ATP ADP CATALISI DELLO SCORRIMENTO DEL NUCLEOSOMA (A) (B) (C) 10 nm CAPITOLO 4 DNA, cromosomi e genomi 201 © 978-88-08-62126-9 chaperone degli istoni complesso di rimodellamento della cromatina dipendente da ATP ATP ATP ADP SCAMBIO DI DIMERI H2A-H2B ADP ATP DNA privo di nucleosomi chaperone degli istoni paci di rimuovere il nucleo del nucleosoma in tutto o in parte, catalizzando uno scambio dei suoi istoni H2A-H2B o la rimozione completa del nucleo ottamerico dal DNA (Figura 4.27). Le misurazioni hanno dimostrato che nella cellula, come risultato di questi processi, un nucleosoma tipico viene sostituito sul DNA ogni una o due ore. Le cellule contengono decine di diversi complessi di rimodellamento della cromatina dipendenti da ATP che sono specializzati in ruoli differenti. Per la maggior parte si tratta di grandi complessi proteici che possono contenere 10 o più subunità, alcune delle quali si legano a specifiche modificazioni degli istoni (vedi Figura 4.26C). L’attività di questi complessi è controllata accuratamente dalla cellula. Quando i geni vengono accesi e spenti i complessi di rimodellamento della cromatina sono portati in regioni specifiche del DNA, dove agiscono localmente per influenzare la struttura della cromatina (vedi Capitolo 7; vedi anche Figura 4.40, più avanti). Sebbene alcune sequenze di DNA si leghino più strettamente di altre al nucleo del nucleosoma (vedi Figura 4.25), ciò che influenza maggiormente il posizionamento dei nucleosomi sembra essere la presenza di altre proteine saldamente legate al DNA. Alcune proteine legate favoriscono la formazione di un nucleosoma nelle vicinanze, mentre altre creano ostacoli che forzano i nucleosomi a spostarsi altrove. Le posizioni esatte dei nucleosomi lungo un tratto di DNA dipendono perciò soprattutto dalla presenza e dalla natura di altre proteine legate al DNA. A causa della presenza di complessi di rimodellamento dipendenti da ATP la disposizione dei nucleosomi sul DNA può essere altamente dinamica, cambiando rapidamente secondo le necessità della cellula. ■ I nucleosomi sono in genere impacchettati in una fibra compatta di cromatina Sebbene file enormemente lunghe di nucleosomi si formino sulla maggior parte del DNA cromosomico, la cromatina in una cellula vivente raramente adotta la forma estesa a “perline su un filo”. I nucleosomi sono invece compattati l’uno sull’altro, generando schiere regolari in cui il DNA è ancora più condensato. Così, quando i nuclei vengono lisati molto delicatamente su un retino per microscopia elettronica, la maggior parte della cromatina è visibi- ADP SCAMBIO DEL NUCLEO DEL NUCLEOSOMA (OTTAMERO DI ISTONI) Figura 4.27 Rimozione del nucleosoma e scambio degli istoni catalizzati da complessi di rimodellamento della cromatina dipendenti da ATP. Cooperando con chaperoni specifici degli istoni, alcuni complessi di rimodellamento della cromatina possono rimuovere dimeri H2A-H2B da un nucleosoma (reazioni in alto) e sostituirli con dimeri che contengono una variante istonica, come H2AZ-H2B (vedi Figura 4.35). Altri complessi di rimodellamento sono attratti su siti specifici della cromatina e cooperano con chaperoni degli istoni per rimuovere completamente l’ottamero di istoni e/o sostituirlo con un nucleo diverso del nucleosoma (serie di reazioni in basso). Qui sono mostrate immagini molto semplificate del processo. CAPITOLO 4 DNA, cromosomi e genomi 202 © 978-88-08-62126-9 (B) (C) Figura 4.28 Un modello a zigzag della fibra di cromatina di 30 nm. (A) La conformazione di due dei quattro nucleosomi in un tetranucleosoma, da una struttura determinata mediante cristallografia ai raggi X. (B) Schema dell’intero tetranucleosoma; il quarto nucleosoma non è visibile, essendo impilato sul nucleosoma in basso e dietro di esso in questo disegno. (C) Illustrazione schematica di una possibile struttura a zigzag che potrebbe spiegare la fibra di cromatina di 30 nm. (A, codice PDB: 1ZBB; C, adattata da C.L. Woodcock, Nat. Struct. Mol. Biol. 12:639-640, 2005. Con il permesso di Macmillan Publishers Ltd.) (A) Figura 4.29 Un modello ipotetico per il ruolo svolto dalle code degli istoni nella compattazione della cromatina. (A) Questo disegno schematico mostra i punti di uscita approssimativi delle otto code degli istoni, una per ciascuna proteina istonica, che si estendono da ciascun nucleosoma. La struttura reale è mostrata a destra. Nella struttura ad alta risoluzione del nucleosoma le code sono in gran parte non strutturate, suggerendo che siano altamente flessibili. (B) Come indicato, si pensa che le code degli istoni siano coinvolte in interazioni tra i nucleosomi che favoriscono il loro compattamento. (A, codice PDB: 1KX5.) coda H4 coda H2A coda H2A le sotto forma di una fibra con un diametro di circa 30 nm, molto più ampia della cromatina a forma di “perline su un filo” (vedi Figura 4.21). Il modo in cui i nucleosomi sono compattati nella fibra di cromatina di 30 nm non è ancora chiaro. La struttura di un tetranucleosoma (un complesso di quattro nucleosomi), ottenuta mediante cristallografia ai raggi X e microscopia elettronica ad alta risoluzione di cromatina ricostituita, è stata usata per supportare un modello a zigzag per l’impilamento dei nucleosomi nella fibra di 30 nm (Figura 4.28). Ma la microscopia crioelettronica di nuclei preparati con molta attenzione indica che la maggior parte della cromatina è strutturata meno regolarmente. Che cosa provoca un impilamento così stretto dei nucleosomi l’uno sull’altro? I collegamenti nucleosoma-nucleosoma formati dalle code degli istoni, soprattutto dalla coda di H4, costituiscono un fattore importante (Figura 4.29). Un altro fattore importante è un istone addizionale spesso presente in un rapporto 1 a 1 con i nuclei dei nucleosomi, l’istone H1. Questo cosiddetto istone linker è più grande dei singoli istoni del nucleo ed è stato conservato assai meno durante l’evoluzione. Una singola molecola di istone H1 si lega a ciascun nucleosoma, entrando in contatto sia col DNA che con proteine e cambiando il percorso del DNA quando esce dal nucleosoma. Si pensa che questo cambiamento nel percorso di uscita del DNA aiuti a compattare il nucleosoma (Figura 4.30). La maggior parte degli organismi eucariotici produce parecchi istoni H1 con sequenze amminoacidiche correlate ma piuttosto distinte. La presenza di molte altre proteine che legano il DNA, oltre a proteine che si legano direttamente agli istoni, aggiunge certamente caratteristiche importanti a qualunque serie di nucleosomi. coda H2B coda H3 coda H4 coda H2B coda H3 (A) (B) CAPITOLO istone H1 nucleosoma C (A) N 4 DNA, cromosomi e genomi 203 © 978-88-08-62126-9 istone H1 (B) (C) SOMMARIO Un gene è una sequenza di nucleotidi in una molecola di DNA che agisce da unità funzionale per la produzione di una proteina, di un RNA strutturale o di una molecola di RNA catalitico o regolatore. Negli eucarioti i geni che codificano proteine sono di solito composti da una fila di introni ed esoni alternati associati a sequenze regolatrici di DNA. Un cromosoma è formato da una singola molecola di DNA enormemente lunga che contiene una serie lineare di molti geni, legati a un’ampia serie di proteine. Il genoma umano contiene 3,2 3 109 coppie di nucleotidi di DNA, divisi fra 22 autosomi diversi (presenti in due copie ciascuno) e 2 cromosomi sessuali. Soltanto una piccola percentuale di questo DNA codifica proteine o molecole funzionali di RNA. Una molecola di DNA cromosomico contiene anche altri tre tipi di sequenze nucleotidiche funzionalmente importanti: origini di replicazione e telomeri permettono alla molecola di DNA di essere replicata con efficienza, mentre un centromero attacca le molecole figlie di DNA al fuso mitotico, assicurandone l’accurata segregazione nelle cellule figlie durante la fase M del ciclo cellulare. Il DNA negli eucarioti è saldamente legato a una massa equivalente di istoni, che formano una schiera ripetuta di particelle DNA-proteine chiamate nucleosomi. Il nucleosoma è composto da un nucleo ottamerico di proteine istoniche intorno al quale si avvolge la doppia elica del DNA. I nucleosomi si trovano a intervalli di circa 200 coppie di nucleotidi e sono di solito compattati insieme (con l’aiuto di molecole di istone H1) in schiere quasi regolari per formare una fibra di cromatina di 30 nm. Nonostante l’alto grado di compattamento nella cromatina, la sua struttura deve essere altamente dinamica per permettere alla cellula di accedere al DNA. Si ha un certo grado di svolgimento e di riavvolgimento spontaneo del DNA sul nucleosoma, ma la strategia generale per cambiare reversibilmente strutture locali di cromatina utilizza complessi di rimodellamento della cromatina spinti da ATP. Le cellule contengono una grande serie di questi complessi, che sono indirizzati a regioni specifiche della cromatina nei momenti appropriati. I complessi di rimodellamento collaborano con chaperoni di istoni per permettere di riposizionare i nuclei dei nucleosomi, di ricostituirli con istoni diversi o di rimuoverli completamente per esporre il DNA sottostante. La struttura e la funzione della cromatina Dopo aver analizzato il modo in cui il DNA viene compattato nei nucleosomi per creare una fibra di cromatina, ci occuperemo adesso dei meccanismi che formano strutture diverse della cromatina in regioni diverse del genoma di una cellula. Meccanismi di questo tipo hanno varie funzioni importanti nella cellula. Ma ancora più importante è il fatto che alcuni tipi di struttura della cromatina possono essere ereditati; la struttura può essere quindi trasmessa direttamente da una cellula ai suoi discendenti. Poiché la memoria cellulare che ne risulta si basa sulla struttura ereditata della cromatina e non su un cambiamento della sequenza del DNA, questa è una forma di ereditarietà epigenetica. Il prefisso epi in greco significa “sopra” ed è particolarmente appropriato perché l’epigenetica rappresenta una forma di ereditarietà che è sovrapposta all’ereditarietà genetica basata sul DNA. Figura 4.30 Il modo in cui l’istone linker si lega al nucleosoma. Sono mostrate la posizione e la struttura dell’istone H1. La regione centrale dell’istone H1 vincola altre 20 coppie di nucleotidi di DNA nel punto in cui questo esce dal nucleo del nucleosoma ed è importante per la compattazione della cromatina. (A) Disegno schematico e (B) struttura di un singolo nucleosoma dedotta da una struttura determinata mediante microscopia elettronica ad alta risoluzione di una fibra di cromatina ricostituita (C). (B e C, adattate da F. Song et al., Science 344:376-380, 2014.) CAPITOLO 4 DNA, cromosomi e genomi 204 © 978-88-08-62126-9 Nel Capitolo 7 presenteremo i molti modi differenti in cui è regolata l’espressione dei geni, analizzeremo in dettaglio l’ereditarietà epigenetica ed esamineremo parecchi meccanismi diversi che possono produrla. Qui ci occuperemo soltanto di uno di essi, quello basato sulla struttura della cromatina. Inizieremo questa sezione riassumendo le osservazioni che per prime hanno dimostrato che le strutture della cromatina possono essere ereditate. Successivamente descriveremo alcune delle reazioni chimiche che rendono possibile questo meccanismo, le modificazioni covalenti degli istoni nel nucleosoma. Queste modificazioni hanno molte funzioni, dal momento che servono da siti di riconoscimento per domini proteici che legano complessi proteici specifici nelle regioni appropriate della cromatina. Di conseguenza gli istoni hanno un effetto sull’espressione genica, come anche su molti altri processi legati al DNA. Tramite questi meccanismi la struttura della cromatina svolge un ruolo centrale nello sviluppo, nella crescita e nel mantenimento degli organismi eucariotici, compreso l’uomo. ■ L’eterocromatina è altamente organizzata e limita l’espressione genica Studi al microscopio ottico eseguiti negli anni ’30 hanno distinto due tipi di cromatina nei nuclei interfasici di molte cellule di eucarioti superiori: una forma altamente condensata, chiamata eterocromatina, e la rimanente, che è meno condensata, chiamata eucromatina. L’eterocromatina rappresenta una forma particolarmente compatta di cromatina (vedi Figura 4.9), di cui stiamo finalmente iniziando a comprendere le proprietà molecolari. Essa è altamente concentrata in regioni specifiche, soprattutto nei centromeri e nei telomeri menzionati in precedenza (vedi Figura 4.19), ma è presente anche in molte altre regioni lungo il cromosoma, regioni che possono variare a seconda dello stato fisiologico della cellula. In una tipica cellula di mammifero più del 10% del genoma è compattato in questo modo. Il DNA nell’eterocromatina contiene pochi geni; quando regioni di eucromatina sono convertite in eterocromatina, come risultato i loro geni sono generalmente spenti. Tuttavia oggi sappiamo che il termine eterocromatina si applica a diverse modalità di compattamento della cromatina che hanno conseguenze differenti sull’espressione genica. Pertanto non si deve pensare che l’eterocromatina incapsuli DNA “morto”, ma che definisca piuttosto i diversi domini di cromatina compatta che hanno la caratteristica comune di essere insolitamente resistenti all’espressione genica. ■ Lo stato eterocromatico si autopropaga Un segmento di cromosoma che è normalmente eucromatico può essere traslocato nelle vicinanze di un tratto di eterocromatina per mezzo di rottura e riunione del cromosoma, sia a causa di un evento genetico naturale che di un artificio sperimentale. È importante notare come questo spesso causi un silenziamento (inattivazione) dei geni normalmente attivi. Questo fenomeno, che viene definito effetto di posizione, riflette una diffusione dello stato eterocromatico nella regione originariamente eucromatica e ha fornito prove importanti per capire i meccanismi che creano e mantengono l’eterocromatina. Riconosciuti per la prima volta nella Drosophila, gli effetti di posizione sono ora osservabili in molti eucarioti, fra cui lieviti, vegetali ed esseri umani. In eventi di rottura e riunione cromosomica del tipo appena descritto la zona di silenziamento, dove l’eucromatina è convertita allo stato di eterocromatina, diffonde a distanze differenti in cellule precoci diverse dell’embrione della mosca. È importante notare che queste differenze sono poi perpetuate per il resto della vita dell’animale: in ogni cellula, una volta che si è stabilita la condizione eterocromatica, questa tende a essere ereditata stabilmente da tutta la progenie della cellula (Figura 4.31). Questo fenomeno notevole, chiamato variegatura da effetto di posizione, è stato riconosciuto per la prima volta in seguito a un’analisi genetica dettagliata della perdita a zone del pigmento rosso nell’occhio della mosca (Figura 4.32), ma ha molte caratteristiche in comune con l’estesa diffusione dell’eterocromatina che inattiva uno CAPITOLO 4 DNA, cromosomi e genomi 205 © 978-88-08-62126-9 1 2 3 4 5 barriera eterocromatina eucromatina geni 1 2 3 4 5 1 2 3 4 5 precocemente nello sviluppo embrionale l’eterocromatina si forma e si diffonde nell’eucromatina adiacente in misura diversa in cellule diverse 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 TRASLOCAZIONE CROMOSOMICA proliferazione cellulare 1 2 3 4 5 eterocromatina eucromatina clone di cellule con il gene 1 inattivo (A) clone di cellule con i geni 1, 2 e 3 inattivi clone di cellule con nessun gene inattivato (B) Figura 4.31 La causa della variegatura da effetto di posizione nella Drosophila. (A) L’eterocromatina (verde) normalmente non può diffondere in regioni adiacenti di eucromatina (rosa) a causa di speciali sequenze barriera, di cui parleremo fra breve. Nelle mosche che ereditano certi riarrangiamenti cromosomici, però, questa barriera non è più presente. (B) Durante lo sviluppo precoce di queste mosche l’eterocromatina si può diffondere nel DNA cromosomico adiacente, avanzando per distanze diverse in cellule diverse. Questa diffusione presto si ferma, ma lo schema di eterocromatina che si è creato viene ereditato, cosicché vengono prodotti grandi cloni di cellule discendenti che hanno gli stessi geni confinanti condensati in eterocromatina e quindi inattivati (da qui l’aspetto “variegato” di alcune di queste mosche; vedi Figura 4.32). Il termine “diffusione”, sebbene sia usato per descrivere la formazione di nuova eterocromatina vicino a eterocromatina esistente in precedenza, può non essere completamente preciso. Ci sono prove che durante l’espansione l’eterocromatina può “saltare” alcune regioni di cromatina, risparmiando i geni ivi presenti da effetti repressivi. dei due cromosomi X nelle femmine dei mammiferi. Anche qui un processo casuale agisce in ogni cellula precoce dell’embrione per determinare quale cromosoma X sarà inattivato; quello stesso cromosoma X rimarrà poi inattivo in tutta la progenie cellulare, creando, nel corpo dell’adulto, un mosaico di differenti cloni cellulari (vedi Figura 7.50). Queste osservazioni, nel loro insieme, indicano una strategia fondamentale per la formazione dell’eterocromatina: l’eterocromatina produce altra eterocromatina. Questo meccanismo a feedback positivo può operare sia nello spazio, causando la diffusione dello stato eterocromatico lungo il cromosoma, sia nel tempo, attraverso le generazioni cellulari, propagando lo stato eterocromatico della cellula genitrice alle cellule figlie. La sfida è spiegare i meccanismi molecolari che sono alla base di questo straordinario comportamento. Come primo passo si possono cercare le molecole coinvolte. Questo è stato fatto per mezzo di screening genetici in cui è stato generato un grande numero di mutanti, dopo di che sono stati analizzati quelli che mostravano anormalità nel processo in questione. Screening genetici estesi sono stati eseguiti nella Drosophila, nei funghi e nei topi, hanno identificato più di 100 geni che aumentano o sopprimono la diffusione di eterocromatina e la sua ereditarietà; in altre parole, geni che aumentano o sopprimono la variegatura causata dall’effetto di posizione. Si è visto che molti di questi geni codificano proteine cro- il gene White nella sua posizione normale barriera eterocromatina rara inversione cromosomica barriera gene White vicino all’eterocromatina Figura 4.32 La scoperta degli effetti di posizione sull’espressione genica. Il gene White della Drosophila controlla la produzione del pigmento nell’occhio e prende il nome dalla mutazione che ha portato alla sua identificazione. Le mosche di tipo selvatico con un gene White normale (White+) hanno una normale produzione di pigmento, che dà come risultato occhi rossi; se però il gene White è mutato e inattivato, le mosche mutanti (White–) non producono pigmento e hanno occhi bianchi. Nelle mosche in cui un gene normale White è stato spostato vicino a una regione di eterocromatina, gli occhi sono marezzati, con chiazze sia rosse che bianche. Le chiazze bianche rappresentano cellule in cui il gene White è stato silenziato dagli effetti dell’eterocromatina. Le chiazze rosse invece rappresentano cellule che esprimono il gene White. Durante lo sviluppo precoce, quando l’eterocromatina si forma per la prima volta, diffonde nell’eucromatina circostante in grado diverso nelle cellule embrionali diverse (vedi Figura 4.31). La presenza di grandi chiazze di cellule rosse e bianche rivela che lo stato di attività trascrizionale, determinato dal compattamento di questo gene in cromatina in quelle cellule progenitrici, viene ereditato da tutte le cellule figlie. CAPITOLO 4 DNA, cromosomi e genomi 206 © 978-88-08-62126-9 mosomiche non istoniche che interagiscono con gli istoni e sono coinvolti nella modificazione o nel mantenimento della struttura della cromatina.Tratteremo come funzionano nelle sezioni che seguono. ■ Gli istoni del nucleo sono modificati covalentemente a livello di molti siti diversi Le catene laterali degli amminoacidi dei quattro istoni del nucleo del nucleosoma sono soggette a una notevole varietà di modificazioni covalenti, fra cui acetilazione di lisine, mono-, di- e trimetilazione di lisine, e fosforilazione di serine (Figura 4.33). Un gran numero di queste modificazioni avviene sulle otto “code degli istoni” N-terminali relativamente non strutturate che sporgono dal nucleosoma (Figura 4.34).Tuttavia ci sono più di 20 modificazioni specifiche di catene laterali anche sul nucleo globulare del nucleosoma. Tutti questi tipi di modificazioni sono reversibili: un enzima serve a creare un particolare tipo di modificazione e un altro a rimuoverlo. Questi enzimi sono molto specifici. Così, per esempio, gruppi acetilici sono aggiunti a lisine specifiche da una serie di istone acetil trasferasi (HAT) diverse e rimossi da una serie di complessi di istone deacetilasi (HDAC). In modo simile gruppi metilici sono aggiunti a catene laterali di lisine da una serie di istone metil trasferasi diverse e rimossi da una serie di istone demetilasi. Ciascun enzima è reclutato in siti specifici sulla cromatina a tempi definiti della vita di ciascuna cellula. Il reclutamento iniziale di questi enzimi dipende in gran parte da proteine che regolano la trascrizione (talvolta chiamate fattori di trascrizione). Queste proteine riconoscono e si legano a specifiche sequenze di DNA del cromosoma (vedi Capitolo 7) e vengono prodotte in tempi diversi durante la vita di un organismo, determinando di conseguenza dove e quando agiranno gli enzimi che modificano la cromatina. Ma, almeno in alcuni casi, le modificazioni covalenti dei nucleosomi possono perdurare a lungo do- (A) L’ACETILAZIONE E LA METILAZIONE DELLA LISINA SONO REAZIONI IN COMPETIZIONE H O N C C H CH2 H H O N C C H CH2 H O N C C H CH2 H O N C C H CH2 H O N C C H CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 CH2 N NH3 C O lisina + N H3C H + N H H3C H + N H3C CH3 + CH3 CH3 CH3 acetil lisina monometil lisina dimetil lisina trimetil lisina (B) FOSFORILAZIONE DELLA SERINA Figura 4.33 Alcuni tipi importanti di modificazioni covalenti di catene laterali di amminoacidi presenti negli istoni dei nucleosomi. (A) Sono mostrati tre diversi livelli di metilazione della lisina; ciascuno di essi può essere riconosciuto da una diversa proteina di legame e quindi può avere un significato diverso per la cellula. Si noti che l’acetilazione rimuove la carica positiva dalla lisina e che, cosa della massima importanza, una lisina acetilata non può essere metilata e viceversa. (B) La fosforilazione della serina aggiunge una carica negativa a un istone. Le modificazioni non mostrate qui sono la mono- e la dimetilazione di un’arginina, la fosforilazione di una treonina, l’aggiunta di ADPribosio a un acido glutammico e l’aggiunta di un gruppo di ubiquitina, di SUMO o di biotina a una lisina. H O N C C H CH2 H O N C C H CH2 OH serina O O O P _ O fosfoserina CAPITOLO 4 DNA, cromosomi e genomi 207 © 978-88-08-62126-9 H3 P A A A A SGRGKQGGKARAKAKTRSSRAGLQFPVGRV H3 1 vista laterale 5 9 H2A 13 15 H4 M P A A A A A PEPAKSAPAPKKGSKKAVTKAQKKDGKKRK 5 12 14 15 20 H2B 2324 A M A A A A M M M M M P M M M P ARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVK H2B H2B 2 H2A 4 9 10 14 1718 23 26 2728 H3 36 H2A H4 A A P M A M M A A SGRGKGGKGLGKGGAKRHRKVLRDNIQGIT H3 H3 H2A 1 3 5 8 12 16 code N-terminali H2B domini globulari H2B H4 LEGENDA: H2A M metilazione H4 20 P fosforilazione A acetilazione vista dal basso (A) (B) po che le proteine regolatrici che le hanno indotte per la prima volta sono scomparse, conservando così una memoria della storia di sviluppo della cellula. Fatto ancora più notevole, questa memoria può essere trasmessa da una generazione cellulare all’altra, come nel fenomeno correlato di variegatura da effetto di posizione visto prima. In differenti gruppi di nucleosomi si trovano molti schemi diversi di modificazioni covalenti, a seconda della loro posizione precisa su un cromosoma e lo stato della cellula. Le modificazioni degli istoni sono controllate accuratamente e hanno conseguenze importanti. L’acetilazione di lisine sulle code N-terminali tende ad allentare la struttura della cromatina, in parte perché l’aggiunta di un gruppo acetilico alle lisine rimuove la loro carica positiva, riducendo così l’affinità delle code per i nucleosomi adiacenti. Tuttavia l’effetto più profondo delle modificazioni degli istoni è la loro capacità di attrarre proteine specifiche in un tratto di cromatina che è stato modificato in modo appropriato. La trimetilazione di una lisina specifica sulla coda dell’istone H3, per esempio, attrae la proteina HP1 specifica per l’eterocromatina e contribuisce al consolidamento e alla diffusione dell’eterocromatina. Più in generale, le proteine reclutate agiscono con gli istoni modificati per determinare come e quando i geni saranno espressi, così come altre funzioni del cromosoma. In questo modo la struttura precisa di un dominio di cromatina determina l’espressione dei geni che contiene e quindi la struttura e la funzione della cellula eucariotica. ■ La cromatina acquisisce un’ulteriore variabilità tramite l’inserzione sito-specifica di una piccola serie di varianti istoniche Oltre ai quattro nuclei istonici standard molto conservati, gli eucarioti contengono anche alcune varianti istoniche che si assemblano nei nucleosomi. Questi istoni sono presenti in quantità notevolmente inferiori rispetto agli istoni principali e sono stati conservati in misura minore durante l’evoluzione. A eccezione dell’istone H4, esistono varianti di ciascuno degli istoni del nucleo; alcuni esempi sono mostrati nella Figura 4.35. Figura 4.34 Le modificazioni covalenti delle code degli istoni del nucleo. (A) La struttura del nucleosoma che evidenzia la posizione dei primi 30 amminoacidi di ciascuna delle sue otto code istoniche N-terminali (verde). (B) Sono indicate le modificazioni ben documentate delle quattro proteine istoniche del nucleo. Sebbene qui sia usato un unico simbolo per la metilazione (M), ciascuna lisina (K) o arginina (R) può essere metilata in diversi modi. Si noti anche che alcune posizioni (per esempio, lisina 9 di H3) possono essere modificate per metilazione o acetilazione, ma non contemporaneamente. La maggior parte delle modificazioni mostrate aggiunge una molecola relativamente piccola alle code degli istoni; l’eccezione è l’ubiquitina, una proteina di 76 amminoacidi usata anche per altri processi cellulari (vedi Figura 3.69). Anche se non mostrate ci sono poi più di 20 modificazioni possibili localizzate nel nucleo globulare degli istoni. (A, codice PDB: 1KX5; B, adattata da H. Santos-Rosa e C. Caldas, Eur. J. Cancer 41:23812402, 2005. Con il permesso di Elsevier.) CAPITOLO 4 DNA, cromosomi e genomi 208 © 978-88-08-62126-9 ripiegamento istonico FUNZIONE SPECIALE H3 H3.3 attivazione trascrizionale CENP-A inserto ad ansa funzione del centromero e assemblaggio del cinetocore H2A H2AX riparazione e ricombinazione del DNA H2AZ espressione genica, segregazione dei cromosomi macroH2A repressione trascrizionale, inattivazione del cromosoma X ripiegamento istonico Figura 4.35 La struttura di alcune varianti istoniche confrontata con l’istone principale che sostituiscono. Questi istoni sono inseriti nei nucleosomi in siti specifici dei cromosomi da enzimi che rimodellano la cromatina dipendenti da ATP che agiscono di concerto con chaperoni degli istoni (vedi Figura 4.27). Una variante CENP-A (centromere protein-A, proteina centromerica A) dell’istone H3 è trattata più avanti in questo capitolo (vedi Figura 4.42); altre varianti sono trattate nel Capitolo 7. Le sequenze colorate in modo differente in ciascuna variante (confrontate con l’istone principale sopra) denotano regioni con una sequenza amminoacidica diversa dalla sequenza corrispondente dell’istone principale. (Adattata da K. Sarma e D. Reinberg, Nat. Rev. Mol. Cell Biol. 6:139-149, 2005. Con il permesso di Macmillan Publishers Ltd.) Gli istoni principali sono sintetizzati soprattutto durante la fase S del ciclo cellulare e assemblati in nucleosomi sulle eliche figlie di DNA appena dietro la forcella di replicazione (vedi Figura 5.32). La maggior parte delle varianti istoniche è invece sintetizzata durante l’interfase. Questi istoni sono spesso inseriti in cromatina già formata, il che richiede un processo di scambio degli istoni catalizzato dai complessi di rimodellamento della cromatina dipendenti da ATP discussi in precedenza. Questi complessi di rimodellamento contengono subunità che ne provocano il legame a siti specifici sulla cromatina e a chaperoni degli istoni con una variante particolare. Come risultato, ciascuna variante istonica è inserita nella cromatina in maniera altamente selettiva (vedi Figura 4.27). ■ Le modificazioni covalenti e le varianti istoniche agiscono in maniera concertata per controllare le funzioni cromosomiche Il numero delle diverse marcature possibili su un singolo nucleosoma è teoricamente enorme e questo potenziale di diversità è ancora più grande se prendiamo in considerazione i nucleosomi che contengono varianti istoniche.Tuttavia, sappiamo che le modificazioni istoniche avvengono in serie coordinate. Nelle cellule di mammifero possono essere identificate più di 15 di queste serie. Non è però ancora chiaro quanti tipi diversi di cromatina sono importanti funzionalmente per la cellula. Alcune combinazioni sembrano avere un significato specifico per la cellula perché determinano come e quando il DNA compattato nei nucleosomi è accessibile o manipolabile, il che ha portato all’ipotesi di un codice istonico. Per esempio, un tipo di marcatura segnala che un tratto di cromatina è stato appena replicato, un altro segnala che il DNA presente in quella cromatina è stato danneggiato e necessita di riparazione, mentre molti altri tipi segnalano quando e dove deve avvenire l’espressione dei geni. Diverse proteine regolatrici contengono piccoli domini che si legano a marcature specifiche, riconoscendo per esempio una lisina 4 trimetilata sull’istone H3 (Fi- CAPITOLO 4 DNA, cromosomi e genomi 209 © 978-88-08-62126-9 CH3 CH3 H3C Zn N+ Zn (A) Arg2 Lys4 Thr6 Thr3 Gln5 (B) (C) Figura 4.36 Il modo in cui viene letta la marcatura su un nucleosoma. La figura mostra la struttura di un modulo proteico (definito dominio ING PHD) che riconosce specificamente l’istone H3 trimetilato sulla lisina 4. (A) Gruppo trimetilico. (B) Modello a spazio pieno di un dominio ING PHD legato alla coda di un istone (verde, con il gruppo trimetilico evidenziato in giallo). (C) Un modello a nastro che mostra come vengono riconosciuti i sei amminoacidi N-terminali della coda di H3. Le linee rosse rappresentano i legami idrogeno. Questo è un membro della famiglia di domini PHD che riconoscono lisine metilate sugli istoni; domini diversi si legano strettamente a lisine che si trovano in posizioni diverse e possono anche distinguere fra una lisina mono-, di- e trimetilata. In modo simile altri piccoli moduli proteici riconoscono catene laterali di istoni specifici che sono stati marcati con gruppi acetilici, gruppi fosfato e così via. (Adattata da P.V. Peña et al., Nature 442:100-103, 2006. Con il permesso di Macmillan Publishers Ltd.) gura 4.36). Questi domini sono spesso associati in modo da formare moduli in una singola grande proteina o complesso proteico, che in questo modo riconosce una specifica combinazione di modificazioni istoniche (Figura 4.37). Il risultato è un complesso che legge il codice (o di lettura), che permette a particolari combinazioni di marcature della cromatina di attrarre ulteriori complessi proteici che svolgono una funzione biologica appropriata nel momento giusto (Figura 4.38). Le marcature sui nucleosomi dovute a modificazioni covalenti degli istoni sono dinamiche e vengono costantemente rimosse e aggiunte a velocità che dipendono dalle loro posizioni cromosomiche. Poiché le code degli istoni si estendono verso l’esterno a partire dal nucleo dei nucleosomi ed è probabile che siano accessibili anche quando la cromatina è condensata, si uscita della coda H3 dal nucleo N-terminale Ala uscita della coda H4 dal nucleo Figura 4.37 Riconoscimento di una specifica combinazione di marcature su un nucleosoma. Nell’esempio mostrato due domini adiacenti che sono parte del complesso di rimodellamento della cromatina NURF (nucleosome remodelling factor, fattore di rimodellamento nucleosomico) legano il nucleosoma, con il dominio PHD (rosso) che riconosce una lisina 4 di H3 metilata e un altro dominio (un bromodominio, azzurro) che riconosce una lisina 16 di H4 acetilata. Queste due marcature istoniche costituiscono uno schema di modificazione unico che avviene in sottogruppi di nucleosomi nelle cellule umane. Qui le due code istoniche sono indicate da linee verdi tratteggiate ed è mostrata solo metà di un nucleosoma. (Modificata da A.J. Ruthenburg et al., Cell 145:692-706, 2011. Con il permesso di Elsevier.) CAPITOLO 4 DNA, cromosomi e genomi 210 © 978-88-08-62126-9 Figura 4.38 Disegno schematico moduli proteici che si legano a modificazioni specifiche degli istoni sul nucleosoma che mostra il modo in cui una particolare combinazione di modificazioni istoniche può essere riconosciuta da un complesso che legge il codice. Un grande complesso proteico che contiene una serie di moduli proteici, ciascuno dei quali riconosce una marcatura istonica specifica, è illustrato schematicamente (verde). Questo “complesso che legge il codice” si legherà con forza soltanto su una regione di cromatina che contiene alcune delle marcature istoniche che riconosce. Perciò soltanto una combinazione specifica di marcature farà legare il complesso alla cromatina e attrarrà ulteriori complessi proteici (viola) necessari per catalizzare una funzione biologica. proteina impalcatura complesso che legge il codice modificazione covalente sulla coda di un istone (marcatura) IL COMPLESSO CHE LEGGE IL CODICE SI LEGA E ATTRAE ALTRE COMPONENTI complesso proteico con attività catalitica e ulteriori siti di legame attacco ad altri componenti nel nucleo, che porta all’espressione genica, al silenziamento genico o a un’altra funzione biologica Figura 4.39 Alcuni significati specifici delle modificazioni istoniche. (A) Sono mostrate le modificazioni sulla coda N-terminale dell’istone H3, come nella Figura 4.34. (B) La coda di H3 può essere marcata da combinazioni diverse di modificazioni che agiscono in combinazione per conferire un significato specifico. Sono noti soltanto pochi significati, fra i quali i tre esempi mostrati. Non è illustrato il fatto che, come abbiamo appena detto (vedi Figura 4.38), la lettura di una marcatura istonica in genere coinvolge il contemporaneo riconoscimento di marcature in altri siti nel nucleosoma insieme al riconoscimento della coda dell’istone H3, come indicato. Inoltre sono generalmente richiesti livelli specifici di metilazione (gruppi mono-, di- o trimetilici). Quindi, per esempio, la trimetilazione della lisina 9 attrae la proteina specifica dell’eterocromatina HP1, che induce un’onda di diffusione di ulteriore trimetilazione della lisina 9 seguita da un ulteriore attacco di HP1, secondo lo schema generale che verrà illustrato fra breve (vedi Figura 4.40). In questo processo è anche importante, tuttavia, la trimetilazione sinergica sulla lisina 20 della coda N-terminale dell’istone H4. ritiene che costituiscano un substrato particolarmente adatto a creare marcature in una forma che può essere facilmente alterata quando cambiano le necessità della cellula. Sebbene resti ancora molto da scoprire sul significato delle numerose diverse combinazioni del codice istonico, alcuni esempi ben studiati dell’informazione che può essere codificata nella coda dell’istone H3 sono elencati nella Figura 4.39. (A) A M M M P A M A M A M A M M P M R K KS K RK K RK S K 2 4 9 10 14 17 18 23 26 27 28 36 (B) stato di modificazione istone H3 “significato” trimetile M formazione di eterocromatina, silenziamento genico K 9 trimetile M A K K 4 9 espressione genica trimetile M K 27 silenziamento genico (complesso repressore Polycomb) CAPITOLO 4 DNA, cromosomi e genomi 211 © 978-88-08-62126-9 ■ Un complesso di proteine di lettura e di scrittura del codice può diffondere modificazioni specifiche della cromatina a grande distanza lungo un cromosoma Il fenomeno della variegatura da effetto di posizione descritto in precedenza richiede che almeno alcune forme modificate di cromatina abbiano la capacità di diffondere per notevoli distanze lungo una molecola di DNA cromosomico (vedi Figura 4.31). In che modo ciò può accadere? Gli enzimi che modificano gli istoni (o rimuovono modificazioni) nei nucleosomi fanno parte di complessi multisubunità e possono essere portati all’inizio in una particolare regione di cromatina da una delle proteine che legano sequenze specifiche di DNA (proteine che regolano la trascrizione), che tratteremo nei Capitoli 6 e 7 (per un esempio specifico, vedi Figura 7.20). Ma dopo che un enzima modificatore ha “scritto” la sua sigla su uno o più nucleosomi adiacenti, possono seguire eventi che assomigliano a una reazione a catena. In questo caso l’enzima che “scrive il codice” lavora insieme a una proteina che “legge il codice” situata nello stesso complesso proteico. La proteina che legge il codice contiene un modulo che riconosce la marcatura e si lega con forza al nucleosoma appena modificato (vedi Figura 4.36), posizionando il suo enzima di scrittura attaccato vicino a un nucleosoma adiacente.Tramite molti di questi cicli di lettura e scrittura la proteina di lettura può portare l’enzima di scrittura lungo il DNA, diffondendo la marcatura passo dopo passo lungo il cromosoma (Figura 4.40). In realtà il processo è più complicato dello schema appena descritto. Sia i lettori che gli scrittori fanno parte di un complesso di proteine che contiene proteina che regola i geni enzima che modifica gli istoni (di scrittura) Figura 4.40 Il modo in cui il proteina di lettura del codice modificazione dell’istone (marcatura) IL NUOVO COMPLESSO DI LETTURA-SCRITTURA SI LEGA RIPETIZIONI DIFFUSIONE DELL’ONDA DI CONDENSAZIONE DELLA CROMATINA reclutamento di un complesso di lettura-scrittura può diffondere cambiamenti della cromatina lungo un cromosoma. Lo scrittore è un enzima che crea modificazioni specifiche su uno o più dei quattro istoni del nucleosoma. Dopo il suo reclutamento in un sito specifico di un cromosoma da parte di una proteina che regola la trascrizione, la proteina di scrittura collabora con una proteina che legge il codice per diffondere la sua marcatura da nucleosoma a nucleosoma per mezzo del complesso di letturascrittura indicato. Affinché questo meccanismo funzioni il lettore deve riconoscere la stessa modificazione degli istoni prodotta dalla proteina di scrittura: il suo legame alla marcatura può attivare la proteina di scrittura. In questo esempio schematico è indotta un’onda di diffusione della condensazione della cromatina. Non sono mostrate le altre proteine coinvolte, compreso un complesso rimodellatore della cromatina ATP-dipendente necessario per riposizionare i nucleosomi modificati. CAPITOLO 4 DNA, cromosomi e genomi 212 © 978-88-08-62126-9 probabilmente più lettori e scrittori e che per diffondere richiede marcature multiple sul nucleosoma. Inoltre molti di questi complessi lettori-scrittori contengono anche proteine di rimodellamento della cromatina dipendenti da ATP (vedi Figura 4.26C); le proteine di lettura, di scrittura e di rimodellamento lavorano di concerto per decondensare o condensare lunghi tratti di cromatina man mano che il lettore si sposta progressivamente lungo il DNA compattato nei nucleosomi. Un processo simile è usato per rimuovere le modificazioni istoniche da una regione specifica del DNA; in questo caso un “enzima che cancella”, come un’istone metilasi o un’istone deacetilasi, viene reclutato nel complesso. Come per il complesso di scrittura della Figura 4.40, proteine che legano il DNA in maniera sequenza-specifica (regolatori della trascrizione) danno istruzioni su dove debbano avvenire queste modificazioni (vedi Capitolo 7). Ci si può fare un’idea della complessità dei processi appena descritti dai risultati degli screening genetici per geni mutanti che fanno aumentare o sopprimono la diffusione e la stabilità dell’eterocromatina in test della variegatura da effetto di posizione nella Drosophila (vedi Figura 4.32). Come abbiamo osservato in precedenza, sono noti più di 100 geni di questo tipo, la maggior parte dei quali codifica probabilmente delle subunità in uno o più complessi proteici di lettura-scrittura-rimodellamento. ■ Sequenze barriera di DNA bloccano la diffusione dei complessi di lettura-scrittura separando così domini adiacenti di cromatina Il meccanismo appena descritto per la diffusione di strutture di cromatina solleva un possibile problema. Poiché ciascun cromosoma consiste di una molecola ininterrotta di DNA molto lunga, che cosa impedisce che domini adiacenti di cromatina “parlino” fra loro creando confusione? I primi studi sulla variegatura da effetto di posizione avevano suggerito una risposta: l’esistenza di sequenze specifiche di DNA che separano un dominio di cromatina dall’altro (vedi Figura 4.31). Oggi sono state identificate e caratterizzate diverse sequenze barriera di questo tipo mediante l’uso di tecniche di ingegneria genetica che permettono di rimuovere o di aggiungere ai cromosomi regioni specifiche di sequenza di DNA. Per esempio, in cellule destinate a dare origine a eritrociti, una sequenza chiamata HS4 separa normalmente il dominio di cromatina attiva che contiene il locus della b-globina umana da una regione adiacente di cromatina condensata silenziata negli eritrociti. Se questa sequenza viene deleta, il locus della b-globina viene invaso da cromatina condensata. Questa cromatina silenzia i geni che ricopre e diffonde in grado diverso in cellule diverse, creando uno schema di variegatura da effetto di posizione simile a quello osservato nella Drosophila. Come descritto nel Capitolo 7, questa invasione ha conseguenze disastrose: i geni della globina sono espressi a basso livello e gli individui portatori di questa delezione soffrono di una forma grave di anemia. In esperimenti di ingegneria genetica la sequenza HS4 viene spesso aggiunta alle estremità di un gene che viene inserito in un genoma di mammifero, per proteggere il gene dal silenziamento causato dalla diffusione dell’eterocromatina. L’analisi di questa sequenza barriera rivela che essa contiene un gruppo di siti di legame per enzimi istone acetilasi. Dal momento che l’acetilazione di una catena laterale di lisina è incompatibile con la metilazione della stessa catena laterale, e metilazioni specifiche della lisina sono necessarie per diffondere l’eterocromatina, le istone acetilasi e le istone deacetilasi sono candidati logici per la formazione di barriere sul DNA che bloccano la diffusione di forme diverse di cromatina (Figura 4.41). Tuttavia sono noti diversi altri tipi di modificazione della cromatina che proteggono i geni dal silenziamento. ■ La cromatina dei centromeri rivela il modo in cui le varianti istoniche possono creare strutture speciali I nucleosomi che portano varianti istoniche hanno caratteri distintivi e si pensa che possano produrre marcature nella cromatina che hanno una du- CAPITOLO 4 DNA, cromosomi e genomi 213 © 978-88-08-62126-9 (A) Figura 4.41 Alcuni meccanismi poro nucleare eterocromatina in diffusione eucromatina proteina barriera (B) proteina barriera (C) proteina barriera rata insolitamente lunga. Un esempio importante è fornito dalla formazione e dall’ereditarietà della struttura specializzata della cromatina che si trova sui centromeri, la regione di DNA di ciascun cromosoma necessaria per l’attacco al fuso mitotico, e dalla segregazione ordinata delle copie duplicate del genoma nelle cellule figlie a ogni divisione cellulare. In molti organismi complessi, compreso l’uomo, ciascun centromero è immerso in un tratto molto esteso di eterocromatina centromerica che permane per tutta l’interfase, anche se l’attacco al fuso mediato dal centromero e il movimento diretto dal centromero del DNA avvengono soltanto durante la mitosi. Questa cromatina contiene una variante dell’istone H3 specifica del centromero, nota come CENP-A (centromeric protein-A: proteina A del centromero, vedi Figura 4.35), oltre a ulteriori proteine che compattano i nucleosomi in disposizioni particolarmente dense e formano il cinetocore, la struttura speciale necessaria per l’attacco del fuso mitotico (vedi Figura 4.19). Una sequenza specifica di DNA di circa 125 coppie di nucleotidi è sufficiente come centromero nel lievito S. cerevisiae. Nonostante le piccole dimensioni, più di una decina di proteine diverse si assembla su questa sequenza di DNA; le proteine comprendono la variante dell’istone H3 CENP-A che, insieme agli altri tre istoni del nucleo, forma un nucleosoma centromero-specifico. Le proteine addizionali che si legano al centromero del lievito attaccano questo nucleosoma a un singolo microtubulo del fuso mitotico del lievito (Figura 4.42). I centromeri degli organismi più complessi sono considerevolmente più grandi di quelli presenti nei lieviti gemmanti. Per esempio, i centromeri della mosca e dell’uomo si estendono per centinaia di migliaia di coppie di nucleotidi e, pur contenendo CENP-A, non sembrano contenere una sequenza di DNA centromero-specifica. Questi centromeri consistono di brevi sequenze ripetute di DNA, note come DNA satellite alfa nell’uomo. Ma le stesse sequenze ripetute si trovano anche in altre posizioni (non centromeriche) sui cromosomi, il che indica che non sono sufficienti a dirigere la formazione del centromero. Ancora più sorprendente è il fatto che, in alcuni casi insoliti, è stata osservata la formazione spontanea di nuovi centromeri umani (chiamati neocentromeri) su cromosomi frammentati. Alcune delle nuove posizioni erano in origine eucromatiche e del tutto prive di DNA satellite alfa (Figura 4.43). Sembra perciò che i centromeri degli organismi complessi siano definiti da un gruppo di proteine e non da una sequenza specifica di DNA. dellÕazione di barriera. Questi modelli sono derivati da analisi diverse dell’azione di barriera; una combinazione di alcuni di essi può funzionare in qualunque sito. (A) L’attacco di una regione di cromatina a un grande sito fisso, come il complesso del poro nucleare illustrato qui, può formare una barriera che blocca la diffusione dell’eterocromatina. (B) Lo stretto legame di proteine barriera a un gruppo di nucleosomi può competere con la diffusione dell’eterocromatina. (C) Reclutando un gruppo di enzimi molto attivi che modificano gli istoni, le barriere possono cancellare le marcature istoniche necessarie per la diffusione dell’eterocromatina. Per esempio, una potente acetilazione della lisina 9 sull’istone H3 competerà con la metilazione della lisina 9, impedendo così l’attacco della proteina HP1 necessario per produrre alcune forme di eterocromatina. (Basata su A.G. West e P. Fraser, Hum. Mol. Genet. 14:R101-R111, 2005. Con il permesso della Oxford University Press.) CAPITOLO 4 DNA, cromosomi e genomi 214 © 978-88-08-62126-9 Figura 4.42 Un modello per la struttura di un semplice centromero. (A) Nel lievito Saccharomyces cerevisiae una sequenza speciale di DNA centromerico assembla un singolo nucleosoma in cui due copie di una variante H3 istonica (chiamata CENP-A nella maggior parte degli organismi) sostituiscono l’H3 normale. (B) Viene mostrato il modo in cui sequenze peptidiche esclusive di questa variante istonica (vedi Figura 4.35) aiutano ad assemblare ulteriori proteine, alcune delle quali formano un cinetocore. Il cinetocore di lievito è insolito in quanto cattura un solo microtubulo; gli esseri umani hanno centromeri molto più grandi e formano cinetocori che possono catturare 20 o più microtubuli (vedi Figura 4.43). Il cinetocore è discusso in dettaglio nel Capitolo 17. (Adattata da A. Joglekar et al., Nat. Cell Biol. 8:581-585, 2006. Con il permesso di Macmillan Publishers Ltd.) nucleosoma normale nucleosoma con istone H3 specifico del centromero (A) proteina che lega una sequenza specifica di DNA DNA centromerico di lievito microtubulo cinetocore di lievito (B) nucleosoma specifico del centromero ripetizione di ordine superiore monomero di DNA satellite alfa (171 coppie di nucleotidi) centromero attivo (A) eterocromatina pericentrica centromero inattivo con DNA satellite alfa non funzionale Figura 4.43 La prova della plasticità della formazione del centromero umano. (A) Una serie di sequenze ricche di A-T di DNA satellite alfa è ripetuta molte migliaia di volte in ciascun centromero umano (rosso), circondata da eterocromatina pericentrica (marrone). Tuttavia, a causa di un antico evento di rottura e riunione del cromosoma, alcuni cromosomi umani contengono due blocchi di DNA satellite alfa, ciascuno dei quali funzionava presumibilmente da centromero nel suo cromosoma originale. Di solito questi cromosomi dicentrici non vengono propagati stabilmente perché si attaccano in modo inappropriato al fuso e si spezzano durante la mitosi. Nei cromosomi che riescono a sopravvivere, però, uno dei centromeri è stato in qualche modo inattivato, anche se contiene tutte le sequenze di DNA necessarie. Ciò permette al cromosoma di essere propagato stabilmente. (B) Cromosomi extra si osservano nelle cellule di una piccola frazione (1/2000) (B) neocentromero formato senza DNA satellite alfa di neonati umani. Alcuni di questi cromosomi extra, che si sono formati per un evento di rottura, sono del tutto privi di DNA satellite alfa, eppure nuovi centromeri (neocentromeri) si sono generati da ciò che in origine era DNA eucromatico. La complessità della cromatina centromerica non è illustrata in questi disegni. Il DNA satellite alfa che forma la cromatina centromerica negli esseri umani è impacchettato in blocchi alternati. Un blocco è formato da una lunga stringa di nucleosomi che contengono la variante CENP-A dell’istone H3; l’altro blocco contiene nucleosomi che sono marcati in modo speciale con lisina 4 dimetilica sul cromosoma H3 normale. Ogni blocco è più lungo di 1000 nucleotidi. La cromatina centromerica è circondata da eterocromatina pericentrica, come mostrato. La cromatina pericentrica contiene lisina 9 metilata sull’istone H3, insieme alla proteina HP1, ed è un esempio di eterocromatina “classica” (vedi Figura 4.39). L’inattivazione di alcuni centromeri e la formazione de novo di altri sembra avere svolto un ruolo essenziale nell’evoluzione. Specie diverse, anche strettamente correlate, hanno spesso un numero di cromosomi differente; si veda la Figura 4.14 per un esempio estremo. Come discuteremo in seguito, una comparazione dettagliata dei genomi mostra che in molti casi il cambiamento nel numero di cromosomi si è generato per mezzo di eventi di rottura e riunione dei cromosomi preesistenti, creando in questo modo nuovi cromosomi, alcuni dei quali all’inizio devono aver avuto un numero di centromeri anomalo, CAPITOLO 4 DNA, cromosomi e genomi 215 © 978-88-08-62126-9 anche più di uno o nessuno.Tuttavia, un’ereditarietà stabile richiede che ciascun cromosoma contenga un unico centromero. Sembra che i centromeri soprannumerari siano stati disattivati e/o nuovi centromeri siano stati creati in modo da permettere che la configurazione riarrangiata dei cromosomi fosse mantenuta stabilmente. ■ Alcune strutture della cromatina possono essere ereditate direttamente I cambiamenti nell’attività dei centromeri appena trattati, una volta stabiliti, devono essere perpetuati attraverso le generazioni cellulari seguenti. Quale potrebbe essere il meccanismo alla base di questo tipo di ereditarietà epigenetica? È stato proposto che la formazione de novo di un centromero richieda un evento iniziale di semina, che comporta la formazione di una struttura specializzata DNA-proteina che contiene nucleosomi formati con la variante CENP-A dell’istone H3. Negli esseri umani questo evento di semina avviene più facilmente su serie di DNA satellite alfa che su altre sequenze di DNA. I tetrameri H3-H4 di ciascun nucleosoma dell’elica di DNA parentale sono ereditati direttamente dalle eliche di DNA figlie a livello della forcella di replicazione (vedi Figura 5.32). Perciò, una volta che una serie di nucleosomi che contengono CENP-A è stata assemblata su un tratto di DNA, è facile comprendere come si possa generare un nuovo centromero nello stesso punto di entrambi i cromosomi figli dopo ciascun ciclo di divisione cellulare. Bisogna solo assumere che la presenza di un istone CENP-A presente in un nucleosoma ereditato recluti selettivamente altri istoni CENP-A nelle sue nuove vicinanze. Esistono delle somiglianze sorprendenti fra la formazione e il mantenimento dei centromeri e la formazione e il mantenimento di altre regioni di eterocromatina. In particolare, l’intero centromero si forma come un’entità “tutto o nulla”, suggerendo che la creazione della cromatina centromerica sia un processo altamente cooperativo, che emerge a partire da un evento iniziale, in un modo che ricorda il fenomeno della variegatura da effetto di posizione che abbiamo trattato in precedenza. In entrambi i casi una struttura particolare di cromatina, una volta formata, sembra essere ereditata direttamente sul DNA dopo ogni ciclo di replicazione cromosomica. Quindi un reclutamento cooperativo di proteine, insieme all’azione di complessi scrittori-lettori, può non solo spiegare la diffusione di forme di cromatina specifiche nello spazio lungo il cromosoma, ma anche la sua propagazione attraverso le generazioni cellulari, dalla cellula parentale alla cellula figlia (Figura 4.44). Figura 4.44 Il modo in cui il proteine dell’eterocromatina nucleosomI modificazione degli istoni eterocromatina eucromatina DUPLICAZIONE DEL CROMOSOMA NUOVE PROTEINE DELL’ETEROCROMATINA AGGIUNTE A ISTONI MODIFICATI IN MODO APPROPRIATO eterocromatina eucromatina eterocromatina eucromatina compattamento del DNA nella cromatina può essere ereditato durante la replicazione del cromosoma. In questo modello alcuni dei componenti specializzati della cromatina sono distribuiti a ciascun cromosoma figlio dopo la duplicazione del DNA, insieme ai nucleosomi marcati in modo speciale a cui si legano. Dopo la replicazione del DNA i nucleosomi ereditati che sono modificati in modo speciale, agendo di concerto con i componenti ereditati della cromatina, cambiano lo schema di modificazione degli istoni sui nucleosomi figli circostanti appena formati. Ciò crea nuovi siti di legame per gli stessi componenti della cromatina, che si assemblano quindi per completare la struttura. Quest’ultimo processo coinvolge probabilmente complessi lettorescrittore-rimodellamento che agiscono in maniera simile a quella illustrata in precedenza nella Figura 4.40. CAPITOLO 4 DNA, cromosomi e genomi 216 © 978-88-08-62126-9 ■ Esperimenti con embrioni di rana suggeriscono che sia le strutture di cromatina attivanti che quelle inattivanti possano essere ereditate epigeneticamente L’ereditarietà epigenetica ha un ruolo centrale nella creazione degli organismi pluricellulari. I loro tipi cellulari differenziati si stabilizzano durante lo sviluppo e persistono una volta differenziati nonostante cicli ripetuti di divisioni cellulari. Le figlie di una cellula del fegato continuano a esistere come cellule del fegato, quelle di una cellula epidermica come cellule epidermiche e così via, nonostante contengano lo stesso patrimonio genetico; ciò può avvenire perché gli schemi caratteristici di espressione genica sono trasmessi fedelmente dalla cellula parentale alla cellula figlia. La struttura della cromatina ha un ruolo in questa trasmissione epigenetica dell’informazione da una generazione cellulare alla successiva. Prove al riguardo vengono da studi in cui il nucleo di una cellula di una rana o di un girino è trapiantato in una cellula uovo di rana il cui nucleo è stato rimosso (una cellula uovo enucleata). Una serie di esperimenti classici svolti nel 1968 ha dimostrato che un nucleo preso da una cellula donatrice differenziata può essere riprogrammato in questo modo per sostenere lo sviluppo di un nuovo girino (vedi Figura 7.2). Questa riprogrammazione avviene però con difficoltà e diventa sempre meno efficiente se si usano nuclei di animali più vecchi: per esempio, meno del 2% di oociti enucleati iniettati con un nucleo derivante da una cellula epiteliale di un girino allo stadio di girino che nuota, invece del 35% quando i nuclei donatori sono stati presi da un embrione precoce (stadio di gastrula). Con nuovi strumenti sperimentali ora si può individuare la causa di questa resistenza alla riprogrammazione. Essa ha origine, almeno in parte, perché specifiche strutture di cromatina nel nucleo originario differenziato tendono a persistere e a essere trasmesse attraverso i molti cicli di divisione cellulare necessari allo sviluppo dell’embrione. In esperimenti con embrioni di Xenopus è stato dimostrato che strutture di cromatina sia attivanti che inattivanti possono persistere per 24 cicli di divisione cellulare, causando l’espressione di geni in zone non corrette. La Figura 4.45 descrive brevemente uno di questi esperimenti, incentrato sulla cromatina contenente la variante istonica H3.3.Torneremo su questi fenomeni nella parte finale del Capitolo 22, dove tratteremo le cellule staminali e i modi in cui un tipo cellulare si trasforma in un altro. ■ Le strutture della cromatina sono importanti per la funzione dei cromosomi eucariotici Sebbene resti ancora molto da scoprire sulle funzioni delle diverse strutture della cromatina, il compattamento del DNA nei nucleosomi è stato probabilmente cruciale per l’evoluzione di eucarioti come gli esseri umani. L’evoluzione di organismi pluricellulari complessi sembra poter avvenire soltanto se le cellule di linee diverse possono specializzarsi cambiando l’accessibilità e l’attività di molte centinaia di geni. Come vedremo nel Capitolo 21, ciascuna cellula conserva la memoria della storia passata del suo sviluppo nei circuiti regolatori che controllano i suoi molti geni. Sembra che questa memoria sia in parte conservata nella struttura della cromatina. Sebbene anche i batteri abbiano meccanismi di memoria cellulare, la complessità dei circuiti di memoria negli eucarioti superiori è senza precedenti. Strategie basate sulle variazioni locali della struttura della cromatina, caratteristica unica degli eucarioti, possono far sì che singoli geni, una volta accesi o spenti, possano restare in quello stato finché nuovi fattori non intervengono per invertire la loro condizione. A un estremo si trovano le strutture come l’eterocromatina centromerica che, una volta formate, vengono ereditate stabilmente da una generazione cellulare alla successiva. Alla stessa maniera, il tipo più importante di eterocromatina “classica”, che contiene lunghe file della proteina HP1 (vedi Figura 4.39), può persistere stabilmente per tutta la vita, mentre una forma di cromatina condensata generata dal gruppo di proteine Polycomb serve per silenziare geni che devono essere mantenuti inattivi in certe condizioni, ma che sono attivi in altre. Quest’ultimo tipo di eterocro- CAPITOLO 4 DNA, cromosomi e genomi 217 © 978-88-08-62126-9 cellule dei somiti che esprimono MyoD oocita enucleato embrione di Xenopus donatore trasferimento nucleare embrione allo stadio di 2 cellule iniezione di mRNA codificante H3.3 normale nessuna iniezione (controllo) iniezione di mRNA codificante H3.3 mutante embrione allo stadio di blastula le cellule sono analizzate per quantificare l’espressione di MyoD e la presenza dell’istone H3.3 sul promotore di MyoD MEMORIA EPIGENETICA DI MyoD ALTA (è prodotta molta proteina MyoD) MEMORIA EPIGENETICA DI MyoD MODERATA MEMORIA EPIGENETICA DI MyoD BASSA (è prodotta poca proteina MyoD) matina silenzia un elevato numero di geni che codificano proteine regolatrici della trascrizione durante lo sviluppo embrionale precoce, come vedremo nel Capitolo 21. Esistono molte altre forme di cromatina, alcune con una vita molto più breve, spesso inferiore al tempo di divisione della cellula. Tratteremo la varietà di tipi di cromatina più in dettaglio nella prossima sezione. SOMMARIO Nonostante l’assemblaggio uniforme del DNA cromosomico nei nucleosomi, negli organismi eucariotici è possibile una grande varietà di strutture diverse della cromatina. Questa varietà si basa su un’ampia serie di modificazioni covalenti reversibili dei quattro istoni del nucleo del nucleosoma. Queste modificazioni comprendono mono-, di- e trimetilazione di molte catene laterali di lisine diverse, una reazione importante che è incompatibile con l’acetilazione delle stesse lisine. Combinazioni specifiche delle modificazioni marcano molti nucleosomi, governando così la loro interazione con altre proteine. Queste marcature vengono lette quando moduli proteici che fanno parte di un complesso proteico più grande si legano ai nucleosomi modificati in una regione di cromatina. Queste proteine che leggono il codice attraggono quindi ulteriori proteine che svolgono funzioni diverse. Alcuni complessi di proteine che leggono il codice contengono un enzima che modifica gli istoni, come un’istone metilasi, che “scrive” lo stesso segno recepito dal lettore del codice. Un complesso di lettura-scrittura-rimodellamento di questo tipo può diffondere una forma specifica di cromatina a grandi distanze lungo un cromosoma. In particolare, si pensa che grandi regioni di eterocromatina condensata si formino in questo modo. L’eterocromatina si trova comunemente intorno ai centromeri e vicino ai telomeri, ma è presente anche in molte altre posizioni sui cromosomi. Lo stretto compattamento del DNA in eterocromatina di solito silenzia i geni al suo interno. Il fenomeno della variegatura da effetto di posizione fornisce una buona prova dell’ereditarietà diretta di forme condensate di cromatina da una generazione cellulare all’altra. Sembra che un meccanismo simile sia responsabile del mantenimento della cromatina specializzata dei centromeri. Più in generale, la capacità di trasmettere strutture specifiche di cromatina da una generazione cellulare alla successiva fornisce le basi di un processo di memoria cellulare epigenetico che è probabilmente cruciale per il mantenimento della complessa serie di diversi stati cellulari richiesti dagli organismi pluricellulari complessi. ● Figura 4.45 Dimostrazione dell’ereditarietà di uno stato della cromatina che attiva geni. Il gene ben caratterizzato MyoD codifica una delle principali proteine regolatrici della trascrizione nel muscolo, MyoD (vedi p. 420). Normalmente questo gene è espresso nella regione del giovane embrione indicata, dove si formano i somiti. Quando un nucleo derivante da questa regione viene iniettato in un oocita enucleato come mostrato, molti nuclei cellulari della progenie esprimono in maniera anomala la proteina MyoD in regioni non muscolari dell’”embrione da trapianto nucleare” che si forma. Questa espressione anormale può essere attribuita al mantenimento della regione promotrice di MyoD nel suo stato di cromatina attiva attraverso i molti cicli di divisione cellulare che producono lo stato embrionale di blastula, una cosiddetta “memoria epigenetica”, che in questo caso persiste in assenza di trascrizione. La cromatina attiva che circonda il promotore di MyoD contiene la variante istonica H3.3 (vedi Figura 4.35) in una forma metilata in Lys4. Come indicato, una sovrapproduzione di questo istone causata iniettando mRNA codificante la proteina H3.3 normale in eccesso, aumenta sia l’occupazione del promotore di MyoD da parte di H3.3, sia la produzione epigenetica di MyoD, mentre l’iniezione di un mRNA che codifica una forma mutante di H3.3 che non può essere metilata nella Lys4 riduce la produzione epigenetica di MyoD. Questi esperimenti forniscono la prova che l’ereditarietà di un certo stato della cromatina è responsabile della memoria epigenetica osservata. (Adattata da R.K. Ng e J.B. Gurdon, Nat. Cell Biol. 10:102-109, 2008. Con il permesso di Macmillan Publishers Ltd.) CAPITOLO 4 DNA, cromosomi e genomi 218 © 978-88-08-62126-9 cromatina estesa in un dominio ad ansa 10 µm cromatidi fratelli cromatina meno condensata cromatina altamente condensata Figura 4.46 Un modello per i domini di cromatina in un cromosoma a spazzola. È mostrata una piccola parte di una coppia di cromatidi fratelli. Qui due doppie eliche di DNA identiche sono allineate fianco a fianco, compattate in due tipi diversi di cromatina. La serie di cromosomi a spazzola in molti anfibi contiene un totale di circa 10 000 anse di cromatina che assomigliano a quelle mostrate qui. Il resto del DNA in ciascun cromosoma (la grande maggioranza) resta altamente condensato. Quattro copie di ciascuna ansa sono presenti in ogni cellula, poiché ciascuno dei due cromosomi mostrati in alto consiste di due cromosomi appena replicati strettamente giustapposti. Questa struttura a quattro filamenti è caratteristica di questo momento dello sviluppo dell’oocita, che è stato fermato allo stadio di diplotene della meiosi; vedi Figura 17.56. Figura 4.47 Cromosomi a spazzola. (A) Una fotografia al microscopio ottico di cromosomi a spazzola di un oocita di anfibio. In una fase precoce del differenziamento dell’oocita ciascun cromosoma si replica per iniziare la meiosi e i cromosomi omologhi replicati si appaiano formando questa struttura molto estesa che contiene un totale di quattro molecole replicate di DNA, o cromatidi. Lo stadio del cromosoma a spazzola perdura per mesi o anni, mentre l’oocita accumula una scorta di materiali necessari per il suo sviluppo finale in un nuovo individuo. (B) Una regione ingrandita di un cromosoma simile, colorato con un reagente fluorescente che rende chiaramente visibili le anse attive nella sintesi di RNA. (Per gentile concessione di Joseph G. Gall.) La struttura globale dei cromosomi Dopo aver discusso il DNA e le molecole proteiche che compongono la fibra di cromatina, occupiamoci adesso dell’organizzazione del cromosoma su una scala più globale e del modo in cui i suoi vari domini sono disposti nello spazio. Sotto forma di una fibra di 30 nm un tipico cromosoma umano sarebbe ancora lungo 0,1 cm e capace di attraversare il nucleo più di 100 volte. Chiaramente deve esserci un livello ancora superiore di ripiegamento, anche nei cromosomi interfasici. Sebbene le sue basi molecolari siano ancora in gran parte ignote, il compattamento di ordine superiore quasi certamente comporta il ripiegamento della cromatina in una serie di anse e spirali. Questo compattamento della cromatina è fluido e cambia spesso in risposta alle necessità della cellula. Inizieremo descrivendo alcuni cromosomi interfasici insoliti che possono essere facilmente visualizzati, in quanto si pensa che alcune caratteristiche di questi casi eccezionali siano rappresentative di tutti i cromosomi interfasici. Inoltre essi forniscono un mezzo unico per studiare alcuni aspetti fondamentali della struttura della cromatina che abbiamo incontrato nella sezione precedente. Descriveremo poi il modo in cui un tipico cromosoma interfasico è disposto nel nucleo di una cellula di mammifero. Infine analizzeremo l’ulteriore compattamento di dieci volte che i cromosomi interfasici subiscono durante il passaggio dall’interfase alla mitosi. ■ I cromosomi sono ripiegati in grandi anse di cromatina Informazioni sulla struttura dei cromosomi delle cellule interfasiche sono state ottenute grazie a studi sui rigidi ed estesi cromosomi negli oociti in crescita (uova immature) degli anfibi. Questi cosiddetti cromosomi a spazzola (i cromosomi più grandi conosciuti), appaiati in preparazione alla mitosi, sono chiaramente visibili anche al microscopio ottico: sono organizzati in una serie di grandi anse di cromatina che si dipartono da un asse cromosomico lineare (Figura 4.46 e Figura 4.47). (A) 100 µm (B) 20 µm CAPITOLO 4 DNA, cromosomi e genomi 219 © 978-88-08-62126-9 proteine che legano il DNA formazione di legami crociati sonde a DNA usate per la PCR TRATTAMENTO CON FORMALDEIDE TAGLIO CON NUCLEASI DI RESTRIZIONE Figura 4.48 Un metodo per determinare la posizione delle anse nei cromosomi interfasici. In questa tecnica, nota come metodo di cattura della conformazione dei cromosomi (3C), le cellule sono trattate con formaldeide per creare i legami crociati covalenti indicati DNA-proteina e DNA-DNA. Il DNA viene quindi trattato con una nucleasi di restrizione che spezza il DNA in molti frammenti, tagliando a livello di sequenze nucleotidiche definite strettamente e formando serie di “estremità coesive” identiche (vedi Figura 8.28). Le estremità coesive possono essere unite tramite appaiamento complementare delle basi. Cosa LEGATURA DEL DNA RIMOZIONE DEI LEGAMI CROCIATI MEDIANTE TRATTAMENTO AL CALORE E PROTEOLISI si ottiene un prodotto di DNA soltanto se le proteine tengono insieme le due sequenze di DNA nella cellula importante, prima del passaggio di legatura mostrato il DNA viene diluito in modo che i frammenti che sono stati mantenuti in stretta vicinanza (dai legami crociati) siano quelli che si uniranno con maggiore probabilità. Infine i legami crociati sono spezzati e i frammenti di DNA appena legati sono identificati e quantificati mediante PCR (la reazione a catena della polimerasi, vedi Capitolo 8). Combinando l’informazione di frequenza di associazione generata dalla tecnica 3C con l’informazione di sequenza del DNA si possono produrre modelli strutturali per la conformazione dei cromosomi interfasici. In questi cromosomi una data ansa contiene sempre la stessa sequenza di DNA e rimane estesa nello stesso modo mentre l’oocita cresce. Questi cromosomi stanno producendo grandi quantità di RNA per l’oocita e moltissimi geni presenti nelle anse di DNA sono attivamente espressi. La maggior parte del DNA, tuttavia, non è in forma di anse ma rimane altamente condensata sull’asse del cromosoma, dove i geni sono generalmente non espressi. Si pensa che i cromosomi interfasici di tutti gli eucarioti siano disposti in anse. Sebbene queste anse siano normalmente troppo piccole e fragili per essere osservate facilmente al microscopio ottico, si possono usare altri metodi per dedurne la presenza. Per esempio, è diventato possibile stabilire la frequenza con cui due loci su un cromosoma interfasico si appaiano fra loro, rivelando così probabili candidati per i siti sulla cromatina che formano le basi strettamente giustapposte delle strutture ad ansa (Figura 4.48). Questi e altri esperimenti suggeriscono che il DNA nei cromosomi umani sia organizzato in anse di lunghezze diverse. Una tipica ansa potrebbe contenere da 50 000 a 200 000 coppie di nucleotidi, anche se è stato suggerito che esistano anse di un milione di nucleotidi (Figura 4.49). ■ I cromosomi politenici sono utili in quanto permettono di visualizzare le strutture della cromatina Ulteriori indicazioni sono venute da un’altra particolare classe di cellule, le cellule politeniche delle mosche, come il moscerino della frutta Drosophila. Alcuni tipi di cellule, in molti organismi, diventano di dimensioni enormi tra- Figura 4.49 Un modello per l’organizzazione di un cromosoma interfasico. Una sezione di un cromosoma interfasico è mostrata ripiegata in una serie di domini ad ansa, ciascuno contenente circa 50 000-200 000 coppie di nucleotidi di DNA a doppia elica condensato in una fibra di 30 nm. La cromatina di ogni singola ansa è ulteriormente condensata tramite processi di ripiegamento poco compresi che si invertono quando la cellula richiede un accesso diretto al DNA compattato in queste anse. Non si comprende ancora né la composizione dell’asse cromosomico postulato né come la fibra di 30 nm ripiegata sia ancorata all’asse del cromosoma, ma nei cromosomi mitotici le basi delle anse cromosomiche sono arricchite sia di condensine (trattate più avanti) che di DNA topoisomerasi II (trattate nel Capitolo 5), due proteine che possono formare una buona parte dell’asse in metafase. alto livello di espressione dei geni dell’ansa dominio ad ansa fibra di cromatina ripiegata enzimi che modificano gli istoni complessi che rimodellano la cromatina RNA polimerasi proteine che formano l’impalcatura del cromosoma CONTROLLO DEI SEGMENTI UNITI MEDIANTE PCR CAPITOLO 4 DNA, cromosomi e genomi 220 © 978-88-08-62126-9 Figura 4.50 L’intera serie di cromosomi politenici di una cellula salivare di Drosophila. In questo disegno di una micrografia ottica i cromosomi giganti sono stati sparsi per visualizzarli schiacciandoli contro un vetrino da microscopio. La Drosophila ha quattro cromosomi e sono presenti quattro diverse coppie di cromosomi. Ma ciascun cromosoma è strettamente appaiato con il suo omologo (così che ciascuna coppia appare come una struttura singola), il che non accade nella maggior parte dei nuclei (se non durante la meiosi). Ciascun cromosoma ha subito cicli multipli di replicazione; gli omologhi e tutti i loro duplicati sono rimasti in registro esatto fra loro, formando enormi cavi di cromatina dello spessore di molti filamenti di DNA. I quattro cromosomi politenici sono normalmente uniti fra loro da regioni eterocromatiche vicine ai centromeri che si aggregano formando un singolo grande cromocentro (regione rosa). In questa preparazione, però, il cromocentro è stato spezzato in due dalla tecnica di schiacciamento usata. (Adattata da T.S. Painter, J. Hered. 25:465-476, 1934. Con il permesso della Oxford University Press.) Figura 4.51 Micrografie di cromosomi politenici di ghiandole salivari di Drosophila. (A) Micrografia ottica di una porzione di un cromosoma. Il DNA è stato colorato con un colorante fluorescente, ma qui è presentata un’immagine invertita che rende il DNA nero invece che bianco; le bande si vedono chiaramente come regioni a concentrazione maggiore di DNA. Questo cromosoma è stato sottoposto a un trattamento ad alta pressione per mostrare più chiaramente il suo schema distinto di bande e interbande. (B) Una micrografia elettronica di una piccola sezione di un cromosoma politenico di Drosophila visto in sezione sottile. Si possono distinguere facilmente bande di spessore molto diverso, separate da interbande, che contengono cromatina meno condensata. (A, adattata da D.V. Novikov, I. Kireev e A.S. Belmont, Nat. Methods 4:483-485, 2007. Con il permesso di Macmillan Publishers Ltd.; B, per gentile concessione di Veikko Sorsa.) braccio destro del cromosoma 2 cromosomi mitotici normali alla stessa scala regione in cui due cromosomi omologhi sono separati braccio sinistro del cromosoma 2 cromosoma X cromosoma 4 cromocentro braccio sinistro del cromosoma 3 20 µm braccio destro del cromosoma 3 mite cicli multipli di sintesi di DNA senza divisione cellulare. Queste cellule che contengono più del normale corredo di DNA sono dette poliploidi. Nelle ghiandole salivari delle larve di moscerino questo processo è portato a un grado estremo, generando cellule enormi che contengono centinaia o migliaia di copie del genoma. Inoltre, in questo caso, tutte le copie di ciascun cromosoma sono tenute insieme fianco a fianco in perfetto registro, come cannucce in una scatola, creando grandi cromosomi politenici. Questi cromosomi permettono di evidenziare caratteristiche che si pensa siano in comune con cromosomi normali in interfase, ma che sono difficili da vedere. Quando i cromosomi politenici di una ghiandola salivare di moscerino vengono osservati al microscopio ottico, sono visibili bande scure e interbande chiare alternate (Figura 4.50), ciascuna formata da un migliaio di sequenze identiche di DNA disposte fianco a fianco in registro. Circa il 95% del DNA nei cromosomi politenici è in bande e il 5% è in interbande. Una banda molto sottile può contenere 3000 coppie di nucleotidi, mentre una banda spessa può contenerne 200 000 in ciascuno dei suoi filamenti di cromatina. La cromatina in ciascuna banda appare scura perché il DNA è più condensato del DNA nelle interbande e può anche contenere una percentuale maggiore di proteine (Figura 4.51). Questo schema di bandeggio sembra riflettere lo stesso tipo di organizzazione osservato nei cromosomi a spazzola degli anfibi descritto in precedenza. interbande bande (A) 2 µm (B) 1 µm CAPITOLO 4 DNA, cromosomi e genomi 221 © 978-88-08-62126-9 Ci sono approssimativamente 3700 bande e 3700 interbande nella serie completa di cromosomi politenici di Drosophila. Le bande possono essere riconosciute dai loro differenti spessori e spaziature; a ciascuna è stato assegnato un numero per generare una “mappa” cromosomica che è stata indicizzata alla sequenza completa del genoma di questa mosca. I cromosomi politenici di Drosophila rappresentano un buon punto di partenza per esaminare il modo in cui la cromatina è organizzata su larga scala. Nella sezione precedente abbiamo visto che esistono molte forme di cromatina, ciascuna delle quali contiene nucleosomi con una combinazione diversa di istoni modificati. Serie specifiche di proteine non istoniche si assemblano sui nucleosomi per influenzare la funzione biologica in modi diversi. Alcune di queste proteine non istoniche possono diffondere a grandi distanze lungo il DNA, impartendo una struttura simile alla cromatina di regioni contigue del genoma (vedi Figura 4.40). Tali regioni, in cui tutta la cromatina ha una struttura simile, sono separate dai domini confinanti mediante proteine barriera (vedi Figura 4.41). A bassa risoluzione, il cromosoma interfasico può essere perciò considerato un mosaico di strutture di cromatina, ciascuna contenente modificazioni particolari dei nucleosomi associate a una serie particolare di proteine non istoniche. I cromosomi politenici ci permettono di osservare al microscopio ottico i dettagli di questo mosaico di domini, ma anche alcuni dei cambiamenti associati all’espressione genica. ■ Esistono molteplici forme di cromatina Mediante colorazione con anticorpi specifici o mediante l’uso di una tecnica più recente chiamata analisi ChIP (immunoprecipitazione della cromatina, vedi Capitolo 8), si possono mappare sia le proteine istoniche sia quelle non istoniche presenti nella cromatina dell’intera sequenza di DNA del genoma di un organismo. Tale analisi in Drosophila ha permesso finora di localizzare più di 50 diverse proteine della cromatina e modificazioni istoniche. I risultati indicano che in questo organismo predominano tre tipi principali di cromatina con funzione repressiva, insieme a due tipi principali di cromatina in cui i geni vengono attivamente trascritti, e che ciascun tipo è associato a un complesso differente di proteine non istoniche. Perciò l’eterocromatina classica contiene più di sei di tali proteine, compresa la proteina dell’eterocromatina 1 (HP1), mentre la forma di eterocromatina cosiddetta Polycomb contiene un numero simile di proteine di un gruppo diverso (proteine PcG). Oltre ai principali cinque tipi di cromatina sembra siano presenti altre forme meno rappresentate di cromatina, ognuna delle quali potrebbe essere regolata in maniera differente e avere ruoli diversi nella cellula. Il gruppo di proteine legate alla cromatina in un certo locus varia a seconda del tipo cellulare e del suo stato di sviluppo. Queste variazioni fanno sì che l’accessibilità a geni specifici sia diversa nei differenti tessuti, contribuendo a generare la diversificazione cellulare che accompagna lo sviluppo embrionale (descritto nel Capitolo 21). ■ Le anse di cromatina si decondensano quando i geni al loro interno vengono espressi Quando un insetto progredisce da uno stadio di sviluppo all’altro si formano puff (sbuffi) cromosomici distinti e i puff vecchi scompaiono dai cromosomi politenici man mano che vengono espressi nuovi geni e vecchi geni vengono spenti (Figura 4.52). Dall’esame di ciascun puff, quando è relativamente piccolo e lo schema di bandeggio è ancora riconoscibile, sembra che la maggior parte di essi derivi dal decondensamento di una singola banda cromosomica. Le singole fibre di cromatina che compongono un puff possono essere visualizzate al microscopio elettronico. Nei casi favorevoli si vedono delle anse, molto simili a quelle osservate nei cromosomi a spazzola degli anfibi. Quando non è espressa, l’ansa di DNA assume una struttura ispessita, forse di una fibra ripiegata di 30 nm, ma quando c’è espressione dei geni l’ansa diventa più estesa. Nelle micrografie elettroniche la cromatina posta su entrambi i lati dell’ansa decondensata appare decisamente più compatta, sug- sintesi di RNA 10 µm Figura 4.52 Sintesi di RNA nei puff dei cromosomi politenici. Un’autoradiografia di un singolo puff in un cromosoma politenico delle ghiandole salivari del moscerino Chironomus tentans. Come accennato nel Capitolo 1 e descritto in dettaglio nel Capitolo 6, il primo passaggio dell’espressione genica è la sintesi di una molecola di RNA usando il DNA come stampo. La porzione decondensata del cromosoma sta sintetizzando RNA e viene perciò marcata con 3H-uridina, un precursore dell’RNA che è incorporato nelle catene in crescita di RNA. (Per gentile concessione di José Bonner.) CAPITOLO 4 DNA, cromosomi e genomi 222 © 978-88-08-62126-9 Figura 4.53 Visualizzazione simultanea dei territori cromosomici di tutti i cromosomi umani in un singolo nucleo interfasico. Qui varie sonde a DNA per ciascun cromosoma sono state marcate con coloranti che sono fluorescenti a diversa lunghezza d’onda; questo permette di usare l’ibridazione DNA-DNA per identificare ciascun cromosoma, come nella Figura 4.10. Successivamente viene prodotta questa ricostruzione tridimensionale. Sotto alla micrografia ciascun cromosoma è identificato in un disegno schematico dell’immagine reale. Si noti che i due cromosomi omologhi (per esempio, le due copie del cromosoma 9) in genere non sono colocalizzati. (Da M.R. Speicher e N.P. Carter, Nat. Rev. Genet. 6:782-792, 2005. Con il permesso di Macmillan Publishers Ltd.) 10 µm 9 3 11 10 4 19 9 13 21 14 15 22 1 8 12 7 3 8 6 X 13 14 12 2 4 7 15 17 18 6 21 5 20 17 Figura 4.54 La distribuzione delle regioni ricche di geni del genoma umano in un nucleo interfasico. Le regioni ricche di geni sono state visualizzate con una sonda fluorescente che ibrida con le ripetizioni sparse Alu, presenti in più di un milione di copie nel genoma umano (vedi p. 308). Per ragioni sconosciute queste sequenze si raggruppano nelle regioni cromosomiche ricche di geni. In questa rappresentazione le regioni ricche di sequenze Alu sono verdi, le regioni che hanno poche di queste sequenze sono rosse, mentre le regioni con un contenuto medio sono gialle. Le regioni ricche di geni sono largamente assenti nel DNA vicino all’involucro nucleare. (Da A. Bolzer et al., PLoS Biol. 3:826-842, 2005.) gerendo che un’ansa costituisca un dominio funzionale indipendente della struttura della cromatina. Osservazioni eseguite nelle cellule umane suggeriscono anche che anse altamente ripiegate di cromatina si espandano occupando un volume maggiore quando un gene al loro interno viene espresso. Per esempio, regioni cromosomiche quiescenti da 0,4 a 2 milioni di coppie di nucleotidi appaiono come punti compatti in un nucleo interfasico quando questo è osservato al microscopio a fluorescenza, ma lo stesso DNA occupa un territorio più ampio quando i suoi geni sono espressi, con strutture allungate e punteggiate che sostituiscono il punto iniziale. Nuovi modi di visualizzare i singoli cromosomi hanno dimostrato che ciascuno dei 46 cromosomi interfasici presenti in una cellula umana tende a occupare un territorio distinto caratteristico all’interno del nucleo: ne consegue che i cromosomi non sono aggrovigliati tra loro (Figura 4.53). Tuttavia fotografie come questa presentano soltanto un’immagine media del DNA di ciascun cromosoma. Esperimenti che localizzano in modo specifico le regioni eterocromatiche di un cromosoma rivelano che queste sono spesso strettamente associate alla lamina nucleare, indipendentemente dal cromosoma esaminato. Sonde a DNA che colorano specificamente regioni ricche di geni dei cromosomi umani producono un’immagine sorprendente del nucleo interfasico che presumibilmente riflette posizioni medie diverse per i geni attivi e per quelli inattivi (Figura 4.54). Come è condensata la maggior parte della cromatina in ciascun cromosoma in interfase quando i suoi geni non sono espressi? Una potente variante del metodo di cattura della conformazione cromosomica descritto precedentemente (vedi Figura 4.48), che utilizza una tecnologia di sequenziamento del DNA ad alta processività chiamata sequenziamento massivo parallelo (vedi Quadro 8.1, pp. 506-509), permette di congiungere tutti i diversi segmenti di una megabase (1 Mb) del genoma umano che devono essere mappati nei cromosomi umani in interfase. I risultati rivelano che la maggior parte delle regioni dei nostri cromosomi è ripiegata in una conformazione definita globulo frattale: una disposizione senza nodi che facilita al massimo un denso impacchettamento, preservando al contempo la capacità della fibra di cromatina di dipanarsi e di ripiegarsi (Figura 4.55). ■ La cromatina si può spostare in siti specifici all’interno del nucleo per alterare l’espressione dei geni Tipi diversi di esperimenti hanno portato alla conclusione che la posizione di un gene all’interno del nucleo cambia quando viene espresso ad alto livello. Così si osserva che una regione che diventa trascritta molto attivamente si estende talvolta fuori dal territorio del suo cromosoma, come se si trovasse in un’ansa estesa (Figura 4.56).Vedremo nel Capitolo 6 che l’inizio della trascrizione – il primo passaggio dell’espressione genica – richiede l’assemblaggio di più di 100 proteine, e ha senso che ciò avvenga più rapidamente in regioni del nucleo particolarmente ricche di queste proteine. Più in generale, è chiaro che il nucleo è molto eterogeneo, con regioni funzionalmente diverse nelle quali si possono muovere porzioni di cromosomi quando sono soggette a processi biochimici diversi, come quando cambia la loro espressione genica. Questo è il prossimo argomento di cui tratteremo. CAPITOLO 4 DNA, cromosomi e genomi 223 © 978-88-08-62126-9 cromosoma ,5 megabasI Figura 4.55 Un modello a RIPIEGAMENTO DEL CROMOSOMA NEL NUCLEO nucleo territorio del cromosoma sezione trasversale ■ Reti di macromolecole formano una serie di ambienti globulo frattale per la cromatina interfasica. Per misurare quanto ognuno dei tremila segmenti da 1 Mb fosse vicino a ognuno degli altri segmenti è stata usata un’estensione del metodo 3C della Figura 4.48, chiamato Hi-C. I risultati sono in accordo con il tipo di modello mostrato. Nel globulo frattale ingrandito qui illustrato si vede una regione di 5 milioni di coppie di basi avvolta in modo da mantenere regioni che sono vicine lungo l’elica di DNA unidimensionale, vicine anche nelle tre dimensioni. Ciò dà origine ai blocchi monocromatici di questa rappresentazione, che sono evidenti sia in superficie che in sezione. Il globulo frattale è una conformazione senza nodi del DNA che permette un denso compattamento, ma che mantiene la capacità di avvolgere e di svolgere facilmente qualunque locus genomico. (Adattata da E. LiebermanAiden et al., Science 326:289-293, 2009. Con il permesso di AAAS.) biochimici distinti allÕinterno del nucleo Nel Capitolo 6 descriveremo la funzione di vari sottocompartimenti presenti nel nucleo. Il più grande e il più ovvio di questi è il nucleolo, una struttura ben nota ai microscopisti persino nel XIX secolo (vedi Figura 4.9). Il nucleolo è la zona della cellula in cui si formano le subunità ribosomiali ed è anche il luogo dove avvengono molte altre reazioni specializzate (vedi Figura 6.42): esso consiste di reti di RNA e di proteine che circondano i geni in attiva trascrizione dell’RNA ribosomiale. Negli eucarioti il genoma contiene copie multiple dei geni codificanti l’RNA ribosomiale e, sebbene siano di norma raggruppati insieme in un singolo nucleolo, sono spesso localizzati su diversi cromosomi separati. All’interno del nucleo sono presenti anche vari organelli meno evidenti. Per esempio, strutture sferiche chiamate corpi di Cajal e gruppi di granuli di (A) 5 µm involucro nucleare cromosomi omologhi rilevati con tecniche di ibridazione gene marcato in modo speciale (B) GENE SPENTO GENE ACCESO Figura 4.56 Un effetto degli alti livelli di espressione genica sulla posizione intranucleare della cromatina. (A) Micrografie a fluorescenza di nuclei umani che mostrano come la posizione di un gene cambi quando viene trascritto attivamente. Si vede che la regione del cromosoma adiacente al gene (rosso) lascia il suo territorio cromosomico (verde) soltanto quando è altamente attivo. (B) Rappresentazione schematica di una grande ansa di cromatina che si espande quando il gene è acceso e si contrae quando il gene è spento. Si può dimostrare con lo stesso metodo che altri geni espressi meno attivamente restano nel loro territorio cromosomico quando sono trascritti. (Da J.R. Chubb e W.A. Bickmore, Cell 112:403-406, 2003. Con il permesso di Elsevier.) CAPITOLO 4 DNA, cromosomi e genomi 224 © 978-88-08-62126-9 1 µm Figura 4.57 Micrografia elettronica che mostra due sottocompartimenti nucleari fibrosi comuni. La grande sfera è un corpo di Cajal. La sfera più piccola e più scura è un gruppo di granuli intercromatinici, noto anche come macchiolina (speckle) (vedi anche Figura 6.46). Questi “organelli subnucleari” sono del nucleo di un oocita di Xenopus. (Da K.E. Handwerger e J.G. Gall, Trends Cell Biol. 16:19-26. Con il permesso di Elsevier.) Figura 4.58 Compartimentazione effettiva senza un doppio strato di membrana. (A) Illustrazione schematica dell’organizzazione di un organello sferico subnucleare (sinistra) e di un sottocompartimento organizzato in modo simile ipotizzato appena sotto l’involucro nucleare (destra). In entrambi i casi RNA e/o proteine (grigio) si associano per formare strutture altamente porose simili a gel che contengono siti di legame per altre proteine e molecole di RNA specifiche (oggetti colorati). (B) Il modo in cui l’attacco di una serie selezionata di proteine e di molecole di RNA a lunghe catene polimeriche flessibili, come in (A), potrebbe creare “aree di attività” che accelerano di molto la velocità delle reazioni in sottocompartimenti del nucleo. Le reazioni catalizzate dipenderanno dalle particolari macromolecole che sono localizzate da questo attacco. Lo stesso tipo di accelerazione della velocità delle reazioni è anche impiegato altrove nella cellula (vedi anche Figura 3.78). intercromatina sono presenti nella maggior parte delle cellule vegetali e animali (Figura 4.57). Come il nucleolo, questi organelli sono composti da proteine e molecole di RNA selezionate che si legano insieme per creare reti altamente permeabili ad altre proteine e molecole di RNA presenti nel nucleoplasma circostante. Strutture come queste possono creare ambienti biochimici distinti immobilizzando gruppi selezionati di macromolecole, come avviene a opera di altre reti di proteine e di molecole di RNA associate ai pori nucleari e con l’involucro nucleare. In linea di principio ciò permette alle molecole che entrano in questi spazi di essere modificate con grande efficienza in vie di reazioni complesse. Reti fibrose altamente permeabili di questo tipo possono così portare molti dei vantaggi cinetici della compartimentazione (vedi p. 171) a reazioni che hanno luogo in sottoregioni del nucleo (Figura 4.58A). Tuttavia, a differenza dei compartimenti circondati da membrana del citoplasma (vedi Capitolo 12), questi sottocompartimenti nucleari – privi di una membrana a doppio strato lipidico – non possono né concentrare né escludere piccole molecole specifiche. La cellula ha una notevole capacità di costruire ambienti biochimici distinti per svolgere compiti biochimici complessi in maniera efficiente. Quelli che abbiamo indicato per il nucleo facilitano vari aspetti dell’espressione genica, che saranno trattati nel Capitolo 6. Come il nucleolo, questi sottocompartimenti sembrano formarsi soltanto quando sono necessari e creano un’alta concentrazione locale dei molti enzimi e molecole di RNA necessari per un particolare processo. In modo analogo, quando il DNA è danneggiato da radiazioni si vede che la serie di enzimi necessari per eseguire la riparazione del DNA si aggrega in foci distinti all’interno del nucleo, creando “fabbriche di riparazione” (vedi Figura 5.52). I nuclei spesso contengono centinaia di foci distinti che rappresentano fabbriche per la sintesi di DNA o di RNA (vedi Figura 6.47). Sembra probabile che tutte queste entità facciano uso del tipo di guinzagli illustrato nella Figura 4.58B, in cui lunghi tratti flessibili di catena polipeptidica (o di qualche altro polimero) sono ricoperti da siti di legame che concentrano le numerose proteine e/o molecole di RNA necessarie per catalizzare un particolare processo. Non è sorprendente che guinzagli simili siano usati per accelerare processi biologici nel citoplasma, aumentando le velocità di reazioni specifiche (per esempio, vedi Figura 16.18). Esiste anche una struttura intranucleare, analoga al citoscheletro, su cui sono organizzati i cromosomi e gli altri componenti del nucleo? La matrice o impalcatura nucleare è stata definita come il materiale insolubile lasciato nel nucleo dopo una serie di passaggi di estrazione biochimica. Molte delle protei- involucro nucleare (A) (B) CAPITOLO 4 DNA, cromosomi e genomi 225 © 978-88-08-62126-9 ne e delle molecole di RNA che formano questo materiale insolubile derivano probabilmente dai sottocompartimenti fibrosi del nucleo appena discussi, mentre altre sembrano essere proteine che aiutano a formare la base delle anse cromosomiche o ad attaccare i cromosomi ad altre strutture del nucleo. cromosoma ■ I cromosomi mitotici sono formati da cromatina nel suo stato pi• condensato centromero Dopo aver discusso la struttura dinamica dei cromosomi interfasici, occupiamoci adesso dei cromosomi mitotici. I cromosomi di quasi tutte le cellule eucariotiche diventano chiaramente visibili al microscopio ottico durante la mitosi, quando si avvolgono formando strutture altamente condensate. Questa ulteriore condensazione riduce la lunghezza di un tipico cromosoma interfasico solo di dieci volte, ma produce un cambiamento drastico nell’aspetto dei cromosomi. La Figura 4.59 mostra un tipico cromosoma mitotico nello stadio di metafase della mitosi (per gli stadi della mitosi vedi Figura 17.3). Le due molecole figlie di DNA prodotte dalla replicazione del DNA durante l’interfase del ciclo di divisione cellulare sono ripiegate separatamente per produrre due cromosomi fratelli, o cromatidi fratelli, uniti a livello dei centromeri, come abbiamo detto in precedenza. Questi cromosomi sono normalmente ricoperti da una varietà di molecole, fra cui grandi quantità di complessi RNA-proteine. Una volta che questo rivestimento è stato rimosso, ciascun cromatidio può essere visibile in micrografie elettroniche organizzato in anse di cromatina che si diramano da un’impalcatura centrale (Figura 4.60). Esperimenti di ibridazione del DNA per rilevare sequenze specifiche di DNA dimostrano che l’ordine delle caratteristiche visibili lungo un cromosoma mitotico riflette almeno approssimativamente l’ordine dei geni lungo la molecola di DNA. La condensazione dei cromosomi mitotici può quindi essere considerata come il livello finale nella gerarchia del compattamento dei cromosomi (Figura 4.61). Il compattamento dei cromosomi durante la mitosi è un processo dinamico altamente organizzato che serve ad almeno due scopi importanti. Innanzitutto, quando la condensazione è completa (in metafase) i cromatidi fratelli sono stati disavvolti e si trovano fianco a fianco. Così i cromatidi fratelli pos- cromatidio Figura 4.59 Un tipico cromosoma mitotico in metafase. Ciascun cromatidio fratello contiene una di due molecole figlie identiche di DNA generate in precedenza durante il ciclo cellulare per replicazione del DNA (vedi anche Figura 17.21). cromatidio 1 cromatidio 2 breve regione di DNA a doppia elica 2 nm 0,1 µm 11 nm forma della cromatina a “perline su un filo” fibra di cromatina di 30 nm di nucleosomi compattati 30 nm fibra di cromatina ripiegata in anse 700 nm Figura 4.60 Una micrografia elettronica a scansione di una regione vicina a un’estremità di un tipico cromosoma mitotico. Si pensa che ciascuna proiezione a pomolo rappresenti la punta di un dominio ad ansa separato. Si noti che i due cromatidi identici appaiati (disegnati nella Figura 4.59) possono essere distinti chiaramente. (Da M.P. Marsden e U.K. Laemmli, Cell 17:849-858, 1979. Con il permesso di Elsevier.) centromero cromosoma mitotico intero 1400 nm RISULTATO NETTO: CIASCUNA MOLECOLA DI DNA È STATA COMPATTATA IN UN CROMOSOMA MITOTICO CHE È 10 000 VOLTE PIÙ CORTO DELLA SUA LUNGHEZZA SE ESTESO Figura 4.61 Compattamento della cromatina. Questo modello mostra alcuni dei molti livelli di compattamento della cromatina che si pensa diano origine al cromosoma mitotico altamente condensato. CAPITOLO 4 DNA, cromosomi e genomi 226 © 978-88-08-62126-9 sono separarsi facilmente quando l’apparato mitotico inizia a tirarli in direzioni opposte. In secondo luogo, il compattamento dei cromosomi protegge le molecole di DNA relativamente fragili dalla rottura quando vengono tirate in cellule figlie separate. La condensazione dei cromosomi interfasici in cromosomi mitotici avviene all’inizio della fase M ed è strettamente connessa con il progresso del ciclo cellulare. Durante la fase M l’espressione genica si spegne e gli istoni subiscono modificazioni specifiche che aiutano a riorganizzare la cromatina man mano che si compatta. Al compattamento partecipano due classi di proteine a forma di anello, le coesine e le condensine. Il modo in cui esse contribuiscono a produrre i due cromatidi ripiegati separatamente di un cromosoma mitotico sarà discusso nel Capitolo 17, insieme ai dettagli del ciclo cellulare. SOMMARIO I cromosomi sono generalmente decondensati durante l’interfase, cosicché i dettagli della loro struttura sono difficili da visualizzare direttamente. Eccezioni notevoli sono i cromosomi specializzati a spazzola degli oociti dei vertebrati e i cromosomi politenici delle cellule secretorie giganti degli insetti. Studi su questi due tipi di cromosomi interfasici suggeriscono che ciascuna lunga molecola di DNA in un cromosoma sia divisa in un gran numero di domini distinti organizzati in anse di cromatina che sono compattate da un ulteriore ripiegamento. Quando i geni contenuti in un’ansa sono espressi, l’ansa si decondensa e permette al macchinario della cellula un facile accesso al DNA. I cromosomi interfasici occupano territori distinti nel nucleo della cellula; cioè non si intrecciano estesamente. L’eucromatina compone la maggior parte dei cromosomi interfasici e, quando non è trascritta, probabilmente è sotto forma di fibre strettamente ripiegate di nucleosomi compattati. Tuttavia l’eucromatina è interrotta da tratti di eterocromatina, in cui i nucleosomi sono soggetti a ulteriori livelli di compattamento che di solito la rendono resistente all’espressione genica. L’eterocromatina esiste in diverse forme, alcune delle quali sono presenti in grandi blocchi dentro e intorno ai centromeri e vicino ai telomeri, ma è presente anche in altre posizioni sui cromosomi, dove serve a regolare geni importanti per lo sviluppo. L’interno del nucleo è altamente dinamico, con l’eterocromatina spesso posizionata vicino all’involucro nucleare e anse di cromatina che si spostano dal territorio del loro cromosoma quando i geni sono espressi a un livello molto alto. Ciò riflette l’esistenza di sottocompartimenti nucleari, in cui serie diverse di reazioni biochimiche sono facilitate da una maggiore concentrazione di proteine e RNA selezionati. I componenti coinvolti nella formazione di un sottocompartimento possono autoassemblarsi in organelli distinti come i nucleoli o i corpi di Cajal e possono anche essere attaccati tramite guinzagli a strutture fisse come l’involucro nucleare. Durante la mitosi l’espressione genica si spegne e tutti i cromosomi adottano una conformazione altamente condensata in un processo che comincia all’inizio della fase M e che serve a compattare le due molecole di DNA di ciascun cromosoma replicato in due cromatidi ripiegati separatamente. Il processo di condensazione è accompagnato da modificazioni degli istoni che facilitano il compattamento della cromatina. Tuttavia il completamento soddisfacente di questo processo ordinato, che riduce la lunghezza di ciascuna molecola di DNA rispetto alla lunghezza interfasica di un ulteriore fattore dieci, richiede l’azione di proteine aggiuntive. ● Il modo in cui evolvono i genomi In questa sezione finale discuteremo alcuni dei modi in cui i geni e i genomi si sono evoluti nel tempo per produrre la grande diversità delle forme di vita attuali sul nostro pianeta. Il sequenziamento dei genomi di migliaia di organismi sta rivoluzionando la nostra visione del processo dell’evoluzione, scoprendo una quantità stupefacente di informazioni non solo sulle relazioni familiari fra gli organismi, ma anche sui meccanismi molecolari attraverso i quali l’evoluzione è progredita. Forse non è sorprendente che geni con funzioni simili possano trovarsi in una gamma diversificata di esseri viventi. Ma la grande rivelazione degli ultimi 30 anni è stata la scoperta di quanto le sequenze nucleotidiche di molti ge- CAPITOLO © 978-88-08-62126-9 ni si siano conservate. I geni omologhi – cioè geni che sono simili nella loro sequenza nucleotidica e nella loro funzione a causa di un antenato comune – possono spesso essere riconosciuti attraverso distanze filogenetiche enormi. Per esempio, geni sicuramente omologhi di molti geni umani sono facilmente riscontrabili in organismi quali i vermi nematodi, i moscerini della frutta, i lieviti e anche i batteri. In molti casi la somiglianza è così stretta che la porzione che codifica le proteine di un gene di lievito può essere sostituita con il suo omologo umano, anche se l’uomo e il lievito sono separati da più di un miliardo di anni di storia evolutiva. Come abbiamo sottolineato nel Capitolo 3, il riconoscimento di omologia di sequenza è diventato uno strumento importante per comprendere la funzione dei geni e delle proteine. Sebbene trovare un’omologia di sequenza non garantisca una somiglianza della funzione, si è però dimostrato un indizio eccellente. Così è spesso possibile predire la funzione nell’uomo di un gene per il quale non sono disponibili informazioni biochimiche o genetiche semplicemente confrontando la sua sequenza nucleotidica con quelle di geni che sono stati caratterizzati in altri organismi più facili da studiare. In generale, le sequenze dei geni sono spesso conservate molto più della struttura globale del genoma. Come abbiamo visto in precedenza, si riscontra che altri aspetti dell’organizzazione del genoma, quali le dimensioni del genoma, il numero dei cromosomi, l’ordine dei geni lungo i cromosomi, l’abbondanza e le dimensioni degli introni e la quantità di DNA ripetitivo, variano moltissimo fra gli organismi, come il numero di geni che un organismo contiene. ■ Il confronto fra i genomi rivela sequenze funzionali di DNA conservate durante lÕevoluzione Un ostacolo rilevante all’interpretazione della sequenza di 3,2 miliardi di nucleotidi del genoma umano è il fatto che molte sequenze sono probabilmente prive di importanza funzionale. Le regioni codificanti del genoma (gli esoni) si trovano di norma in brevi segmenti (dimensioni medie di circa 145 coppie di nucleotidi), piccole isole in un mare di DNA la cui esatta sequenza nucleotidica si pensa abbia poca importanza. Questa disposizione rende difficile identificare tutti gli esoni in un tratto di sequenza di DNA ed è spesso complicato determinare dove comincia e finisce un gene. Un approccio molto importante nella decifrazione del nostro genoma consiste nella ricerca di sequenze di DNA che sono molto simili tra specie differenti, basandosi sul presupposto che sia molto più probabile che sequenze di DNA che hanno una funzione siano conservate rispetto a quelle senza funzione. Per esempio, si pensa che gli esseri umani e i topi si siano separati da un progenitore mammifero comune circa 80 3 106 anni fa, un tempo abbastanza lungo perché la maggioranza dei nucleotidi nei loro genomi sia stata cambiata da eventi mutazionali casuali. Di conseguenza le sole regioni che saranno rimaste molto simili nei due genomi sono quelle in cui le mutazioni avrebbero inattivato la funzione e creato uno svantaggio per gli animali in cui erano presenti, fino ad arrivare alla loro eliminazione dalla popolazione per selezione naturale. Queste regioni molto simili sono note come regioni conservate. Oltre a rivelare quelle sequenze di DNA che codificano esoni e molecole di RNA funzionalmente importanti, queste regioni conservate comprenderanno sequenze di DNA regolatrici, così come sequenze la cui funzione non è ancora nota. Le regioni non conservate rappresentano invece DNA la cui sequenza non è generalmente cruciale per la funzione. La potenza di questo metodo può essere aumentata confrontando il nostro genoma con i genomi di altri animali i cui genomi sono stati sequenziati completamente, come ratto, pollo, pesce, cane e scimpanzé, ma anche topo. Rivelando in questo modo i risultati di un lunghissimo “esperimento” naturale, che è durato centinaia di milioni di anni, gli studi di sequenziamento comparativo hanno evidenziato le regioni più interessanti dei genomi. Studi comparativi di questo tipo hanno dimostrato che il 5% circa del genoma umano consiste di “sequenze conservate in molte specie”. Inaspettatamente soltanto un terzo di queste sequenze codifica proteine (vedi Tabella 4.1, p. 193). Alcu- 4 DNA, cromosomi e genomi 227 CAPITOLO 4 DNA, cromosomi e genomi 228 © 978-88-08-62126-9 ne delle sequenze conservate non codificanti corrispondono a gruppi di siti di legame per proteine che sono coinvolte nella regolazione dei geni, mentre altre producono molecole di RNA che non vengono tradotte in proteine ma che sono importanti per altri scopi conosciuti.Tuttavia, anche nelle specie studiate più intensamente, la funzione della maggior parte di queste sequenze altamente conservate rimane sconosciuta. Questa scoperta inattesa ha portato i ricercatori a concludere che la nostra conoscenza della biologia cellulare dei vertebrati è minore di quanto non si immaginasse in precedenza. È certo che ci sono enormi opportunità per nuove scoperte e dobbiamo aspettarci molte sorprese nel futuro. ■ Le alterazioni del genoma sono causate da errori dei normali meccanismi di copiatura e di mantenimento del DNA, nonchŽ da elementi di DNA trasponibili Figura 4.62 Una rappresentazione del contenuto della sequenza nucleotidica del genoma umano sequenziato. I LINE (long interspersed nuclear elements, lunghi elementi nucleari intercalati), i SINE (short interspersed nuclear elements, brevi elementi nucleari intercalati), elementi simili a retrovirus e trasposoni a solo DNA sono elementi genetici mobili che si sono moltiplicati nel nostro genoma replicandosi e inserendo le nuove copie in posizioni diverse. Questi elementi genetici mobili sono trattati nel Capitolo 5 (vedi Tabella 5.3 a p. 282). Le ripetizioni di sequenze semplici sono brevi sequenze nucleotidiche (meno di 14 coppie di nucleotidi) che sono ripetute più volte per lunghi tratti. Le ripetizioni segmentali sono ampi blocchi di sequenza di DNA (1000-200 000 coppie di nucleotidi) che sono presenti in due o più siti nel genoma. I blocchi di DNA più altamente ripetuti nell’eterocromatina non sono stati ancora sequenziati, perciò circa il 10% delle sequenze di DNA umane non è rappresentato in questo schema. (Dati per gentile concessione di E. Margulies.) L’evoluzione dipende da incidenti e da errori seguiti da sopravvivenza non casuale. La maggior parte dei cambiamenti genetici che si verificano è causata semplicemente da errori dei normali meccanismi mediante i quali i genomi vengono copiati o riparati quando sono danneggiati, anche se il movimento di elementi trasponibili di DNA (trattato più avanti) ha anch’esso un ruolo importante. Come vedremo nel Capitolo 5, i meccanismi che mantengono le sequenze di DNA sono notevolmente precisi, ma non sono perfetti. Le sequenze di DNA sono ereditate con tale straordinaria fedeltà che, di norma, lungo una certa linea di discendenza, soltanto un nucleotide circa su mille viene cambiato a caso nella linea germinale nell’arco di alcuni milioni di anni. Anche così, in una popolazione di 10 000 individui diploidi, ogni possibile sostituzione nucleotidica sarà stata “provata” in circa 20 occasioni nel corso di un milione di anni, un lasso di tempo breve in relazione all’evoluzione delle specie. Errori nella replicazione del DNA, nella ricombinazione del DNA o nella riparazione del DNA possono portare a semplici cambiamenti della sequenza del DNA – le cosiddette mutazioni puntiformi, come la sostituzione di una coppia di basi con un’altra – o a riarrangiamenti genomici su larga scala come delezioni, duplicazioni, inversioni e traslocazioni di DNA da un cromosoma a un altro. Oltre a questi errori del macchinario genetico, il genoma contiene elementi mobili di DNA che sono una fonte importante di cambiamenti genomici (vedi Tabella 5.3, p. 282). Questi elementi trasponibili di DNA (trasposoni) sono sequenze parassite di DNA che colonizzano i genomi e possono diffondersi al loro interno. In questo processo spesso essi distruggono la funzionalità o alterano la regolazione di geni esistenti; talvolta creano addirittura geni del tutto nuovi tramite fusioni fra sequenze di trasposoni e segmenti di geni esistenti. Nel corso di lunghi periodi di tempo evolutivo questi trasposoni hanno influenzato profondamente la struttura dei genomi, così tanto che quasi metà del DNA del genoma umano consiste di reperti riconoscibili di eventi di trasposizione passati (Figura 4.62). Una parte ancora maggiore del nostro genoma è senza dubbio derivata da eventi di trasposizione che si sono verificati così tanto tempo fa (>108 anni) che le sequenze non possono più essere ricondotte a trasposoni. percentuale 0 10 20 30 40 LINE SINE elementi simili a retrovirus “fossili” di trasposoni a solo DNA 50 60 70 80 90 100 introni regioni che codificano proteine GENI TRASPOSONI ripetizioni di sequenze semplici duplicazioni segmentali SEQUENZE RIPETUTE DNA non ripetitivo che non si trova né negli introni né nelle regioni codificanti SEQUENZE UNICHE CAPITOLO 4 DNA, cromosomi e genomi 229 © 978-88-08-62126-9 ■ Le sequenze dei genomi di due specie differiscono in proporzione al tempo durante il quale si sono evolute separatamente Le differenze fra i genomi di specie viventi oggi si sono accumulate per più di tre miliardi di anni. In mancanza di una registrazione diretta dei cambiamenti nel corso del tempo possiamo tuttavia ricostruire il processo di evoluzione dei genomi mediante confronti dettagliati dei genomi di organismi contemporanei. Lo strumento base della genomica comparativa è l’albero filogenetico. Un esempio semplice è l’albero che descrive la divergenza degli esseri umani dalle grandi scimmie (Figura 4.63). Il supporto principale per ricostruire quest’albero deriva da confronti di sequenze di geni e di proteine. Per esempio, confronti fra le sequenze geniche o proteiche umane e quelle delle grandi scimmie di norma rivelano che il numero di differenze fra l’uomo e lo scimpanzé è quello minore, mentre quello fra l’uomo e l’orangutan è il maggiore. Per organismi correlati strettamente come l’uomo e lo scimpanzé è possibile ricostruire le sequenze geniche dell’ultimo progenitore comune estinto delle due specie (Figura 4.64). La stretta somiglianza fra i geni umani e quelli di scimpanzé è dovuta soprattutto al breve tempo che è stato disponibile per l’accumulo di mutazioni nelle due linee divergenti, anziché a restrizioni funzionali che hanno mantenuto uguali le sequenze. Una prova di questa visione deriva dall’osservazione che anche sequenze di DNA il cui ordine dei nucleotidi non è obbligato dalla funzione – come nella terza posizione di codoni “sinonimi” (codoni che specificano lo stesso amminoacido, ma che differiscono nel nucleotide in terza posizione) – sono quasi identiche nell’uomo e nello scimpanzé. Per organismi correlati meno strettamente, come uomo e pollo (che si sono evoluti separatamente per circa 300 milioni di anni), la conservazione di sequenza presente nei geni è in gran parte dovuta a selezione purificatrice (cioè una selezione che elimina individui portatori di mutazioni che interferiscono con funzioni genetiche importanti), piuttosto che al poco tempo disponibile perché avvenissero le mutazioni. ■ Gli alberi filogenetici costruiti in base al confronto di sequenze di DNA tracciano le relazioni fra tutti gli organismi 15 ultimo antenato comune milioni di anni fa 1,5 10 1,0 5 0 0,5 uomo scimpanzé gorilla orangutan 0,0 percentuali di sostituzioni nucleotidiche L’integrazione di alberi filogenetici basata su confronti delle sequenze con i reperti fossili ha portato alla migliore visione possibile dell’evoluzione delle forme moderne di vita. I resti fossili rimangono importanti per stabilire date assolute basate sul decadimento di radioisotopi nelle formazioni rocciose in cui si trovano. Tuttavia, poiché la disponibilità di reperti fossili nel tempo è discontinua, tempi precisi di divergenza fra le specie sono difficili da stabilire anche per specie che lasciano buoni fossili con una morfologia distintiva. Gli alberi filogenetici, la cui cronologia è stata calibrata utilizzando i reperti fossili, suggeriscono che cambiamenti nelle sequenze di geni o di pro- Figura 4.63 Un albero filogenetico che mostra la relazione fra l’uomo e le grandi scimmie basata su dati di sequenza nucleotidica. Come indicato, si stima che le sequenze dei genomi di tutte e quattro le specie differiscano dalla sequenza del genoma del loro ultimo antenato comune di poco più dell’1,5%. Poiché i cambiamenti si verificano indipendentemente su entrambe le linee che divergono, i confronti a coppie rivelano il doppio di divergenza di sequenza dall’ultimo antenato comune. Per esempio, il confronto uomo-orangutan mostra di norma divergenze di sequenza di poco più del 3%, mentre il confronto uomo-scimpanzé evidenzia divergenze di circa l’1,2%. (Modificata da F.C. Chen e W.H. Li, Am. J. Hum. Genet. 68:444-456, 2001.) CAPITOLO 4 DNA, cromosomi e genomi 230 Figura 4.64 Tracciamento della sequenza progenitrice da un confronto della sequenza delle regioni codificanti dei geni della leptina umani e di scimpanzé. È illustrato un segmento continuo di 300 nucleotidi di un gene codificante una leptina; si legge da sinistra a destra e dall’alto verso il basso. La leptina è un ormone che regola l’assunzione di cibo e l’utilizzo dell’energia in risposta all’adeguatezza delle riserve di grasso. Come indicato dai codoni nei riquadri verdi, solo 5 nucleotidi (su 441 totali) differiscono fra le due specie. Inoltre, solamente in una delle cinque posizioni la differenza nucleotidica porta a una sostituzione amminoacidica. Per ciascuna delle 5 posizioni nucleotidiche varianti è indicata anche la sequenza corrispondente nel gorilla. In due casi la sequenza del gorilla corrisponde a quella umana, mentre in tre casi corrisponde a quella di scimpanzé. Qual era la sequenza del gene della leptina nell’ultimo antenato comune? Un modello evolutivo che cercasse di ridurre al minimo il numero di mutazioni postulate durante l’evoluzione dei geni umani e di scimpanzé ipotizzerebbe che la sequenza della leptina dell’ultimo antenato comune fosse uguale a quelle dell’uomo e dello scimpanzé dove queste corrispondono; dove non corrispondono, userebbe la sequenza di gorilla per prendere una decisione. Per convenienza, sono riportati soltanto i primi 300 nucleotidi delle sequenze codificanti della leptina. I 141 restanti sono identici nell’uomo e nello scimpanzé. © 978-88-08-62126-9 uomo gorilla CAA Q 1 60 GTGCCCATCCAAAAAGTCCAAGATGACACCAAAACCCTCATCAAGACAATTGTCACCAGG scimpanzé GTGCCCATCCAAAAAGTCCAGGATGACACCAAAACCCTCATCAAGACAATTGTCACCAGG V P I Q K V Q D D T K T L I K T I V T R proteina uomo K 61 120 ATCAATGACATTTCACACACGCAGTCAGTCTCCTCCAAACAGAAAGTCACCGGTTTGGAC scimpanzé ATCAATGACATTTCACACACGCAGTCAGTCTCCTCCAAACAGAAGGTCACCGGTTTGGAC proteina I N D I S H T O S V S S K Q K V T G L D gorilla AAG uomo gorilla CCC P 121 180 TTCATTCCTGGGCTCCACCCCATCCTGACCTTATCCAAGATGGACCAGACACTGGCAGTC scimpanzé TTCATTCCTGGGCTCCACCCTATCCTGACCTTATCCAAGATGGACCAGACACTGGCAGTC proteina F I P G L H P I L T L S K M D Q T L A V uomo V 181 240 TACCAACAGATCCTCACCAGTATGCCTTCCAGAAACGTGATCCAAATATCCAACGACCTG scimpanzé TACCAACAGATCCTCACCAGTATGCCTTCCAGAAACATGATCCAAATATCCAACGACCTG proteina Y Q Q I L T S M P S R N M I Q I S N D L gorilla ATG uomo D 241 300 GAGAACCTCCGGGATCTTCTTCAGGTGCTGGCCTTCTCTAAGAGCTGCCACTTGCCCTGG scimpanzé GAGAACCTCCGGGACCTTCTTCAGGTGCTGGCCTTCTCTAAGAGCTGCCACTTGCCCTGG proteina E N L R D L L H V L A F S K S C H L P W gorilla GAC teine particolari tendano ad avvenire a velocità costante, anche se in particolari linee si osservano velocità che differiscono dalla norma fino a due volte. Questo ci fornisce un “orologio molecolare” per l’evoluzione, o piuttosto una serie di orologi molecolari corrispondenti a diverse categorie di sequenze di DNA. Come nell’esempio della Figura 4.65, l’orologio cammina più rapidamente e regolarmente in sequenze che non sono soggette a selezione purificatrice, come porzioni di introni prive di segnali di splicing o regolatori, la terza posizione nei codoni sinonimi e geni che sono stati inattivati irreversibilmente da una mutazione (i cosiddetti pseudogeni). L’orologio cammina più lentamente per sequenze che sono soggette a forti restrizioni funzionali: per esempio, le sequenze di amminoacidi di proteine che prendono parte a interazioni specifiche con moltissime altre proteine e la cui struttura perciò è altamente sottoposta a restrizioni, o la sequenza nucleotidica che codifica l’RNA delle subunità del ribosoma, da cui dipende la sintesi proteica. Occasionalmente si osservano rapidi cambiamenti in una sequenza in precedenza altamente conservata. Come vedremo più avanti in questo capitolo, questi episodi assumono un interesse del tutto speciale perché si pensa che riflettano periodi di forte selezione positiva per mutazioni che hanno conferito un vantaggio selettivo nella particolare linea in cui si era verificato il cambiamento rapido. topo esone introne uomo topo uomo Figura 4.65 Le velocità di evoluzione di esoni e introni sono molto diverse, come illustrato dal confronto di una porzione dei geni della leptina di topo e uomo. Le posizioni in cui le sequenze differiscono per una singola sostituzione nucleotidica sono in riquadri verdi, mentre le posizioni che differiscono per l’aggiunta o la delezione di nucleotidi sono in riquadri gialli. Si noti che, grazie alla selezione purificatrice, la sequenza codificante dell’esone è molto più conservata della sequenza intronica adiacente. CAPITOLO 4 DNA, cromosomi e genomi 231 © 978-88-08-62126-9 La velocità a cui camminano gli orologi molecolari durante l’evoluzione non è determinata solo dal grado di selezione purificatrice, ma anche dal tasso di mutazione. Gli orologi più notevoli negli animali, anche se non nei vegetali, sono quelli basati su sequenze di DNA mitocondriale che non hanno restrizioni funzionali e che camminano molto più velocemente degli orologi basati su sequenze nucleari non limitate funzionalmente, a causa di un’insolita alta frequenza di mutazioni nei mitocondri degli animali. Le categorie di DNA per cui l’orologio molecolare cammina veloce sono le più informative per gli eventi evolutivi recenti. Per esempio, l’orologio del DNA mitocondriale è stato usato per determinare la cronologia della divergenza della linea dell’uomo di Neanderthal da quella dell’odierno Homo sapiens. Per studiare eventi evolutivi più antichi si deve esaminare DNA il cui orologio cammini molto più lento; quindi la divergenza dei rami principali dell’albero della vita – batteri, archei ed eucarioti – è stata dedotta studiando le sequenze che specificano l’RNA ribosomiale. In generale, gli orologi molecolari, se scelti appropriatamente, hanno una risoluzione temporale più fine rispetto ai resti fossili e sono una guida più affidabile alla struttura dettagliata di alberi filogenetici rispetto ai metodi classici di costruzione degli alberi, che si basano su confronti della morfologia e dello sviluppo embrionale. Per esempio, la relazione precisa fra le linee delle grandi scimmie e quella dell’uomo non è stata stabilita finché negli anni ’80 non si sono accumulati abbastanza dati di sequenza per produrre l’albero filogenetico mostrato nella Figura 4.63. E con le grandi quantità di sequenza di DNA determinate oggi per vari mammiferi si stanno ottenendo stime molto migliori delle relazioni fra l’uomo e questi animali (Figura 4.66). ■ Un confronto fra i cromosomi umani e quelli di topo mostra come divergono le strutture dei genomi Come atteso, il genoma umano e quello di scimpanzé sono molto più simili di quanto lo siano i genomi umano e di topo, sebbene le dimensioni dei genomi di topo e di uomo siano approssimativamente le stesse e le serie di geni che contengono siano quasi identiche. Le linee murina e umana hanno avuto approssimativamente 80 milioni di anni per divergere mediante accumulo di mutazioni rispetto ai 6 milioni di anni per gli uomini e gli scimpanzé. Inoltre, come indicato nella Figura 4.66, le linee dei roditori (rappresentate dal ratto e dal topo) hanno orologi molecolari insolitamente veloci e la divergenza di queste linee dalla linea umana è stata più rapida di quanto atteso. Mentre il modo in cui il genoma è organizzato in cromosomi è quasi identico nell’uomo e nello scimpanzé, questa organizzazione ha subìto una notevole divergenza fra esseri umani e topi. Secondo stime approssimative, un totale Figura 4.66 Un albero filogenetico che evidenzia le relazioni evolutive tra alcuni dei mammiferi odierni. La lunghezza di ciascuna linea è proporzionale al numero di “sostituzioni neutre”, cioè ai cambiamenti nucleotidici in siti dove si assume non ci sia selezione purificatrice. (Adattata da G.M. Cooper et al., Genome Res. 15:901913, 2005. Con il permesso di Cold Spring Harbor Laboratory Press.) opossum wallaby antenato armadillo porcospino pipistrello gatto cavallo cane mucca pecora muntjac indiano maiale coniglio galago lemure scimmia marmorizzata scimmia scoiattolo cercopiteco verde babbuino macaco orangutan gorilla scimpanzé uomo ratto topo CAPITOLO 4 DNA, cromosomi e genomi 232 © 978-88-08-62126-9 di 180 eventi di rottura e riunione si è verificato nelle linee umane e di topo dal momento in cui le due specie hanno avuto l’ultimo antenato in comune. Nel processo, anche se il numero di cromosomi è simile nelle due specie (23 per il genoma aploide nell’uomo contro 20 nel topo), le loro strutture generali sono molto cambiate. Nonostante ciò, anche dopo un esteso rimaneggiamento genomico, ci sono grandi blocchi di DNA in cui l’ordine dei geni è lo stesso nell’uomo e nel topo. Questi segmenti di ordine genico conservato nei cromosomi sono chiamati regioni di sintenia. La Figura 4.67 illustra come segmenti differenti di cromosomi di topo mappino sulla serie di cromosomi umani. Per vertebrati molto più distanti evolutivamente, come pollo e uomo, il numero di eventi di rottura e riunione è stato molto più elevato e le regioni di sintenia sono molto più corte; inoltre, queste ultime sono spesso difficili da riconoscere a causa della divergenza delle sequenze di DNA in esse contenute. Una conclusione inaspettata derivata da un confronto dettagliato delle sequenze complete dei genomi di uomo e di topo, confermata da successivi confronti fra i genomi di altri vertebrati, è che piccoli blocchi di sequenza vengono deleti e aggiunti ai genomi a un ritmo sorprendentemente rapido. Così, se assumiamo che il nostro antenato comune avesse un genoma di dimensioni umane (circa 3,2 miliardi di coppie di nucleotidi), i topi avrebbero perso un totale pari al 45% di quel genoma in seguito all’accumulo di delezioni durante gli 80 milioni di anni trascorsi, mentre gli esseri umani ne avrebbero perso il 25% circa.Tuttavia, guadagni sostanziali di sequenze dovuti a molte piccole duplicazioni cromosomiche e alla moltiplicazione dei trasposoni hanno compensato queste delezioni. Come risultato, le dimensioni del nostro genoma sono rimaste quasi uguali a quelle dell’ultimo antenato comune di uomo e topo, mentre il genoma del topo è più piccolo soltanto di 0,3 miliardi di nucleotidi. Prove convincenti della perdita di sequenze di DNA in piccoli blocchi durante l’evoluzione si possono ottenere da un confronto dettagliato della maggior parte delle regioni di sintenia nei genomi umani e di topo. Il ridimensionamento del genoma di topo si vede chiaramente da questi confronti, con la perdita netta di sequenze sparse in tutti i lunghi tratti di DNA che altrimenti sarebbero omologhi (Figura 4.68). Il DNA è aggiunto ai genomi sia per duplicazione spontanea di segmenti cromosomici che contengono decine di migliaia di coppie di nucleotidi (come vedremo fra breve) sia per inserzione di nuove copie di trasposoni attivi. La maggior parte degli eventi di trasposizione è duplicativa, perché la copia Figura 4.67 Sintenia tra cromosomi umani e murini. In questo disegno il gruppo di cromosomi umani è mostrato sopra, con ogni parte di ciascun cromosoma colorata in base al cromosoma murino con cui è sintenica. Il codice colore usato per ciascun cromosoma murino è mostrato sotto. Le regioni eterocromatiche altamente ripetitive (come i centromeri) che sono difficili da sequenziare non possono essere mappate in questo modo e sono colorate in nero. (Adattata da E.E. Eichler e D. Sankoff, Science 301:793797, 2003. Con il permesso di AAAS.) 1 2 3 4 codice colore del cromosoma murino 5 6 7 8 1 3 4 2 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 X CAPITOLO 4 DNA, cromosomi e genomi 233 © 978-88-08-62126-9 cromosoma 14 umano cromosoma 12 del topo 200 000 basi Figura 4.68 Confronto di una porzione sintenica dei genomi di uomo e di topo. Il 90% circa dei due genomi può essere allineato in questo modo. Si noti che, mentre c’è un ordine identico delle sequenze indice corrispondenti (segni rossi), nella linea del topo c’è stata una perdita netta di DNA sparsa nell’intera regione. Questo genere di perdita netta è tipico per tutte le regioni come questa e spiega il fatto che il genoma di topo contiene il 14% di DNA in meno del genoma umano. (Adattata dal Mouse Sequencing Consortium, Nature 420:520-573, 2002. Con il permesso di Macmillan Publishers Ltd.) Figura 4.69 Un confronto del gruppo dei geni della β-globina umana γG ε γA δ β gruppo dei geni della β-globina di topo ε γ β maggiore β minore 10 000 coppie di nucleotidi originale del trasposone resta dov’era quando una copia si inserisce in un nuovo sito; per esempio, vedi Figura 5.63. Il confronto delle sequenze di DNA derivate dai trasposoni nell’uomo e nel topo rivela rapidamente alcune delle aggiunte di sequenze (Figura 4.69). Per ragioni sconosciute tutti i mammiferi hanno conservato dimensioni dei genomi di circa 3 miliardi di coppie di nucleotidi che contengono serie quasi identiche di geni, anche se soltanto circa 150 milioni di coppie di nucleotidi sembrano avere restrizioni funzionali sequenza-specifiche. ■ Le dimensioni del genoma di un vertebrato riflettono gruppo dei geni della b-globina nei genomi di uomo e di topo, che mostra la posizione di elementi trasponibili. Questo tratto del genoma umano contiene cinque geni funzionali del tipo della b-globina (arancione); la regione paragonabile del genoma di topo ne ha solo quattro. Le posizioni delle sequenze Alu umane sono indicate da pallini verdi e le sequenze umane L1 da pallini rossi. Il genoma di topo contiene elementi trasponibili diversi ma correlati: le posizioni degli elementi B1 (che sono correlati alle sequenze Alu umane) sono indicate da triangoli blu, mentre le posizioni degli elementi L1 di topo (che sono correlati alle sequenze umane L1) sono indicate da triangoli arancione. L’assenza di elementi trasponibili dai geni strutturali delle globine può essere attribuita a selezione purificatrice, che avrebbe eliminato qualunque inserzione che compromettesse la funzione dei geni. (Per gentile concessione di Ross Hardison e Webb Miller.) il ritmo relativo di aggiunta e perdita di DNA in una linea evolutiva Nei vertebrati evolutivamente più distanti le dimensioni del genoma possono variare considerevolmente, in apparenza senza effetti drastici sull’organismo o sul numero dei suoi geni. Così, il genoma di pollo, con un miliardo di coppie nucleotidiche, è soltanto un terzo di quello di mammifero. Un esempio estremo è il pesce palla, Fugu rubripes (Figura 4.70), che ha un genoma minuscolo per un vertebrato (0,4 miliardi di coppie di nucleotidi in confronto a un miliardo o più degli altri pesci). Le piccole dimensioni del genoma del Fugu sono dovute in gran parte alle piccole dimensioni dei suoi introni. Specificamente gli introni del Fugu, oltre ad altri segmenti non codificanti del genoma del Fugu, sono privi del DNA ripetitivo che costituisce una grande porzione dei genomi della maggior parte dei vertebrati studiati a fondo. Nonostante ciò, le posizioni degli introni del Fugu sono conservate quasi perfettamente rispetto alle posizioni nei genomi dei mammiferi (Figura 4.71). All’inizio sembrava un mistero, ma oggi abbiamo una spiegazione semplice per queste grandi differenze nelle dimensioni dei genomi in organismi simili: poiché tutti i vertebrati subiscono un processo continuo di perdita e aggiunta di DNA, le dimensioni di un genoma dipendono semplicemente dall’equilibrio fra questi processi opposti che agiscono nel corso di milioni di anni. Sup- Figura 4.70 Il pesce palla, Fugu rubripes. (Per gentile concessione di Byrappa Venkatesh.) CAPITOLO 4 DNA, cromosomi e genomi 234 © 978-88-08-62126-9 Figura 4.71 Confronto delle sequenze genomiche del gene umano e di quello del Fugu che codificano la proteina huntingtina. Entrambi i geni (indicati in rosso) contengono 67 brevi esoni che si allineano in una corrispondenza 1:1; questi esoni sono connessi da linee curve. Il gene umano è 7,5 volte più grande del gene del Fugu (180 000 contro 24 000 coppie di nucleotidi). La differenza di dimensioni è completamente dovuta a introni più grandi nel gene umano. Le maggiori dimensioni degli introni umani sono in parte dovute alla presenza di retrotrasposoni (vedi Capitolo 5), le cui posizioni sono rappresentate da linee verticali verdi; gli introni del Fugu sono privi di retrotrasposoni. Nell’uomo la mutazione del gene dell’huntingtina provoca la malattia di Huntington, un disordine neurodegenerativo ereditario. (Adattata da S. Baxendale et al., Nat. Genet. 10:67-76, 1995. Con il permesso di Macmillan Publishers Ltd.) gene umano gene del Fugu 0,0 100,0 migliaia di coppie di nucleotidi 180,0 poniamo, per esempio, che nella linea che ha portato al Fugu il ritmo di aggiunta di DNA sia rallentato di molto. Nel corso di lunghi periodi di tempo ciò avrebbe portato a una grande “ripulitura” dal genoma del pesce di quelle sequenze di DNA di cui si poteva tollerare la perdita. Il risultato è un genoma inusualmente compatto, relativamente libero da spazzatura e sequenze inutili, ma che conserva attraverso il processo di selezione purificatrice le sequenze di DNA dei vertebrati funzionalmente importanti. Questo fa sì che il Fugu, con i suoi 400 milioni di coppie di nucleotidi di DNA, sia una risorsa importante per la ricerca sul genoma finalizzata alla comprensione del genere umano. ■ é possibile ricostruire la sequenza di alcuni genomi antichi I genomi di organismi ancestrali possono essere ipotizzati, ma mai osservati direttamente. Il DNA è molto stabile se comparato con la maggior parte delle molecole organiche, ma non lo è del tutto e la sua progressiva degradazione, anche nelle migliori circostanze, significa che è virtualmente impossibile estrarre informazioni contenute nelle sequenze di DNA di fossili che hanno più di un milione di anni. Sebbene un organismo attuale come il granchio a ferro di cavallo sembri notevolmente simile ad antenati fossili che sono vissuti 200 milioni di anni fa, ci sono tutte le ragioni per credere che il genoma del granchio a ferro di cavallo si sia modificato durante tutto quel tempo a una velocità simile a quella di altre linee evolutive. Restrizioni selettive devono avere mantenuto proprietà funzionali chiave del genoma del granchio a ferro di cavallo per spiegare la stabilità morfologica della linea.Tuttavia le sequenze del genoma rivelano che la frazione del genoma soggetta a selezione purificatrice è piccola, per cui il genoma del granchio a ferro di cavallo attuale deve differire di molto da quello dei suoi antenati estinti, che conosciamo soltanto per i resti fossili. È possibile ottenere informazioni dirette sulla sequenza esaminando i campioni di DNA da materiale antico, se questo non è troppo vecchio. In anni recenti, avanzamenti tecnologici hanno permesso il sequenziamento di DNA da frammenti ossei eccezionalmente ben conservati datati a più di 100 000 anni fa. Sebbene qualunque DNA così vecchio non sia conservato perfettamente, è stato possibile ricostruire la sequenza del genoma dell’uomo di Neanderthal a partire da molti milioni di corte sequenze di DNA. Questo risultato ha rivelato – tra le altre cose – che i nostri antenati si sono incrociati con i Neanderthal in Europa e che gli esseri umani odierni hanno ereditato da loro geni specifici (Figura 4.72). La differenza media nella sequenza di DNA tra esseri umani e uomini di Neanderthal mostra che le due linee si sono divise in un periodo di tempo compreso tra 270 000 e 440 000 anni fa, molto prima del periodo di tempo in cui si pensava che gli esseri umani fossero migrati fuori dall’Africa. Ma che cosa possiamo dire circa la possibilità di decifrare i genomi di antenati molto più vecchi, quelli per i quali non può essere isolato DNA utilizzabile? Per organismi che sono correlati strettamente, come esseri umani CAPITOLO 4 DNA, cromosomi e genomi 235 © 978-88-08-62126-9 caverna di Vindija in Croazia (A) (B) e scimpanzé, abbiamo visto che ciò può non essere difficile. In quel caso ci si può riferire alla sequenza del gorilla per determinare quali piccole differenze fra il DNA di uomo e di scimpanzé sono state ereditate dal nostro antenato comune circa 6 milioni di anni fa (vedi Figura 4.64). Per un antenato che ha prodotto un numero elevato di organismi diversi ancora vivi oggi si possono confrontare simultaneamente le sequenze di molte specie per derivare la sequenza ancestrale, permettendo ai ricercatori di seguire le sequenze di DNA molto più indietro nel tempo. Per esempio, dalle sequenze complete dei genomi di decine di mammiferi placentati attuali, dovrebbe essere possibile decifrare la maggior parte della sequenza genomica del loro antenato che ha 100 milioni di anni e che ha dato origine a specie così diverse come cane, topo, coniglio, armadillo e uomo (vedi Figura 4.66). ■ I confronti di sequenze fra specie multiple identificano sequenze importanti di DNA a funzione sconosciuta La massiccia quantità di sequenze di DNA presente oggi nei database (centinaia di miliardi di coppie di nucleotidi) fornisce una grande risorsa a cui i ricercatori possono ricorrere per molti scopi. Queste informazioni possono essere usate non solo per analizzare i percorsi evolutivi che hanno portato agli organismi moderni, ma anche per avere indizi sul modo in cui funzionano cellule e organismi. Forse la scoperta più notevole in questo campo è stata l’osservazione che un’impressionante quantità di sequenza di DNA che non codifica proteine è stata conservata durante l’evoluzione dei mammiferi (vedi Tabella 4.1, p. 193). Questa massa di sequenza conservata è rivelata più chiaramente quando allineiamo e confrontiamo blocchi di sintenia di DNA di molte specie diverse. In questo modo si possono facilmente identificare le cosiddette sequenze conservate in molte specie: alcune di queste codificano proteine ma la maggior parte no (Figura 4.73). Le sequenze conservate non codificanti scoperte in questo modo si sono rivelate in gran parte brevi, poiché contengono fra 50 e 200 coppie di nucleotidi.Tra le più misteriose ci sono quelle chiamate regioni non codificanti “ultraconservate”, rappresentate da più di 5000 segmenti di DNA più lunghi di 100 nucleotidi che sono identici nell’uomo, nel topo e nel ratto. La maggior parte ha subìto lievi cambiamenti, oppure è rimasta perfettamente conservata da quando gli antenati di uccelli e mammiferi si sono separati circa 300 milioni di anni fa. La stretta conservazione implica che, sebbene queste sequenze non codifichino proteine, ognuna di esse abbia un’importante funzione mantenuta dalla selezione purificatrice. Il rompicapo ora è svelare quali sono queste funzioni. Molte sequenze conservate che non codificano proteine codificano molecole di RNA non tradotto, come le migliaia di RNA non codificanti lunghi (long noncoding RNAs, lncRNA), che si pensa abbiano funzioni importanti nella regolazione della trascrizione genica. Come vedremo nel Capitolo 7, altre sono brevi regioni di DNA distribuite in tutto il genoma che legano direttamente proteine coinvolte nella regolazione genica. Ma non è chiaro quanto del DNA non codificante conservato possa essere spiegato in questo modo, e la funzione di gran parte di esso resta un mistero. Questo enigma mette in luce (C) 5 cm Figura 4.72 L’uomo di Neanderthal. (A) Una cartina dell’Europa che mostra la posizione della caverna in Croazia dove è stata scoperta la maggior parte delle ossa utilizzate per isolare il DNA impiegato per derivare la sequenza del genoma dell’uomo di Neanderthal. (B) Fotografia della caverna di Vindija. (C) Fotografia delle ossa di 38 000 anni fa trovate a Vindija. Studi più recenti sono riusciti a estrarre l’informazione della sequenza di DNA da resti di ominidi molto più antichi (vedi Filmato 8.3). (B, per gentile concessione di Johannes Krause; C, da R.E. Green et al., Science 328: 710722, 2010. Con il permesso di AAAS.) CAPITOLO 4 DNA, cromosomi e genomi 236 © 978-88-08-62126-9 gene umano del CFTR (regolatore della conduttanza transmembrana della fibrosi cistica) 190 000 coppie di nucleotidi 5′ 3′ introne esone sequenze conservate in molte specie 100% 50% scimpanzé orangutan babbuino scimmia marmorizzata lemure coniglio identità % cavallo gatto cane topo opossum pollo 100% 50% Fugu 100 coppie di nucleotidi 10 000 coppie di nucleotidi Figura 4.73 L’individuazione di sequenze conservate in molte specie. In questo esempio le sequenze dei genomi di ciascuno degli organismi mostrati sono state confrontate con la regione indicata del gene umano del CFTR (cystic fibrosis transmembrane conductance regulator, regolatore di conduttanza trasmembrana della fibrosi cistica); questa regione contiene un esone più una grande quantità di DNA intronico. Per ciascun organismo la percentuale di identità con l’uomo per ogni blocco di 25 nucleotidi è riportata in verde. Inoltre è stato usato un algoritmo computazionale per rilevare le sequenze all’interno di questa regione che sono più altamente conservate quando si tengono in considerazione le sequenze di tutti gli organismi. Oltre all’esone (blu scuro, sopra alla linea in cima alla figura), sono mostrati anche altri tre blocchi di sequenze conservate in molte specie (azzurro). La funzione della maggior parte di queste sequenze nel genoma umano non è nota. (Per gentile concessione di Eric D. Green.) quanto ci sia ancora da imparare riguardo i meccanismi biologici fondamentali che operano negli animali e negli altri organismi complessi, e la sua soluzione avrà senz’altro conseguenze profonde per la medicina. In che modo i biologi cellulari possono affrontare il mistero del DNA non codificante conservato? Tradizionalmente i tentativi per determinare la funzione di una sequenza di DNA iniziano con l’osservare le conseguenze della sua distruzione per via sperimentale, ma molte sequenze di DNA che sono cruciali per la vita allo stato selvaggio di un organismo potrebbero non avere alcun effetto osservabile sul suo fenotipo in condizioni di laboratorio: quello che è necessario a un topo per sopravvivere in una gabbia da laboratorio è molto meno di quello che gli è necessario per riuscirci in natura. Inoltre, calcoli fatti basandosi sulla genetica delle popolazioni rivelano che è sufficiente un piccolo vantaggio selettivo – meno dello 0,1% di differenza nella sopravvivenza – per favorire fortemente il mantenimento di una particolare sequenza di DNA su scale temporali di tipo evolutivo. Non ci si deve perciò sorprendere nel rilevare che tante sequenze di DNA ultraconservate possono essere tolte dal genoma del topo senza alcun effetto evidente sul topo da laboratorio. Un secondo approccio importante per scoprire la funzione di una sequenza di DNA non codificante misteriosa utilizza tecniche biochimiche per identificare proteine o molecole di RNA che si legano a esse e/o a ogni molecola di RNA prodotta. Molti di questi obiettivi sono ancora da affrontare, ma i primi passi sono stati fatti (vedi p. 457). ■ Cambiamenti in sequenze precedentemente conservate possono aiutare a decifrare passaggi cruciali dellÕevoluzione Data l’informazione della sequenza genomica, possiamo affrontare un’altra affascinante domanda: quali alterazioni nel nostro DNA hanno reso gli esseri umani così diversi dagli altri animali o, comunque, che cosa rende ogni singo- CAPITOLO © 978-88-08-62126-9 la specie così diversa dalle sue specie parenti? Per esempio, non appena sono diventate disponibili la sequenza umana e quella dello scimpanzé, gli studiosi hanno iniziato a cercare cambiamenti di sequenza di DNA che potessero spiegare le sorprendenti differenze fra gli esseri umani e gli scimpanzé. Con 3,2 miliardi di coppie di nucleotidi da confrontare nelle due specie ciò potrebbe sembrare un’impresa impossibile, ma il lavoro è stato reso molto più facile limitando la ricerca alle 35 000 sequenze conservate in molte specie chiaramente definite (un totale di circa 5 milioni di coppie di nucleotidi), che rappresentano parti del genoma che con tutta probabilità sono funzionalmente importanti. Sebbene queste sequenze siano fortemente conservate, la conservazione non è tuttavia perfetta e, quando la versione di una specie viene confrontata con quella di un’altra, generalmente si scopre che si sono allontanate di poco in relazione semplicemente al tempo trascorso dall’ultimo antenato comune. In una piccola parte di casi si vedono però segni di uno scatto evolutivo improvviso. Per esempio, si rileva che alcune sequenze di DNA che sono state altamente conservate in altre specie di mammiferi sono cambiate con eccezionale rapidità durante i sei milioni di anni di evoluzione umana dal momento in cui ci siamo separati dagli scimpanzé. Si pensa che queste regioni umane accelerate (HAR) riflettano funzioni che sono state particolarmente importanti nel renderci diversi in qualche modo utile. In uno studio sono stati identificati circa 50 di questi siti, un quarto dei quali si trova vicino a geni associati allo sviluppo neurale. La sequenza che mostra il cambiamento più rapido (18 cambiamenti fra uomo e scimpanzé, in confronto a due soli cambiamenti fra scimpanzé e pollo) è stata ulteriormente esaminata. Si è trovato che la sequenza codifica una molecola di RNA non codificante lunga 118 nucleotidi, HAR1F (human accelerated region 1F), che viene prodotta nella corteccia cerebrale umana in un momento decisivo dello sviluppo del cervello. Sebbene la funzione di questo RNA HAR1F non sia ancora nota, questa scoperta affascinante sta stimolando studi ulteriori che si spera getteranno luce su aspetti cruciali del cervello umano. Un approccio correlato nella ricerca di quelle mutazioni importanti che hanno contribuito all’evoluzione umana in modo simile inizia con sequenze di DNA che sono state conservate durante l’evoluzione dei mammiferi e, anziché andare alla ricerca di cambiamenti accelerati in singoli nucleotidi, si concentra invece su regioni cromosomiche che hanno subito delezioni nei 6 milioni di anni che ci separano dalla divisione della nostra linea da quella degli scimpanzé. Sono state scoperte più di 500 di queste sequenze, conservate tra le altre specie ma assenti nell’uomo. Ogni delezione rimuove in media 95 nucleotidi di sequenza di DNA. Solo una di queste delezioni riguarda una regione che codifica proteine; si ritiene che le rimanenti alterino regioni che influiscono sull’espressione dei geni circostanti, un’ipotesi che è stata confermata sperimentalmente in alcuni casi. Gran parte delle presunte regioni regolatrici identificate in questa maniera si trova vicino a geni che agiscono sulla funzione neurale e/o vicino a geni coinvolti nella segnalazione da steroidi, suggerendo che cambiamenti nel sistema nervoso e nelle funzioni immunitarie o riproduttive abbiano svolto un ruolo molto importante nell’evoluzione umana. ■ Mutazioni nelle sequenze di DNA che controllano l’espressione genica hanno determinato molti dei cambiamenti evolutivi nei vertebrati L’enorme quantità di dati sulle sequenze genomiche accumulata finora può essere esplorata in tanti altri modi per rivelare eventi accaduti anche centinaia di milioni di anni fa. Per esempio, si può cercare di scoprire le origini degli elementi regolatori del DNA che hanno svolto un ruolo cruciale nell’evoluzione dei vertebrati. Un tale studio è iniziato con l’identificazione di quasi 3 milioni di sequenze non codificanti, lunghe in media 28 coppie di basi, che sono state conservate nella recente evoluzione dei vertebrati e che, invece, sono assenti in antenati più antichi. Ognuna di queste speciali sequenze non codificanti probabilmente rappresenta un’innovazione funzionale peculiare di un particolare ramo dell’albero filogenetico della famiglia dei vertebrati e si pensa che per la maggior parte esse siano costituite da DNA regolatore che control- 4 DNA, cromosomi e genomi 237 CAPITOLO 4 DNA, cromosomi e genomi 238 Figura 4.74 È stato dedotto che i tipi di cambiamento nella regolazione genica hanno predominato durante l’evoluzione dei nostri antenati vertebrati. Per ottenere l’informazione riassunta in questo grafico, tutte le volte che è stato possibile il tipo di gene regolato da ciascuna sequenza non codificante conservata è stato dedotto dall’identità del gene che codifica proteine a esso più vicino. Quindi per ottenere le conclusioni mostrate è stato usato il tempo di fissazione per ogni sequenza conservata. (Basata su C.B. Lowe et al., Science 33:10191024, 2011. Con il permesso di AAAS.) © 978-88-08-62126-9 ricezione di segnali extracellulari UOMO TOPO MUCCA ORNITORINCO POLLO RANA sviluppo e regolazione trascrizionale PESCE modificazione post-traduzionale di proteine 500 400 300 200 milioni di anni fa 100 0 la l’espressione dei geni vicini. Date le sequenze di interi genomi, si possono identificare i geni che sono più vicini e che quindi più probabilmente sono divenuti soggetti al controllo di questi nuovi elementi regolatori. Comparando molte specie diverse, i cui tempi di divergenza sono noti, si può anche stimare quando ognuno di questi elementi regolatori è diventato una caratteristica conservata. Queste scoperte suggeriscono notevoli differenze evolutive tra le varie classi funzionali di geni (Figura 4.74). Elementi regolatori conservati che hanno avuto origine all’inizio dell’evoluzione dei vertebrati – cioè più di circa 300 milioni di anni fa, quando la linea dei mammiferi si è divisa dalla linea che ha portato a uccelli e rettili – sembrano essere prevalentemente associati a geni che codificano proteine regolatrici della trascrizione e proteine con ruoli nell’organizzazione dello sviluppo embrionale. Successivamente c’è stata un’era in cui le innovazioni riguardo il DNA regolatore sono sorte vicino a geni che codificano recettori che mediano segnali extracellulari. Infine, durante gli ultimi 100 milioni di anni, le innovazioni regolatrici sembrano essersi concentrate nelle vicinanze di geni codificanti proteine che, come le proteina chinasi, operano modificazioni post-traduzionali su altre proteine. Molte domande riguardo questi fenomeni e il loro significato rimangono senza risposta. Una possibile spiegazione è che la logica – lo schema del circuito – della rete di geni regolatori nei vertebrati si sia stabilita precocemente e che cambiamenti evolutivi più recenti siano avvenuti principalmente mediante l’aggiustamento di parametri quantitativi. Questo potrebbe aiutare a spiegare, per esempio, perché tra i mammiferi lo schema corporeo di base, cioè la topologia di tessuti e organi, sia largamente conservato. ■ La duplicazione genica fornisce una fonte importante di novitˆ genetica durante lÕevoluzione L’evoluzione dipende dalla creazione di nuovi geni, oltre che dalla modificazione di quelli che già esistono. In che modo ciò può avvenire? Quando confrontiamo organismi che sembrano molto diversi – un primate con un roditore, per esempio, o un topo con un pesce – raramente incontriamo geni in una specie che non hanno omologhi nell’altra. I geni senza corrispondenti omologhi sono relativamente rari quando confrontiamo organismi così divergenti come un mammifero e un verme. D’altra parte, spesso troviamo famiglie di geni che hanno numeri diversi di membri in specie differenti. Per creare queste famiglie i geni sono stati ripetutamente duplicati e le copie hanno subìto una divergenza per assumere nuove funzioni che spesso variano da una specie all’altra. La duplicazione genica avviene con alta frequenza in tutte le linee evolutive, contribuendo al vigoroso processo di aggiunta di DNA esaminato in precedenza. In uno studio dettagliato sulle duplicazioni spontanee nel lievito, sono state osservate comunemente duplicazioni di 50 000-250 000 coppie di nucleotidi, la maggior parte delle quali erano ripetute in tandem. Queste ripetizioni sembravano dovute a errori di replicazione del DNA che avevano por- CAPITOLO © 978-88-08-62126-9 tato alla riparazione non esatta di rotture cromosomiche a doppio filamento. Un confronto dei genomi di uomo e scimpanzé rivela che, dal momento della divergenza fra questi due organismi, duplicazioni segmentali hanno aggiunto circa 5 milioni di coppie di nucleotidi a ciascun genoma ogni milione di anni, con una media di dimensioni delle duplicazioni intorno a 50 000 coppie di nucleotidi (tuttavia ci sono duplicazioni cinque volte più grandi). In effetti, se si contano i nucleotidi, gli eventi di duplicazione hanno creato più differenze fra le nostre due specie delle sostituzioni di singoli nucleotidi. ■ I geni duplicati divergono Qual è il destino dei geni appena duplicati? Nella maggior parte dei casi si presume che non ci sia praticamente selezione – almeno inizialmente – per mantenere lo stato duplicato poiché ciascuna copia può fornire una funzione equivalente. Quindi molti eventi di duplicazione sono probabilmente seguiti da mutazioni che portano alla perdita di funzione in uno dei due geni. Questo ciclo ripristinerebbe funzionalmente lo stato a un solo gene che precedeva la duplicazione. In effetti ci sono molti esempi nei genomi contemporanei in cui si può vedere che una copia di un gene duplicato è stata inattivata irreversibilmente da mutazioni multiple. Con il passare del tempo ci si aspetterebbe che la somiglianza di sequenza fra un tale pseudogene e il gene funzionale dalla cui duplicazione è stato prodotto venga erosa dall’accumulo di molte mutazioni nello pseudogene, diventando alla fine irriconoscibile. Un destino alternativo per le duplicazioni geniche è che entrambe le copie restino funzionali, mentre la loro sequenza e il loro schema di espressione divergono e assumono ruoli diversi. Questo processo di “duplicazione e divergenza” quasi certamente spiega la presenza di grandi famiglie di geni con funzioni correlate negli organismi biologicamente complessi e si pensa che abbia un ruolo cruciale nell’evoluzione di un’aumentata complessità biologica. Un esame di molti genomi eucariotici diversi suggerisce che la probabilità che un gene particolare subisca un evento di duplicazione che si diffonde nella maggior parte o in tutti gli individui di una specie è approssimativamente dell’1% ogni milione di anni. Duplicazioni dell’intero genoma offrono esempi particolarmente evidenti del ciclo di duplicazione-divergenza. Una duplicazione di un intero genoma può avvenire molto semplicemente: tutto ciò che è necessario è un ciclo di replicazione del genoma in una linea di cellule germinali senza una corrispondente divisione cellulare. All’inizio il numero dei cromosomi semplicemente raddoppia. Questi aumenti improvvisi della ploidia di un organismo sono comuni, specialmente nei funghi e nei vegetali. Dopo una duplicazione dell’intero genoma, tutti i geni sono copie duplicate.Tuttavia, a meno che la duplicazione non sia avvenuta così di recente da aver lasciato poco tempo per alterazioni successive nella struttura del genoma, i risultati di una serie di duplicazioni segmentali – che avvengono in tempi diversi – sono molto difficili da distinguere dal prodotto finale di una duplicazione dell’intero genoma. Nel caso dei mammiferi, per esempio, la parte rappresentata dalle duplicazioni dell’intero genoma a fronte di quella dovuta a una serie di duplicazioni di pezzi di segmenti di DNA è molto incerta. Nonostante ciò, è chiaro che nel lontano passato è avvenuta una grande quantità di duplicazioni geniche. L’analisi del genoma dello zebrafish, in cui almeno una duplicazione dell’intero genoma si pensa sia avvenuta centinaia di milioni di anni fa, ha gettato un po’ di luce sul processo di duplicazione genica e divergenza. Sebbene sembri che molti duplicati dei geni dello zebrafish siano andati perduti per mutazione, una frazione significativa – forse fino al 30-50% – ha subìto una divergenza funzionale mentre entrambe le copie sono rimaste attive. In molti casi la differenza f