Il Problema della Fase - Web server per gli utenti dell`Università
by user
Comments
Transcript
Il Problema della Fase - Web server per gli utenti dell`Università
Il Problema della Fase A.A. 2009-2010 Marco Nardini Dipartimento di Scienze Biomolecolari e Biotecnologie Università di Milano Il Problema della Fase Problema della fase: ? Ihkl ρ(x,y,z) Il Problema della Fase Problema della fase: Ihkl ∝ |Fhkl|2 Proprietà strutturale (posizione) Proprietà dell’atomo N atomi Fhkl = Fattore di struttura Densità elettronica Σ f exp [2πi (hx + ky + lz )] = |F j=1 j j j j hkl| exp (iαhkl) i ∫ Fhkl = ρ(x,y,z) exp [2πi(hx+ky+lz)] dV Vcell 1 ρ(x,y,z) = V f3 F π Σhkl |Fhkl| exp [-2πi(hx+ky+lz-α’hkl)] αP non misurabile sperimentalmente f1 f2 r Il Problema della Fase Calcolo della Densità Elettronica: La densità elettronica ρ(xyz) esprime la posizione degli atomi (cioè la struttura tridimensionale) della proteina nella cella elementare, e può dunque essere espressa matematicamente come la trasformata di Fourier inversa di Fhkl: ρ(x,y,z) = +∞ 1 ΣΣΣ F e-2πi(hx+ky+lz) V h=-∞ k l hkl = 1 Σ (Fhkl eiαhkl ) e-2πi(hx+ky+lz) V hkl V = volume della cella elementare Da un semplice esperimento di diffrazione di raggi X su un monocristallo macromolecolare nativo si misurano i moduli di Fhkl (Fhkl) mentre non si hanno informazioni sulle fasi αhkl. Il Problema della Fase Calcolo della Densità Elettronica: Quindi non è possibile calcolare la funzione densità elettronica per gli atomi che si trovano nella cella elementare. Per ottenere informazioni su e quindi essere in grado di calcolare la funzione densità elettronica è necessario utilizzare i seguenti metodi: 1) metodo delle “Sostituzioni Isomorfe” o metodo degli “Atomi Pesanti” 2) metodo delle “Sostituzioni molecolari” (“Molecular Replacement”) Il Problema della Fase Metodo degli Atomi Pesanti: Metodo sperimentale basato sulla possibilità di modificare i fattori di struttura (modulo e fase) della proteina “nativa” mediante il legame specifico di “atomi pesanti” (cioè a numero atomico molto superiore a quello di C, O, N, S. Tipicamente si usano Hg, Pt, U). Quando la posizione degli atomi pesanti all’interno della cella elementare viene determinata (calcolo della Funzione di Patterson) è possibile calcolare delle fasi approssimate da associare al modulo di ciascun fattore di struttura osservato, e calcolare una densità elettronica approssimata per la proteina. Il Problema della Fase Modificazione chimica (“derivatizzazione”) del cristallo: - “soaking” del cristallo in una soluzione stabilizzante addizionata con atomi pesanti -“cocristallizzazione” proteina-atomi pesanti Il cristallo derivatizzato deve essere isomorfo con quello nativo In caso di perfetto isomorfismo fra cristallo nativo e cristallo derivato, la conformazione delle proteine, la loro posizione ed orientazione rispetto agli assi cristallografici, ed i parametri dell’unità di cella e la simmetria cristallina sono gli stessi Il Problema della Fase Le differenze fra i fattori di struttura del cristallo nativo (FP) e derivato (FPH) sono dovuti esclusivamente agli atomi pesanti legati (FH). FPH = FP+ FH (somma vettoriale) i FPH π αPH αP FH αH FP r Le ampiezze FPH ed FP sono misurate sperimentalmente dai diagrammi di diffrazione del cristallo nativo e di quello derivato (I ∝ |F|2). FH (ampiezza e fase) sono calcolati dalla posizione degli atomi pesanti legati alle proteine nel cristallo derivato, che può essere ottenuta utilizzando la sintesi di Patterson, con coefficienti (FPH - FP)2. Il Problema della Fase MIR (Multiple Isomorphous Replacement): i N atomi Fhkl = Σ f exp [2πi (hx + ky + lz )] = |F j=1 j j j j hkl| exp (iαhkl) π αP F P r atomi pesanti cristallo nativo H (Ihkl)P (Ihkl)PH cristallo derivato Il Problema della Fase Il calcolo della fase αP da assegnare a FP può essere descritto attraverso una costruzione geometrica dovuta ad Harker. i |FPH | Protein FH In tale rappresentazione i fattori di struttura FP ed una serie di FPH ottenuti da diversi derivati sono disegnati come cerchi nel piano complesso. π |FP | r Protein + Heavy atom Il Problema della Fase i i |FPH | Protein FH |FP | π |FP | r r -FH |FPH | Protein + Heavy atom Da un esperimento con un unico atomo pesante si ottengono due possibili valori di fase che possono essere attribuiti a FP. Tale ambiguità viene rimossa misurando per lo meno un’altro derivato pesante Il Problema della Fase i i FH2 |FPH2| |FP | π π |FPH2| r -FH2 FP αP |FP | r -FH |FPH | Protein + Heavy atom 2 Il paragone dei contributi forniti dai due atomi pesanti diversi (devono legarsi in punti diversi della proteina) identifica il corretto valore di αP da associare a FP Il Problema della Fase Nei casi reali, un atomo pesante può variare di poco l’ampiezza del fattore di struttura. Inoltre, il calcolo di FH è spesso molto approssimato sia a causa di una deconvoluzione approssimata della differenza di Patterson isomorfa, sia a causa di fenomeni di non-isomorfismo. Il risultato di queste approssimazioni sperimentali e di calcolo è che i cerchi di Harker non si intersecano in un singolo punto e si ha una certa incertezza nella assegnazione della fase. Il Problema della Fase Praticamente, maggiore è il numero dei derivati di cui si raccolgono dati di diffrazione isomorfi alla nativa, maggiore è la probabilità di ottenere una stima ragionevolmente accurata della fase da attribuire ai fattori di struttura. La ρ(x,y,z) migliore è quella che associa a ciascun |FP|hkl (cioè Fhkl) la fase αP più probabile α(best)hkl 1 +∞ ρ(x,y,z) = Σ Σ Σ m [Fhkl eiα(best)hkl ] e-2πi(hx+ky+lz) V h=-∞ k l m = figura di merito 0 ≤ m ≤ 1 Il Problema della Fase Scattering Anomalo : Gli elementi possono sia assorbire raggi X che emetterli. L’assorbimento ha un picco poco prima della lunghezza d’onda di emissione caratteristica. Un elemento mostra scattering anomalo quando la lunghezza d’onda incidente è prossima alla soglia di assorbimento (“absorption edge”). Raggio X (λ ≅ absorption edge) H cristallo derivato Il Problema della Fase Per gli atomi leggeri presenti nell’unità di cella tali soglie non sono prossime alle lunghezze d’onda utilizzate per la cristallografia, quindi gli atomi di carbonio, ossigeno ed azoto non contribuiscono allo scattering anomalo. Tuttavia, gli atomi pesanti hanno soglie in questo range di lunghezze d’onda. Se si raccolgono dati al sincrotrone, è possibile portare la lunghezza d’onda dei raggi X incidenti a valori tali da massimizzare lo scattering anomalo degli atomi pesanti. Quando la lunghezza d’onda dei raggi X è prossima al picco di assorbimento di un atomo pesante, una frazione della radiazione è assorbita dall’atomo pesante e riemessa con una fase alterata. fanomalo (θ,λ) = f 0(θ)+ f ’(λ) + i f ”(λ) ƒ‘ e ƒ“ sono espressi in unità di elettrone come ƒ0 Il Problema della Fase Significato fisico dello scattering anomalo : A certe energie dei raggi X (λ di assorbimento), l’onda elettromagnetica incidente avrà una frequenza che interferisce con l’oscillazione degli elettroni interni dell’atomo (effetto di risonanza) → gli elettroni non possono essere più considerati “liberi” Coefficiente di assorbimento atomico per il rame (μa): la soglia di assorbimento K è 1.380 Å. μa (cm2) è definito come μa= (μ/ρ) x (A/N) dove ρ è la densità del materiale assorbente, A è il suo peso atomico, N è il numero di Avogadro, e μ è il coefficiente di assorbimento lineare totale definito da I = I0 exp(-μt) dove t è lo spessore del materiale in cm, I0 l’intensità incidente ed I quella del fascio trasmesso. Il Problema della Fase Significato fisico dello scattering anomalo : L’effetto anomalo aumenta con il numero atomico dello scatteratore e con l’avvicinarsi dell’energia dei raggi X all’energia di risonanza per l’eccitazione degli elettroni da particolari livelli orbitali. Le soglie di assorbimento sono classificate in accordo con le shells di energia degli elettroni, come K, LI, LII, LIII o M. Teoria classica: interazioni di scattering → 2 oscillatori accoppiati - onda corrispondente al raggio X incidente - atomo, trattato come un dipolo oscillante con frequenze naturali uguali alle soglie di assorbimento delle shell elettroniche Il Problema della Fase Significato fisico dello scattering anomalo : Teoria classica: interazioni di scattering → 2 oscillatori accoppiati Se all’onda incidente sull’atomo è associato un campo elettrico E=E0 exp(iωt) nella posizione in cui si trova il dipolo, il campo induce l’oscillazione degli elettroni atomici. Lo spostamento della particella è dato da: .. . x + kx + ωS2x = (eE0/m) exp(iωt) k = fattore di accoppiamento ωS = frequenza circolare dell’elettrone m = massa elettrone ruotante attorno al nucleo (fermo) x = (eE0/m) [exp(iωt) / (ωS2 - ω2 + ikω)] Il Problema della Fase Significato fisico dello scattering anomalo : Teoria classica: interazioni di scattering → 2 oscillatori accoppiati x = (eE0/m) [exp(iωt) / (ωS2 - ω2 + ikω)] Il dipolo irradia un’onda di frequenza ω con ampiezza nel piano equatoriale (normale ad E) ad una distanza unitaria: A = (e2/mc2) [ω2E0 / (ωS2 - ω2 + ikω)] Ae = ampiezza scatterata da elettrone libero (ampiezza di Thomson, ωS = 0, k = 0) Ae = - (e2/mc2) E0 ƒ = fattore di scattering di dipolo = A / Ae= [ω2 / (ω2 - ωS2 – ikω)] Il Problema della Fase Significato fisico dello scattering anomalo : Teoria classica: interazioni di scattering → 2 oscillatori accoppiati ƒ = fattore di scattering di dipolo = A / Ae= [ω2 / (ω2 - ωS2 – ikω)] ƒ = ƒ' + iƒ" ƒ‘(ω) = [ω2 (ω2 - ωS2 )] / [(ω2 - ωS2 )2 + k2ω2 ] ƒ"(ω) = (kω3) / [(ω2 - ωS2)2 + k2ω2 ] Se si considera un atomo come formato da una distribuzione di dipoli oscillanti, il fattore di scattering atomico contiene una componente reale ed una immaginaria Il Problema della Fase Raggio X (λ ≅ absorption edge) H cristallo derivato fanomalo (θ,λ) = f 0(θ)+ f ’(λ) + i f ”(λ) f 0 f f0 f" f' L’ampiezza di scattering fanomalo contiene un termine reale, f 0,relativo alla diffusione Thompson da elettrone libero e funzione del solo angolo di diffrazione θ, e due termini f ’, f ” dipendenti dalla lunghezza d’onda della radiazione incidente ma non dall’angolo di diffrazione θ. Il Problema della Fase Il Problema della Fase Element Se (Z = 34) Atomic mass: 78.9600 Edge K L-I L-II L-III E (keV) 12.6578 1.6539 1.4762 1.4358 λ (Å) 0.9795 7.4965 8.3989 8.6352 Il Problema della Fase In condizione di scattering anomalo non vale più la legge di Friedel asse immaginario Legge di Friedel: Ihkl = Ihkl cioè |Fhkl| = |Fhkl|, φhkl= -φhkl (+) hkl π FP+ A φP+ B φP- In generale: Fhkl = Σ fj e[2πi(hxj + kyj + lzj)] = Fhkl eiαhkl F = |F| eiα = F eiα = |F| (cos φ + i sen φ) = A + iB dove i = (-1)1/2 (-) hkl asse reale FP- Il Problema della Fase Allora: Fhkl = Ahkl + iBhkl = |Fhkl| cos φ + i |Fhkl| sen φ N Ahkl = jΣ= 1 fj cos 2π(hxj + kyj + lzj) asse immaginario N Bhkl = jΣ= 1 fj sen 2π(hxj + kyj + lzj) F F sen φ φ F cos φ asse reale Il fenomeno della diffrazione introduce sempre un centro di simmetria nella distribuzione delle intensità diffratte: Il Problema della Fase Ihkl = Ihkl dove hkl significa -h, -k, -l x Il Problema della Fase In assenza di scattering anomalo questa legge vale anche se il reticolo diretto non presenta un centro di simmetria Dimostrazione: Ahkl = Σ fj cos 2π(-hxj - kyj - lzj) = Σ fj cos 2π(hxj + kyj + lzj) quindi: Ahkl = Ahkl Bhkl = Σ fj sen 2π(-hxj - kyj - lzj) = Σ fj [-sen 2π(hxj + kyj + lzj)] quindi: Bhkl = -Bhkl Il Problema della Fase poichè: Ihkl = K |Fhkl|2 =K (A2hkl + B2hkl) Ihkl = K |Fhkl|2 =K (A2hkl + B2hkl) = K (A2hkl + B2hkl) quindi: Ihkl = Ihkl Il Problema della Fase SIRAS (Single I. R. with Anomalous Scattering): non vale più |Fhkl| = |Fhkl|, φhkl= -φhkl la legge di Friedel i (+) hkl π (-) hkl i F”H+ FPH+ FPH FPH FH π FP+ FPFPH- FH FPH+ r F”H- F”H+ FH FPH FP F”H- FPH- r Il Problema della Fase Se sono presenti atomi pesanti nella struttura proteica, la conseguenza del loro scattering anomalo (diffrazione a prossime alla soglia di assorbimento per quel dato atomo pesante) risulta essere una differenza (piccola) tra i valori assoluti e le fasi di Fhkl e Fhkl (coppie di Bijvoet) La violazione della legge di Friedel può essere utilizzata per la determinazione dell’angolo di fase da attribuire a Fhkl, anche utlizzando un solo atomo pesante (metodo SIRAS, MAD) Il Problema della Fase i FPH+ F”H+ FH FPH π FP i F”H- FPH- r FPH- π FH+ FHFP r i FH+ π F”H+ FH FPH FP FH- r F”H- FPH+ Il Problema della Fase ¾ In presenza di scattering anomalo un solo derivato pesante è sufficiente per risolvere il problema dell’ambiguità della fase da associare a FP ¾ In media, le differenze isomorfe (FPH – FP) sono maggiori rispetto alle differenze anomale (FPH+ – FPH-) ¾ (FPH – FP) deriva da misure su cristalli diversi errori di non isomorfismo, non presenti in (FPH+ – FPH-) Il Problema della Fase Metodo MAD (Multiple Anomalous Dispersion) f(λ) = f0+ Δf (λ) + if "(λ) λ1) Δf ha il suo minimo (massima differenza dispersiva) ΔFΔλ(hkl) = |Fλ1(h)|-|Fλ3(h)| λ λ dove |Fλ (h)| = | F (h)|+| F (-h)| 2 λ2) f " ha il suo massimo (massima differenza coppie di Bijvoet) λ3) remota, dove Δf e f " sono piccole (>1000 eV da λ2) Il Problema della Fase Metodo MAD (scelta delle λ sperimentali) f (λ) = f 0 + Δf (λ) + if ′′(λ) = f ′ + if ′′ peak: f’’ massimo, Δf medio remote: f’’ minimo, Δf grande inflection: f’’ medio, Δf minimo Il Problema della Fase Intuitivamente, il confronto dei fattori di struttura raccolti alla lunghezza d’onda λ1 e quelli raccolti alla λ3 (remota) è simile a quello operato nel caso del metodo MIR. Infatti per λ=λ1 la variazione di f’ (o Δf) è massima, mentre f’’ è relativamente piccolo. Quindi FPH(λ1) e FPH(λ3) differiscono per il fatto che nel fattore di scattering atomico associato all’atomo pesante è presente il fattore reale f’. E’ come se nel cristallo contenente l’atomo pesante, la variazione di λ da λ3 a λ1 avesse introdotto un ulteriore atomo pesante “fittizio” di fattore di scattering reale pari a f’. Questo in analogia al metodo delle sostituzioni isomorfe in cui un atomo pesante di fattore di scattering atomico f (reale) va ad aggiungersi ai fattori di scattering atomici degli atomi della proteina nativa. Il Problema della Fase Il confronto dei fattori di struttura raccolti alla lunghezza d’onda λ2 e quelli raccolti alla λ3 (remota) è simile, invece, a ciò che accade nel metodo SIRAS. Infatti per λ=λ2 la variazione di f’’ è massima, mentre f’ è relativamente piccolo. Quindi la variazione di λ da λ3 a λ2 porta ad un incremento di un fattore immaginario f’’ del fattore di scattering dell’atomo pesante, contribuendo alla distinzione delle coppie di Friedel (o di Bijvoet), proprio come accade quando si confrontano dati di diffrazione raccolti su cristalli nativi a con dati raccolti su cristalli contenenti atomi pesanti a λ prossime alle soglie di assorbimento per quel dato atomo pesante (scattering anomalo). In generale, va notato che i contributi f’ ed f” al fattore di scattering atomico dell’atomo pesante al variare di λ da λ3 a λ1 e λ2 sono molto inferiori rispetto alle variazioni dovute all’introduzione di un atomo pesante in un cristallo nativo. Il Problema della Fase ¾ Metodo MAD - soaking o cocristallizzazione Se - incorporazione “naturale” (proteina contenente un elemento con sufficiente segnale anomalo. Es: 1 Se (Z=34) Se-metionina per non più di circa 100-150 residui) ¾ Un solo cristallo è richiesto ¾ Radiazione X a λ variabile (λ stabile) precisa scelta di λ per ottimizzare le differenze in intensità fra le coppie di Bijvoet e fra riflessi misurati a diverse λ ¾ Crio-cristallografia (T ∼100 K) Fe Il Problema della Fase ¾ Metodo MAD (+) il non-isomorfismo tra cristalli nativi e derivati non è più un problema → le differenze anomale e dispersive possono essere stimate con maggior precisione (-) l’intensità del segnale (spesso meno di 10 elettroni) è molto più debole rispetto al caso MIR (>50 elettroni) poiché la componente anomala del fattore di scattering (ƒ‘+ iƒ“) è indipendente dall’angolo di scattering (mentre ƒ0 decade rapidamente con θ) il contributo relativo del segnale anomalo tende ad aumentare con la risoluzione è possibile calcolare fasi utilizzando solo le differenze anomale (SAD/S: Single Anomalous Dispersion/Scattering). La bimodalità nel caso SAD può essere risolta applicando estensivamente tecniche di density modification Il Problema della Fase Molecular Replacement: Ihkl ∝ |Fhkl|2 Proteina Prerequisito: modello proteina modello atomico da cui possono essere calcolate fasi approssimate Densità elettronica ρ(x,y,z) = 1 V Σhkl |Fhkl| exp [-2πi(hx+ky+lz-α’hkl)] fasi approssimate Il Problema della Fase Si crea un cristallo “virtuale”, con parametri di cella e gruppo spaziale uguali al cristallo reale, in cui si posiziona “opportunamente” un modello molecolare (ottenuto per omologia di sequenza) per la proteina a struttura incognita. La struttura tridimensionale del modello viene presa dal Protein Data Bank (http://www.rcsb.org/pdb). Sulla base delle coordinate degli atomi del modello “opportunamente” posizionato nel cristallo “virtuale” si possono calc calc calc calcolare i fattori di struttura Fhkl in modulo e fase (Fhkl e αhkl ). calc N Fhkl = j=1 Σ fj e[2πi(hxj + kyj + lzj)] = calc Fhkleiαhkl Il Problema della Fase Per il calcolo della densità elettronica approssimata per la proteina a struttura incognita (di cui sono stati raccolti dati di diffrazione su un oss cristallo nativo, Ihkl = intensità osservate) si utilizzano le fasi calc calcolate dal modello ( αhkl ) ed i moduli dei fattori di struttura oss osservati ( Fhkl ). calc oss 1 i α ρ(x,y,z) = Σ ( Fhkl e hkl ) e-2πi(hx+ky+lz) V hkl Se il metodo del Molecular Replacement ha avuto successo (il modello era sufficientemente simile alla struttura incognita ed è stato posizionato correttamente nel cristallo “virtuale” in modo da simulare il cristallo reale), allora nella densità elettronica così ottenuta si dovranno vedere le caratteristiche strutturali della proteina incognita (e non del modello). Il Problema della Fase ¾ Proteina a struttura incognita (ma a sequenza nota) Ricerca nel PDB di una proteina a struttura nota con alta similarità di sequenza con la sequenza della proteina a struttura incognita ¾ Proteina ..YKTQAGKTVDYINAAIGG----SADGAGL.. Modello ..YQTQASKTVDYITAALAGSRNVSADAAGL.. * *** ****** ** * *** *** l’omologia strutturale correla col livello di identità in sequenza (MR se almeno 30% identità) Il Problema della Fase Osservazioni pratiche Dati L’uso di dati a risoluzione migliore di 3.0 Å non aumenta la possibilità di trovare una soluzione nel MR. Anzi, l’uso di dati a risoluzione troppo alta può avere l’effetto contrario, a seguito di una scarsa correlazione tra il modello e la struttura reale. Modello. ¾ Modelli costruiti per omologia di solito non funzionano ¾ Più alta è la frazione di u.a. occupata dal modello meglio è Per proteine con più stati conformazionali è importante usare un modello avente lo stesso stato conformazionale della proteina a struttura incognita ¾ Il Problema della Fase Osservazioni pratiche Modello. Nel caso di un modello NMR si possono utilizzare la sovrapposizione di tutti i modelli, il modello medio minimizzato, ciascun singolo modello. ¾ Più alta è l’identità di sequenza tra modello e proteina a struttura incognita meglio è. Per residui non corrispondenti: ¾ - lasciare la sequenza originale (es: una Leu ed una Asn a 3.5Å non sono appaiono molto diverse) - tagliare le catene laterali ad Ala - sostituire le catene laterali del modello con quelle della proteina (solo se si ha un’ottima idea di dove orientare le catene laterali Il Problema della Fase ¾ ¾ Creazione del cristallo “virtuale” e posizionamento (uso della funzione di Patterson) in esso del modello tratto dal PDB (eventualmente modificato sulla base dell’allineamento di sequenze) calc Calcolo dei fattori di struttura derivati dal modello Fhkl in calc calc modulo e fase ( Fhkl e αhkl ) Calcolo della densità elettronica approssimata usando calc oss i fattori di struttura ibridi Fhkl = Fhkl eiαhkl ) ¾ calc oss 1 ρ(x,y,z) = Σ ( Fhkl eiαhkl ) e-2πi(hx+ky+lz) V hkl Il Problema della Fase Uso del Molecular Replacement: ¾ proteina omologa ¾ stessa proteina in forma ‘nativa’ (studi di mutanti o complessi) ¾ parte di una proteina multidominio modello proteina mutante modello complesso modello I II III