...

Il Problema della Fase - Web server per gli utenti dell`Università

by user

on
Category: Documents
14

views

Report

Comments

Transcript

Il Problema della Fase - Web server per gli utenti dell`Università
Il Problema della Fase
A.A. 2009-2010
Marco Nardini
Dipartimento di Scienze Biomolecolari e Biotecnologie
Università di Milano
Il Problema della Fase
Problema della fase:
?
Ihkl
ρ(x,y,z)
Il Problema della Fase
Problema della fase:
Ihkl ∝ |Fhkl|2
Proprietà strutturale
(posizione)
Proprietà
dell’atomo
N atomi
Fhkl =
Fattore
di struttura
Densità
elettronica
Σ f exp [2πi (hx + ky + lz )] = |F
j=1
j
j
j
j
hkl|
exp (iαhkl)
i
∫
Fhkl = ρ(x,y,z) exp [2πi(hx+ky+lz)] dV
Vcell
1
ρ(x,y,z) =
V
f3
F
π
Σhkl |Fhkl| exp [-2πi(hx+ky+lz-α’hkl)]
αP
non misurabile
sperimentalmente
f1
f2
r
Il Problema della Fase
Calcolo della Densità Elettronica:
La densità elettronica ρ(xyz) esprime la posizione degli atomi (cioè la
struttura tridimensionale) della proteina nella cella elementare, e può
dunque essere espressa matematicamente come la trasformata di Fourier
inversa di Fhkl:
ρ(x,y,z) =
+∞
1 ΣΣΣ F e-2πi(hx+ky+lz)
V h=-∞ k l hkl
= 1 Σ (Fhkl eiαhkl ) e-2πi(hx+ky+lz)
V hkl
V = volume della cella elementare
Da un semplice esperimento di diffrazione di raggi X su un monocristallo
macromolecolare nativo si misurano i moduli di Fhkl (Fhkl) mentre non si
hanno informazioni sulle fasi αhkl.
Il Problema della Fase
Calcolo della Densità Elettronica:
Quindi non è possibile calcolare la funzione densità
elettronica per gli atomi che si trovano nella cella elementare.
Per ottenere informazioni su e quindi essere in grado di calcolare la
funzione densità elettronica è necessario utilizzare i seguenti metodi:
1) metodo delle “Sostituzioni Isomorfe” o metodo degli “Atomi Pesanti”
2) metodo delle “Sostituzioni molecolari” (“Molecular Replacement”)
Il Problema della Fase
Metodo degli Atomi Pesanti:
Metodo sperimentale basato sulla possibilità di modificare i fattori di
struttura (modulo e fase) della proteina “nativa” mediante il legame
specifico di “atomi pesanti” (cioè a numero atomico molto superiore a
quello di C, O, N, S. Tipicamente si usano Hg, Pt, U).
Quando la posizione degli atomi pesanti all’interno della cella elementare
viene determinata (calcolo della Funzione di Patterson) è possibile
calcolare delle fasi approssimate da associare al modulo di ciascun fattore
di struttura osservato, e calcolare una densità elettronica approssimata per la
proteina.
Il Problema della Fase
Modificazione chimica (“derivatizzazione”) del cristallo:
- “soaking” del cristallo in una soluzione stabilizzante addizionata con
atomi pesanti
-“cocristallizzazione” proteina-atomi pesanti
Il cristallo derivatizzato deve essere isomorfo con quello nativo
In caso di perfetto isomorfismo fra cristallo nativo e cristallo derivato, la
conformazione delle proteine, la loro posizione ed orientazione rispetto agli
assi cristallografici, ed i parametri dell’unità di cella e la simmetria
cristallina sono gli stessi
Il Problema della Fase
Le differenze fra i fattori di struttura del
cristallo nativo (FP) e derivato (FPH) sono
dovuti esclusivamente agli atomi pesanti
legati (FH).
FPH = FP+ FH
(somma vettoriale)
i
FPH
π
αPH
αP
FH
αH
FP
r
Le ampiezze FPH ed FP sono misurate sperimentalmente dai diagrammi di
diffrazione del cristallo nativo e di quello derivato (I ∝ |F|2).
FH (ampiezza e fase) sono calcolati dalla posizione degli atomi pesanti
legati alle proteine nel cristallo derivato, che può essere ottenuta utilizzando
la sintesi di Patterson, con coefficienti (FPH - FP)2.
Il Problema della Fase
MIR (Multiple Isomorphous Replacement):
i
N atomi
Fhkl =
Σ f exp [2πi (hx + ky + lz )] = |F
j=1
j
j
j
j
hkl|
exp (iαhkl)
π
αP F P
r
atomi
pesanti
cristallo
nativo
H
(Ihkl)P
(Ihkl)PH
cristallo
derivato
Il Problema della Fase
Il calcolo della fase αP da assegnare a FP può essere descritto attraverso
una costruzione geometrica dovuta ad Harker.
i
|FPH |
Protein
FH
In tale rappresentazione i fattori
di struttura FP ed una serie di FPH
ottenuti da diversi derivati sono
disegnati come cerchi nel piano
complesso.
π
|FP |
r
Protein +
Heavy atom
Il Problema della Fase
i
i
|FPH |
Protein
FH
|FP |
π
|FP |
r
r
-FH
|FPH |
Protein +
Heavy atom
Da un esperimento con un unico atomo pesante si ottengono due
possibili valori di fase che possono essere attribuiti a FP. Tale ambiguità
viene rimossa misurando per lo meno un’altro derivato pesante
Il Problema della Fase
i
i
FH2
|FPH2|
|FP |
π
π
|FPH2|
r
-FH2
FP
αP |FP |
r
-FH
|FPH |
Protein +
Heavy atom 2
Il paragone dei contributi forniti dai due atomi pesanti diversi (devono
legarsi in punti diversi della proteina) identifica il corretto valore di αP da
associare a FP
Il Problema della Fase
Nei casi reali, un atomo pesante può variare di poco l’ampiezza del fattore
di struttura. Inoltre, il calcolo di FH è spesso molto approssimato sia a causa
di una deconvoluzione approssimata della differenza di Patterson isomorfa,
sia a causa di fenomeni di non-isomorfismo.
Il risultato di queste approssimazioni sperimentali e di calcolo è che i cerchi
di Harker non si intersecano in un singolo punto e si ha una certa incertezza
nella assegnazione della fase.
Il Problema della Fase
Praticamente, maggiore è il numero dei derivati di cui si raccolgono dati di
diffrazione isomorfi alla nativa, maggiore è la probabilità di ottenere una
stima ragionevolmente accurata della fase da attribuire ai fattori di struttura.
La ρ(x,y,z) migliore è quella che associa a ciascun |FP|hkl (cioè Fhkl) la fase
αP più probabile α(best)hkl
1 +∞
ρ(x,y,z) = Σ Σ Σ m [Fhkl eiα(best)hkl ] e-2πi(hx+ky+lz)
V h=-∞ k l
m = figura di merito 0 ≤ m ≤ 1
Il Problema della Fase
Scattering Anomalo :
Gli elementi possono sia assorbire raggi X che emetterli.
L’assorbimento ha un picco poco prima della lunghezza d’onda di
emissione caratteristica. Un elemento mostra scattering anomalo quando la
lunghezza d’onda incidente è prossima alla soglia di assorbimento
(“absorption edge”).
Raggio X
(λ ≅ absorption edge)
H
cristallo
derivato
Il Problema della Fase
Per gli atomi leggeri presenti nell’unità di cella tali soglie non sono
prossime alle lunghezze d’onda utilizzate per la cristallografia, quindi gli
atomi di carbonio, ossigeno ed azoto non contribuiscono allo scattering
anomalo. Tuttavia, gli atomi pesanti hanno soglie in questo range di
lunghezze d’onda.
Se si raccolgono dati al sincrotrone, è possibile portare la lunghezza d’onda
dei raggi X incidenti a valori tali da massimizzare lo scattering anomalo
degli atomi pesanti.
Quando la lunghezza d’onda dei raggi X è prossima al picco di
assorbimento di un atomo pesante, una frazione della radiazione è assorbita
dall’atomo pesante e riemessa con una fase alterata.
fanomalo (θ,λ) = f 0(θ)+ f ’(λ) + i f ”(λ)
ƒ‘ e ƒ“ sono espressi in unità di elettrone come ƒ0
Il Problema della Fase
Significato fisico dello scattering anomalo :
A certe energie dei raggi X (λ di assorbimento), l’onda elettromagnetica
incidente avrà una frequenza che interferisce con l’oscillazione degli
elettroni interni dell’atomo (effetto di risonanza) → gli elettroni non
possono essere più considerati “liberi”
Coefficiente di assorbimento atomico
per il rame (μa):
la soglia di assorbimento K è 1.380 Å. μa (cm2)
è definito come
μa= (μ/ρ) x (A/N)
dove ρ è la densità del materiale assorbente, A è il suo peso atomico, N è il numero
di Avogadro, e μ è il coefficiente di assorbimento lineare totale definito da
I = I0 exp(-μt)
dove t è lo spessore del materiale in cm, I0 l’intensità incidente ed I quella del fascio
trasmesso.
Il Problema della Fase
Significato fisico dello scattering anomalo :
L’effetto anomalo aumenta con il numero atomico dello scatteratore e con
l’avvicinarsi dell’energia dei raggi X all’energia di risonanza per
l’eccitazione degli elettroni da particolari livelli orbitali.
Le soglie di assorbimento sono classificate in accordo con le shells di
energia degli elettroni, come K, LI, LII, LIII o M.
Teoria classica: interazioni di scattering → 2 oscillatori accoppiati
- onda corrispondente al raggio X incidente
- atomo, trattato come un dipolo oscillante con frequenze naturali uguali
alle soglie di assorbimento delle shell elettroniche
Il Problema della Fase
Significato fisico dello scattering anomalo :
Teoria classica: interazioni di scattering → 2 oscillatori accoppiati
Se all’onda incidente sull’atomo è associato un campo elettrico E=E0 exp(iωt)
nella posizione in cui si trova il dipolo, il campo induce l’oscillazione degli
elettroni atomici.
Lo spostamento della particella è dato da:
..
.
x + kx + ωS2x = (eE0/m) exp(iωt)
k = fattore di accoppiamento
ωS = frequenza circolare dell’elettrone
m = massa elettrone ruotante attorno al nucleo (fermo)
x = (eE0/m) [exp(iωt) / (ωS2 - ω2 + ikω)]
Il Problema della Fase
Significato fisico dello scattering anomalo :
Teoria classica: interazioni di scattering → 2 oscillatori accoppiati
x = (eE0/m) [exp(iωt) / (ωS2 - ω2 + ikω)]
Il dipolo irradia un’onda di frequenza ω con ampiezza nel piano equatoriale
(normale ad E) ad una distanza unitaria:
A = (e2/mc2) [ω2E0 / (ωS2 - ω2 + ikω)]
Ae = ampiezza scatterata da elettrone libero (ampiezza di Thomson, ωS = 0, k = 0)
Ae = - (e2/mc2) E0
ƒ = fattore di scattering di dipolo = A / Ae= [ω2 / (ω2 - ωS2 – ikω)]
Il Problema della Fase
Significato fisico dello scattering anomalo :
Teoria classica: interazioni di scattering → 2 oscillatori accoppiati
ƒ = fattore di scattering di dipolo = A / Ae= [ω2 / (ω2 - ωS2 – ikω)]
ƒ = ƒ' + iƒ"
ƒ‘(ω) = [ω2 (ω2 - ωS2 )] / [(ω2 - ωS2 )2 + k2ω2 ]
ƒ"(ω) = (kω3) / [(ω2 - ωS2)2 + k2ω2 ]
Se si considera un atomo come formato da una distribuzione di dipoli oscillanti, il
fattore di scattering atomico contiene una componente reale ed una immaginaria
Il Problema della Fase
Raggio X
(λ ≅ absorption edge)
H
cristallo
derivato
fanomalo (θ,λ) = f 0(θ)+ f ’(λ) + i f ”(λ)
f
0
f
f0
f"
f'
L’ampiezza di scattering fanomalo contiene un termine reale, f 0,relativo alla
diffusione Thompson da elettrone libero e funzione del solo angolo di
diffrazione θ, e due termini f ’, f ” dipendenti dalla lunghezza d’onda della
radiazione incidente ma non dall’angolo di diffrazione θ.
Il Problema della Fase
Il Problema della Fase
Element Se (Z = 34) Atomic mass: 78.9600
Edge
K
L-I
L-II
L-III
E (keV)
12.6578
1.6539
1.4762
1.4358
λ (Å)
0.9795
7.4965
8.3989
8.6352
Il Problema della Fase
In condizione di scattering anomalo non vale più la legge di Friedel
asse immaginario
Legge di Friedel:
Ihkl = Ihkl cioè |Fhkl| = |Fhkl|, φhkl= -φhkl
(+) hkl
π
FP+
A
φP+ B
φP-
In generale:
Fhkl = Σ fj e[2πi(hxj + kyj + lzj)] = Fhkl eiαhkl
F = |F| eiα = F eiα = |F| (cos φ + i sen φ) = A + iB
dove i = (-1)1/2
(-) hkl
asse reale
FP-
Il Problema della Fase
Allora:
Fhkl = Ahkl + iBhkl = |Fhkl| cos φ + i |Fhkl| sen φ
N
Ahkl = jΣ= 1 fj cos 2π(hxj + kyj + lzj)
asse
immaginario
N
Bhkl = jΣ= 1 fj sen 2π(hxj + kyj + lzj)
F
F sen φ
φ
F cos φ
asse reale
Il fenomeno della diffrazione introduce sempre un centro di
simmetria nella distribuzione delle intensità diffratte:
Il Problema della Fase
Ihkl = Ihkl
dove hkl significa -h, -k, -l
x
Il Problema della Fase
In assenza di scattering anomalo questa legge vale anche se il
reticolo diretto non presenta un centro di simmetria
Dimostrazione:
Ahkl = Σ fj cos 2π(-hxj - kyj - lzj) = Σ fj cos 2π(hxj + kyj + lzj)
quindi:
Ahkl = Ahkl
Bhkl = Σ fj sen 2π(-hxj - kyj - lzj) = Σ fj [-sen 2π(hxj + kyj + lzj)]
quindi:
Bhkl = -Bhkl
Il Problema della Fase
poichè:
Ihkl = K |Fhkl|2 =K (A2hkl + B2hkl)
Ihkl = K |Fhkl|2 =K (A2hkl + B2hkl) = K (A2hkl + B2hkl)
quindi:
Ihkl = Ihkl
Il Problema della Fase
SIRAS (Single I. R. with Anomalous Scattering):
non vale più
|Fhkl| = |Fhkl|, φhkl= -φhkl
la legge di Friedel
i
(+) hkl
π
(-) hkl
i
F”H+
FPH+
FPH
FPH
FH
π
FP+
FPFPH- FH
FPH+
r
F”H-
F”H+
FH
FPH
FP
F”H-
FPH-
r
Il Problema della Fase
Se sono presenti atomi pesanti nella struttura proteica, la conseguenza del
loro scattering anomalo (diffrazione a prossime alla soglia di assorbimento
per quel dato atomo pesante) risulta essere una differenza (piccola) tra i
valori assoluti e le fasi di Fhkl e Fhkl (coppie di Bijvoet)
La violazione della legge di Friedel può essere utilizzata per la
determinazione dell’angolo di fase da attribuire a Fhkl, anche utlizzando un
solo atomo pesante (metodo SIRAS, MAD)
Il Problema della Fase
i
FPH+
F”H+
FH
FPH
π
FP
i
F”H-
FPH-
r
FPH-
π
FH+
FHFP
r
i
FH+
π
F”H+
FH
FPH
FP
FH-
r
F”H-
FPH+
Il Problema della Fase
¾ In presenza di scattering anomalo un solo derivato pesante è sufficiente
per risolvere il problema dell’ambiguità della fase da associare a FP
¾
In media, le differenze isomorfe (FPH – FP) sono maggiori
rispetto alle differenze anomale (FPH+ – FPH-)
¾
(FPH – FP) deriva da misure su cristalli diversi
errori di non isomorfismo, non presenti in (FPH+ – FPH-)
Il Problema della Fase
Metodo MAD (Multiple Anomalous Dispersion)
f(λ) = f0+ Δf (λ) + if "(λ)
λ1) Δf ha il suo minimo
(massima differenza dispersiva)
ΔFΔλ(hkl) = |Fλ1(h)|-|Fλ3(h)|
λ
λ
dove |Fλ (h)| = | F (h)|+| F (-h)|
2
λ2) f " ha il suo massimo
(massima differenza coppie di Bijvoet)
λ3) remota, dove Δf e f " sono piccole
(>1000 eV da λ2)
Il Problema della Fase
Metodo MAD (scelta delle λ sperimentali)
f (λ) = f 0 + Δf (λ) + if ′′(λ) = f ′ + if ′′
peak: f’’ massimo, Δf medio
remote: f’’ minimo, Δf grande
inflection: f’’ medio, Δf minimo
Il Problema della Fase
Intuitivamente, il confronto dei fattori di struttura raccolti alla lunghezza
d’onda λ1 e quelli raccolti alla λ3 (remota) è simile a quello operato nel caso
del metodo MIR. Infatti per λ=λ1 la variazione di f’ (o Δf) è massima,
mentre f’’ è relativamente piccolo.
Quindi FPH(λ1) e FPH(λ3) differiscono per il fatto che nel fattore di
scattering atomico associato all’atomo pesante è presente il fattore reale f’.
E’ come se nel cristallo contenente l’atomo pesante, la
variazione di λ da λ3 a λ1 avesse introdotto un ulteriore atomo pesante
“fittizio” di fattore di scattering reale pari a f’.
Questo in analogia al metodo delle sostituzioni isomorfe in cui un atomo
pesante di fattore di scattering atomico f (reale) va ad aggiungersi ai fattori
di scattering atomici degli atomi della proteina nativa.
Il Problema della Fase
Il confronto dei fattori di struttura raccolti alla lunghezza d’onda λ2 e quelli
raccolti alla λ3 (remota) è simile, invece, a ciò che accade nel metodo
SIRAS. Infatti per λ=λ2 la variazione di f’’ è massima, mentre f’ è
relativamente piccolo.
Quindi la variazione di λ da λ3 a λ2 porta ad un
incremento di un fattore immaginario f’’ del fattore di scattering dell’atomo
pesante, contribuendo alla distinzione delle coppie di Friedel (o di Bijvoet),
proprio come accade quando si confrontano dati di diffrazione raccolti su
cristalli nativi a con dati raccolti su cristalli contenenti atomi pesanti a λ
prossime alle soglie di assorbimento per quel dato atomo pesante (scattering
anomalo).
In generale, va notato che i contributi f’ ed f” al fattore di scattering
atomico dell’atomo pesante al variare di λ da λ3 a λ1 e λ2 sono molto
inferiori rispetto alle variazioni dovute all’introduzione di un atomo pesante
in un cristallo nativo.
Il Problema della Fase
¾
Metodo MAD
- soaking o cocristallizzazione
Se
- incorporazione “naturale”
(proteina contenente un elemento con
sufficiente segnale anomalo. Es: 1 Se (Z=34)
Se-metionina
per non più di circa 100-150 residui)
¾
Un solo cristallo è richiesto
¾
Radiazione X a λ variabile (λ stabile)
precisa scelta di λ per ottimizzare le
differenze in intensità fra le coppie di
Bijvoet e fra riflessi misurati a diverse λ
¾
Crio-cristallografia (T ∼100 K)
Fe
Il Problema della Fase
¾
Metodo MAD
(+) il non-isomorfismo tra cristalli nativi e derivati non è più un problema
→ le differenze anomale e dispersive possono essere stimate con maggior
precisione
(-) l’intensità del segnale (spesso meno di 10 elettroni) è molto più debole
rispetto al caso MIR (>50 elettroni)
poiché la componente anomala del fattore di scattering (ƒ‘+ iƒ“) è
indipendente dall’angolo di scattering (mentre ƒ0 decade rapidamente con
θ) il contributo relativo del segnale anomalo tende ad aumentare con la
risoluzione
è possibile calcolare fasi utilizzando solo le differenze anomale (SAD/S:
Single Anomalous Dispersion/Scattering). La bimodalità nel caso SAD può
essere risolta applicando estensivamente tecniche di density modification
Il Problema della Fase
Molecular Replacement:
Ihkl ∝ |Fhkl|2
Proteina
Prerequisito:
modello
proteina
modello atomico da cui possono essere calcolate fasi approssimate
Densità
elettronica
ρ(x,y,z) =
1
V
Σhkl |Fhkl| exp [-2πi(hx+ky+lz-α’hkl)]
fasi approssimate
Il Problema della Fase
Si crea un cristallo “virtuale”, con parametri di cella e gruppo
spaziale uguali al cristallo reale, in cui si posiziona
“opportunamente” un modello molecolare (ottenuto per omologia di
sequenza) per la proteina a struttura incognita. La struttura
tridimensionale del modello viene presa dal Protein Data Bank
(http://www.rcsb.org/pdb).
Sulla base delle coordinate degli atomi del modello
“opportunamente” posizionato nel cristallo “virtuale” si possono
calc
calc
calc
calcolare i fattori di struttura Fhkl in modulo e fase (Fhkl e αhkl ).
calc
N
Fhkl = j=1
Σ fj
e[2πi(hxj + kyj + lzj)] =
calc
Fhkleiαhkl
Il Problema della Fase
Per il calcolo della densità elettronica approssimata per la proteina a
struttura incognita (di cui sono stati raccolti dati di diffrazione su un
oss
cristallo nativo, Ihkl = intensità osservate) si utilizzano le fasi
calc
calcolate dal modello ( αhkl ) ed i moduli dei fattori di struttura
oss
osservati ( Fhkl ).
calc
oss
1
i
α
ρ(x,y,z) =
Σ ( Fhkl e hkl ) e-2πi(hx+ky+lz)
V hkl
Se il metodo del Molecular Replacement ha avuto successo (il
modello era sufficientemente simile alla struttura incognita ed è stato
posizionato correttamente nel cristallo “virtuale” in modo da
simulare il cristallo reale), allora nella densità elettronica così
ottenuta si dovranno vedere le caratteristiche strutturali della
proteina incognita (e non del modello).
Il Problema della Fase
¾
Proteina a struttura incognita (ma a sequenza nota)
Ricerca nel PDB di una proteina a struttura nota con alta
similarità di sequenza con la sequenza della proteina a
struttura incognita
¾
Proteina ..YKTQAGKTVDYINAAIGG----SADGAGL..
Modello ..YQTQASKTVDYITAALAGSRNVSADAAGL..
* *** ****** ** *
*** ***
l’omologia strutturale correla col livello di identità in
sequenza (MR se almeno 30% identità)
Il Problema della Fase
Osservazioni pratiche
Dati
L’uso di dati a risoluzione migliore di 3.0 Å non aumenta la possibilità di
trovare una soluzione nel MR. Anzi, l’uso di dati a risoluzione troppo alta
può avere l’effetto contrario, a seguito di una scarsa correlazione tra il
modello e la struttura reale.
Modello.
¾
Modelli costruiti per omologia di solito non funzionano
¾
Più alta è la frazione di u.a. occupata dal modello meglio è
Per proteine con più stati conformazionali è importante usare un modello
avente lo stesso stato conformazionale della proteina a struttura incognita
¾
Il Problema della Fase
Osservazioni pratiche
Modello.
Nel caso di un modello NMR si possono utilizzare la sovrapposizione di
tutti i modelli, il modello medio minimizzato, ciascun singolo modello.
¾
Più alta è l’identità di sequenza tra modello e proteina a struttura
incognita meglio è. Per residui non corrispondenti:
¾
- lasciare la sequenza originale (es: una Leu ed una Asn a 3.5Å non sono
appaiono molto diverse)
- tagliare le catene laterali ad Ala
- sostituire le catene laterali del modello con quelle della proteina (solo se
si ha un’ottima idea di dove orientare le catene laterali
Il Problema della Fase
¾
¾
Creazione del cristallo “virtuale” e posizionamento (uso
della funzione di Patterson) in esso del modello tratto dal
PDB (eventualmente modificato sulla base dell’allineamento
di sequenze)
calc
Calcolo dei fattori di struttura derivati dal modello Fhkl in
calc
calc
modulo e fase ( Fhkl e αhkl )
Calcolo della densità elettronica approssimata
usando
calc
oss
i fattori di struttura ibridi Fhkl = Fhkl eiαhkl )
¾
calc
oss
1
ρ(x,y,z) =
Σ ( Fhkl eiαhkl ) e-2πi(hx+ky+lz)
V hkl
Il Problema della Fase
Uso del Molecular Replacement:
¾ proteina
omologa
¾ stessa
proteina in forma ‘nativa’
(studi di mutanti o complessi)
¾ parte di una
proteina
multidominio
modello
proteina
mutante
modello
complesso
modello
I
II
III
Fly UP