Modelli Fisico Matematici Teoria delle Caratteristiche e
by user
Comments
Transcript
Modelli Fisico Matematici Teoria delle Caratteristiche e
Modelli Fisico Matematici Teoria delle Caratteristiche e Propagazione Ondosa Laurea triennale in Matematica 2012/13 Franco Cardin Premessa Il contenuto culturale di questo corso Modelli Fisico Matematici è stato progettato, discusso, scelto, pensando a due direttrici d’utilizzo: da un lato, prolungare adeguatamente la cultura generale in Fisica Matematica — iniziata col primo corso al second’anno di Fisica Matematica— dall’altro, costruire un corpo di argomenti scientifici fortemente matematicizzati e utili in applicazioni tecnologiche ingegneristiche. La scelta da operare era da ricercarsi in filoni culturali adatti alle aspettative dell’indirizzo modellisiticonumerico del corso di laurea in Matematica, di cui questo corso è parte costitutiva, una direzione dunque di tecno-matematica, pensando cosı̀ con questo aggettivo alla suddivisione della Matematica Applicata che sempre più spesso si incontra in vari paesi Europei: la tecno-matematica (elaborazione ed analisi di rigorosi modelli tecnologici predittivi, sistemi dinamici utili in Fisica e in applicazioni ingegneristico-industriali) e l’econo-matematica (aspetti probabilisitici stocastici attuariali di modelli economico finanziari). Tale scelta è dunque caduta sulla teoria matematica dei continui deformabili e di alcune applicazioni possibili in tale modello: la termodinamica rigorosa, la teoria della propagazione delle onde, quest’ultima poggiantesi su una introduzione alla ‘teoria delle caratteristiche’, linguaggio matematico base moderno per l’iniziale studio delle equazioni alle derivate parziali (PDE). Ed andando a ritroso, tale teoria delle caratteristiche deve poggiare a sua volta nella cosiddetta ‘formulazione Hamiltoniana’ della Meccanica Analitica, di cui sono note agli allievi matematici (dal corso di second’anno di Fisica Matematica) solamente le premesse. Incidentalmente, la necessità contingente di acquisire una competenza di base in Meccanica Hamiltoniana diventa virtuosa: lo studente che deviasse dall’indirizzo modellistico-numerico verso per esempio l’indirizzo generale, magari per una specializzazione più prettamente fisico-matematica, non si troverebbe spiazzato nel recupero della cultura Hamiltoniana, fondamentale nella costruzione della Fisica Matematica moderna. Si è tentato di dare un taglio didattico alla teoria e alla applicazioni della meccanica dei continui di tipo ‘dinamicistico’, presentando tale teoria come un paradigma di sistema dinamico infinito-dimensionale: questo è in sostanza uno stile ispiratore di questa dispensa, sia degli appunti di meccanica dei continui presenti nell’altra mia dispensa (Sistemi Dinamici Meccanici), già utilizzata parzialmente nel corso di Fisica Matematica, sia degli appunti redatti da M. Favretti, appositamente per parte di questo corso. Franco Cardin, 18 gennaio 2013 1 Indice 1 Metodo delle Caratteristiche 1.1 Teoria Lineare . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Teoria Quasi-Lineare . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Un’analisi dettagliata delle singolarità. La genesi delle galassie secondo il modello di Zeldovic-Arnol’d . . . . 1.3 Teoria Non-Lineare . . . . . . . . . . . . . . . . . . . . . . . 1.3.1 Equazione di Hamilton-Jacobi . . . . . . . . . . . . . 1.3.2 Equazione di Hamilton-Jacobi di tipo evolutivo. Problema di Cauchy . . . . . . . . . . . . . . . . . . . . 2 3 4 . 4 . 10 . 12 . 18 . 18 . 23 Ottica Ondulatoria asintotica elementare e Ottica Geometrica 2.1 Da Maxwell a Fermat . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Esempio: caustiche . . . . . . . . . . . . . . . . . . . . 2.1.2 Altro esempio: da Fermat alla legge di rifrazione di Snellius . . . . . . . . . . . . . . . . . . . . . . . . . . Propagazione per Onde nei Sistemi di PDE di Leggi di Bilancio 3.1 Onde di Discontinuità deboli . . . . . . . . . . . . . . . . . . . 3.2 Onde Asintotiche ad Alta Frequenza . . . . . . . . . . . . . . 3.3 Onde d’Urto (Shock waves) . . . . . . . . . . . . . . . . . . . 3.4 Velocità del suono . . . . . . . . . . . . . . . . . . . . . . . . . 28 28 34 39 41 41 46 46 50 4 La teoria di Friedrichs - Lax - Godounov - Boillat 52 5 Primi Elementi di Teoria Qualitativa dei Sistemi Dinamici 5.1 Integrali primi, dipendenti dal tempo, di campi vettoriali che dipendono possibilmente dal tempo . . . . . . . . . . . . . . . 5.2 Intermezzo: Derivata di determinante . . . . . . . . . . . . . . 5.3 Teorema del Trasporto . . . . . . . . . . . . . . . . . . . . . . 55 2 55 56 57 5.4 5.5 5.6 5.7 Leggi di Conservazione . . . . . . . . . . . . . . . . . . . . . (Verso la) Diffusione . . . . . . . . . . . . . . . . . . . . . . Il fenomeno del Large Damping nelle equazioni di Newton . 5.6.1 Large Damping lineare . . . . . . . . . . . . . . . . . Funzionali di Lyapunov per Fokker-Planck: entropia relativa e energia libera . . . . . . . . . . . . . . . . . . . . . . . . . 5.7.1 Generalità sull’equazione di Fokker-Planck . . . . . . 5.7.2 L’Entropia . . . . . . . . . . . . . . . . . . . . . . . . 5.7.3 Fokker-Planck e termodinamica di non-equilibrio . . 5.7.4 Fokker-Planck e teoria delle Grandi Deviazioni . . . . . . . . 60 61 63 63 . . . . . 65 65 66 68 69 6 Serie di Fourier ed equazione del calore: la diffusione 6.1 Euristica: Teorema di rappresentazione di vettori negli spazi finito-dimensionale . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Lo spazio delle funzioni L2 ([0, T ]; C) . . . . . . . . . . . . . . . 6.2.1 Serie di soli coseni (o di soli seni) . . . . . . . . . . . . 6.2.2 Qualche teorema e stima . . . . . . . . . . . . . . . . . 6.3 Equazione del calore . . . . . . . . . . . . . . . . . . . . . . . 6.3.1 Una (rapida) deduzione dell’equazione del calore . . . . 6.3.2 Soluzione dell’equazioni del calore con le serie di Fourier 6.3.3 Equazione di Diffusione . . . . . . . . . . . . . . . . . . 6.3.4 Effetto grotta-cantina . . . . . . . . . . . . . . . . . . . 7 Riduzione finito-dimensionale esatta in teoria dei campi 8 Trasformata di Fourier e TAC 8.1 Euristica: dalle serie all’integrale di Fourier . . . . . . . . . . 8.2 Trasformata di Fourier . . . . . . . . . . . . . . . . . . . . . 8.2.1 Serie e Trasformate di Fourier multiple: rispettivamente in [0, T ]n e in Rn . . . . . . . . . . . . . . . . . . . 8.2.2 Generalità analitiche & topologiche . . . . . . . . . . 8.3 Tomografia Assiale Computerizzata . . . . . . . . . . . . . . 8.3.1 Teorema di invarianza per rotazioni di F . . . . . . . 8.3.2 TAC: ricostruzione della densità . . . . . . . . . . . . 3 72 72 73 76 77 77 77 79 80 81 84 89 . 89 . 90 . . . . . 90 91 92 92 93 Capitolo 1 Metodo delle Caratteristiche 1.1 Teoria Lineare Consideriamo l’equazione differenziale alle derivate parziali (PDE) lineare nell’incognita u = u(x), d X (∗) aα (x) α=0 ∂u (x) = b(x) ∂xα somma su α = 0, 1, 2, ..., d, per esempio d = 3, x0 = t, x = (xα )α=0,1,2,...,d ∈ Rd+1 : Spazio − Tempo. Il nostro problema (Problema iniziale di Cauchy) consiste nel ricercare soluzione u di (∗) tale che sulla ipersuperficie Σd dello Spazio−Tempo, Σd ,→ Rd+1 k L 7→ x̃α (k L ) L = 1, 2, ..., d, l’incognita u valga u|Σd = σ, ove σ è il dato iniziale, σ : Σd −→ R, k L 7→ σ(k L ). Naturalmente u|Σd = σ significa: u(x̃α (k L )) = σ(k L ). 4 Una scelta naturale per Σd nell’impostazione presente è Σd = {t = 0}×Rd , in altre parole, il nostro in problema è cosı̀ ai ‘valori inizali’, si chiede che l’incognita u = u(x) = u(t, xL ) soddisfi alla condizione u(0, xL ) = σ(xL ); la generale impostazione qui adottata (cioè, dato iniziale su una generica ipersuperficie di co-dimensione 1 nello spazio-tempo) sarà utile nei più generali problemi cosiddetti ‘al bordo’. La strategia della costruzione della soluzione sarà squisitamente geometrica. Nello spazio Rd+2 , inteso come Spazio Tempo Allargato allo spazio R1 ove assume valori l’incognita scalare u, consideriamo il seguente campo vettoriale V V : Rd+2 −→ Rd+2 (x, u) 7→ (a0 , a1 , ..., aα , ..., ad , b) La nostra equazione differenziale si interpreta cosı̀ nella ricerca di Φ : Rd+2 −→ R, della forma : Φ(x, u) = φ(x) − u, tale che (• : prodotto scalare in Rd+2 , ∇ = ∇Rd+2 ) (∗∗) V • ∇ΦΦ=0 = 0 Infatti, ∂φ ∂φ , ..., , −1) ∂x0 ∂xd e si verifica facilmente l’equivalenza di (∗∗) con (∗). La (∗∗) ci offre ora una proprietà geometrica molto utile della soluzione, vista ora come ‘zeri’ della funzione Φ: ∇Φ = ∇Rd+2 (φ(x) − u) = ( Il campo vettoriale caratteristico V è ovunque tangente al luogo Φ = 0. L’idea è la seguente: le linee di flusso di V comporranno il tessuto realizzante Φ = 0; in Rd+2 rappresentiamo la varietà iniziale d-dimensionale Σ̂d dei dati iniziali, la cui immersione è k 7−→ (x̃(k), σ(k)), se il campo vettoriale V interseca trasversalmente Σ̂d (cioè, non vi è tangente), allora la superficie ‘rigata’ d+1-dim, che si ottiene costruendo le soluzioni dv = V (v) che partono dell’equazione differenziale ordinaria associata a V , dλ d per λ = 0 da Σ̂ , è candidata ad essere il luogo geometrico rappresentato da Φ(x, u) = 0, cioè infine u = φ(x) e la condizione V • ∇Φ = 0 è chiaramente soddisfatta. ẋ = a(x) v̇ = V (v) : u̇ = b(x) 5 Si noti che il primo gruppo di equazioni ẋ = a(x) è indipendente dall’ultima equazione u̇ = b(x). Scriviamo con x = x(λ, x0 ) il flusso di ẋ = a(x), dunque la curva (detta caratteristica) che parte da k ∈ Σ̂d è x = x̄(λ, k) := x(λ, x̃(k)) mentre Z u = ū(λ, k) = σ(k) + λ b x̄(λ0 , k) dλ0 0 Si noti che k, λ sono coordinate naturali globali, in Rd+2 , sulla superficie ‘rigata’ d + 1- dim delle caratterisitiche uscenti da Σ̂d , infatti essa ha la struttura di ‘grafico’: u = ū(λ, k). Ultimo passo: la mappa R1 × Σd −→ Rd+1 (λ, k) 7−→ x̄(λ, k) è un diffeomorfismo globale, è invertibile? Se il campo vettoriale ẋ = a(x) non ammette punti d’equilibrio 1 ed eventuali soluzioni periodiche non si accumulano, allora, almeno localmente, ma indipendentemente dal dato iniziale σ, il flusso di a, a partire da una ipersuperficie Σd , spazza ‘diffeomorficamente’ regioni dello spazio-tempo. Dunque esiste l’inversa λ = λ̆(x), k = k̆(x) e la soluzione cercata è infine Z h u = φ(x) = ū λ̆(x), k̆(x) = σ(k) + 0 1 λ 0 i b x̄(λ , k) dλ 0 . λ̆(x),k̆(x) basta per esempio che una componente del campo vettoriale sia sempre diversa da zero, p.e. a0 (x) ≡ 1, P ∂ come nel caso dell’equazione di evoluzione: ∂t u + dL=1 aL (t, x) ∂x∂L u = b(t, x). 6 Esercizio. Studiare il problema di Cauchy ∂u ∂u (t, x) = x (t, x), ∂t ∂x u(0, x) = σ(x) Il campo vettoriale caratteristico è V : R3 → R3 , v = (t, x, u) 7→ V (v) = (1, −x, 0) ṫ = 1 ẋ = −x v̇ = V (v), u̇ = 0 t(λ, t0 , x0 , u0 ) = t0 + λ x(λ, t0 , x0 , u0 ) = x0 e−λ u(λ, t0 , x0 , u0 ) = u0 per d = 1 : Σd = {t0 = 0} × R1 Σ̂d = {(t0 , x0 , u0 ) : t0 = 0, x0 = k, u0 = σ(k), k ∈ R1 } Il flusso di V che parte da Σ̂d disegna la superficie 2-dimensionale: t̄(λ, k) = λ x̄(λ, k) = ke−λ ū(λ, k) = σ(k) e infine la soluzione è: u = u(t, x) = σ(et x). 7 (∗) Consideriamo l’equazione appena studiata come un sistema dinamico infinito-dimensionale. Sia Q := C ∞ (R; R) lo spazio degli stati ove evolve il sistema. Il campo vettoriale (da un altro punto di vista, è un operatore differenziale) sia X : Q −→ Q dv (x). dx Studiare la dinamica associata ad X significa ricercare le curve R 3 t 7→ v(t, ·) ∈ Q tali che v̇ = X(v) v(·) 7→ X(v(·))(x) := x con generico dato iniziale (problema di Cauchy) v|t=0 = ϕ ∈ Q. In dettaglio, ∂ ∂ v(t, x) = x v(t, x), ∂t ∂x v(0, x) = ϕ(x). Si tratta quindi di studiare un problema di Cauchy per un’equazione alle derivate parziali, e i conti sopra esposti con la teoria delle caratteristiche ci permettono di scriverne esplicitamente la soluzione: v(t, x) = ϕ(et x). Si nota subito che la soluzione identicamente nulla v = 0 è un equilibrio per tale sistema dinamico: X(0) = 0. Per analizzarne l’eventuale Lyapunov stabilità, doteremo dunque di topologia lo spazio Q := C ∞ (R; R) mediante opportune norme: vedremo che la non equivalenza topologica delle norme negli spazi infinito-dimensionali implicherà radicali differenze qualitative intorno alla stabilità. i) Consideriamo ||v||∞ = supx∈R |v(x)|. Ci chiediamo se per ogni ε > 0 esiste δ > 0 tale che per ogni dato iniziale ||ϕ||∞ < δ la soluzione v(t, ·) sia tale che ||v(t, ·)||∞ < ε per ogni t ≥ 0; questo è banalmente vero per δ = ε: ||v(t, ·)||∞ = supx∈R |ϕ(et x)| = supx∈R |ϕ(x)| = ||ϕ||∞ , dunque v = 0 è un equilibrio stabile nella L∞ -topologia. 8 ii) Consideriamo ora le norme Lp : Z 1/p ||v||Lp = |v(x)|p dx . x∈R Consideriamo quindi la stima della soluzione Z 1/p ||v(t, ·)||Lp = |ϕ(et x)|p dx , x∈R facciamo il cambio di variabile d’integrazione τ (x) = et x, otteniamo Z 1/p ||v(t, ·)||Lp = |ϕ(τ )|p e−t dτ = e−t/p ||ϕ||Lp . x∈R Otteniamo pertanto l’asintotica stabilità nella Lp -topologia. iii) Infine la norma C 1 , ||v||C 1 = sup |v(x)| + sup | x∈R x∈R d v(x)|. dx Ora accade che ||v(t, ·)||C 1 = sup |ϕ(et x)| + sup | x∈R x∈R d d ϕ(et x)| = sup |ϕ(x)| + et sup | ϕ(x)|. dx x∈R x∈R dx Dunque, comunque scegliamo ϕ, l’andamento esponenziale ci mostra che la soluzione esce, a qualche istante t, da qualunque palla di raggio ε > 0: v = 0 è instabile nella C 1 -topologia. In questa linea di pensiero, e per ulteriori sviluppi applicativi, si veda per esempio V. I. Yudovich “The Linearization Method in Hydrodynamical Stability Theory”, American Mathematical Society - Translations of Mathemat. Monographs, Vol. 74, 1980. 9 1.2 Teoria Quasi-Lineare Lo studio dei problemi di Cauchy per l’equazione differenziale alle derivate parziali quasi-lineare nell’incognita u = u(x), d X aα (x, u(x)) α=0 ∂u (x) = b(x, u(x)) ∂xα si imposta esattamente come nel caso lineare. Ora però il campo vettoriale caratteristico V coinvolge in maniera non separabile le variabili x e u: V : Rd+2 −→ Rd+2 v = (x, u) 7→ (a0 (x, u), a1 (x, u), ..., aα (x, u), ..., ad (x, u), b(x, u)) ẋ = a(x, u) v̇ = V (v) : u̇ = b(x, u) La richiesta che la mappa R1 × Σd −→ Rd+1 (λ, k) 7−→ x̄(λ, k) sia un diffeomorfismo si scontra non solo con aspetti tecnici di V (come nel caso lineare), ma anche (questa è la novità) con la struttura del dato iniziale (o di bordo) σ. Esempio. Studiamo il moto (inerziale) di un continuo 1-dimensionale privo di struttura e di forze esterne, il campo incognito u(t, x) rappresenta la velocità spaziale (o euleriana) e il dato iniziale consiste in una distribuzione gaussiana di velocità: ∂u ∂u +u = 0, ∂t ∂x u(0, x) = σ(x) = e−x v̇ = V (v) : ṫ = 1 ẋ = u u̇ = 0 t = t(λ, t0 , x0 , u0 ) = t0 + λ u = u(λ, t0 , x0 , u0 ) = u0 x = x(λ, t0 , x0 , u0 ) = x0 + u0 λ Dati iniziali: t0 = 0, x0 = k ∈ R, 10 2 u0 = e−k , 2 t = t̄(λ, k) = λ 2 u = ū(λ, k) = e−k 2 2 x = x̄(λ, k) = k + λe−k , x = k + te−k Se da quest’ultima relazione riuscissimo ad estrarre k = k̆(t, x), sostituendo in 2 u(λ, k) = e−k , osservando banalmente che λ̆(t, x) = t, otterremo la soluzione cercata; dobbiamo studiare la condizione (teor. f. implicita): ∂ 2 2 (−x + k + te−k ) = 1 − 2kte−k , ∂k per ogni k ∗ (> 0) fissato (punto geometrico da cui muove una caratteristik∗2 ∗2 ca) esiste un tempo critico t∗ (> 0) per cui 1 − 2k ∗ t∗ e−k = 0: t∗ = e2k∗ , s’innescano soluzioni multivoche, in altri termini, non esistono più soluzioni classiche. Altro esempio, continuo 1-dimensionale privo di struttura e in presenza di viscosità: ∂u ∂u +u = −χu, ∂t ∂t χ > 0, v̇ = V (v) : u(0, x) = σ(x) = e−x 2 =1 ṫ ẋ =u u̇ = −χu t = t(λ, t0 , x0 , u0 ) = t0 + λ u = u(λ, t0 , x0 , u0 ) = u0 e−χλ Rλ 0 x = x(λ, t0 , x0 , u0 ) = x0 + 0 u0 e−χλ dλ0 = x0 + u0 (1 χ − e−χλ ) Dati iniziali: x0 = k ∈ R, t0 = 0, 2 u0 = e−k , t = t̄(λ, k) = λ 2 u = ū(λ, k) = e−k e−χλ x = x̄(λ, k) = k + e−k χ 2 (1 − e−χλ ), x = k + 2 e−k χ 2 (1 − e−χt ) 2 ∂ e−k e−k [−x + k + (1 − e−χt )] = 1 − 2k (1 − e−χt ) ∂k χ χ e per χ sufficientemente grande non è mai nulla: la soluzione classica globale esiste. 11 1.2.1 Un’analisi dettagliata delle singolarità. La genesi delle galassie secondo il modello di ZeldovicArnol’d In accordo con le moderne teorie cosmologiche, al tempo t = 0 la distribuzione iniziale delle velocità delle particelle y eiettate nella ‘grande esplosione’ (big bang) da un ‘nocciolo duro’ (hard core) C ∗ ⊂ R3 sia di tipo cosiddetto ‘potenziale’: ∂W ∂W ∂W ∗ 3 3 , v:C ⊂R →R , y 7−→ v(y) = ∇y W (y) = , , ∂y 1 ∂y 2 ∂y 3 per qualche (non nota) funzione scalare W : C ∗ ⊂ R3 → R, y 7−→ W (y). Quaest’ipotesi è sorretta dal fatto che le osservazioni degli astrofisici sullo stato primordiale del cosmo non rivelano alcuna ‘vorticità’ inizale ω, ∂vj ∂vi 1 ω := skw(∇v)ij := 2 ∂y j − ∂y i dunque nel nostro caso 1 ∂vi ∂vj skw(∇v)ij = − i =0 2 ∂y j ∂y e questo implica2 che vi = ∂W ∂y i i = 1, 2, 3 È facile notare la compatibilità dell’ultima relazione con l’ipotesi di assenza di vorticità: basta p.e. ricordare che le derivate parziali miste di funzioni C 2 2W ∂2W sono simmetriche3 , cioè, ∂y∂ i ∂y j = ∂y j ∂y i . Inoltre, altra grande semplificazione, riterremo che tali particelle primordiali interagiscano tra loro solo mediante collisioni, ritenendo quindi trascurabili gli effetti gravitazionali rispetto all’altissima energia (velocità) coinvolta; per la velocità euleriana v(t, x): 3 ∂vi X ∂vi j + v = 0, j ∂t ∂x j=1 2 3 nei domini semplicemente connessi teorema di Schwartz 12 v(0, x) = ∇W (x) Il moto di tale mezzo continuo è pertanto descritto da x = x(t, y) = y + v(y)t = y + ∇y W (y)t Si noti che ogni particella y ∈ C ∗ viaggia con velocità costante: ∂ ∂ x(t, y) = ∂t x(0, y) = v(y) = ∇y W (y) ∂t Questa funzione-moto x(t, y) esprime in che punto geometrico x dello spazio R3 si trova al tempo t ∈ R la particella y ∈ C ∗ . L’ulteriore idea è che nelle collisioni le particelle si condensarono e formarono strutture evolute (galassie, ecc.). Dal punto di vista matematico: la ricerca della genesi di tali strutture è esattamente equivalente alla descrizione della caduta di invertibilità della funzione-moto sopra scritta. Infatti, se per ogni fissato t ≥ 0, la mappa C ∗ 3 y 7−→ x(t, y) ∈ x(t, C ∗ ) |{z} | {z } dominio immagine fosse invertibile, cioè esistesse l’inversa x 7−→ ỹ(t, x) tale che x(t, ỹ(t, x)) = x allora, evidentemente, nessuna collisione avrebbe luogo. Dobbiamo dunque indagare sulle ‘patologie’ del moto, cioè indagare sui tempi e sulle particelle coinvolti nella ‘caduta’ della condizione algebrica nel teorema di inversione locale, e cioè osservare quando la matrice jacobiana delle derivate parziali del moto diventa degenere: ∂ 2W ∂xi (t, y) = det δij + i j (y)t = det(1 + ∇2yy W (y)t) = 0 det ∂yj ∂y ∂y Notiamo che la matrice 1 + ∇2yy W (y)t è simmetrica. Dunque, esiste4 una rotazione opportuna degli assi (dello spazio geometrico delle x) per cui questa matrice si rappresenta ora in forma diagonale e gli elementi di tale diagonale sono esattamente gli autovalori della matrice in studio, che sono (data la simmetria della matrice) numeri reali. Si osservi che tale diagonalizzazione è proprio possibile grazie all’ipotesi di assenza di vorticità effettuata. In tale nuova base 4 Mediante semplice algebra e/o geometria elementare delle f. quadratiche 13 det 1 + ∇2yy W (y)t = 1 0 0 a1 (y) 0 0 a2 (y) 0 t = Π3j=1 1 + aj (y)t det 0 1 0 + 0 0 0 1 0 0 a3 (y) e supponiamo ora che ad un tempo t0 , per un indice j 0 e per una particella y0 , si abbia: 1 aj 0 (y0 ) = − , t0 1 0 0 a1 (y0 ) 0 0 a2 (y0 ) 0 t0 = Π3j=1 1 + aj (y0 )t0 = 0 det 0 1 0 + 0 0 0 1 0 0 a3 (y0 ) a1 (y0 ) 0 0 a2 (y0 ) 0 , e dunque pure Si noti che − t10 è autovalore di 0 0 0 a3 (y0 ) 2 di ∇yy W (y0 ) (più avanti sarà utile). Accade dunque un fenomeno locale di collisione al tempo t0 e coinvolgente la particella y0 . • Se affermiamo che al tempo t0 questa è la prima collisione, allora y0 è un minimo locale per C ∗ 3 y 7→ aj 0 (y) ∈ R. Infatti, se in un aperto locale ad y0 esistesse un y1 tale che aj 0 (y1 ) < aj 0 (y0 ) = − 1 , t0 allora esisterebbe t1 < t0 per cui: aj 0 (y1 ) = − 1 1 < − = aj 0 (y0 ) , t1 t0 ma ciò è assurdo, perché stiamo supponendo che al tempo t0 avvenga la prima collisione (o singolarità), che è coinvolgente y0 . Supponiamo genericamente5 che tale minimo sia ‘leggibile’ mediante il test delle derivate seconde, cioè: ∇y aj 0 (y0 ) = 0, 5 ∇2yy aj 0 (y0 ) : definita positiva si dimostra che non è una ipotesi severa 14 • Vorremmo ora capire cosa accade per tempi immediatamente successivi a t0 . Indaghiamo prima di tutto sulle particelle (e quali) coinvolte negli urti ad un tempo t0 + , per piccolo > 0. Pratichiamo uno sviluppo di Taylor per aj 0 (y) con polo in y0 : 1 aj 0 (y) = aj 0 (y0 ) + ∇2yy aj 0 (y0 )(y − y0 )(y − y0 ) + O(|y − y0 |3 ), 2 1 1 + ∇2yy aj 0 (y0 )(y − y0 )(y − y0 ) + O(|y − y0 |3 ), t0 2 e consideriamo le particelle y, vicine ad y0 , coinvolte nelle collisioni al tempo t0 + , cosicché 1 aj 0 (y) = − , t0 + 1 1 1 − = − + ∇2yy aj 0 (y0 )(y − y0 )(y − y0 ) + O(|y − y0 |3 ), t0 + t0 2 aj 0 (y) = − Ora, a meno dei termini O(|y −y0 |3 ), e trascurando inoltre termini dell’ordine O(2 ), per cui approssimiamo − 1 1 + = t0 + t0 d = = + + O(2 ) ≈ 2 , (t0 + )t0 (t0 + )t0 =0 d (t0 + )t0 =0 t0 riscriviamo l’ultima relazione nella forma: 1 = ∇2yy aj 0 (y0 )(y − y0 )(y − y0 ) 2 t0 2 dove, genericamente, ∇2yy aj 0 (y0 ) è supposta definita positiva. Rappresenteremo l’ellissoide delle particelle y (in C ∗ ⊂ R3y ) coinvolte nelle collisioni al tempo t0 + nel seguente modo: √ y = y0 + n k(n) dove per ogni fissato n ∈ S2 , |n| = 1, esiste un k(n) > 0, indipendente da , k : S2 → R+ , per cui si realizza la relazione di cui sopra. Questo ellissoide è nello spazio ‘materiale’ , C ∗ , qual è la sua forma nello spazio ‘geometrico’ R3x ? Per vederlo, dobbiamo far agire la funzione-moto al tempo t0 + . √ √ x = x(t0 + , y)|y=... = y0 + n k(n) +∇y W y0 + n k(n) (t0 + ), | {z } | {z } =y =y 15 ∇y W y0 + n k(n) √ √ = ∇y W (y0 ) + ∇2yy W (y0 ) n k(n) + O() Inserendo nel moto: √ √ x = y0 + n k(n) + ∇y W (y0 ) + ∇2yy W (y0 ) n k(n) + O() (t0 + ), ordinando: x = y0 + ∇y W (y0 )(t0 + ) + O()t0 + (non dipende linearmente da n) | {z } | {z } O() O(1) √ + ∇2yy W (y0 ) n k(n) 3/2 + t0 ∇2yy W (y0 ) + 1 n k(n) +O(2 ) | {z } | {z } O(3/2 ) O(1/2 ) infine, a meno dei termini O(2 ), x = x(n) è dato da n o x = y0 + ∇y W (y0 )(t0 + ) + O()t0 + √ +∇2yy W (y0 ) n k(n) 3/2 + t0 ∇2yy W (y0 ) + 1 n k(n) . Qualora scegliamo per n esattamente l’autovettore di ∇2yy W (y0 ) relativo al l’autovalore − t10 , allora il termine t0 ∇2yy W (y0 ) + 1 n = 0 cosicché la forma del luogo di collissione nello spazio R3x è quella di un ellissoide con due assi di ordine 1/2 (grande!) ed un terzo asse, parallelo a n, di ordine 3/2 (piccolo!): Questa è precisamente la forma di un ellissoide molto schiacciato, un flying saucer, proprio come una galassia (o un cluster, ammasso di galassie). Interazione tra singolarità in R2 (da “Catastrophe theory”, V.I. Arnol’d): 16 Arnol’d V.I., Catastrophe theory. Third edition. Springer-Verlag, Berlin, 1992. xiv+150 pp. (tradotto in italiano da Bollati-Boringhieri) Arnol’d V.I., Zeldovich Ya. B., Shandarin S. F. The large-scale structure of the universe. I. General properties. One-dimensional and two-dimensional models. (Russian) Akad. Nauk SSSR Inst. Prikl. Mat. Preprint 1981, no. 100, 31 pp. Arnol’d V.I., Reconstructions of singularities of potential flows in a collisionfree medium and caustic metamorphoses in three-dimensional space. (Russian) Trudy Sem. Petrovsk. No. 8, (1982), 21–57. Zeldovich Ya. B., Gravitational instability: an approximate theory for large density perturbation. (Russian) Astron. Astrophys. 5 (1970) 84–89. 17 1.3 Teoria Non-Lineare 1.3.1 Equazione di Hamilton-Jacobi Siamo ora interessati allo studio dell’equazione6 (HJ) H(q, ∂u (q)) = 0, ∂q dove H : T ∗ Rn = R2n → R, (q, p) 7→ H(q, p) è una funzione Hamiltoniana, possibilmente non lineare. Il caso in cui x = (t, q) è nello spazio-tempo sarà considerato in seguito. Tale equazione prende il nome di equazione di Hamilton-Jacobi, e non è naturalmente la più generale equ. non lineare del primo ordine che, infatti, è del tipo: F (q, u(q), ∂u (q)) = ∂q 0. La teoria delle caratteristiche finora sviluppata è insufficiente per tale equazione e per i problemi di Cauchy associati. Per tratteggiare, motivare, una nuova teoria, supponiamo che u(q) sia una soluzione classica di HamiltonJacobi; consideriamone il grafico del differenziale nello spazio delle fasi R2n : Λ := {(q, p) : p = ∂u (q), q ∈ Rn } ⊂ T ∗ Rn ∂q Prima di indagare sulle proprietà di Λ, introduciamo7 nelle spazio delle fasi (il ‘fibrato co-tangente’) T ∗ Rn = R2n la seguente 1-forma differenziale8 (detta di Liouville) n X θ= pi dq i i=1 Ritorniamo a Λ, notiamo i seguenti fatti: (i) dimΛ = n = 12 dimT ∗ Rn , (ii) θ|Λ è esatta, (iii) Λ, dato che ha la struttura di un grafico, è trasversale9 alle fibre della proiezione π : R2n → Rn , (q, p) 7→ π(q, p) = q. P α Ricordiamo che la restrizione (‘pull-back’) di una 1-forma ω = 2n α=1 ωα (x)dx 2n 2n su R di una sotto-varietà n-dim. S, j : S ,→ R , λ 7→ x = j(λ), è data dalla 1-forma 6 Non cambierebbe nulla concettualmente se fosse H(q, ∂u (q)) = e, con e 6= 0, basta ridefinire ∂q l’Hamiltoniana per ricadere nel caso sopra descritto. 7 in realtà, richiamiamo un oggetto già introdotto nel corso introduttivo di Fisica Matematica. 8 La più generale 1-forma in R2n è del tipo: Ψ= n X Ai (q, p)dq i + i=1 9 n X i=1 cioè, ∀q ∈ Rn , Λ ∩ π −1 (q) contiene un unico punto. 18 B i (q, p)dpi ω|S = 2n X ωα (x)dxα |S = α=1 2n X ωα (j(λ)) α=1 n X ∂j α i=1 ∂λi (λ)dλi 10 Dunque, ritornando alla verifica della (ii), e pensando che l’inclusione (q)) —in altre parole, Λ è di Λ in R2n è semplicemente q 7→ (q, p = ∂u ∂q parametrizzata dalle q ∈ Rn : Λ è diffeomorfa a Rn — si ha: θ|Λ = n X i=1 n X ∂u pi dq |Λ = (q)dq i = du. i ∂q i=1 i Dire infine che u(q) risolve Hamilton-Jacobi in questo linguaggio geometrico significa affermare che (HJ geom.) Λ ⊂ H −1 (0) La strategia di costruzione di nuove soluzioni generalizzate di (HJ) e di tipo globale (soluzioni classiche sono in generale costruibili solo localmente data la non linearità dell’equazione) sarà la seguente: definiremo prima di tutto le sottovarietà Lagrangiane di T ∗ Rn (che generalizzano i grafici di differenziali): Λ ⊂ T ∗ Rn è sottovarietà Lagrangiana se i) dimΛ = n = 21 dimT ∗ Rn , ii) θ|Λ è chiusa. Si noti che è una definizione più debole di quanto osservato per i grafici di differenziali: ‘esatto’ si rilassa in ‘chiuso’ e non si richiede la globale trasversalità. Definizione: Diremo che Λ è una soluzione geometrica di Hamilton-Jacobi se è una sottovarietà Lagrangiana contenuta in H −1 (0). Si tratta ora di definire un metodo per costruire sottovarietà Lagrangiane Λ ⊂ T ∗ Rn . Una generica sottovarietà Lagrangiana non sarà in tutta generalità identificabile con Rn , come nel caso del grafico di differenziale, bensı́ j π Λ ,→ T ∗ Rn −→ Rn k 7→ (q(k), p(k)) 7→ q(k) 10 la verifica delle altre due proprietà (i) e (iii) è invece immediata. 19 A volte scriveremo: z(k) = (q(k), p(k)). Richiamiamo qui che n i X XhX ∂q i θΛ= pi (k)dq i (k) = (k) dkj , pi (k) ∂kj i=1 j i dunque θΛ è chiusa se e solo se, ∀j, l, ∂ h X ∂q i i ∂ h X ∂q i i = , pi pi ∂kl i ∂kj ∂kj i ∂kl e, sviluppando, θΛ è chiusa se e solo se, ∀j, l, X ∂pi ∂q i X ∂pi ∂q i − = 0. ∂kl ∂kj ∂kj ∂kl i i (∗) Tale condizione si può riassumere introducendo la seguente matrice 2n × 2n: i O I q Γ E= , z= z = ∈ R2n −I O pj e si verifica che (∗) si riscrive (∗)0 EΓ∆ ∂z ∆ ∂z Γ (k) (k) = 0. ∂ki ∂kj Realizziamo ora un test sulla nuova definizione di soluzione: se vale Λ ⊂ H −1 (0) e se, inoltre, Λ è trasversale alle fibre di T ∗ Rn , cioè ‘al di sopra’ di ogni q ∈ Rn esiste uno ed un unico punto di Λ, in altri termini, π ◦ j è un diffeomorfismo, Λ 3 k 7→ q(k) ∈ Rn , (?) e ne indicheremo con k(q) l’inverso, allora considerata una primitiva11 di θ|Λ , ū(k) i XhX ∂q i (k) dkj , dū(k) = pi (k) ∂kj j i definiamo u(q) := ū(k(q)). Si ha che du = 11 ∂ ū ∂k ∂q ∂k ∂u dq = p(k)|k=k(q) dq ⇒ p|Λ (q) = (q), ∂k ∂q ∂k ∂q ∂q ogni forma chiusa è localmente esatta, lemma di Poincaré. 20 cioè Λ è proprio il grafico del differenziale della funzione u = u(q). In queste ipotesi di esattezza e trasversalità, la s.varietà Lagrangiana Λ porge soluzioni classiche u = u(q) nei sottoinsiemi semplicemente connessi di Λ. Come si costruiscono le s.v. Lagrangiane Λ ⊂ H −1 (0)? Il seguente teorema (dopo il lemma) è il motore fondamentale per la costruzione di Λ Lagrangiane in H −1 (0). Faremo delle premesse, definiremo (richiameremo) i campi vettoriali Hamiltoniani. Data la generica funzione Hamiltoniana H(q, p), x ∈ Rn , z = (q, p) ∈ R2n , il campo vettoriale XH è data da XH : T ∗ Rn → T (T ∗ Rn ) ≡ R4n ∂H ∂H (q, p), − (q, p)) (z) 7→ (z; X(z)) = (z; E∇z H(z)) = (q, p; ∂p ∂q e dunque l’equazione differenziale associata a tale campo vettoriale XH si scrive q̇ = ∂H (q, p), ∂p ∂H ṗ = − ∂q (q, p). Nel nostro caso, ∂H ∂H O I ∂q ∂p XH = = ∂H ∂H −I O − ∂p ∂q ż = XH (z) = E∇z H(z) Lemma ∀k ∈ Λ, s.v. Lagrangiana, i vettori di Tk (T ∗ Rn ) che sono E-ortogonali a Tk Λ sono esattamente tutti e soli i vettori di Tk Λ. X Prova. Infatti ∈ Tz(k) (T ∗ Rn ) è E-ortogonale ai vettori di Tk Λ se Y X̄ X X̄ =0 ∀ ∈ Tk Λ, E , Y Ȳ Ȳ X̄ sono del tipo (rem: Tk Λ = im[dz(k)] ): ove Ȳ X̄ = dz(k)K̄, per K̄ arbitrari in Rn . Ȳ La condizione ∂q K̄ X E , ∂k =0 ∂p Y K̄ ∂k è sicuramente soddisfatta da vettori del tipo (cf. (∗)0 ) ∂q X K = ∂k , per K arbitrari in Rn . ∂p Y K ∂k 21 Non ce ne sono altri: infatti, E è non degenere, cosicché la dimensione dello spazio E-ortogonale a Tk Λ è dim Tz(k) (T ∗ Rn ) − dim Tk Λ = 2n − n = n; dato che Tk Λ è E-ortogonale a Tk Λ, non esistono ulteriori vettori (e dunque sottospazi di Tz(k) (T ∗ Rn )) E-ortogonali a Tk Λ. Ecco quindi il teorema sopra annunciato. Teorema: Sia Λ una generica sottovarietà Lagrangiana contenuta in H −1 (0): Λ ⊂ H −1 (0), allora il campo vettoriale Hamiltoniano XH è tangente a Λ: XH ∈ T Λ Prova. Dalla definizione data di campo vettoriale Hamiltoniano, XH = E∇H, notando che E2 = −I, si ottiene la definizione equivalente (è un’uguaglianza tra 1-forme): (E XH , ·) = −dH(·). (#) Ora, per ogni v ∈ Tk Λ si ha (E XH , v) = −dH(v) = 0, dove la prima uguaglianza vale per (#), la seconda perché se v ∈ Tk Λ, dato che Λ ⊂ H −1 (0), v è pure tangente a H −1 (0) e dunque v ∈ ker dH|H −1 (0) , cioè XH è E-ortogonale a Λ (ai vettori di Tk Λ), dunque XH (per il Lemma) è tangente a Λ. Osservazioni: 1) Questo teorema ci suggerisce il modo di estendere l’idea del “metodo delle caratteristiche”, operante nel caso lineare, all’attuale equazione non lineare di H-J, e cioè, costruire sottovarietà Lagrangiane Λ in H −1 (0) mediante un ‘tessuto’ composto di curve risolventi le equazioni di Hamilton. Pd α 2) Nel caso di Hamiltoniano lineare nelle p: H(q, p) = α=0 a(q) pα − b(q), mostrare che si ‘riproduce’ la teoria lineare delle caratteristiche vista precedentemente, cercando soluzioni geometriche in H = 0: α α q̇ = a (q), ṗα = − d X ∂aβ β=0 22 ∂q α (q)pβ + ∂b (q). ∂q α 1.3.2 Equazione di Hamilton-Jacobi di tipo evolutivo. Problema di Cauchy Applicheremo quanto sopra visto per studiare i problemi di Cauchy delle equazioni di Hamilton-Jacobi di tipo evolutivo. Consideriamo la funzione Hamiltoniana H : R × R2d −→ R (t, q, p) 7−→ H(t, q, p) L’equazione differenziale non lineare del primo ordine che intendiamo studiare è della forma tipica dell’equazione di evoluzione di Hamilton-Jacobi: ∂u ∂u + H t, q, =0 (HJ) ∂t ∂q nell’incognita u(t, q) = u(x), x = (t, q) ∈ Rd+1 : spazio-tempo. Introduciamo il seguente Hamiltoniano nello spazio delle fasi dello spazio-tempo R2d+2 3 (t, q; τ, p) = (x, y), H : R2d+2 −→ R (t, q; τ, p) 7−→ H(x, y) = H(t, q; τ, p) := τ + H(t, q, p), in tal caso l’equazione sopra scritta assume la struttura: ∂u 0 (HJ) H x, = 0. ∂x Quest’ultima si dice versione omogenea dell’equazione differenziale iniziale: è del tipo descritto nel paragrafo precedente. Consideriamone un problema di Cauchy: determinare u(t, q) tale che ∂u ∂u + H t, q, =0 (i) ∂t ∂q e tale che sull’ipersuperficie Σd ≡ {t = t(0) } × Rd dello spazio-tempo Rd+1 valga (ii) u(t(0) , q) = σ(q). La strategia di ricerca e costruzione della soluzione è la seguente. In T ∗ Rd+1 ≡ R2d+2 , lo spazio delle fasi dello spazio-tempo, si cercherà la soluzione u = 23 u(t, q) come grafico del suo differenziale in H−1 (0) –cf. (HJ)0 . Più debolmente, si cercherà una sotto-varietà Lagrangiana Λd+1 , cosı̀ globalmente parametrizzata (rem: x = (t, q), y = (τ, p)) dalla seguente mappa di immersione z(t, k): Rd+1 3 (t, k) 7→ z(t, k) = (x(t, k), y(t, k)) ∈ R2d+2 , con le proprietà: (i) dimensione: dim (Λd+1 ) = 1/2 dim (T ∗ Rd+1 ) = d + 1, (ii) Λd+1 è tale che la seguente 1-forma differenziale (di Liouville) X θ= yα dxα α ristretta a Λd+1 , θΛ , sia chiusa. Infine, il fatto che cercheremo Λd+1 ⊂ H−1 (0) significa proprio che vogliamo ‘risolvere’ l’equazione differenziale di partenza: ∂u (x, (x))|x∈Rd+1 ⊂ H−1 (0) ∂x ∂u ∂u ∂u ∂u = , = L, H = τ + H, L ∂x0 ∂t ∂x ∂q ∂u ∂u + H(t, q, (t, q)) = 0. ∂t ∂q ———— Osservazione: Si noti che dovremo fare i conti con l’ulteriore richiesta di trasversalità supposta in (?), cioè (t, k L ) 7→ xα (t, k L ) sia diffeom. ———— Le equazioni di Hamilton per H si scrivono: ṫ =1 ∂H q̇ = ∂p τ̇ = − ∂H ∂t ṗ = − ∂H ∂q e scriveremo ΦtXH il flusso associato a tale equazione differenziale Hamiltoniana. 24 Osservazione: Il Teorema del paragrafo precedente ci permette finalmente di generalizzare in modo utile il punto di vista adottato nel caso lineare: in T ∗ Rd+1 rappresenteremo i dati iniziali con la sottovarietà d-dimensionale Λ0 , Λ0 = o n ∂σ ∂σ (k) , p = (k) , k ∈ Rd t = t(0) , q = k; τ = −H t(0) , k, ∂q ∂q e a partire da essa considereremo le nuove caratteristiche ora date dalle curve che risolvono le equazioni canoniche di Hamilton, la superficie d + 1-dimensionale che otterremo12 sarà sicuramente una (la) Λd+1 cercata: [ Λd+1 = ΦtXH (Λ0 ), t∈R infatti: ha la dimensione giusta, è in H−1 (0), e, per costruzione, XH vi è tangente. (In effetti, si deve infine dimostrare che la 1-forma di Liouville ristretta a Λd+1 è chiusa: solo in tal caso possiamo dire che Λd+1 è s.v. Lagrangiana; è un conto un po’ lungo, ma semplice13 .) Data tale Λd+1 , che possiamo chiamarla soluzione ‘geometrica’ del problema, come si opera per ottenere una funzione u = u(t, q)? Sappiamo che la 1-forma di Liouville ristretta a Λd+1 è chiusa, diciamo pure esatta nel caso sia semplicemente connessa: calcoliamone una primitiva, direttamente integrando θ|Λd+1 sulla sottovarietà Λd+1 , parametrizzata da (t, k). Osserviamo che, la 1-forma di Liouville da considerare dev’essere prima di tutto, ristretta a H−1 (0) (ricordiamo che q 0 = t, p0 = τ ) = pdq − Hdt θ = ydx = (pL dq L + p0 dq 0 ) −1 −1 −1 H H (0) H (0) (0) Si costruisce dunque la seguente funzione u(t, k) globalmente definita sopra Λd+1 : Z t dt0 , ū(t, k) = σ(k)+ [p(t0 , t(0) , q(0) , p(0) )q̇(t0 , t(0) , q(0) , p(0) )−H(...)] ∂σ (q(0) ,p(0) )=(k, ∂q (k)) t0 dove per brevità si è scritto H(...) = H(t0 , q(t0 , t(0) , q(0) , p(0) ), p(t0 , t(0) , q(0) , p(0) )). 12 Bisogna naturalmente accertare che il campo Hamiltoniano non sia tangente in nessun punto a Λ0 : questo è vero perché ṫ = 1. 13 Lo studente Francesco De Anna, nel 2010/11, ha proposto una soluzione elegante a tale problema, senza introdurre le k-forme differenziali. 25 Quest’ultima non rappresenta ancora la soluzione cercata: Λd+1 è trasversale14 alle fibre del fibrato cotangente dello spazio-tempo? Se infatti ‘sopra ogni’ x = (t, q) ∈ Rd+1 c’è uno ed un unico punto di Λd+1 , cosicché Λd+1 3 (t, k) 7−→ (t, q(t, t(0) , k, ∂σ (k)) ∈ Rd+1 ∂q è globalmente invertibile mediante delle funzioni Rd+1 3 (t, q) 7−→ (t, k = k̆(t, q)) ∈ Λd+1 , allora la soluzione sarà infine data da: u(t, q) = ū(t, k) . k=k̆(t,q) Osservazione 1 La struttura della soluzione finale è della forma (ricordando la trasformazione di Legendre) Z t Z t 0 u(t, q) = σ + (pq̇ − H)dt = σ + L(q(t0 , ...)dt0 , t0 t0 cioè il funzionale stesso (l’“Azione”) del Calcolo delle Variazioni fornisce la struttura della soluzione. Osservazione 2 Qual è il significato geometrico dell’esistenza del diffeomorfismo ipotizzato tra Λd+1 e lo spazio-tempo Rd+1 ? Pensiamo a Λd+1 immersa nello spazio delle fasi dello spazio-tempo, il fibrato co-tangente dello spazio-tempo: Λd+1 ⊂ T ∗ Rd+1 = R2d+2 . Se esiste il diffeomorfismo, allora le componenti q delle caratteristiche uscenti dalla varietà base non si intersecano mai, fatto che potrebbe certamente accadere in tutta generalità: l’unica proprietà di cui siamo sicuri è il non-intreccio delle caratteristiche (x, y) in R2d+2 (per il teorema di esistenza e unicità delle O.D.E.). Questo possibile fenomeno di ‘intreccio’ delle q-componenti delle caratteristiche rappresenta la presenza di una ‘caustica’ e tale nomenclatura è mutuata dall’applicazione della presente teoria ai fenomeni di propagazione in Ottica Geometrica. A differenza dal caso lineare, tale costruzione delle soluzioni mediante le curve caratteristiche mostra che soluzioni regolari sono possibili solo localmente; le caustiche rappresentano l’ostruzione topologica all’esistenza di soluzioni globali. 14 Cioè, ∀(t, q) ∈ Rd+1 , Λd+1 interseca la fibra {(p0 , p)} sopra (t, q) in un unico punto. 26 Osservazione 3 Quando il sopra accennato diffeomorfismo esiste, la ‘soluzione geometrica’ Λd+1 ⊂ R2d+2 è esattamente il ‘grafico del differenziale’ della soluzione analitica u(t, q): o n ∂u ∂u Λd+1 = (t, q; τ, p) : τ = (t, q), p = (t, q) ⊂ H−1 (0) ⊂ R2d+2 . ∂t ∂q Osservazione 4 Si provi a generalizzare la costruzione sopra sviluppata al caso in cui si debba trattare con un’equazione di Hamilton-Jacobi H = 0 con gli stessi dati iniziali dove ora l’Hamiltoniana H : T ∗ Rd+1 → R sia di struttura più generale, cioè non necessariamente della forma H = p0 + H(t, q, p). Ci si renderà conto che l’unica sostanziale differenza risiede nel ∂H fatto che q̇ 0 = ∂p 6= 1 cosicché q 0 non è ora identificabile col parametro di 0 evoluzione t delle soluzioni delle equazioni canoniche; inoltre, θ|H=0 non avrà la struttura sopra utilizzata pdq − Hdt, e la soluzione geometrica Λd+1 avrà una più generale forma ū(t, k) = σ(k)+ Z tX d 0 α 0 + pα (t , q(0) , p(0) )q̇ (t , q(0) , p(0) ) dt0 , ∂σ (q(0) ,p(0) )=(t(0) ,k;p̆0 (t(0) ,k), ∂q (k)) t0 α=0 dove con p̆0 (t(0) , k) si intende la soluzione data dal teorema della funzione implicita per p0 dell’equazione H(t(0) , k; p0 , ∂σ (k)) = 0. L’ulteriore ipotesi di ∂q trasversalità permetterà di giungere alla soluzione analitica u(t, q). 27 Capitolo 2 Ottica Ondulatoria asintotica elementare e Ottica Geometrica 2.1 Da Maxwell a Fermat Le equazioni di Maxwell si ∂B ∂D ∂t + rot E = + J − rot H = ∂t div B = div D − ρ = scrivono (c è la velocità della luce nel vuoto): 0 0 0 0 (legge dell0 induzione di Faraday) (legge della circuitazione di Ampère) (assenza di carica magnetica) (legge di Gauss) (1) e l’equazione di continuità: ∂ρ + div J = 0 (conservazione della carica elettrica) ∂t (2) Queste equazioni coinvolgono i campi: E : campo elettrico D : vettore spostamento B : vettore induzione H : campo magnetico ρ : densità di carica elettrica J : vettore corrente elettrica Si assegnano le equazioni costitutive che riguardano la natura materiale del mezzo attraverso il quale evolve il campo elettro-magnetico: D = E, B = µH, (J = σE : legge di Ohm) 28 = (q) (costante dielettrica), ≥ 0 > 0 : nel vuoto µ = µ(q) > 0 (permeabilità magnetica), µ0 : nel vuoto Può accadere: sia µ > µ0 (materiali paramagnetici), sia µ < µ0 (materiali diamagnetici). ——— Nel vuoto, considerando il caso di assenza di cariche e correnti, ρ = 0, J = 0, inserendo nelle (prime due) equazioni di Maxwell ≡ 0 , µ ≡ µ0 , E, H : µ0 ∂H + rot E = 0, ∂t 0 ∂E − rot H = 0, ∂t derivando rispetto al tempo e utilizzando l’identità (facilmente verificabile con ijk , si veda l’Appendice alla fine del capitolo): rot rot V = grad div V − ∆ V, ∆ = div grad V, e per div V = 0 (ultime due equ. di Maxwell), otteniamo 1 ∂2 H = ∆H, v 2 ∂t2 1 v := √ = c (equazione delle onde) 0 µ0 (e analogamente per E). Si ottengono soluzioni elementari del seguente tipo “onde progressive”: prendiamo un’arbitraria funzione C 2 Ĥ : R → R3 e verifichiamo che, per fissato vettore k ∈ R3 , H(q, t) = Ĥ(k · q − ωt) è soluzione a patto che |k|2 = ω2 , v2 dunque 1 H(q, t) = Ĥ ω( vers k · q − t) v L’interpretazione è immediata: al tempo t = 0 il vettore costante Ĥ(0) è il valore di H su tutto il piano passante per q = 0 e ortogonale al fissato k; questo stesso valore vettoriale Ĥ(0) si propaga, si ritrova essere il valore costante vettoriale di H, dopo un tempo T > 0, nei punti del piano, ancora ortogonale a k, ma ora affine e lontano vT dall’origine: 1 ( vers k · q − t) = 0 v per t = 0 e vers k · q = 0 29 1 per t = T e vers k · q = vT ( vers k · q − t) = 0 v Osservazione Tale velocità scalare di propagazione v dei fronti d’onda è stata cosı̀ dedotta supponendo spazialmente costanti e µ: v = √10 µ0 . Questo legame/significato puntuale tra v e , µ lo riterremo valido anche in situazioni di non uniformità. La linearità dell’equazione delle onde mostra naturalmente la validità del ‘principio di sovrapposizione’. R-combinazioni di soluzioni è ancora soluzione. Si noti che k-sovrapposizioni di soluzioni del tipo “onde piane”: H(q, t) = Hk ei(k·q−ωt) con |k| = ωv , cioè 1 H(q, t) = Hk eiω( v vers k·q−t) porta decisamente alla ricerca di soluzioni mediante la teoria della ‘trasformata di Fourier’. Pensando al più generale caso di non uniformità di e µ, e nella ricerca di soluzioni significative più generali dell’onda piana sopra scritta, si iniziò coll’estendere il termine lineare spaziale ω i vers k · q, v a più generali funzioni 1-omogenee in q; ed infine, a completamente generali funzioni1 iωΦ(q), posto E(q) = E0 (q)eiωΦ(q) , H(q) = H0 (q)eiωΦ(q) (3) si propone: E(t, q) = E(q) e−iωt = E0 (q)eiω[Φ(q)−t] H(t, q) = H(q) e−iωt = H0 (q)eiω[Φ(q)−t] Le considerate soluzioni test di cui sopra, con termine temporale del tipo iωt, sono dette monocromatiche; inoltre le considereremo tali che siano soddisfacenti (per le ultime due equazioni di Maxwell) a div E = 0 = div H. Dalle prime due equazioni di Maxwell: ∂B −iωµ H + rot E = 0 ∂t + rot E = 0 ⇒ ∂D −iω E − rot H = 0 − rot H = 0 ∂t 1 Tale evoluzione di costruzione delle soluzioni è stata percorsa dalla teoria degli ‘operatori pseudo- differenziali’ e infine dagli ‘operatori integrali di Fourier’. 30 Usando ancora l’identità: rot rot V = grad div V − ∆ V, ∆ = div grad V e rot (φV) = grad φ × V + φ rot V, si ottiene −iω(µ rot H + grad µ × H) − ∆E = 0 −iω( rot E + grad × E) + ∆H = 0 −iω(−iωµ E + grad µ × H) − ∆E = 0 −iω(iωµ H + grad × E) + ∆H = 0 −ω 2 µ E − iωgrad µ × H − ∆E = 0 (•) 2 ω µ H − iωgrad × E + ∆H = 0 Ricordiamo ora le (3), E(q) = E0 (q)eiωΦ(q) , H(q) = H0 (q)eiωΦ(q) , e deduciamo −ω 2 µ E0 eiωΦ(q) − iω grad µ × H0 eiωΦ(q) − ∆(E0 eiωΦ(q) ) = 0 ω 2 µ H0 eiωΦ(q) − iω grad × E0 eiωΦ(q) + ∆(H0 eiωΦ(q) ) = 0 Sviluppiamo la prima equazione: −ω 2 µ E0 eiωΦ(q) + iω grad µ × H0 eiωΦ(q) − (∆E0 + 2iω∇Φ · ∇E0 + iωE0 ∆Φ − ω 2 |∇Φ|2 E0 ) eiωΦ(q) = 0 Analogo conto per la seconda equazione. A questo punto introduciamo l’unica approssimazione che adotteremo: nel limite dell’alta frequenza, cioè per ω → +∞, le ultime equazioni diventano un’unica equazione per la fase Φ, in sostanza, dividendo le equazioni per ω 2 , trascureremo i termini 1/ω rispetto 31 ai termini finiti 2 |∇Φ|2 = µ (equ. iconale) L’equ. iconale è chiaramente un’equazione di Hamilton-Jacobi H(q, ∂Φ 1 (q)) = ∂q 2 (5) di Hamiltoniana (l’introduzione del termine 1/2 è, come si vedrà, di reminescenza meccanica): c 1 c 2 2 √ |p| , n(q) := c µ, v = , n : Rn → [1, +∞) H(q, p) = 2 n(q) n c ove n è l’indice di rifrazione, vale 1 nel vuoto, e v(q) := n(q) è la velocità dei n fronti d’onda e.m. transitanti per il punto q ∈ R del mezzo ottico. Una rilettura ‘meccanica’ è immediata: i fotoni si propagano lungo ‘raggi’ che soddisfano alle equ. di Hamilton con H = 21 oppure alle equ. di Lagrange di Lagrangiana (realizzando la trasf. di Legendre) 1 n(q) 2 2 |q̇| L(q, q̇) = 2 c con dati per cui l’energia vale E = L = 21 . Digressione di Meccanica Analitica Si dimostra mediante un conto diretto il seguente fatto: se q(t) risolve le equ. di Lagrange per L(q, q̇) = 1 a (q)q̇ i q̇ j , aij def. pos., allora q(t) risolve le equ. di Lagrange per L(q, q̇) = 2 ij p L(q, q̇). Prova. L’integrale primo di Jacobi, l’energia, è coincidente con L, dunque: √ √ d∂ L ∂ L d 1 ∂L 1 ∂L 1 ∂L d ∂L − = ( √ )− √ = √ ( − i ) = 0. i i i i i dt ∂ q̇ ∂q dt 2 L ∂ q̇ ∂q 2 L ∂q 2 L dt ∂ q̇ Viceversa, 2 Proviamo a perfezionare ulteriormente la nostra scelta di soluzioni asintotiche, tentiamo con generiche ‘sovrapposizioni continue’ (visto che il sistema è lineare) del tipo appena descritto. in sostanza, ci si cimenta nel tentativo di generalizzare ciò che accade per la trasformata di Fourier, precisamente q · u ... → ... ωφ(q, u), per qualche φ da determinarsi, ove ora permettiamo a u di appartenere ad uno spazio parametrico Rk non necessariamente di dimensione uguale a quella di Q = Rn : Z Z E(q) = E0 (q, u)eiωΦ(q,u) du, H(q) = H0 (q, u)eiωΦ(q,u) du, (4) u∈Rk u∈Rk ed ancora una volta, nel limite dell’alta frequenza ω → +∞, otteniamo che, affinché esistano soluzioni ampiezze E0 e H0 non banali, la fase Φ(q, u) deve soddisfare all’equ. iconale. 32 p Data una soluzione q(t) delle equ. di Lagrange per L(q, q̇), lo è pure ogni sua arbitraria riparametrizzazione del tempo q̄(τ ) = q(t(τ )), t : [0, T ] → [0, T ], dt/dτ > 0. Questo è equivalente all’affermazione che Il funzionale del principio variazionale di Hamilton per L = Z Tr dq I(q(·)) = L(q(t), (t)) dt dt 0 p L(q, q̇), è invariante per riparametrizzazioni del tempo q̄(τ ) = q(t(τ )), t : [0, T ] → [0, T ], dt/dτ > 0. Prova. Si osserva che L è positivamente 1-omogenea nelle variabili q̇: L(q, λq̇) = λL(q, q̇), ∀λ > 0. Z T d I[q̄(·)] = I[q(t(·))] = L q(t(τ )), q(t(τ )) dτ = dτ 0 Z T Z dt T d d = L q(t(τ )), q(t)t=t(τ ) (τ )dτ = L q(t), q(t) dt = I[q(·)]. dt dτ dt 0 0 Fine della digressione di Meccanica Analitica Dunque il principio variazionale il cui funzionale integrale ha come integranda 1 n(q) L(q, q̇) = √ q̇ 2 c misura, individua, le curve geometriche dei ‘raggi’ ottici, indipendentemente dalla loro parametrizzazione temporale. Fissati due punti nello spazio, q(0) e q(1) , consideriamo l’insieme Γ le curve C 2 tra queste due configurazioni e parametrizzate nell’intervallo [0, 1], Z 1 n(q(λ)) dq 1 I:Γ→R q(·) 7→ I[q(·)] = √ (λ) dλ c dλ 2 0 Dalla teoria della rettificazioneR delle curve si ha che la lunghezza della curva λ dq λ 7→ q(λ) è data da: s(λ) = 0 dλ (λ0 ) dλ0 , e la velocità scalare del fotone lungo il raggio è dλ ds ds dλ dq = = (λ) (t)|t=t(λ) (∗) v(λ) = dt dλ dt dλ dt 33 d’altra parte (vedi L’Oss. indietro), riterremo che c , n(q(λ)) v(λ) = (∗∗) cosicché il differenziale della funzione ‘tempo’ t = t(λ) è dq dq (λ) (λ) n(q(λ)) dq 0 (∗) dλ (∗∗) dλ dt = t (λ)dλ = dλ = dλ = (λ) dλ c v(λ) c dλ n(q(λ)) Giungiamo cosı̀ ad un’interpretazione del funzionale I: Z 1 Z 1 n(q(λ)) dq dt 1 1 1 (λ)dλ = √ T [q(·)], I[q(·)] = √ (λ) dλ = √ c dλ 2 0 2 0 dλ 2 dove T [q(·)] è il funzionale Tempo speso dal fotone lungo la curva [0, 1] 3 λ 7→ q(λ) ∈ Rn . Dunque, i fotoni stazionarizzano il funzionale ‘tempo’ (a volte, ma non sempre, lo ‘minimizzano’, tra le due configurazioni prefissate): ritroviamo esattamente in questa interpretazione il principio variazionale noto come Principio di Fermat (o del tempo minimo). 2.1.1 Esempio: caustiche • Consideriamo il problema di Cauchy per la seguente equazione di HamiltonJacobi detta “iconale” (ottica geometrica) per q ∈ R2 H(q, ∂S (q, t)) = 1 ∂q j : R ,→ R2 , H(q, p) = |p|2 k 7→ q̃(k) = ( σ : R −→ R, k2 , k), 2A σ(k) ≡ 0. La superficie iniziale “di emissione” è una parabola (A > 0) con il vertice nell’origine e asse di simmetria coincidente con l’asse x = q1 . |∇R2 S(q)|2 = 1, S(q̃(k)) = 0. Indaghiamo sulla proiezione sulla varietà base R2 del suo ‘ciclo singolare’, ostruzione alla locale costruzione della soluzione classica: questo luogo è ‘la caustica’ della soluzione. 34 Scriviamo il sistema delle caratteristiche: q̇i = ∂H , ∂pi ṗi = − q̇ i = 2pi , ∂H , ∂qi ṗi = 0, Inserendo il dato iniziale nel flusso, si ottiene cosı̀ q̄(λ, k), p̄(λ, k), infine, quando q = q̄(λ, k) è invertibile con (λ(q), k(q)), la soluzione classica si ottiene integrando la 1-forma di Liouville: Z λ ˙ 0 , k)dλ p̄(λ0 , k)q̄(λ S(q) = σ(k) + |{z} (λ(q),k(q)) 0 ≡0 (0) (0) (0) qi = qi (λ, q (0) , p(0) ) = qi + λ2pi , q1 = q̄1 (λ, k) = k2 (0) + λ2p1 , 2A pi (λ, q (0) , p(0) ) = pi (0) q2 = q̄1 (λ, k) = k + λ2p2 , (0) p̄i = pi (λ, k)? ∂S dq1 ∂S dq2 + =0 ∂q1 dk ∂q2 dk S(q(k)) = σ(k) = 0 : k (0) (0) (0) + p2 = 0, (p1 )2 + (p2 )2 = 1 A (nel seguito, non scriviamo più l’esponente (...)(0) ) (0) p1 p2 = −p1 k A p2 k =− p1 A 1 |p1 | = q 1+ q1 − p21 + p21 k2 =1 A2 k2 A2 k2 = 2p1 λ q2 − k = 2p2 λ 2A p2 k =− p1 A da cui − k q2 − k = . k2 A q1 − 2A Riordinando, k 3 + 2A(A − q1 )k − 2A2 q2 = 0. 35 (∗) Ci chiediamo se riusciamo a costruire soluzioni classiche, cioè se riusciamo ad esplicitare k = k(q1 , q2 ). La (∗) è una cubica del tipo: k 3 + αk + β = 0, β = −2A2 q2 α = 2A(A − q1 ) le cui soluzioni si determinano nel seguente modo. (Cardano) sia una radice cubica dell’unità, per esempio =e 2πi 3 1 i√ =− + 3, 2 2 allora, posto s u= β − + 2 r β 2 β − − 2 r β 2 3 s v= 3 2 2 + + α 3 3 α 3 3 , , le radici nel loro complesso sono: η1 = u + v η2 = u + 2 v, η3 = 2 u + v. Pertanto la condizione di realtà di almeno una soluzione (e sarà η1 la nostra candidata soluzione) si legge 4A4 (q2 )2 8A3 (A − q1 )3 + ≥ 0, 4 27 la frontiera di tale luogo, la caustica, dove vale l’uguaglianza, è data da (q2 )2 = 8 (q1 − A)3 , 27A 36 una (ben nota) “parabola semi-cubica”. 37 of in all in ceial na powith nes the ndithe The hed the the l in point on this spatial optical caustic or ray envelope is the focus of light rays reflected from a small portion of the circular inner surface of the cup. In Figs. 4–7 the caustic for a family of worldlines !or paths" represents a limit for those worldlines !or paths". No 38 Fig. 8. The coffee-cup optical caustic. The caustic shape in panel !b" !a nephroid" was derived by Johann Bernoulli in 1692 !Ref. 44". C. G. Gray and E. F. Taylor 437 2.1.2 Altro esempio: da Fermat alla legge di rifrazione di Snellius Si considerano raggi luminosi nel piano Oxy. Nel semi-piano y ≥ 0 l’indice di rifrazione sia il numero n1 ∈ [1, +∞), mentre in y < 0 valga n2 ∈ [1, +∞). Posto c la velocità della luce, qualunque raggio luminoso in y ≥ 0 è rettilineo e con velocità costante v1 = nc1 , analogamente, in y < 0, v2 = nc2 . Fissato un punto P1 = (x1 , y1 ) con y1 > 0 e un punto P2 = (x2 , y2 ) con y2 < 0, Il Principio di Fermat afferma che gli eventuali raggi luminosi da P1 a P2 devono minimizzare il tempo di percorrenza. Da quanto sopra descritto, le eventuali traiettorie geometriche dei possibili raggi da P1 a P2 sono dunque delle spezzate, composte da due segmenti, eventualmente distinti nell’asse delle x. (i) Scrivere la funzione ‘tempo’ T (x) impiegato da un generico candidato raggio luminoso da P1 a P2 in funzione del punto di passaggio x (più precisamente (x, 0)) tra i due semi-piani. (ii) Determinare l’esistenza del minimo x∗ di tale funzione T (x). (iii) In corrispondenza a x∗ , transita dunque il reale, secondo Fermat, raggio luminoso da P1 a P2 . Mostrare che in corrispondenza ad esso vale sin α1 n2 = n1 sin α2 dove αi , i = 1, 2, è l’angolo tra la verticale, parallela ad y, e il segmento da Pi a (x∗ , 0). Soluzione |P1 , (x, 0)| |P2 , (x, 0)| + , T (x) = v1 v2 q q n1 n2 T (x) = (x1 − x)2 + y12 + (x − x2 )2 + y22 , c c cerchiamo tra i punti stazionari per T , c dT −(x1 − x) −(x − x2 ) = n1 p + n2 p = 0, 2 2 dx (x1 − x) + y1 (x − x2 )2 + y22 cioè: −n1 sin α1 + n2 sin α2 = 0 Considerazioni di geometria elementare (scriverle in dettaglio!) mostrano che il punto stazionario è unico ed è un minimo. Appendice: Il Simbolo di Ricci 39 In R3 , il seguente oggetto completamente emisimmetrico ijk è a volte chiamato tensore o simbolo di Ricci (attenzione: c’è la somma sottintesa sugli indici doppi): 123 = n 1, 1, ijk = −1, ijk = 0, se ijk si ottiene mediante una permutazione pari di 123, se ijk si ottiene mediante una permutazione dispari di 123, appena due indici sono uguali. Si verifica che ∀ U, V ∈ R3 , ∀ matrice (3 × 3) A, ∀ campo vettoriale differenziabile W : R3 −→ R3 , e funzione scalare differenziabile f , valgono: (U × V )i det A ijk (rot W )i V(1) · V(2) × V(3) rot(f W ) = ijk U j V k = lmn Ail Ajm Akn = ijk ∂x∂ j Wk j i k = ijk V(1) V(2) V(3) = ∇f × W + f rotW Infine: ijk klm = δil δjm − δim δjl Esercizio: con quest’ultima formula dimostrare la formula del doppio prodotto vettore e la formula del doppio rotore, rot rot V, sopra usata. 40 Capitolo 3 Propagazione per Onde nei Sistemi di PDE di Leggi di Bilancio 3.1 Onde di Discontinuità deboli Nello Spazio-Tempo Rd+1 , α, β = 0, 1, 2, ..., d, x0 = t, L = 1, ..., d, sia ui = ui (x) una funzione a n componenti: u : Rd+1 −→ Rn x = (xα ) 7−→ u(x) = (ui (x)), Per esempio, u(x) sia la soluzione di un sistema di leggi di conservazione in forma quasi-lineare1 che scriveremo ∂ i X ∂ iL u+ f (u) = g i (u), L ∂t ∂x L X ∂f iL ∂ i ∂uj u (x)+ (u(x)) (u(x)) = g i (u), j L ∂t ∂u ∂x j,L oppure, per F i0 = ui , e F iL = f iL , X ∂ F iα (u) = g i (u). α ∂x α Sia Φ(x) = 0, Φ(t, x1 , ..., xd ) = 0, dove Φ : Rd+1 → R, una iper-superficie (cioè, di co-dimensione uno) nello spazio tempo. Per ogni tempo t fissato, essa rappresenta una iper-superficie nello spazio d-dimensionale, cosicché Φ(x) = 1 Si dice quasi-lineare perché è lineare nelle derivate d’ordine massimo (le prime) mentre i coefficienti possono dipendere non linearmente da u. 41 0 rappresenta l’evoluzione temporale di una superficie mobile St in Rd , di dimensione d − 1. Ipotesi: sia ui = ui (x, t) una soluzione Lipschitziana del sistema, e dunque (per il teorema di Rademacher) quasi ovunque differenziabile, più precisamente: ui (·) siano continue attraverso la sup. Φ(x) = 0, 1) 2) ∂ui (·) ∂xα siano discontinue attraverso la sup. Φ(x) = 0. Naturalmente si suppone che ∇Φ 6= 0 (questo, tra l’altro, ci dice che Φ=0 Φ = 0 è una varietà regolare), cosicché rimane orientata tale superficie e lo d+1 spazio-tempo: la direzione di ∇Φ va da Rd+1 (−) a R(+) , d+1 Rd+1 = Rd+1 (−) ∪ {Φ = 0} ∪ R(+) . Sia x ∈ {Φ = 0}, e sia h un generico vettore tangente a {Φ = 0} in x, ∇Φ(x)h = 0. Per > 0 e |h| sufficientemente piccoli, si ha che (è utile abbozzare un disegno) x − ∇Φ(x) + h ∈ Rd+1 (−) x + ∇Φ(x) + h ∈ Rd+1 (+) d+1 Rispettivamente in Rd+1 (−) e R(+) valgono i due seguenti sviluppi u(x − ∇Φ(x) + h) = u(x − ∇Φ(x)) + ∂u (x − ∇Φ(x))h + o(h) ∂x ∂u (x + ∇Φ(x))h + o(h) ∂x per → 0+ le due espressioni coincidono perché u è continua in {Φ = 0}, sottraendo m. a m.: ∂u [ (x)]h + o(h) = 0 ∂x dove si è indicato con u(x + ∇Φ(x) + h) = u(x + ∇Φ(x)) + [ ∂u ∂u ∂u (x)] := lim (x + ∇Φ(x)) − (x − ∇Φ(x)) →0 ∂x ∂x ∂x 42 il ‘salto’ della derivata. Più precisamente, la formula sopra dedotta vale nella forma (senza l’o(h), perché?): [ ∂u (x)]h = 0 ∂x ∀h ∈ Tx ({Φ = 0}). In altri termini, vale l’implicazione: h ∈ ker ∇Φ(x) ⇒ h ∈ ker[ ∂u (x)] ∂x Il ‘primo teorema di omomorfismo’ per spazi vettoriali (in altre parole, la teoria dei moltiplicatori di Lagrange) ci dice che esiste una mappa lineare, le cui componenti le indicheremo con λ = λ(x), per cui (∗) [ ∂ui (x)] = λi ∇α Φ(x) ∂xα (Condizioni di Hugoniot − Hadamard). Torniamo alla descrizione della geometria dell’onda Φ = 0. Consideriamo un punto geometrico che si muove nello spazio-tempo restando sopra Φ = 0: t 7→ x = (t, x̄L (t)) ∈ Rd+1 , Φ(t, x̄L (t)) = 0, ∀t ∈ R. Deriviamo in t, 0= X ∂Φ ∂Φ dx̄L d Φ(t, x̄(t)) = (t, x̄(t)) + (t, x̄(t)) (t), dt ∂t ∂xL dt L Notiamo che il versore ortogonale a Φ(t, ·) = 0 in Rd è nL (t, x) = P ( M ∂Φ ∂xL . ∂Φ ∂Φ 1/2 ) ∂xM ∂xM Otteniamo cosı̀ dx̄L ∂Φ L ∂xL (t, x̄(t)) dt (t) P ∂Φ ∂Φ 1/2 ( M ∂x M ∂xM ) P = ∂Φ (t, x̄(t)) − P ∂t ∂Φ ∂Φ 1/2 , ( M ∂xM ∂xM ) ∂Φ dx̄ n· = − ∂t dt |∇Rd Φ| Dunque il primo membro della formula appena scritta rappresenta la proiezione della velocità di x̄(t) lungo la normale alla superficie mobile in studio; 43 tale quantità, come si nota dalle formule appena scritte, non dipende dalle derivate della curva x̄(t) arbitrariamente scelta, ma solo dal posto e dal tempo t, la chiameremo velocità di avanzamento dell’onda: vn (t, xL ) := − (?) ∂Φ ∂t |∇Rd Φ| . Supponiamo dunque che una soluzione u(t, x) del sistema di leggi di bilancio ∂ i X ∂ iL u + f (u) = g i (u), L ∂t ∂x L ammetta una discontinuità debole, solo sulle derivate, come quella finora descritta. Da un punto di vista strettamente analitico, stiamo precisamente considerando soluzioni Lipschitziane le quali per il teorema di Rademacher sono quasi ovunque differenziabili e con Φ = 0 denotiamo la localizzazione (di misura nulla) del possibile salto (finito) delle derivate. Indicando ancora con le parentesi quadrate [...] il salto della discontinuità, [ X ∂uj ∂ i f,jiL (u)[ L ] = 0, u]+ ∂t ∂x Lj usando (∗) e (?), ∂Φ X iL ∂Φ + f,j (u)λj L = 0, ∂t ∂x Lj XX f,jiL (u)nL − vn δji λj = 0. λi j L Pertanto la soluzione ammette in t, x una discontinuità non banale (λ 6= 0) nelle derivate se e solo se X iL i (†) det f,j (u)nL − vn δj = 0 L Riassumiamo il significato conoscitivo della (†): una possibile onda di discontinuità debole transita al tempo t per x ∈ Rd , ove ivi il campo soluzione vale u = u(t, x), e nella direzione spaziale nL , solo e soltanto se la velocità Psua iL i di avanzamento vn è un autovalore della n×n-matrice aj (u) := L f,j (u)nL . Il sistema in studio si dice iperbolico se lo spettro di f,jiL (u)nL risulta reale per ogni u e per ogni direzione n. 44 E’ chiaro che quest’ultima informazione è stata dedotta senza risolvere il sistema in studio, è in effetti una relazione di compatibilità tra gli oggetti geometrici e fisici in gioco. Più in dettaglio, ancora senza risolvere il sistema di PDE (compito in generale arduo), cosa possiamo dire sulla generale struttura delle onde di discontinuità debole? Tornando alle formule che hanno prodotto (†), possiamo scrivere (a meno del fattore 1/|∇Rd Φ|, il ché non crea problemi) X ∂Φ i ∂Φ δj = 0 det f,jiL (u) L + ∂x ∂t L Quest’ultima è un’equazione di Hamilton-Jacobi, H = 0, dove compare un’Hamiltoniana dipendente parametricamente da u: X H(u, p0 , pL ) := det f,jiL (u)pL + p0 δji L Si apprende dunque che una soluzione ũ(t, x) continua con una discontinuità sulle derivate evolventesi nello spazio e nel tempo secondo Φ(t, x) = 0 risulta compatibile con Φ se, data l’Hamiltoniana X H̃(t, x, p0 , pL ) := det f,jiL (ũ(t, x))pL + p0 δji , L , ∂Φ ) = 0, la funzione scalare Φ(t, x) soddisfa l’equazione di H-J: H̃(t, x, ∂Φ ∂t ∂xL X ∂Φ ∂Φ (#) det f,jiL (ũ(t, x)) L (t, x) + (t, x) δji = 0 ∂x ∂t L La teoria delle caratteristiche riduce lo studio di questa PDE scalare allo studio delle curve risolventi il sistema di ODE canonico Hamiltoniano associato a H̃(t, xL , p0 , pL ). Nel caso generale non-lineare il risultato di cui sopra potrebbe apparire poco soddisfacente, lo diventa realmente importante invece nel caso semi-lineare: ∂ i X iL ∂uj u + Aj (t, x) L = g i (u), ∂t ∂x jL in tale situazione la teoria porta all’equazione di HJ, che è indipendente dalle soluzioni ũ(x, t), X ∂Φ ∂Φ i (##) det AiL (t, x) (t, x) + (t, x) δ j j = 0 ∂xL ∂t L (Possibili applicazioni: equazioni di Maxwell, elasticità lineare.) 45 3.2 Onde Asintotiche ad Alta Frequenza Riconsideriamo il sistema di leggi di bilancio ∂ l X ∂ lL u + f (u) = g l (u). L ∂t ∂x L P (Oppure, più in generale, α ∂x∂α f lα (u) = g l (u), dove f l0 (u) non è necessariamente ul .) Sia u∗ : g(u∗ ) = 0, soluzione costante, d’equilibrio per il nostro sistema. Supponiamo di voler cercare soluzioni approssimate, in un senso che si preciserà, della forma ūl (t, x) = u∗ + √ v l (t, x) exp(i Φ(t, x) ), dove → 0, e la fase Φ e l’ampiezza v l non dipendono da . Otteniamo i X l ∂Φ X lL ∗ ∂Φ j Φ(t, x) √ f,j (u ) L v exp(i δj + )+ ∂t ∂x j L + termini di ordine O(1) che non coinvolgono derivate di Φ. Asintoticamente, per 1/ → +∞ l’equazione da studiare risulta ancora della forma analoga a quella incontrata nelle onde di discontiunità deboli: X ∂Φ X ∂Φ f,jlL (u∗ ) L v j = 0 + δjl ∂t ∂x j L Si noti il ruolo ben diverso che ha nell’attuale contesto la funzione fase Φ, che ora ha senso per ogni valore del suo co-dominio, rispetto al significato assunto da Φ nelle onde di discontinuità deboli, dove invece ha senso solo per Φ = 0. 3.3 Onde d’Urto (Shock waves) Consideriamo ora possibili soluzioni discontinue ancora del sistema di leggi di bilancio d ∂ i X ∂ iL u + f (u) = g i (u), L ∂t ∂x L=1 oppure 46 d X ∂ iα F (u) = g i (u). α ∂x α=0 (∗) Il modo moderno di studiare queste equazioni è quello nel ‘senso delle distribuzioni’. In dettaglio, procediamo cosı̀: moltiplichiamo ogni i-componente dell’equazione (∗) per generiche funzioni φi (x) ∈ C0∞ a supporto compatto, sommiamo su i, integriamo in x ∈ Rd+1 , e alla fine, la seguente affermazione, nel caso di soluzioni regolari, è esattamente equivalente al sistema (∗): Z n X d X ∂ iα F (u) − g i (u)]φi (x)dd+1 x = 0, [ α Rd+1 i=1 α=0 ∂x ∀φ = (φi (x))i=1,...,n ∈ C0∞ (supporto compatto) Ma ora quest’ultima versione ci consente di ‘scaricare’ le derivate sulle funzioni test φ e scrivere (somma sottintesa sugli indici ripetuti), Z Z ∂ iα iα ∂ i F F (u)φ − φ + g φ i i i = 0, α ∂xα supp φ supp φ ∂x il primo integrale si annulla (con il teorema della divergenza in domini spaziotemporali), cosı̀ (∗) ora si può sostituire, più debolmente, senza richiedere la derivabilità del campo incognito, con la seguente: Z ∂ F iα (u) α φi + g i (u)φi = 0, ∀(φi (x))i=1,...,n ∈ C0∞ (∗∗) ∂x supp φ Diciamo che • u(·) risolve (∗) nel senso delle distribuzioni se la condizione (∗∗) è soddisfatta. La teoria di esistenza e unicità globale per tale tipo di sistemi di PDE è stata definitivamente completata da pochi anni e solo per x ∈ R1 (Alberto Bressan e collaboratori). Il giusto ambiente per u risulta lo spazio delle funzioni BV (‘Variazione Limitata’) e opportuni Lp . Ogni considerazione per d > 1 ha dunque attualmente un valore solo locale. Sia dunque Σd nello spazio tempo Rd+1 una superficie orientata di discontinuità per u(t, x). Valga: d+1 d Rd+1 = Rd+1 (−) ∪ Σ ∪ R(+) . L’idea per estrarre informazioni sugli urti è la seguente: per ogni dominio stokesiano2 Ω ∈ Rd+1 , intersecante Σd , e dunque Ω = Ω(−) ∪ {Ω ∩ Σd } ∪ Ω(+) , si considera il bilancio integrale3 2 tale cioè che per esso valga il teorema di Stokes, nelle sue varie forme: t. della divergenza, ecc. 3 si può pensare alla formulazione distribuzionale prima accennata, con delle φ tali che: φj = 0, j 6= i, e le φi che valgono 1 in Ω e zero fuori; ovviamente, approssimazioni C ∞ , fini quanto vogliamo, di tale appena descritte funzioni a gradino. 47 Z X d ∂ iα F (u) − g i (u)]dd+1 x, 0= [ α Ω α=0 ∂x Z (1) d X iα Z d F (u)Nα d x = g i (u)dd+1 x, Ω ∂Ω α=0 ove N è il versore esterno, devono pure valere i bilanci integrali in Ω(−) e Ω(+) : d X Z (2) iα Z d F (u)Nα d x = Ω(−) ∂Ω(−) α=0 Z (3) d X g i (u)dd+1 x, iα d Z F (u)Nα d x = ∂Ω(+) α=0 g i (u)dd+1 x, Ω(+) sommando m.a m. (2) con (3) i termini a sinistra relativi alle superfici orientate {Ω ∩ Σd }(−) e a {Ω ∩ Σd }(+) (con versori normali N e −N ; N punta da Ω(−) a Ω(+) ) non si elidono data la discontinuità, producendo Z d X ∂Ω α=0 iα d Z F (u)Nα d x − {Ω∩Σd } d X α=0 48 [F iα (u(+) ) − F iα (u(−) )]Nα dd x = Z (4) g i (u)dd+1 x, = Ω confrontando con (1) otteniamo infine d X Z [F iα (u(+) ) − F iα (u(−) )]Nα dd x = 0 {Ω∩Σd } α=0 ma questo dev’essere vero per ogni Ω scelto e dunque su Σd : d X [F iα (u(+) ) − F iα (u(−) )]Nα = 0 (Condizioni di Rankine − Hugoniot). α=0 Ora se F i0 (u) = ui e se Σd = {(t, x) : Φ(t, x) = 0} si ha che N= 2 ∂Φ ∂t + ∂Φ ∂t 1/2 P ∂Φ ∂Φ M ( ∂xM ∂xM ) , 2 ∂Φ ∂t + ∂Φ ∂xL 1/2 P ∂Φ ∂Φ M ( ∂xM ∂xM ) e infine, ricordando le definizioni della velocità vn di avanzamento dell’onda, che ora scriveremo s, e del versore spaziale nL , [u(+) − u(−) ]s = d X [f iL (u(+) ) − f iL (u(−) )]nL . L=1 Usando la notazione [u] := u(+) − u(−) e [f iL (u)] := f iL (u(+) ) − f iL (u(−) ) scriveremo infine i (RH) [u ]s = d X [f iL (u)]nL . L=1 ——— Quando nasce, quando si crea un urto, che velocità s può avere? La (RH) si scrive per hi = [ui ] i hs= d X f iL (u(−) + h) − f iL (u(−) )]nL . L=1 Quest’ultima equazione nell’incognita hi è sicuramente risolta per hi = 0 pertanto, affinché si generi un urto (a partire dall’urto banale, nullo) è necessario che il teorema della funzione implicita fallisca per hi = 0, cioè X (†)0 det f,jiL (u(−) )nL − sδji = 0 L 49 Si individuano cosı̀ dei punti di biforcazione tra la soluzione h(s) ≡ 0 e possibili h = h(s) 6= 0 . Dunque, se un urto nasce, questo inizia a propagarsi con una velocità di discontinuità debole, e se si estingue nell’urto nullo accade lo stesso fenomeno. 3.4 Velocità del suono E’ un esempio importante, l’elasticità (per semplicità, consideriamo il caso omogeneo: µ∗ ≡ 1) L,M =1,2,3 : L u := (FM , v L ) ∈ R12 , F : gradiente di deformazione, v : velocità materiale, T LM : tensore di stress Il sistema di leggi di conservazione per l’elasticità si scrive: ∂ L N ) = 0 (compatibilità) ∂t FM + ∂x∂N (−v L δM ∂ L v ∂t + ∂ T LN (F ) ∂xN = bL (v, F ) (Equ. di Cauchy) Si noti che le equazioni di compatibilità (è una sorta di condizione di chiusura) ci permettono di dire che esiste una mappa (xL , t) 7→ χM (xL , t), il moto, tale che ∂ M L ∂ M L χ (x , t) = v M , χ (x , t) = FNM . ∂t ∂xN • Calcoliamo le velocità caratteristiche (velocità di avanzamento di onde deboli) per una versione semplificata e 1-dim del modello appena visto. ∂ ∂ F − ∂x v = 0 ∂t 1 2 u = (u , u ) = (F, v) ∂ ∂ v + ∂x p(F ) = b (p : pressione) ∂t F f (F, v) = −v ∂ F ∂t + ∂ v ∂t + ∂f F ∂F f v (F, v) = p(F ) F,x + ∂f v F ∂F ,x + ∂f F ∂v v,x = 0 ∂f v v ∂v ,x 50 = b det 0 −1 − s I2×2 = 0, p0(F ) 0 s1,2 = ± s2 + p0(F ) = 0, p −p0(F ) : sono le (sperimentalmente misurate) velocità del suono. Alcune precisazioni (p0 (F ) < 0): Dall’equazione di continuità µ(t, x) det F (t, x) = µ∗ (x), µ(t, x) F (t, x) = 1, µ(t, x) = 1/F (t, x). Un’equazione costitutiva naturale per p = p(µ) è una funzione monotona crescente (grande densità implica grande pressione) e dunque p = p(F ) è una funzione monotona decrescente e dunque con p0 (F ) < 0. 51 Capitolo 4 La teoria di Friedrichs - Lax Godounov - Boillat Riconsideriamo i sistemi di leggi di conservazione in forma quasi-lineare ∂ i X ∂ iL u + f (u) = g i (u). L ∂t ∂x L (1) Supponiamo che Ogni soluzione regolare (C 1 ) u = u(t, x) del sistema (1) soddisfi alla ulteriore (dis)equazione1 S(u),t + hL (u),L ≥ 0 (2) Questa affermazione è talvolta considerata come una formulazione astratta del ‘secondo principio della termodinamica’; nella (2) il campo S = S(u) è una densità di entropia (o, in qualche caso di energia), e hL (u) è il vettore flusso di entropia. Mostriamo che l’introduzione della ‘termodinamica’ si rivela regolarizzante: più precisamente, supposta convessa la funzione densità di entropia S = S(u), l’affermazione di cui sopra comporta che il sistema (1) è equivalente ad un sistema simmetrico iperbolico, dunque un sistema il cui lo studio delle onde (ma anche delle soluzioni globali deboli) risulta ben posto. Il primo passo sarà il seguente: il fatto che (1) ⇒ (2), comporterà delle ‘restrizioni costitutive’ tra le funzioni f iL (u), g i (u), S(u), hL (u). Accettiamo preliminarmente il seguente asserto: localmente (cioè, in un opportuno intorno) ad ogni prefissato punto dello spazio tempo (t̄, x̄) si può sempre costruire una soluzione classica (C 1 ), ũ(·, ·) con arbitrari prefissati 1 scriveremo talvolta S,t = ∂ S, ∂t ecc., e continueremo a sottintendere la sommatoria sugli indici doppi. 52 valori del campo ū = ũ(t̄, x̄) e delle sue derivate spaziali ūL = ũ,L (t̄, x̄). L’equazione (1) ci dirà, mediante semplice calcolo algebrico, quanto vale ũ,t (t̄, x̄). L’esistenza di tale soluzione soluzione regolare, locale in un opportuno piccolo intorno di (t̄, x̄), si può costruire per esempio col teorema di Cauchy-Kowaleskaya, non entreremo nel merito. Le (1) e (2) si scrivono (10 ) ui,t + f,jiL (u)uj,L = g i (u) (20 ) S,i (u)ui,t + hL,j (u)uj,L ≥ 0 Moltiplichiamo ambo i membri del sistema (10 ) per S,i (u), sommiamo sull’indice i, e dall’espressione cosı̀ ottenuta eliminiamo con (20 ) il termine S,i (u)ui,t , otteniamo infine −S,i (u)f,jiL (u) + hL,j (u) uj,L + S,i (u)g i (u) ≥ 0 e dato che possiamo scegliere arbitrariamente le derivate spaziali uj,L e il campo u in un punto (x, t), l’affermazione ‘(1) ⇒ (2)’ è equivalente alle seguenti Restrizioni Costitutive che legano le funzioni che definiscono il sistema: S,i (u)f,jiL (u) = hL,j (u) (3) S,i (u)g i (u) ≥0 La nostra ipotesi fondamentale è la C 2 -convessità di S, cioè che la funzione matriciale Hessiana u 7→ S,ij (u) sia definita positiva2 . Allora la mappa Rn 3 u 7→ v = S 0 (u) ∈ Rn , vi = S,i (u) = ∂S (u), ∂ui stabilisce diffeomorfismi globali sui convessi3 aperti di Rn . Indicheremo con v = v(u) e u = u(v) questa mappa e la sua inversa. Consideriamo ora la seguente Trasformazione (parziale) di Legendre: ΦL (v) := f jL (u(v))vj − hL (u(v)) 2 Si osservi che se A è definita positiva, pure lo è A−1 . Si utilizza lo stesso teorema di inversione globale che ci è servito per stabilire Trasformazioni di Legendre globali. 3 53 e calcoliamone le derivate ∂ΦL (v) = f iL (u(v)) + f,kjL (u(v)) uk,i (v) vj − hL,k (u(v)) uk,i (v), ∂vi osservando che vj = S,j e utilizzando le restrizioni costitutive otteniamo ∂ΦL (v) = f iL (u(v)). ∂vi Riscriviamo infine il sistema (1) utilizzando il nuovo campo incognito v: L ∂ui ∂Φ 00 (1 ) (v) vk,t + (v) = g i (u(v)), ∂vk ∂vi ,L iik ∂ 2 ΦL (u(v)) vk,t + (v) vk,L = g i (u(v)), ∂vk ∂vi h iik 00 −1 (S ) (u(v)) : è i k simmetrica e definita positiva h (S 00 ) −1 ∂ 2 ΦL (v) : è i k simmetrica ∂vk ∂vi pertanto il calcolo delle velocità caratteristiche porta all’equazione ik 00 −1 L ik (††) det Φ nL − vn S =0 ΦL ik = che ammette solo soluzioni reali in vn , si tratta infatti del problema degli autovalori relativi della matrice simmetrica ΦL ik nL rispetto alla ‘metrica’ 00 −1 (def. pos.) S . 54 Capitolo 5 Primi Elementi di Teoria Qualitativa dei Sistemi Dinamici 5.1 Integrali primi, dipendenti dal tempo, di campi vettoriali che dipendono possibilmente dal tempo Dato il campo vettoriale dipendente dal tempo X : R × Rm → Rm (t, x) 7→ X(t, x), l’equazione differenziale ad esso associata è ẋ(t) = X(t, x(t)), x(t0 ) = x0 . Una funzione a valori reali f , f : R × Rm → R è un integrale primo, dipendente dal tempo, se lungo le soluzioni t 7→ x(t) è costante: f (t, x(t)) = costante Non è difficile vedere che per integrali primi differenziabili tale condizione è equivalente a m X ∂f ∂f (t, x) + (t, x)Xi (t, x) = 0. (∗) ∂t ∂x i i=1 55 5.2 Intermezzo: Derivata di determinante Consideriamo la matrice quadrata (N × N ) : a11 ... a1N ... .. . .. . aij .. aN 1 . ... aN N i cui elementi aij sono i valori assunti dalle N 2 funzioni aij = ãij (λ) di R in R. P Sia J = det(aij ). Com’è noto J = N j=1 Aij aij (“sviluppo del determinante rispetto alla i-esima riga”), dove Aij sono i complementi algebrici relativi agli elementi aij ; valgono pure le relazioni: (1) J= N X Aih aih = N X Akj akj ∀i, j = 1, . . . , N. k=1 h=1 Inoltre sappiamo che: N X (2) h=1 Aih ajh ( J se i = j = 0 se i 6= j , cosı̀ si può scrivere: (3) Jδij = N X Aih ajh . h=1 Calcoliamo la derivata di J pensato come funzione di R in R tramite le ˘ N 2 ãij (λ) : J(λ) = J (ã11 (λ), . . . , ãij (λ), . . . , ãN N (λ)). (4) N X ∂J d d ˘ J(λ) = (. . . , ãhk (λ), . . . ) ãhk (λ). dλ ∂aij dλ i,j=1 ∂J . A tale scopo sviluppiamo J Restano da esprimere le derivate parziali ∂a ij rispetto alla P i-esima riga (oppure rispetto alla j-esima colonna, è lo stesso): J = N h=1 Aih aih ; dato che, per i fissato e per h = 1, . . . , N, Aih non dipendono da aij , si ottiene subito: (5) ∂J = Aij . ∂aij 56 Ritorniamo alla (4), si ha infine: N X dJ˘ d (λ) = Aij ãij (λ). dλ dλ i,j=1 (6) 5.3 Teorema del Trasporto Ritorniamo al campo vettoriale dipendente dal tempo X : R × Rm → Rm (t, x) 7→ X(t, x), e all’equazione differenziale ad esso associata ẋ(t) = X(t, x(t)), x(0) = x0 Supponiamo che l’equazione differenziale in studio ammetta flusso con estensione massimale su tutta la retta reale dei tempi. Indichiamo tale operatore flusso con: Φ : R × Rm → Rm (t, y) 7→ Φt y := x(t, y), (2) d x(t, y) = X(t, x(t, y)) e x(0, y) = y. dt Se, come supponiamo, vale un teorema di esistenza e unicità, allora Φt è iniettivo. Dunque Φt : Rm → Rm è noto se, equivalentemente, sappiamo risolvere i problemi di Cauchy: ẋ(t) = X(t, x(t)), ẋ(0) = y, ∀y ∈ Rm , che è estremamente difficile, e, in un certo senso, non significativo: l’insieme dei sistemi dinamici che si lasciano integrare mediante tecniche standard, quali calcolo di primitive e inversioni di funzioni (si parla, appunto, di ‘sistemi integrabili’, il cui prototipo non lineare è ẍ = f (x)) è estremamente ‘piccolo’ in ogni ragionevole topologia. Sia Ω ⊂ Rm un sottoinsieme misurabile ed interpretiamolo come un insieme di possibili “dati iniziali” per la nostra equazione differenziale. Cerchiamo allora di indagare su un aspetto meno forte ma, ciononostante, sufficientemente significativo e interessante. Studiamo l’evoluzione della “misura” (cioè, del “volume” in Rm ) di Ω tramite Φt : Z mis (Φt (Ω)) := dx (dx := dx1 dx2 ... dxm , elemento di volume in Rm ) ove Φt (Ω) 57 Preliminarmente al calcolo di dtd mis (Φt (Ω)) operiamo un cambio di variabili di integrazione: invece di integrare nelle x ∈ Φt (Ω), integreremo nelle y ∈ Ω e il diffeomorfismo tra le x e le y sia proprio dato dal flusso (per t fissato), Z Z d d ∂(x1 , . . . , xm ) dx = (t, y)dy dt Φt (Ω) dt Ω ∂(y1 , . . . , ym ) Posto1 m X ∂(x1 , . . . , xm ) ∂xi J(t, y) := Aih (t, y) (t, y) = (t, y) ∂(y1 , . . . , ym ) ∂yh h=1 si ha che: J(0, y) = 1 e J(t, y) > 0 ∀t ∈ R. Dunque: Z Z d ∂ dx = J(t, y)dy = dt Φt (Ω) Ω ∂t = Z X m Aij (t, y) Ω i,j=1 Z X m ∂ ∂xi = Aij (t, y) (t, y)dy = ∂yj ∂t Ω i,j=1 = Z X m Aij (t, y) Ω i,j=1 ricordando che Pm (3) d dt Z X m Ω i,j=1 m X ∂Xi k=1 Aij (t, y) ∂xk (t, x(t, y)) ∂ Xi (t, x(t, y))dy = ∂yj ∂xk (t, y)dy, ∂yj k j=1 Aij ∂x = δik J, si ottiene: ∂yj Z Z dx = Φt (Ω) Com’è noto: divX := 1 ∂ 2 xi (t, y)dy = ∂t∂yj J(t, y) Ω ∂X i i=1 ∂xi Pm m X ∂X i i=1 ∂xi (t, x(t, y))dy. (operatore “divergenza”). Aih : complemento algebrico della matrice Jacobiana 58 Infine ritornando alle variabili x, otteniamo: Z Z d dx = divX(t, x)dx (Teorema del Trasporto). (4) dt Φt (Ω) Φt (Ω) Esempio 1. Supponiamo ora che l’equazione (1) sia lineare, (5) Xi (x) = m X (Aij : matrice reale costante m × m) Aij xj j=1 In tal caso divX = Pm Aii = trA (tr: traccia), allora la (4) diviene: Z Z d dx = trA dx. dt Φt (Ω) Φt (Ω) i=1 (6) La (6) si integra facilmente: mis(Φt (Ω)) = mis(Ω)et(trA) . (7) Dunque il segno della traccia di A ci dà una indicazione sul modo con cui le traiettorie uscenti da Ω “invadono” (trA > 0) o meno (trA < 0) lo spazio delle fasi Rm . Esempio 2. Consideriamo ora la (4) nel caso che ẋ(t) = X(x(t)) sia un sistema della meccanica classica di n particelle2 con forze che non dipendono dalle velocità. (9) q̇i = vi , v̇i = Fi (q) i = 1, . . . , 3n, Si noti che in tal caso m = 6n, x = (q, v) ∈ R3n × R3n = R6n . Calcoliamo la divergenza del campo vettoriale: div X = 3n 3n X X ∂ ∂ = vi + Fi (q) = 0 ∂xh ∂qi ∂vi i=1 i=1 m X ∂Xh h=1 cioè, Teorema di Liouville: il flusso associato alle equazioni della meccanica classica con forze puramente posizionali mappa nello spazio delle fasi R6n misurabili Ω in misurabili Φt (Ω) di ugual misura. 2 per semplicità, tutte di massa unitaria. 59 Esempio 3. Supponiamo ora che ci sia pure della viscosità (k > 0): (10) q̇i = vi , v̇i = Fi (q) − kvi i = 1, . . . , 3n, ora il calcolo della divergenza del campo vettoriale: div X = m X ∂Xh h=1 ∂xh = 3n 3n X X ∂ ∂ vi + (Fi (q) − kvi ) = −3nk < 0 ∂q ∂v i i i=1 i=1 Dunque: mis(Φt (Ω)) = e−3nk t mis(Ω) pertanto: mis(Φt (Ω)) → 0 per t → ∞, comportamento, questo, tipico dei sistemi dissipativi. Avvertenza: non si pensi che necessariamente Φt (Ω) collassi asintoticamente nel tempo sempre ad un (solo) punto nello spazio delle fasi..... 5.4 Leggi di Conservazione Pensando ad un esempio che ci aiuti a fissare le idee, supponiamo che il campo vettoriale X(t, x) sia il campo di velocità di un fluido (dunque: m = 3): X(t, x) rappresenti la velocità di quel punto materiale (particella) del fluido che al tempo t sta transitando per il punto geometrico (dello spazio) x ∈ R3 . Supponiamo ora che il fluido ‘trasporti’ qualche proprietà, tipo: massa, oppure carica elettrica, che si ‘conserva’. Questo vuol dire che c’è una densità f (t, x) per cui Z d f (t, x)dx = 0, ∀Ω ⊂ Rm dt Φt (Ω) Impostiamo un conto analogo a quello che ci ha portato al teorema del trasporto, dove scriveremo y = y(t, x) per l’inversa di x(t, y): Z Z ∂(x , . . . , x ) d d 1 m f (t, x)dx = f (t, x(t, y)) (t, y)dy = dt Φt (Ω) dt Ω ∂(y1 , . . . , ym ) Z nh i X ∂ ∂f ∂xi = (t, x(t, y)) + f (t, x(t, y)) (t, y) J(t, y)+ ∂t ∂xi ∂t Ω i o ∂ +f (t, x(t, y)) J(t, y) dy = ∂t Z n X ∂f ∂ ∂xi = (t, x(t, y)) + f (t, x(t, y)) (t, y)+ ∂t ∂xi ∂t Ω i 60 o +f (t, x(t, y)) divX(t, x(t, y)) J(t, y)dy = Z n ∂f X ∂ (t, x) + f (t, x)Xi (t, x)+ = ∂t ∂x i Φt (Ω) i o +f (t, x) divX(t, x) dx = 0 e questo n peroogni Ω scelto, dunque, supposta continua in x la funzione di cui sopra . . . , è esattamente tale funzione integranda che deve essere nulla: X ∂ ∂f (t, x) + f (t, x)Xi (t, x) + f (t, x) divX(t, x) = 0, ∂t ∂xi i equivalentemente, X ∂ ∂f (t, x) + f (t, x)Xi (t, x) = 0, ∂t ∂xi i (∗∗) ∂f (t, x) + div f (t, x)X(t, x) = 0 ∂t Importante: si noti che le densità che si conservano per flussi isocori (cioè divX = 0) sono degli integrali primi. 5.5 (Verso la) Diffusione Come nella sezione precedente continuiamo a supporre che il campo vettoriale X(t, x) sia il campo di velocità di un fluido e supponiamo ora che il fluido ‘trasporti’ qualche altro tipo di proprietà (temperatura, ‘probabilità’ ?) che propone un comportamento di dispersione col seguente meccanismo 3 . Esiste dunque una f (t, x) per cui, per qualche costante ν > 0, dove scriviamo con ∂Φt (Ω) la superficie-bordo di Φt (Ω) ⊂ Rm , dove denotiamo con ∇x f (t, x) il gradiente (rispetto alle variabili x), e dove indichiamo con n il versore esterno normale al bordo ∂Φt (Ω), ∀Ω ⊂ Rm : 3 Tale modo di introdurre le equazioni di diffusione lo si può ritrovare per esempio nel libro: H. Amann, Ordinary differential equations. An introduction to nonlinear analysis. Studies in Mathematics, 13. Walter de Gruyter & Co., Berlin, 1990. 61 d dt Z Z ∇x f (t, x) · n(x) da f (t, x)dx = ν Φt (Ω) ∂Φt (Ω) Indaghiamo sul significato del secondo membro. Naturalmente, per ν = 0 riotteniamo per f il significato di densità conservata. Ricordiamo il significato geometrico del gradiente ∇x f (t, x) di una funzione scalare: è un vettore che in quel punto x e in quell’istante t in cui è valutato indica la direzione spaziale di massima crescita locale per la funzione. Dunque, se ad un istante t e in un punto x ∈ ∂Φt (Ω) si ha che p.e. il prodotto scalare ∇x f (t, x) · n(x) > 0 significa che localmente f esternamente a Φt (Ω) è maggiore dunque c’è un contributo di crescita, f tende a fluire all’interno, mentre invece se ∇x f (t, x) · n(x) < 0 si ha che all’interno di Φt (Ω), localmente in x, f è maggiore rispetto all’esterno e dunque ci sarà una tendenza al riequilibrio con un flusso uscente e conseguente contributo di bordo negativo alla derivata espressa nel primo membro. L’uso del teorema di Gauss (o ‘della divergenza’) sul secondo membro ci dà: Z Z d div∇x f (t, x) dx f (t, x)dx = ν dt Φt (Ω) Φt (Ω) X ∂2 div∇x f = f = ∆f : Operatore di Laplace, o Laplaciano ∂x2i i procedendo con conti analoghi alle precedenti sezioni, Z n ∂f X ∂ (t, x) + f (t, x)Xi (t, x)+ ∂t ∂x i Φt (Ω) i o +f (t, x) divX(t, x) − ν∆f (t, x) dx = 0 ∀Ω dunque ancora una volta è la quantificazione ∀Ω che forza la funzione integranda debba essere nulla: X ∂ ∂f (t, x) + f (t, x)Xi (t, x) − ν∆f (t, x) = 0, ∂t ∂xi i (∗ ∗ ∗) ∂f + div f X = ν∆f ∂t Esempi: Equazione di diffusione del calore (f = T ), temperatura. Equazione di diffusione di Fick, Equazione di Fokker-Planck (f = p), densità di propabilità. 62 5.6 Il fenomeno del Large Damping nelle equazioni di Newton Nelle prossime pagine studieremo aspetti tecnici dell’equazione di FokkerPlanck emergente da possibili sistemi dinamici deterministici tipici dalla meccanica classica di n particelle. Il drift Z, cioè il campo vettoriale che regge la dinamica rappresentata al primo ordine, è un campo vettoriale nello spazio delle fasi R6n = {z = (x, v)}: ẋ = v, v̇ = F(x, v) ż = Z(z) : Nella sezione 5.6.1 si introdurrà un’importante approssimazione dovuta alla presenza di ‘grande viscosità’, che ridurrà radicalmente il drift da campo vettoriale di R6n ad un campo vettoriale nello spazio delle configurazioni R3n . A volte viene citata come approssimazione di Smoluchowski. 5.6.1 Large Damping lineare Consideriamo l’equazione differenziale lineare mẍ = −hx − k ẋ, m, h, k > 0 Nel caso k >> m, h, cosicché 2 ∆ = k − 4mh > 0, λ1 = −k + √ k 2 − 4mh , 2m λ2 = −k − la generica soluzione, nel piano delle fasi, è data da: x = c1 eλ1 t + c2 eλ2 t ẋ = c1 λ1 eλ1 t + c2 λ2 eλ2 t Osservando che nelle nostre ipotesi λ2 < λ1 < 0, limt→+∞ ẋ x = limt→+∞ c1 λ1 eλ1 t +c2 λ2 eλ2 t , c1 eλ1 t +c2 eλ2 t = limt→+∞ c1 λ1 +c2 λ2 e(λ2 −λ1 )t , c1 +c2 e(λ2 −λ1 )t = λ1 (< 0), la radice più grande. 63 √ k 2 − 4mh , 2m Cosa accade a questa pendenza di retta asintotica quando k → +∞? limk→+∞ λ1 = limk→+∞ √ −k+ k2 −4mh , 2m √ = limk→+∞ = limk→+∞ (−k+ √ k2 −4mh)(k+ k2 −4mh) √ , 2m(k+ k2 −4mh) −4mh √ 2m(k+ k2 −4mh) =0 Un’osservazione interessante ora è che la funzione k 7→ λ1 (k) = −4mh √ 2m(k+ k2 −4mh) è (infinitesima ed è) asintotica, per k → +∞, alla funzione h k 7→ − , k infatti: lim k→+∞ −4mh √ 2m(k+ k2 −4mh) − hk = lim k→+∞ k+ √ 2k =1 k 2 − 4mh Quest’ultima asintoticità giustifica la riduzione di “large damping” (cioè, per k → +∞) che segue: introdotto il “tempo lento” τ := kt , e definito y(τ ) := x(kτ ), si ha y = x, y 0 = k ẋ, y 00 = k 2 ẍ cosicché dalla nostra equazione di partenza otteniamo m 00 y = −hy − y 0 k2 per grande k > 0 si ‘trascura’ il membro di sinistra e si studia l’equazione approssimata (chiamata appross. di ‘large damping’) y 0 = −hy ma questa è esattamente h ẋ = − x k Abbiamo appena visto che ẋ x ≈ t→+∞ λ1 ≈ k→+∞ 64 − h k Dunque, nel caso lineare tale approssimazione appare giustificata, ha senso per grandi tempi e grande viscosità (damping) sostituire mẍ = −hx − k ẋ h ẋ = − x k =⇒ o meglio, in tutta generalità, se esiste un minimo assoluto per U che diventa equ. asint. stabile con la viscosità, mẍ = −∇U (x) − k ẋ =⇒ 1 ẋ = − ∇U (x) k Quest’ultima estensione al caso non lineare, cioè energia potenziale non necessariamente quadratica come nel caso lineare-elastico, è motivata dal fatto che per tempi lunghi il sistema evolve verso tale equilibrio e dunque diventa essenziale la (sola) parte lineare dell’equazione differenziale. 5.7 5.7.1 Funzionali di Lyapunov per Fokker-Planck: entropia relativa e energia libera Generalità sull’equazione di Fokker-Planck Consideriamo l’equazione di Fokker-Planck in un dominio Ω ⊂ Rn , dove il campo (drift) X(x) è gradiente ed è generato da un’energia potenziale U , X(x) = −gradU (x), con la condizione: gradU (x) · n(x) = 0, ∀x ∈ ∂Ω che ci avverte che le curve integrali di X non escono da Ω: ∂p + div pX = ν∆p ∂t (F okker − P lanck) Tipico problema di Cauchy: Determinare p(t, x) risolvente F-P, tale che gradp(t, x) · n(x) = 0, ∀x ∈ ∂Ω, Z p(0, x) = p0 (x), con la proprietà sul dato iniziale : p0 (x) dx = 1. Ω Mostriamo inizialmente che pe (x) := e− 65 U (x) ν è una soluzione stazionaria di F-P, cioè: div pe X = ν∆pe (staz) Naturalmente penseremo che U , dato che è definita a meno di costante R U (x) additiva, sia tale per cui vale la normalizzazione: Ω e− ν dx = 1. gradU · gradU U 0 −U 1 membro : div −e ν gradU = − ∆U e− ν , ν 0 2 membro : ν∆ e −U ν U gradU − U ∆U gradU · gradU ν = ν div − e =ν − + e− ν . 2 ν ν ν Mostriamo ora che la proprietà di normalizzazione è invariante nel tempo: Z Z Z d p(t, x)dx = div (−pX + νgradp) dx = (−pX + νgradp)·n dxn−1 = 0. dt Ω Ω ∂Ω Questo ci garantirà che se il dato iniziale è una densità normalizzata, cosı̀ sarà tale la corrispondente soluzione ∀t ≥ 0. 5.7.2 L’Entropia U (x) Introduciamo l’entropia (relativa, a pe (x) = e− ν ), Z p(t, x) H[p](t) := p(t, x) ln dx pe (x) Ω e mostriamo che risulta essere una funzione di Lyapunov per tale soluzione stazionaria: Teorema Il funzionale H[p] lungo le soluzioni4 di F-P è non crescente: d H[p](t) ≤ 0, dt (i) inoltre, (ii) H[pe ] = 0, H[p] > 0, per p 6= pe . 4 Un argomento classico, detto principio del massimo, mostra che le nostre soluzioni sono p ≥ 0. 66 Prova Richiamiamo che gradpe = − gradU pe = ν X p. ν e Z d p H[p](t) = div (−pX + νgrad p) ln + 1 dx = dt pe Ω Z p = div (−pX + νgrad p) ln + 1 dx − pe Ω | {z } =0: grad p·n|∂Ω =0=X·n|∂Ω Z − (−pX + νgradp) grad ln Ω p dx = pe Z gradpe p −p = −ν + gradp grad ln dx = pe pe Ω Z gradp gradpe gradpe + gradp − = −ν −p = pe p pe Ω Z gradp gradpe 2 = −ν p − pe p dx ≤ 0, Ω e d H[p](t) = 0 solo se p = pe , dt gradp gradpe − = 0 se e solo se grad ln p = grad ln pe . infatti : p pe e Infine, dalla disuguaglianza (classica): x ln x ≥ x−1, ∀x > 0, e utilizzandolo per x := p/pe , Z Z Z Z p p p ln dx ≥ pe p dx − pe dx ≡ 0. − 1 dx = pe pe Ω Ω Ω Ω Non solo l’entropia è definita positiva, come appena dimostrato, ma ammette pe come suo unico punto critico ed è pure convessa: Z Z ∀δp : (p + δp) dx = 1, dunque tale che δp dx = 0, Ω Ω Z d p d H[p]δp = p ln dx = p+λδp dλ Ω pe λ=0 Z Z p p = δp ln + 1 dx = δp ln dx = 0, pe pe Ω Ω 67 se e solo se: p = pe . Infine, la convessità: Z ∂2 p 2 d H[p](δp, δp) = p ln dx = p+λδp+µδp ∂µ ∂λ Ω pe λ=0, µ=0 Z Z p + µδp |δp|2 1 ∂ δp ln + 1 dx = dx ≥ k δp k2L2 . = ∂µ Ω pe p maxΩ p µ=0 Ω 5.7.3 Fokker-Planck e termodinamica di non-equilibrio In questa sezione si propone una nuova funzione (funzionale) di Lyapunov per l’equazione di Fokker-Planck, ancora con le condizioni esposte in 5.7.1, con un significato termodinamico più immediato e fruibile dell’entropia relativa appena introdotta. Nell’ipotesi di lavoro in cui operiamo, ‘large damping’ e conseguente rilassamento della componente cinetica dell’energia, possiamo affermare che l’energia al tempo t che compete al nostro sistema con densità di probabilità p(t, x) sia Z E = E[p](t) = U (x)p(t, x)dx Ω mentre l’entropia (assoluta) è –prendendo ancora a prestito dall’ambientazione Shannon & Jaynes– Z S = S[p](t) = − p(t, x) ln p(t, x)dx Ω Infine, assimileremo –a meno di costanti aggiustanti la dimensionalità– il parametro di viscosità ν > 0 con la temperatura assoluta θ, ν=θ relazione detta a volte di Einstein-Smoluchowsky, benché sia interamente ascrivibile ad Einstein. I nostri processi sono isolati, dunque isotermi, e ha quindi senso definire l’energia libera F con temperatura costante: Z F = E − θS, F = (U + ν ln p)pdx Ω e quindi cimentarsi nel verificare se il ben noto aspetto quantitativo della seconda legge della termodinamica, che asserisce che F tende al suo minimo assoluto, sia ricostruibile nell’attuale assetto. Z dF [p]δp = (U + ν ln p + ν)δpdx Ω 68 come abbiamo visto, R δp dx = 0, pertanto: Z dF [p]δp = (U + ν ln p)δpdx Ω Ω L’energia libera ammette dunque l’unico punto stazionario nell’equilibrio p = U (x) pe = e ν , che è pure il minimo assoluto data la uniforme L2 -convessità qui sotto verificata. Il calcolo segue sostanzialmente linee analoghe a quelle viste precedentemente per H, Z |δp|2 ν 2 d F [p](δp, δp) = ν dx ≥ k δp k2L2 p max p Ω Ω Infine verifichiamo Z d F [p](t) = (U + ν ln p + ν)div (−pX + νgrad p) dx = dt Ω Z = − grad(U + ν ln p) · (p grad U + ν grad p) dx = Ω Z 2 2 2 |grad p| =− p|gradU | + 2ν grad p · grad U + ν dx = p Ω 2 Z √ grad p = − p gradU + ν √ dx ≤ 0, p Ω U √ p √ e si vede che p gradU + ν grad = 0 se e solo se p = e− ν = pe . p 5.7.4 Fokker-Planck e teoria delle Grandi Deviazioni Consideriamo la varietà compatta e senza bordo Ω, p.e. il toro Tn , ed un campo vettoriale di drift su di esso, X : Ω −→ Rn La struttura della distribuzione di probabilità di equilibrio che abbiamo inU contrato nel caso di drift gradiente, X = −∇U , cioè pe = e− ν , ci spinge a cercare di risolvere 5 ν ∂p + div pX = ∆p ∂t 2 ponendo S(t,x) p(t, x) = e− ν (Cole-Hopf) La presenza di ν2 invece di ν è semplicemente dettata da un motivo tecnico: rendere simmetrica una trasformata di Legendre che seguirà a tale impostazione. 5 69 e sostituendo nell’equazione di Fokker-Planck. Il risultato finale che inseguiamo in questa sezione è la costruzione di una teoria asintotica, per ν → 0, delle soluzioni dei problemi di Cauchy per Fokker-Planck. Otteniamo S,t ∇S · X ∇S − S ν −S − − +∇·X e ν = ∇· − e ν ν ν 2 ν S,t ∇S · X ν ∆S |∇S|2 − S −S − − +∇·X e ν = ∇· − + e ν ν ν 2 ν ν2 |∇S|2 ν S,t + + ∇S · X − ν∇ · X = ∆S 2 2 supporremo che il campo vettoriale di drift sia solenoidale: ∇·X =0 cosı̀ ν |∇S|2 + ∇S · X = ∆S (H-J con viscosità) 2 2 quest’ultima è un’equazione di Hamilton-Jacobi, con termine di viscosità ν ∆S, di Hamiltoniana: 2 S,t + 1 H(x, p) = |p|2 + p · X(x) 2 Un semplice calcolo mostra che la funzione di Lagrange, correlata mediante la trasformazione di Legendre ad H(x, p), è 1 L(x, ẋ) = |ẋ − X(x)|2 2 La formula di Lax-Oleinik6 , rappresentante le soluzioni di viscosità (che sono Lipschitziane) del problema di Cauchy per l’equazione: S,t + |∇S|2 + ∇S · X = 0 2 con dato iniziale: S(0, x) = σ(x), 6 σ : Ω → R, Vedi p.e. Albert Fathi, Weak KAM Theorem in Lagrangian Dynamics, Preliminary Version 70 si scrive: S(t, x) = inf x̄(·)∈C 1 ([0,t];Ω):x̄(t)=x Z σ(x̄(0) + t 0 1 ˙ ) − X(x̄(τ ))|2 dτ |x̄(τ 2 Infine, pensando all’inversa della Cole-Hopf, otteniamo la formula asintotica rigorosa che cercavamo per p(t, x): lim (−ν ln p(t, x)) = ν→0 inf x̄(·) ∈ C 1 ([0, t]; Ω) : x̄(t) = x Z σ(x̄(0)) + 0 t 1 ˙ ) − X(x̄(τ ))|2 dτ |x̄(τ 2 (‘Grandi Deviazioni’) per dato iniziale: p(0, x) = e− σ(x) ν Tale formula è la giustificazione rigorosa della rappresentazione approssimata asintotica che a volte si ritrova per p: p(t, x) ≈ν→0 Z t 1 1 2 ˙ ) − X(x̄(τ ))| dτ inf |x̄(τ exp − σ(x̄(0)) + ν x̄(·) ∈ C 1 : x̄(t) = x 0 2 71 Capitolo 6 Serie di Fourier ed equazione del calore: la diffusione 6.1 Euristica: Teorema di rappresentazione di vettori negli spazi finito-dimensionale Consideriamo Rn dotato del prodotto scalare euclideo h·, ·i : Rn × Rn −→ R hu, vi = n X ui vj δij = i,j=1 n X ui vi = u · v i=1 In tale struttura vettoriale si considera la base naturale orto-normale di vettori generante tutto lo spazio: si scrive {ei }i=1,...,n , ei = (0, . . . 0, 1, . . . 0) con {z } | 1 è nell’i-esimo posto la proprietà (detta, appunto, di orto-normalità): hei , ej i = δij Vale il seguente teorema di rappresentazione per ogni vettore generico u di Rn nella base {ei }i=1,...,n : u= n X hu, ei iei (∗) i=1 In altri termini: il prodotto scalare di u con ei è esattamente la componente i-esima del vettore u, lungo il vettore ei della base {ej }j=1,...,n . 72 La validità della (∗) va al di là della scelta ovvia della base sopra scritta: per ogni altro1 prodotto scalare hu, vi, e per ogni altra scelta di base {Ei }i=,...,n ortonormale rispetto a quel prodotto scalare, cioè hEi , Ej i = δij , vale ancora u= n X hu, Ei iEi (∗∗) i=1 Si ricordi infine che con un prodotto scalare si introduce in modo naturale una norma: p |u| := hu, ui Tale ordine di idee vorremmo estenderlo a spazi infinito-dimensionali coinvolgenti oggetti (funzioni, curve,...) che intervengono nelle equazioni differenziali. 6.2 Lo spazio delle funzioni L2([0, T ]; C) Consideriamo l’insieme delle funzioni definite su di un intervallo [0, T ] della retta reale e possibilmente a valori nei numeri complessi C. Per il momento non ci impegnamo ancora su di una classe di regolarità richiesta: sarà la teoria via via evolventesi che guiderà la scelta. Una prima cosa da osservare è che tale insieme si atteggia naturalmente a C-spazio vettoriale, nel senso che combinazioni di funzioni, con coeff. complessi, è ancora una funzione del tipo considerato. Indichiamo al solito con z̄ := x − iy il complesso coniugato di z = x + iy e introduciamo il seguente (candidato) prodotto scalare: Z 1 T f (x)ḡ(x)dx (?) hf, gi := T 0 La norma che tale pr. scalare introduce2 Z Z i 1 T 1 Th 2 ¯ ||f ||L2 := hf, f i = f (x)f (x)dx = Re{f (x)}2 + Im{f (x)}2 dx T 0 T 0 La presenza di T1 serve per poter affermare, come appare naturale, che la norma della funzione f ≡ 1 sia uguale ad 1. P 1 Pper es., hu v i := ij aij ui vj , dove aij è una matrice (simmetrica) definita positiva: ij aij λi λj > 0 ∀λ 6= (0, . . . , 0). 2 Si ricordi che z z̄ = (x + iy)(x − iy) = x2 + y 2 . 73 Infine, vorremmo affermare3 che f è in L2 ([0, T ], C) se ||f ||L2 < +∞ Ma tale definizione ha un grave difetto. Se infatti modifichiamo la funzione f in un insieme finito di punti, o meglio in un insieme di punti isolati4 , costruendo cosı̀ una nuova funzione f 0 , si ha che (l’integrale non li ‘vede’) ||f ||2L2 = ||f 0 ||2L2 e questo pregiudica la possibilità di usare tale prodotto scalare come norma, infatti: ||f − f 0 ||2L2 = 0, ma f 6= f 0 Questo problema si risolve affermando che gli oggetti del nostro spazio sono non tanto delle funzioni ma delle ‘classi di equivalenza’ di funzioni, dove la relazione di equivalenza è esattamente questa: Z 1 T 0 |f (x) − f 0 (x)|2 dx = 0 f ∼f se e solo se T 0 Dunque, quando diciamo che una ‘funzione’ è in L2 dobbiamo sempre pensare ad una classe di equivalenza e non ad una funzione in senso standard. In altri termine, una funzione in L2 non ha un significato puntuale. Introduciamo una base ortonormale in L2 ([0, T ]; C): n o i 2πk x iα T {Ek }k∈Z := x 7→ e ricordare che e = cos α + i sin α k∈Z Mostriamo infatti che hEk , Eh iL2 = δkh hEk , Eh iL2 = 1 T Z 0 T ei 2π(k−h) x T dx = T 2π(k−h) 1 T ei T x T i2π(k−h) 1, = 0, k 6= h 0 k=h Otteniamo cosı̀ un teorema5 di rappresentazione per funzioni (classi di equivalenza) di L2 : X f (x) = hf, Ek iL2 Ek (x), k∈Z 3 o, se vogliamo, definire delle regole affinché una funzione-vettore f appartenga o meno allo spazio L2 in costruzione. 4 più in generale, in un insieme di ‘misura nulla’ rispetto all’integrale di Lebesgue. 5 accettiamolo, l’abbiamo solo reso plausibile. 74 f (x) = X fk e i 2πk x T (◦) k∈Z dove fk è la componente di f lungo il ‘vettore’ base ei 1 fk = T Z T f (x)e−i 2πk x T 2πk x T : fk = hf, Ek iL2 , dx (◦◦) 0 La serie (◦) è detta serie di Fourier della funzione f ∈ L2 . Possiamo riscrivere la serie di Fourier mettendo in evidenza parte reale e immaginaria: f (x) = f0 + X 2πk 2πk x + i sin x) = T T fk (cos k∈Z\0 = f0 + X fk (cos k∈N f (x) = Re(f0 ) + X 2πk 2πk 2πk 2πk f−k (cos x + i sin x) + x − i sin x), T T T T k∈N X Re(fk + f−k ) cos k∈N X 2πk 2πk x− Im(fk − f−k ) sin x+ T T k∈N n X X 2πk 2πk o Im(fk + f−k ) cos Re(fk − f−k ) sin +i Im(f0 ) + x+ x T T k∈N k∈N Le quattro successioni reali in N sopra coinvolte sono indipendenti e pertanto possiamo riscrivere f (x) = a0 + X k∈N ak cos X 2πk 2πk x+ bk sin x+ T T k∈N n X X 2πk 2πk o +i b0 + Ak cos x+ Bk sin x T T k∈N k∈N ove ak , bk , Ak , Bk sono reali. Supponiamo che f sia reale, allora Z Z 1 T 1 T 2πk 2πk −i 2πk x f (x)e T dx = f (x)(cos x − i sin x)dx k ∈ N : fk = T 0 T 0 T T Z Z 1 T 1 T 2πk 2πk i 2πk x T k ∈ N : f−k = f (x)e dx = f (x)(cos x + i sin x)dx T 0 T 0 T T Z 2 T 2πk ak = Re(fk + f−k ) = f (x) cos x dx T 0 T 75 analogamente 2 bk = Im(f−k − fk ) = T Z T f (x) sin 0 2πk x dx T Si noti inoltre che (◦) vale su tutta la retta reale e dunque tale formula estende per periodicità, con periodo T , una funzione f , definita solo su [0, T ], ad una funzione periodica definita su tutta la retta R. 6.2.1 Serie di soli coseni (o di soli seni) Consideriamo ora, sempre pensando a serie di Fourier di funzioni reali, la seguente nuova rappresentazione (sarà utile poi nell’applicazione all’equazione del calore): data una funzione f : [0, T ] → R estendiamone per parità la definizione nell’intervallo [−T, T ], questo significa che definiamo ∀x ∈ [−T, 0] : f (x) := f (−x) La funzione in [−T, T ] che cosı̀ otteniamo continueremo a chiamarla f ed è pari 6 per ovvia costruzione. Essendo il periodo/intervallo uguale a 2T , essa sarà rappresentata da X X πk πk Bk sin x+ x x ∈ [−T, T ] Ak cos f (x) = A0 + T T k∈N k∈N e i coefficienti Ak e Bk si ottengono nel solito modo, p.e. Z 1 T πk Bk = f (x) sin x dx T −T T ma f è pari, sin πk x è dispari, e cosi’ infine la funzione integranda f (x) sin πk x T T è dispari, questo basta per dire che l’integrale è nullo, ∀k ∈ N: Bk = 0. In definitiva, abbiamo costruito una rappresentazione di f usando solo i coseni: X πk f (x) = A0 + Ak cos x (†) T k∈N Notiamo subito che se la serie dei termini derivati converge alla derivata di f ∈ C 1 ([−T, T ]; R), cioè se X πk df πk (x) = − Ak sin x, dx T T k∈N 6 appunto: f (−x) = f (x), es.: f (x) = cos x; si dice invece dispari una funzione in [−T, T ] per cui f (−x) = −f (x), es.: f (x) = sin x. 76 allora necessariamente df df (0) = 0 = (T ) dx dx Vedremo tra poco la forte utilità d’uso di tali serie di soli coseni per il problema al bordo che studieremo per l’equazione del calore. Esercizio: estendere per disparità in [−T, T ] funzioni f inizialmente definite in [0, T ], introducendo cosı̀ serie di soli seni. Constatare che tali serie sono le più opportune per rappresentare funzioni che sono nulle nel bordo di [0, T ]. 6.2.2 Qualche teorema e stima Abbozziamo una semplice (parziale) classificazione delle funzioni che ammettono una rappresentazione in serie di Fourier. (i) Le funzioni analitiche, cioè le funzioni la cui serie di Taylor converge alla funzione stessa, ammettono rappresentazione in serie di Fourier dove vale, per qualche C > 0 e σ > 0, la seguente stima sui coefficienti di Fourier: |fk | ≤ C e−σ|k| (ii) Le funzioni C s , per esse vale |fk | ≤ C |k|s+1 (iii) Le funzioni C 1 a ‘tratti’, cioè con un numero finito di discontinuità (a salto finito) sia nella funzione sia nella derivata, per esse vale la rappresentazione in serie di Fourier in [0, T ], e, sebbene possa essere che f (0) 6= f (T ), la serie di Fourier esiste e converge su tutto R: nei punti nT ∈ R, n ∈ Z, (T ) essa converge a f (0)+f ; tale comportamento di convergenza sussiste in ogni 2 altro punto x0 di discontinuità della f in studio: la serie converge a limx→x−0 f (x) + limx→x+0 f (x) 2 6.3 6.3.1 Equazione del calore Una (rapida) deduzione dell’equazione del calore Consideriamo una sbarretta metallica [0, L] e supponiamo che nelle estremità la temperatura θ (> 0) possa pure cambiare, ma in modo che non sussistano ‘scambi energetici’ con l’esterno della sbarretta (condizioni di isolamento 77 adiabatico). Assumeremo che l’energia interna della sbarretta sia descritta da una densità di energia (per unità di lunghezza) che dipende linearmente dalla temperatura θ, E = Ẽ(θ) = c θ (c > 0) (densita0 d0 energia) Suo significato fisico: per ogni fissato x, il contenuto energetico della sbarretta, localmente a x, è tanto più elevato quanto più alta è la temperatura. L’energia sotto forma di calore si diffonde, fluisce nella sbarretta, e si ammette che il flusso7 di energia q in transito, da sn a dx, nel punto x della sbarretta, sia dato da q(t, x) = −K ∂θ (t, x) ∂x (K > 0) (f lusso di energia − calore) Suo significato fisico: per ogni fissato x, il calore fluisce dalle regioni ‘calde’ immediatamente vicine a x a quelle più ‘fredde’. (Le costanti c, K > 0 sono, come si usa dire, costitutive, fenomenologiche, dipendono dal materiale che stiamo considerando.) Infine, stabiliamo il generale bilancio dell’energia (è una legge di conservazione) riferito ad un qualsiasi pezzo di sbarretta tra x1 e x2 , 0 ≤ x1 < x2 ≤ L: diremo che nel pezzetto di sbarretta [x1 , x2 ] la variazione di energia per unità di tempo è precisamente data dal bilancio del flusso di energia-calore transitante alle sue estremità8 : Z d x2 Ẽ(θ(t, x)) dx = q(t, x1 ) − q(t, x2 ) (bilancio energia) dt x1 E dunque: Z x2 ∂θ ∂θ ∂θ (t, x)) dx = K( (t, x2 ) − (t, x1 )) ∂t ∂x ∂x x1 Z x2 Z x2 2 ∂θ ∂ θ (t, x) dx c (t, x)) dx = K 2 ∂t x1 ∂x x1 c posto χ := K , c x2 i ∂ 2θ (t, x) dx = 0 ∀x1 , x2 ∈ [0, L] (?) ∂t ∂x2 x1 i h d2 θ affermiamo che ∂θ (t, x)−χ (t, x) = 0: infatti, se per assurdo cosı̀ non fos2 ∂t dx h i ∂θ d2 θ ∗ ∗ ∗ se, allora esisterebbe un (qualche) punto x per cui ∂t (t, x )−χ dx2 (t, x ) 6= Z 7 8 h ∂θ (t, x) − χ è un’energia per unità di tempo naturalmente la sbarretta è dentro una guaina termicamente isolante 78 h 0, per esempio sia > 0, allora, supposta la continuità della funzione ∂θ (t, x)− ∂t i d2 θ χ dx 2 (t, x) rispetto a x, per il teorema della permanenza del segno esisterebbe i h d2 θ (t, x) − χ (t, x) > 0; un intervallo (piccolo) [a, b] contenente x∗ in cui ∂θ ∂t dx2 ma in tal caso si avrebbe Z bh i ∂θ d2 θ (t, x) − χ 2 (t, x) dx > 0 ∂t dx a contro l’affermazione (?) prima dimostrata. ∂θ )) Le ipotesi costitutive sul materiale in studio (la legge Ẽ(θ) e la legge q( ∂x ci hanno condotto ad affermare che il bilancio energetico è equivalente alla equazione alle derivate parziali: ∂θ ∂ 2θ (t, x) = χ 2 (t, x) ∂t ∂x 6.3.2 (χ > 0) (Equazione del calore) Soluzione dell’equazioni del calore con le serie di Fourier La condizione condizione di flusso q nullo sul bordo x = 0 e x = L si scrivono ora: ∂θ ∂θ (t, 0) = 0 = (t, L) ∀t ∈ [0, +∞) ∂x ∂x (CB : Condizioni al bordo) Oltre alle condizioni al bordo sopra scritte, dette anche condizioni di Neumann, dobbiamo considerare le seguenti condizioni iniziali; in sostanza, supponiamo che al tempo iniziale t = 0 la sbarretta abbia un certo ‘profilo’ assegnato di temperature θ(0) (x) ed esso ammetta una rappresentazione di Fourier: X (0) 2πk θk ei L x ∀x ∈ [0, L] θ(0, x) = θ(0) (x) = k∈Z (CI : Condizioni iniziali) A questo punto il criterio di ricerca di soluzioni ci è offerto dall’ambiente funzionale appena costruito: ricercheremo una soluzione θ(t, x) che sia rappresentabile come serie di Fourier rispetto alla variabile spaziale x ∈ [0, L], X 2πk θ(t, x) = θk (t)ei L x k∈Z Dato che il nostro campo incognito è reale (temperatura), useremo le rappresentazioni reali sopra viste: osserviamo subito che date le condizioni al bordo 79 che la nostra soluzione θ(t, x) deve soddisfare è utile usare la rappresentazione in soli coseni. Infatti, dato che la nostra θ(t, x) deve avere derivata nulla rispetto ad x in x = 0 e x = L, si vede bene che la sua estensione per parità all’intervallo [−L, L] è una funzione con la derivata rispetto ad x continua e la serie dei soli coseni sopra studiata ammette automaticamente tal proprietà di bordo CB auspicata. Dunque: θ(t, x) = a0 (t) + X ak (t) cos k∈N CI (0) : θ(0, x) = θ(0) (x) = a0 + CB : P πk x L (∗) (0) k∈N ak cos πk x L automaticamente soddisfatte x Inserendo la (∗) nell’equazione del calore, ricordando che le funzioni cos πk L sono tutte indipendenti tra loro, componente per componente otteniamo le infinite equazioni differenziali ordinarie separate9 del primo ordine, ∀k ∈ N: (0) ȧ0 (t) = 0 : a0 (t) = a0 πk 2 πk 2 (0) ȧk (t) = −χ ak (t) : ak (t) = ak e−χ| L | t L Riassumendo: X πn −χ| πn |2 t (0) a(0) x e L θ(t, x) = a0 + n cos L n∈N (Soluzione) Infine, si osserva il comportamento asintotico nel tempo del profilo della temperatura: esso tende spazialmente ad uniformizzarsi sul valor medio del profilo delle temperature iniziali, è il fenomeno della ‘termalizzazione’: Z L Z 1 L (0) 1 (0) (0) θ (x)dx = θ (x)dx. lim θ(t, x) = a0 = t→+∞ 2L −L L 0 6.3.3 Equazione di Diffusione L’equazione del calore sopra scritta si può interpretare (ed usare) per lo studio di processi generali di diffusione. Si pensi ad un tubicino 1-dimensionale [0, L] di solvente in cui si introduce al tempo t = 0 un piccola macchia di soluto 9 cioè, ogni k-equazione coinvolge solo la k-componente di θ. Sono equazioni del tipo: ẋ = ax, lo spazio vettoriale delle soluzioni di tale equazione lineare è 1-dimensionale e per costuire la base si prova con x(t) = eλt , si vede subito che λ = a e l’integrale generale è: x(t, c) = ceat . 80 di densità µ(0) (x) ≥ 0. Questo vuol dire che la quantità totale di massa di soluto al tempo t = 0 (ma vorremmo che sia tale anche per ogni altro tempo t > 0!) vale: Z L m= µ(0) (x) dx 0 µ(0) (x) = 1 L Z L µ(0) (x)dx + 0 X a(0) n cos n∈N 2πn 2πn X (0) x + x bn sin L L n∈N Considerazioni fisiche conducono alla seguente equazione di diffusione spaziotemporale del soluto nel solvente (Equazione della diffusione): ∂µ ∂ 2µ (t, x) = D 2 (t, x) ∂t ∂x (D > 0) Se le estremità del tubicino sono chiuse, la soluzione dovrà soddisfare a condizioni al bordo analoghe a quelle sopra viste per la temperatura. La soluzione sarà Z X 1 L (0) πn −D| πn |2 t L (Soluzione) µ(t, x) = µ (x)dx + a(0) x e n cos L 0 L n∈N Si noti che vale quanto poco sopra auspicato: la massa di soluto ad ogni istante t ≥ 0 è costante, Z L Z L m(t) = µ(t, x) dx = µ(0) (x) dx = m(0) 0 0 poiché Z 0 6.3.4 L X n∈N a(0) n cos πn 2 πn x dx e−D| L | t = 0. L Effetto grotta-cantina Pensiamo all’asse x come ad un asse puntante verso l’interno del suolo, x = 0: la superficie terrestre. ∂ϑ ∂ 2ϑ (x, t) = χ 2 (x, t) ∂t ∂ x t ∈ [0, T ], x≥0 con dato al bordo (x = 0) t-periodico: ϑ(0, t) = ϑ(0) (t) X (0) 2πk ϑ(0) (t) = ϑk ei T t k∈Z 81 ϑ0 (t+T ) = ϑ0 (t) cercheremo sol. con la stessa t-periodicità ϑ(x, t) = X ϑk (x)ei 2πk t T k∈Z 2πk 2πk ∂2 X ∂ X ϑk (x)ei T t = χ 2 ϑk (x)ei T t ∂t k∈Z ∂ x k∈Z 2πk d2 ϑk (x) = χ 2 ϑk (x) T dx s 2πk ϑk = eλk x ⇒ λk +,− = ± i χT s s 1 2πk 1 2π|k| i i k>0: λk +,− = ±( √ + √ ) k<0: λk +,− = ±( √ − √ ) χT χT 2 2 2 2 s s 1 i 2π|k| π|k| ∀k : λk +,− = ±( √ −sgn(k) √ ) = ±(1−i sgn(k)) =: ±ck χT χT 2 2 ∀k ∈ Z : i ϑk (x; αk , βk ) = αk eck x + βk e−ck x X 2πk (αk eck x + βk e−ck x ) ei T t ϑ(x, t) = | {z } k∈Z ϑk (x) Per x = 0 otteniamo un’informazione che è insufficiente alla completa determinazione di una soluzione: (0) x=0: αk +βk = ϑk come determinare completamente i coeff. αk e βk ? richiederemo che ||ϑ(·, ·)||∞ := |ϑ(x, t)| < +∞ : sup x≥0 t∈[0,T ] 1 ϑk (x) = T Z T ϑ(x, t)e−i 2πk t T dt ⇒ |ϑk (x)| ≤ ||ϑ||∞ < +∞ ⇒ αk = 0, infatti: 0 q |ϑk (x)| ≥ (|αk |e π|k| x χT −|βk |e q π|k| − χT x infine: ϑ(x, t) = X (0) |ϑk (x)| < +∞ ⇔ αk = 0 , βk = ϑk ) (0) ϑk e− q π|k| x χT q π|k| 2π|k| i sgn(k)( χT x+ T t) e k∈Z Esempio: ϑ(x, t) = X ϑk e− (0) q π|k| x χT q ei sgn(k)( π|k| 2π|k| x+ T t) χT k∈Z materiale “tipo suolo”: χ = 2 · 10−7 m2 /sec (...controllare...) (0) ϑ0 = 15 0 C, (0) ϑ1 = 20 0 C, 82 ϑ(0) (t) = 15 + 20 cos ωt, dove ω = 2π 2π = ≈ 2 · 10−7 sec−1 T 365 | · 24 {z· 3600} un anno r π ≈ χT r 10−7 ≈ 0.7 m−1 , −7 2 · 10 2π|k| 2π = ω = 2 · 10−7 sec−1 = T k=1 T ad una profondità di x = 4.5 m : r π sfasamento temporale: x = 0.7 · 4.5 ≈ π (scambio “stagionale”) χT fattore di smorzamento del termine oscillante: e−π ≈ 0.04 83 (temperatura quasi costante) Capitolo 7 Riduzione finito-dimensionale esatta in teoria dei campi Sia Ω ⊂ Rn un dominio ‘Stokesiano’, tale cioè che per esso valga il teorema di Stokes (p.e., frontiera C 1 a tratti) Vogliamo studiare il problema • Per assegnata funzione non lineare F : R → R, ∆u = εF (u) (#) u∂Ω = 0 dove n X ∂2 u ∆u := ∂x2j j=1 è l’operatore differenziale di Laplace, il Laplaciano. Questo problema ammette formulazione variazionale1 : H := {C ∞ (Ω̄; R) : u|∂Ω = 0} → R Z h Z u i 1 2 J : u(·) 7→ |∇u| + εF (λ)dλ dx Ω 2 ū Infatti: dJ(u)h = 0 ∀h ∈ H se e solo se u risolve (#) dJ(u(·))h(·) = d J(u(·) + ξh(·))|ξ=0 = dξ 1 Il problema della scelta del più opportuno spazio funzionale non sarà certamente qui affrontato: un’indagine accurata mostra che lo spazio più adatto è lo spazio di Sobolev W 1,2 = H 1 . 84 dn = dξ Z u(x)+ξh(x) Z h i o 1 2 εF (λ)dλ dx |ξ=0 = |∇u(x) + ξ∇h(x)| + ū Ω 2 Z h i = ∇u(x) · ∇h(x) + εF (u(x))h(x) dx = Ω ( rem : ∇ · u := div u, ∇ · ∇ = div grad = ∆) Z h i ∇ · (∇u(x) h(x)) − ∆u(x) h(x) + εF (u(x))h(x) dx = = Ω Z = h Z (∇u(x) h(x) · n(x)ds − [∆u(x) − εF (u(x))]h(x)dx. ∂Ω Ω sul bordo ∂Ω vale h = 0, dunque Z [∆u − εF (u)]hdx dJ(u)h = − Ω e si conclude col lemma fondamentale del Calcolo delle Variazioni. • Il problema degli autovalori del Laplaciano su di un dominio limitato Ω (problema spettrale) è un ben noto, il Laplaciano è un classico esempio di operatore ellittico: −∆uj = λj uj , hui , uj iL2 1 = meas(Ω) Z ui (x)uj (x)dx = δij , Ω λ0 = 0 < λ1 ≤ λ2 ≤ .... 2 d Esempio 1-dim: Ω = [0, L]: − dx uj (x) = 2 uj = λj uj , 2 e {uj }j∈N è una base di {L ([0, L]; R) : u(0) = 0 = u(L)}, λj = πj L 2 , huj , uk iL2 2 = L Z L sin 0 √ 2 sin πj πk x sin x dx = δjk L L • Per ogni f ∈ L2 , il problema lineare (equazione di Poisson): X uj ∆u =f è risolto da : g(f ) = − hf, uj iL2 u∂Ω = 0 λ j>0 j 85 πj x L , • Fissiamo: m ∈ N (cut-off). Per ogni u ∈ H, X µ := Pm u = uj hu, uj iL2 , η := Qm u = X uj hu, uj iL2 , m<j<+∞ 0<j≤m H = Pm H ⊕ Qm H. • Fissiamo: µ ∈ Pm H. Consideriamo la seguente mappa: Qm H −→ H η 7−→ g̃(η) := g(µ + η) Questa mappa è Lipschitz con Lip(g̃) ≤ g̃(η2 ) − g̃(η1 ) = 1 : λm+1 uj 1 η2 − η1 . hη2 − η1 , uj iL2 ≤ λ λm+1 m<j<+∞ j X • Ancora, per m ∈ N e µ ∈ Pm H fissati, consideriamo la nuova seguente mappa Qm H −→ Qm H η 7−→ εQm F g(µ + η) . Questa mappa, sotto l’ulteriore ipotesi su F , sup |F 0 (u)| = C < +∞, u∈R è una contrazione, i) per piccole perturbazioni ε, oppure ii) per convenientemente grande cut-off m: εC < 1. λm+1 Infatti: εC |η2 − η1 |. εQm F g(µ + η2 ) − εQm F g(µ + η1 ) ≤ λm+1 Banach-Caccioppoli: funzione punto fisso d(m, µ), (∗) d(m, µ) = εQm F g(µ + d(m, µ)) . 86 Se oltre a (∗), we consideriamo l’equazione finita per µ ∈ Pm H ∼ = Rm : (∗∗) µ = εPm F g(µ + d(m, µ)) . Concretamente, in corrispondenza ad ogni soluzione µ di (∗∗), notiamo che, sommando membro a membro (∗) e (∗∗), otteniamo una soluzione di ∆u = εF (u), u|∂Ω = 0, mediante la formula: u = g(µ + d(m, µ)). Il problema è ridotto, diventa finito-dimensionale. Inoltre, per m ∈ N fissato, definita la funzione (generatrice) W : Pm H ≈ Rm −→ R µ 7−→ J ◦ g(µ + d(m, µ)), essa (Teorema) genera esattamente tutte e sole le soluzioni del problema di Dirichlet originale: µ̄ è un punto critico di W , W 0 (µ̄) = 0, se e solo se ū è un punto critico di J, J 0 (ū) = 0, ove ū = g(µ̄ + d(m, µ̄)) . Osservazioni: • W è nota non appena si conosce la funzione punto fisso d(m, µ): questa si determina mediante limite di una successione iterata (⇒ metodi numerici approssimati). •• Lo studio della topologia dei punti critici di una funzione finito-dimensionale, quale W , si può realizzare con tecniche alla Morse e LusternikSchnirelman. • • • Questa tecnica, apparentemente simile alla riduzione di LyapunovSchmidt, mostra abbastanza facilmente la crescita gerarchica del numero delle soluzioni all’aumentare del parametro variazionale ε: εC < 1, λm+1 C = sup |F 0 |, ∆u = ε F (u). [Quando il parametro variazionale ε cresce, bisogna utilizzare un numero via via crescente m di autovalori dell’operatore ellittico lineare L; e dunque la ricerca delle soluzioni va operata in spazi finito-dimensionali di dimensione via via crescente.] 87 Teorema. Sia sup |F 0 (u)| = C < +∞. u∈R Allora, per fissato ε > 0 e conseguentemente fissato m tale che ε < λm+1 /C, i punti stazionari di W : Rm → R, producono esattamente i punti stazionari di J. Prova. ∂W (µ)dµ = dJ(u) dµ g(µ + d(m, µ)), dW = ∂µ u=g(µ+d(m,µ)) dW = h ∆u − εF (u) , dµ g(µ + d(m, µ))i, u=g(µ+d(m,µ)) ora, dal ruolo operativo (definizione) del punto fisso d(m, µ) e dalla definizione della mappa g abbiamo Qm µ + d(m, µ) − εF g(µ + d(m, µ)) = 0, ∆ g(µ + d(m, µ)) = µ + d(m, µ), quindi: Qm ∆u − εF (u) = 0. u=g(µ+d(m,µ)) Pertanto dW = hµ − εPm F (µ + d(m, µ)), Pm dµ g(µ + d(m, µ))i. Da g(f ) = − uj j>0 λj hf, uj iL2 , P+∞ è facile vedere che Pm dµ g(µ + d(m, µ)) = − m X uj j>0 λj dµj , cosicché dW = 0, se e solo se µ − εPm F (µ + d(m, µ)) = 0, che è precisamente l’equazione finita (∗∗) caratterizzante le soluzioni µ. Esercizio. Dimostrare che per piccoli ε, l’equazione non lineare finito dimensionale µ − εPm F (µ + d(m, µ)) = 0, ammette soluzioni µ = µ̃(ε) con µ̃(0) = 0. (Sugg.: usare il t. della funzione implicita, localmente a (ε∗ , µ∗ ) = (0, 0)) 88 Capitolo 8 Trasformata di Fourier e TAC 8.1 Euristica: dalle serie all’integrale di Fourier Riconsideriamo la serie di Fourier di f su di un intervallo limitato di ampiezza T , per convenienza, scegliamo [−T /2, T /2]: X 2πk (◦) fk e i T x f (x) = k∈Z dove fk è la componente di f lungo il ‘vettore’ base ei Z 2πk 1 T /2 fk = f (x)e−i T t dx T −T /2 2πk t T : (◦◦) Supponiamo ora di avere una funzione x 7→ f (x) definita su tutto l’asse reale, con delle proprietà di integrabilità che via via preciseremo. • L’idea è di indagare su cosa accade quando si fa tendere T → +∞. Premessa tecnica/euristica: Consideriamo una funzione R 3 ξ 7→ g(ξ) ∈ R sommabile su R; per T grande, la seguente quantità qui sotto (nella sinistra) appare una approssimazione (‘somma di Riemann’ su intervalli (piccoli) di ampiezza 1/T ) via via sempre più fedele dell’integrale qui sotto scritto (nella destra): Z +∞ X 1 k g ≈T →+∞ g(ξ)dξ. T T −∞ k∈Z Dunque, tornando alla rappresentazione di Fourier: i 2πk X h 1 Z T /2 −i 2πk t T f (x) = f (t)e dt ei T x , T −T /2 k∈Z 89 Z T /2 T → +∞ : f (x) = X 1 2πk ei T (x−t) T k∈Z {z } | f (t) −T /2 dt = qui si identifica: gt,x (ξ) := ei2πξ(x−t) ! T /2 Z ξ=+∞ Z t=+∞ X1 k f (t) = ei2πξ(x−t) dξ dt = f (t) gt,x dξ dt =T →+∞ T T −T /2 ξ=−∞ t=−∞ k∈Z Z ξ=+∞ Z t=+∞ f (t)e−i2πξt dt ei2πξx dξ = ξ=−∞ | t=−∞ {z } Z fˆ(ξ): fˆ è detta trasformata di Fourier di f 8.2 8.2.1 Trasformata di Fourier Serie e Trasformate di Fourier multiple: rispettivamente in [0, T ]n e in Rn Data una funzione f : [0, T ]n → C, x = (x1 , . . . , xn ) 7→ f (x) ∈ C si introduce (estendendo) la rappresentazione in serie di Fourier multi-dimensionale: f (x) = X 2π fk e i T k·x (k · x := k∈Zn n X k j xj ) j=1 dove ora le componenti di Fourier sono date da Z 2π 1 fk = n f (x)e−i T k·x dx T [0,T ]n Analogamente, per funzioni f : Rn → R, velocemente decrescenti all’infinito (come nel caso 1-dim, si veda subito qui sotto), si definisce la trasformata di Fourier Z ˆ f (ξ) := f (x)e−i2πξ·x dx, fˆ : Rn → C x∈Rn cosicché vale la rappresentazione Z f (x) = fˆ(x)ei2πξ·x dξ ξ∈Rn 90 8.2.2 Generalità analitiche & topologiche La Trasformata di Fourier in Rn agisce ‘naturalmente’ in uno spazio di funzioni C ∞ molto decrescenti all’infinito, assieme alle loro derivate, più di qualunque inverso di polinomio, di ogni grado. Tale spazio di funzioni è detto di Schwartz S(Rn ; R): f ∈ S(Rn ; R) se e solo se, per ogni k, m ∈ N e per ogni h1 + h2 + · · · = k, esistono costanti Ck,m > 0 per cui 1 ∂k f (x) ≤ C k,m h h ∂ 1 x1 ∂ 2 x2 .... 1 + |x|m La trasformata di Fourier è cosı̀ definita fˆ(ξ) = F(f )(ξ) = n ∀f ∈ S(R ; R) : Z f (x)e−i2πξ·x dx x∈Rn Si verifica che F :S→S Denotiamo con ∗ la convoluzione in S: Z f (x − y)g(y)dy (f ∗ g)(x) := y∈Rn Valgono: ||fˆ||L2 = ||f ||L2 \ (f ∗ g)(ξ) = fˆ(ξ) ĝ(ξ) F è unitaria F è un morf. d’alg. : F : (S, ∗) → (S, ·) L’Anti-trasformata è, ∀fˆ ∈ S: F −1 (fˆ)(x) = Z fˆ(ξ)ei2πξ·x dξ ξ∈Rn E vale la fondamentale Formula di inversione: F −1 ◦ F = idS(Rn ;R) Z Z −1 (F ◦ Ff )(x) = f (y)e−i2πξ·y dy ei2πξ·x dξ = ξ∈Rn Z = y∈Rn Z ei2πξ·(x−y) dξ f (y)dy = f (x) n y∈Rn | ξ∈R {z } :=δ(y−x) 91 da cui una rappresentazione del (funzionale) δ di Dirac: Z δ(y − x)f (y)dy = f (x) y∈Rn Le funzioni regolari a supporto compatto Cc∞ (Rn ; R) sono evidentemente un sottoinsieme di S(Rn ; R), e poiché Cc0 (Rn ; R) è denso in L2 (Rn ; R), si trae che S(Rn ; R) è denso in L2 (Rn ; R). Inoltre l’isomorfismo (cioè, lineare e biiettivo) F : S→S è un omeomorfismo ove pensiamo alla topologia della struttura di Frechet indotta su S dalle costanti Ck,m . 8.3 Tomografia Assiale Computerizzata 8.3.1 Teorema di invarianza per rotazioni di F Sia f : R2 → R (x1 , x2 ) 7→ f (x1 , x2 ) ∈ R una funzione definita in R2 con un fissato sistema cartesiano (x1 , x2 ). Consideriamo un nuovo sistema (x̃1 , x̃2 ), con ugual origine, ottenuto dal precedente mediante una rotazione degli assi di un angolo Θ in senso anti-orario, x1 cos Θ − sin Θ x̃1 x = R(Θ)x̃ in dettaglio: = x2 sin Θ cos Θ x̃2 Si osserva che R(Θ) è una matrice di rotazione ( cambiare righe con colonne: ATij = Aji ), R(Θ)T R(Θ) = 1, cioè R−1 = RT T denota la ‘trasposizione’, e det R(Θ) = +1. Denotiamo con fΘ , fΘ (x̃), la nuova rappresentazione della stessa funzione f, f (x), nel sistema ruotato: fΘ (·) := f (R(Θ)·), fΘ (x̃) := f (R(Θ)x̃) e consideriamo la medesima rotazione anche nello spazio (il piano R2 ) degli impulsi (forme) ξ, ξ = R(Θ)ξ˜ Teorema (d’invarianza) Sulla base della costruzione sopra indicata, vale: ˜ = fˆ(R(Θ)ξ) ˜ fˆΘ (ξ) 92 In altre parole: la trasformata ˆ di Fourier della funzione rappresentata nel sistema ruotato, fΘ , è esattamente la trasformata di Fourier della ˜ rappresentazione originale di f , valutata in ξ = R(Θ)ξ. Prova. Qui n = 2, ˜ = fˆΘ (ξ) Z f (R(Θ)x̃)e−i2πξ̃·x̃ dx̃ x̃∈Rn realizziamo il cambio di variabili d’integrazione x = R(Θ)x̃, Z T ˆ ˜ fΘ (ξ) = f (x)e−i2πξ̃·R(Θ) x | det R| dx = x∈Rn vale: ξ˜ · R(Θ)T x = R(Θ)ξ˜ · x, Z ˜ f (x)e−i2πR(Θ)ξ̃·x dx = fˆ(R(Θ)ξ) = x∈Rn 8.3.2 TAC: ricostruzione della densità Siamo ora interessati (sarà chiaro il motivo tra poco) al calcolo della trasformata di Fourier, nel sistema Θ-ruotato, valutata per vettori-impulsi del seguente tipo: sono solo sull’asse delle ascisse ruotato, cioè per impulsi del tipo ξ˜ = (ξ˜1 , ξ˜2 ) = (R, 0) Si osservi che per − ∞ < R < +∞ R cos Θ cos Θ − sin Θ R = sin Θ cos Θ 0 R sin Θ {z } | {z } | {z } | R(Θ) ξ ξ̃ Il teorema di invarianza ci dice che ξˆ = (R, 0) : ˜ = fˆΘ ((R, 0)) = fˆ(R(Θ)(R, 0)) = fˆ(R cos Θ, R sin Θ) fˆΘ (ξ) (?) D’altra parte, mediante la definizione diretta di trasformata, tale quantità si scrive pure nel seguente modo: Z ˆ fΘ ((R, 0)) = fΘ (x̃)e−i2π(R x̃1 +0·x̃2 ) dx̃1 dx̃2 = x̃∈R2 93 Z hZ = x̃1 ∈R i fΘ (x̃1 , x̃2 )dx̃2 e−i2πR x̃1 dx̃1 x̃2 ∈R Ecco un punto importante: nell’espressione (?) interpretiamo ξ1 = R cos Θ ξ2 = R sin Θ R ∈ (−∞, +∞), Θ ∈ [0, π) come alla rappresentazione del piano (non ruotato) dei vettori impulsi (ξ1 , ξ2 ) in coordinate Polari (R, Θ)! Sia ora f (x1 , x2 ) ≥ 0, a supporto compatto, la densità superficiale di massa (p.e. grammi/cm2 ) di una ‘fetta’ (slide) di un corpo 3-dim. B ottenuta (matematicamente) intersecando B con un ben preciso e fissato piano. La TAC si propone di ricostruire la densità f mediante misure opportune sulla slide; più precisamente, per ogni fissato angolo Θ vengono emessi raggi X parallelamente all’asse (Θ-ruotato) x̃2 e, per ogni fissato x̃1 , su di uno schermo (ortogonale a x̃2 ), si rileva quando complessivamente è densa la materia dello slide percorsa da tale radiazione, in sostanza si misura su di uno schermo la quantità: Z fΘ (x̃1 , x̃2 ) dx̃2 PΘ (x̃1 ) := x̃2 ∈R che h èi esattamente l’espressione sopra scritta entro le parentesi quadrate . . . . Poi, si cambia Θ, si rifanno le analoghe misure, ecc. Procediamo infine da queste informazioni, avendo misurato PΘ (x̃1 ) per ogni Θ ∈ [0, π), nel ricostruire f (x1 , x2 ) mediante la formula dell’anti-trasformata: Z f (x1 , x2 ) = fˆ(ξ1 , ξ2 )ei2πξ·x dξ, (ξ1 ,ξ2 )∈R2 usiamo la rappresentazione in coordinate polari sopra introdotte per il piano (non ruotato) delle (ξ1 , ξ2 ), f (x1 , x2 ) = Z Z i2π R cos Θ x1 +R sin Θ x2 ˆ = f (R cos Θ, R sin Θ)e |R| dR dΘ, R∈(−∞,+∞) Θ∈[0,π) abbiamo poco sopra interpretato il termine fˆ(R cos Θ, R sin Θ) come R P (x̃ )e−i2πR x̃1 dx̃1 , cosı̀ infine: x̃1 ∈R Θ 1 f (x1 , x2 ) = 94 Z = Z nZ −i2πR x̃1 PΘ (x̃1 )e o dx̃1 ei2π x1 R cos Θ+x2 R sin Θ |R| dR dΘ, Schema sintetico di acquisizione dati R∈(−∞,+∞) Θ∈[0,π) x̃1 la funzione integranda è nota, PΘ (x̃1 ) è dedotta da misure sperimentali, dunque possiamo infine realizzare il calcolo e ottenere esattamente f (x1 , x2 ). Il calcolo ora esposto è undi esempio cosiddetta trasformata Sia K una sezione piana C, didella densit à f (x, y). di Radon. Paolo Dulio, Politecnico di Milano Seminario di cultura matematica 95 Programma di Modelli Fisico-Matematici: 2012/13 Parte svolta da F. Cardin: • Metodo delle Caratteristiche: Cap. 1. • Ottica Ondulatoria asintotica elementare e Ottica Geometrica: Cap. 2. Della deduzione dell’equazione iconale è sufficiente sapere le premesse, cioè le equ. di Maxwell e le ipotesi di struttura sulla soluzione asintotica che si ricerca. • Propagazione per Onde nei Sistemi di PDE di Leggi di Bilancio: Cap. 3, tranne 3.2. • Cap. 4 (Friedrichs - Lax - Godounov - Boillat): No. • Cap. 5: Dal 5.4 compreso, tutto, tranne il 5.7.4. • Serie di Fourier ed equazione del calore: Cap. 6, tutto (Grotta-cantina: leggere). • Riduzione finito-dimensionale esatta in teoria dei campi: Cap. 7, tutto. • Cap. 8 (Tr. di Fourier e TAC). 96