...

Modelli Fisico Matematici Teoria delle Caratteristiche e

by user

on
Category: Documents
17

views

Report

Comments

Transcript

Modelli Fisico Matematici Teoria delle Caratteristiche e
Modelli Fisico Matematici
Teoria delle Caratteristiche
e Propagazione Ondosa
Laurea triennale in Matematica 2012/13
Franco Cardin
Premessa
Il contenuto culturale di questo corso Modelli Fisico Matematici è stato progettato, discusso, scelto, pensando a due direttrici d’utilizzo: da un
lato, prolungare adeguatamente la cultura generale in Fisica Matematica —
iniziata col primo corso al second’anno di Fisica Matematica— dall’altro,
costruire un corpo di argomenti scientifici fortemente matematicizzati e utili in applicazioni tecnologiche ingegneristiche. La scelta da operare era da
ricercarsi in filoni culturali adatti alle aspettative dell’indirizzo modellisiticonumerico del corso di laurea in Matematica, di cui questo corso è parte
costitutiva, una direzione dunque di tecno-matematica, pensando cosı̀ con
questo aggettivo alla suddivisione della Matematica Applicata che sempre
più spesso si incontra in vari paesi Europei: la tecno-matematica (elaborazione ed analisi di rigorosi modelli tecnologici predittivi, sistemi dinamici utili
in Fisica e in applicazioni ingegneristico-industriali) e l’econo-matematica
(aspetti probabilisitici stocastici attuariali di modelli economico finanziari).
Tale scelta è dunque caduta sulla teoria matematica dei continui deformabili
e di alcune applicazioni possibili in tale modello: la termodinamica rigorosa, la teoria della propagazione delle onde, quest’ultima poggiantesi su una
introduzione alla ‘teoria delle caratteristiche’, linguaggio matematico base
moderno per l’iniziale studio delle equazioni alle derivate parziali (PDE). Ed
andando a ritroso, tale teoria delle caratteristiche deve poggiare a sua volta
nella cosiddetta ‘formulazione Hamiltoniana’ della Meccanica Analitica, di
cui sono note agli allievi matematici (dal corso di second’anno di Fisica Matematica) solamente le premesse. Incidentalmente, la necessità contingente
di acquisire una competenza di base in Meccanica Hamiltoniana diventa virtuosa: lo studente che deviasse dall’indirizzo modellistico-numerico verso per
esempio l’indirizzo generale, magari per una specializzazione più prettamente fisico-matematica, non si troverebbe spiazzato nel recupero della cultura
Hamiltoniana, fondamentale nella costruzione della Fisica Matematica moderna. Si è tentato di dare un taglio didattico alla teoria e alla applicazioni
della meccanica dei continui di tipo ‘dinamicistico’, presentando tale teoria
come un paradigma di sistema dinamico infinito-dimensionale: questo è in
sostanza uno stile ispiratore di questa dispensa, sia degli appunti di meccanica dei continui presenti nell’altra mia dispensa (Sistemi Dinamici Meccanici),
già utilizzata parzialmente nel corso di Fisica Matematica, sia degli appunti
redatti da M. Favretti, appositamente per parte di questo corso.
Franco Cardin, 18 gennaio 2013
1
Indice
1 Metodo delle Caratteristiche
1.1 Teoria Lineare . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Teoria Quasi-Lineare . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Un’analisi dettagliata delle singolarità. La genesi delle
galassie secondo il modello di Zeldovic-Arnol’d . . . .
1.3 Teoria Non-Lineare . . . . . . . . . . . . . . . . . . . . . . .
1.3.1 Equazione di Hamilton-Jacobi . . . . . . . . . . . . .
1.3.2 Equazione di Hamilton-Jacobi di tipo evolutivo. Problema di Cauchy . . . . . . . . . . . . . . . . . . . .
2
3
4
. 4
. 10
. 12
. 18
. 18
. 23
Ottica Ondulatoria asintotica elementare e Ottica Geometrica
2.1 Da Maxwell a Fermat . . . . . . . . . . . . . . . . . . . . . . .
2.1.1 Esempio: caustiche . . . . . . . . . . . . . . . . . . . .
2.1.2 Altro esempio: da Fermat alla legge di rifrazione di
Snellius . . . . . . . . . . . . . . . . . . . . . . . . . .
Propagazione per Onde nei Sistemi di PDE di Leggi di
Bilancio
3.1 Onde di Discontinuità deboli . . . . . . . . . . . . . . . . . . .
3.2 Onde Asintotiche ad Alta Frequenza . . . . . . . . . . . . . .
3.3 Onde d’Urto (Shock waves) . . . . . . . . . . . . . . . . . . .
3.4 Velocità del suono . . . . . . . . . . . . . . . . . . . . . . . . .
28
28
34
39
41
41
46
46
50
4 La teoria di Friedrichs - Lax - Godounov - Boillat
52
5 Primi Elementi di Teoria Qualitativa dei Sistemi Dinamici
5.1 Integrali primi, dipendenti dal tempo, di campi vettoriali che
dipendono possibilmente dal tempo . . . . . . . . . . . . . . .
5.2 Intermezzo: Derivata di determinante . . . . . . . . . . . . . .
5.3 Teorema del Trasporto . . . . . . . . . . . . . . . . . . . . . .
55
2
55
56
57
5.4
5.5
5.6
5.7
Leggi di Conservazione . . . . . . . . . . . . . . . . . . . . .
(Verso la) Diffusione . . . . . . . . . . . . . . . . . . . . . .
Il fenomeno del Large Damping nelle equazioni di Newton .
5.6.1 Large Damping lineare . . . . . . . . . . . . . . . . .
Funzionali di Lyapunov per Fokker-Planck: entropia relativa
e energia libera . . . . . . . . . . . . . . . . . . . . . . . . .
5.7.1 Generalità sull’equazione di Fokker-Planck . . . . . .
5.7.2 L’Entropia . . . . . . . . . . . . . . . . . . . . . . . .
5.7.3 Fokker-Planck e termodinamica di non-equilibrio . .
5.7.4 Fokker-Planck e teoria delle Grandi Deviazioni . . . .
.
.
.
.
60
61
63
63
.
.
.
.
.
65
65
66
68
69
6 Serie di Fourier ed equazione del calore: la diffusione
6.1 Euristica: Teorema di rappresentazione di vettori negli spazi
finito-dimensionale . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Lo spazio delle funzioni L2 ([0, T ]; C) . . . . . . . . . . . . . . .
6.2.1 Serie di soli coseni (o di soli seni) . . . . . . . . . . . .
6.2.2 Qualche teorema e stima . . . . . . . . . . . . . . . . .
6.3 Equazione del calore . . . . . . . . . . . . . . . . . . . . . . .
6.3.1 Una (rapida) deduzione dell’equazione del calore . . . .
6.3.2 Soluzione dell’equazioni del calore con le serie di Fourier
6.3.3 Equazione di Diffusione . . . . . . . . . . . . . . . . . .
6.3.4 Effetto grotta-cantina . . . . . . . . . . . . . . . . . . .
7 Riduzione finito-dimensionale
esatta in teoria dei campi
8 Trasformata di Fourier e TAC
8.1 Euristica: dalle serie all’integrale di Fourier . . . . . . . . . .
8.2 Trasformata di Fourier . . . . . . . . . . . . . . . . . . . . .
8.2.1 Serie e Trasformate di Fourier multiple: rispettivamente in [0, T ]n e in Rn . . . . . . . . . . . . . . . . . . .
8.2.2 Generalità analitiche & topologiche . . . . . . . . . .
8.3 Tomografia Assiale Computerizzata . . . . . . . . . . . . . .
8.3.1 Teorema di invarianza per rotazioni di F . . . . . . .
8.3.2 TAC: ricostruzione della densità . . . . . . . . . . . .
3
72
72
73
76
77
77
77
79
80
81
84
89
. 89
. 90
.
.
.
.
.
90
91
92
92
93
Capitolo 1
Metodo delle Caratteristiche
1.1
Teoria Lineare
Consideriamo l’equazione differenziale alle derivate parziali (PDE) lineare
nell’incognita u = u(x),
d
X
(∗)
aα (x)
α=0
∂u
(x) = b(x)
∂xα
somma su α = 0, 1, 2, ..., d, per esempio d = 3, x0 = t,
x = (xα )α=0,1,2,...,d ∈ Rd+1 : Spazio − Tempo.
Il nostro problema (Problema iniziale di Cauchy) consiste nel ricercare soluzione u di (∗) tale che sulla ipersuperficie Σd dello Spazio−Tempo,
Σd ,→ Rd+1
k L 7→ x̃α (k L )
L = 1, 2, ..., d,
l’incognita u valga
u|Σd = σ,
ove σ è il dato iniziale,
σ : Σd −→ R,
k L 7→ σ(k L ).
Naturalmente u|Σd = σ significa:
u(x̃α (k L )) = σ(k L ).
4
Una scelta naturale per Σd nell’impostazione presente è Σd = {t =
0}×Rd , in altre parole, il nostro in problema è cosı̀ ai ‘valori inizali’, si chiede
che l’incognita u = u(x) = u(t, xL ) soddisfi alla condizione u(0, xL ) = σ(xL );
la generale impostazione qui adottata (cioè, dato iniziale su una generica ipersuperficie di co-dimensione 1 nello spazio-tempo) sarà utile nei più generali
problemi cosiddetti ‘al bordo’.
La strategia della costruzione della soluzione sarà squisitamente geometrica. Nello spazio Rd+2 , inteso come Spazio Tempo Allargato allo spazio
R1 ove assume valori l’incognita scalare u, consideriamo il seguente campo
vettoriale V
V : Rd+2 −→ Rd+2
(x, u) 7→ (a0 , a1 , ..., aα , ..., ad , b)
La nostra equazione differenziale si interpreta cosı̀ nella ricerca di
Φ : Rd+2 −→ R,
della forma : Φ(x, u) = φ(x) − u,
tale che (• : prodotto scalare in Rd+2 , ∇ = ∇Rd+2 )
(∗∗)
V • ∇ΦΦ=0 = 0
Infatti,
∂φ
∂φ
,
...,
, −1)
∂x0
∂xd
e si verifica facilmente l’equivalenza di (∗∗) con (∗). La (∗∗) ci offre ora una
proprietà geometrica molto utile della soluzione, vista ora come ‘zeri’ della
funzione Φ:
∇Φ = ∇Rd+2 (φ(x) − u) = (
Il campo vettoriale caratteristico V è ovunque tangente al luogo Φ = 0.
L’idea è la seguente: le linee di flusso di V comporranno il tessuto realizzante Φ = 0; in Rd+2 rappresentiamo la varietà iniziale d-dimensionale Σ̂d
dei dati iniziali, la cui immersione è
k 7−→ (x̃(k), σ(k)),
se il campo vettoriale V interseca trasversalmente Σ̂d (cioè, non vi è tangente), allora la superficie ‘rigata’ d+1-dim, che si ottiene costruendo le soluzioni
dv
= V (v) che partono
dell’equazione differenziale ordinaria associata a V , dλ
d
per λ = 0 da Σ̂ , è candidata ad essere il luogo geometrico rappresentato da
Φ(x, u) = 0, cioè infine u = φ(x) e la condizione V • ∇Φ = 0 è chiaramente
soddisfatta.
ẋ = a(x)
v̇ = V (v) :
u̇ = b(x)
5
Si noti che il primo gruppo di equazioni ẋ = a(x) è indipendente dall’ultima
equazione u̇ = b(x). Scriviamo con x = x(λ, x0 ) il flusso di ẋ = a(x), dunque
la curva (detta caratteristica) che parte da k ∈ Σ̂d è
x = x̄(λ, k) := x(λ, x̃(k))
mentre
Z
u = ū(λ, k) = σ(k) +
λ
b x̄(λ0 , k) dλ0
0
Si noti che k, λ sono coordinate naturali globali, in Rd+2 , sulla superficie
‘rigata’ d + 1- dim delle caratterisitiche uscenti da Σ̂d , infatti essa ha la
struttura di ‘grafico’: u = ū(λ, k).
Ultimo passo: la mappa
R1 × Σd −→ Rd+1
(λ, k) 7−→ x̄(λ, k)
è un diffeomorfismo globale, è invertibile? Se il campo vettoriale ẋ = a(x) non
ammette punti d’equilibrio 1 ed eventuali soluzioni periodiche non si accumulano, allora, almeno localmente, ma indipendentemente dal dato iniziale σ,
il flusso di a, a partire da una ipersuperficie Σd , spazza ‘diffeomorficamente’
regioni dello spazio-tempo. Dunque esiste l’inversa
λ = λ̆(x),
k = k̆(x)
e la soluzione cercata è infine
Z
h
u = φ(x) = ū λ̆(x), k̆(x) = σ(k) +
0
1
λ
0 i
b x̄(λ , k) dλ 0
.
λ̆(x),k̆(x)
basta per esempio che una componente del campo vettoriale sia sempre diversa da zero, p.e. a0 (x) ≡ 1,
P
∂
come nel caso dell’equazione di evoluzione: ∂t
u + dL=1 aL (t, x) ∂x∂L u = b(t, x).
6
Esercizio. Studiare il problema di Cauchy
∂u
∂u
(t, x) = x (t, x),
∂t
∂x
u(0, x) = σ(x)
Il campo vettoriale caratteristico è
V : R3 → R3 ,
v = (t, x, u) 7→ V (v) = (1, −x, 0)

 ṫ = 1
ẋ = −x
v̇ = V (v),

u̇ = 0

 t(λ, t0 , x0 , u0 ) = t0 + λ
x(λ, t0 , x0 , u0 ) = x0 e−λ

u(λ, t0 , x0 , u0 ) = u0
per d = 1 : Σd = {t0 = 0} × R1
Σ̂d = {(t0 , x0 , u0 ) : t0 = 0, x0 = k, u0 = σ(k), k ∈ R1 }
Il flusso di V che parte da Σ̂d disegna la superficie 2-dimensionale:

 t̄(λ, k) = λ
x̄(λ, k) = ke−λ

ū(λ, k) = σ(k)
e infine la soluzione è:
u = u(t, x) = σ(et x).
7
(∗)
Consideriamo l’equazione appena studiata come un sistema dinamico
infinito-dimensionale. Sia
Q := C ∞ (R; R)
lo spazio degli stati ove evolve il sistema. Il campo vettoriale (da un altro
punto di vista, è un operatore differenziale) sia
X : Q −→ Q
dv
(x).
dx
Studiare la dinamica associata ad X significa ricercare le curve R 3 t 7→
v(t, ·) ∈ Q tali che
v̇ = X(v)
v(·) 7→ X(v(·))(x) := x
con generico dato iniziale (problema di Cauchy)
v|t=0 = ϕ ∈ Q.
In dettaglio,
∂
∂
v(t, x) = x v(t, x),
∂t
∂x
v(0, x) = ϕ(x).
Si tratta quindi di studiare un problema di Cauchy per un’equazione alle
derivate parziali, e i conti sopra esposti con la teoria delle caratteristiche ci
permettono di scriverne esplicitamente la soluzione:
v(t, x) = ϕ(et x).
Si nota subito che la soluzione identicamente nulla v = 0 è un equilibrio per
tale sistema dinamico: X(0) = 0. Per analizzarne l’eventuale Lyapunov stabilità, doteremo dunque di topologia lo spazio Q := C ∞ (R; R) mediante opportune norme: vedremo che la non equivalenza topologica delle norme negli
spazi infinito-dimensionali implicherà radicali differenze qualitative intorno
alla stabilità.
i) Consideriamo ||v||∞ = supx∈R |v(x)|. Ci chiediamo se per ogni ε > 0
esiste δ > 0 tale che per ogni dato iniziale ||ϕ||∞ < δ la soluzione v(t, ·) sia
tale che ||v(t, ·)||∞ < ε per ogni t ≥ 0; questo è banalmente vero per δ = ε:
||v(t, ·)||∞ = supx∈R |ϕ(et x)| = supx∈R |ϕ(x)| = ||ϕ||∞ ,
dunque v = 0 è un equilibrio stabile nella L∞ -topologia.
8
ii) Consideriamo ora le norme Lp :
Z
1/p
||v||Lp =
|v(x)|p dx
.
x∈R
Consideriamo quindi la stima della soluzione
Z
1/p
||v(t, ·)||Lp =
|ϕ(et x)|p dx
,
x∈R
facciamo il cambio di variabile d’integrazione τ (x) = et x, otteniamo
Z
1/p
||v(t, ·)||Lp =
|ϕ(τ )|p e−t dτ
= e−t/p ||ϕ||Lp .
x∈R
Otteniamo pertanto l’asintotica stabilità nella Lp -topologia.
iii) Infine la norma C 1 ,
||v||C 1 = sup |v(x)| + sup |
x∈R
x∈R
d
v(x)|.
dx
Ora accade che
||v(t, ·)||C 1 = sup |ϕ(et x)| + sup |
x∈R
x∈R
d
d
ϕ(et x)| = sup |ϕ(x)| + et sup | ϕ(x)|.
dx
x∈R
x∈R dx
Dunque, comunque scegliamo ϕ, l’andamento esponenziale ci mostra che la
soluzione esce, a qualche istante t, da qualunque palla di raggio ε > 0: v = 0
è instabile nella C 1 -topologia. In questa linea di pensiero, e per ulteriori sviluppi applicativi, si veda per esempio V. I. Yudovich “The Linearization Method in Hydrodynamical Stability Theory”, American Mathematical Society
- Translations of Mathemat. Monographs, Vol. 74, 1980.
9
1.2
Teoria Quasi-Lineare
Lo studio dei problemi di Cauchy per l’equazione differenziale alle derivate
parziali quasi-lineare nell’incognita u = u(x),
d
X
aα (x, u(x))
α=0
∂u
(x) = b(x, u(x))
∂xα
si imposta esattamente come nel caso lineare. Ora però il campo vettoriale
caratteristico V coinvolge in maniera non separabile le variabili x e u:
V : Rd+2 −→ Rd+2
v = (x, u) 7→ (a0 (x, u), a1 (x, u), ..., aα (x, u), ..., ad (x, u), b(x, u))
ẋ = a(x, u)
v̇ = V (v) :
u̇ = b(x, u)
La richiesta che la mappa
R1 × Σd −→ Rd+1
(λ, k) 7−→ x̄(λ, k)
sia un diffeomorfismo si scontra non solo con aspetti tecnici di V (come nel
caso lineare), ma anche (questa è la novità) con la struttura del dato iniziale
(o di bordo) σ.
Esempio. Studiamo il moto (inerziale) di un continuo 1-dimensionale
privo di struttura e di forze esterne, il campo incognito u(t, x) rappresenta la
velocità spaziale (o euleriana) e il dato iniziale consiste in una distribuzione
gaussiana di velocità:
∂u
∂u
+u
= 0,
∂t
∂x
u(0, x) = σ(x) = e−x
v̇ = V (v) :

 ṫ = 1
ẋ = u

u̇ = 0
t = t(λ, t0 , x0 , u0 ) = t0 + λ
u = u(λ, t0 , x0 , u0 ) = u0
x = x(λ, t0 , x0 , u0 ) = x0 + u0 λ
Dati iniziali:
t0 = 0,
x0 = k ∈ R,
10
2
u0 = e−k ,
2
t = t̄(λ, k) = λ
2
u = ū(λ, k) = e−k
2
2
x = x̄(λ, k) = k + λe−k , x = k + te−k
Se da quest’ultima relazione riuscissimo ad estrarre k = k̆(t, x), sostituendo in
2
u(λ, k) = e−k , osservando banalmente che λ̆(t, x) = t, otterremo la soluzione
cercata; dobbiamo studiare la condizione (teor. f. implicita):
∂
2
2
(−x + k + te−k ) = 1 − 2kte−k ,
∂k
per ogni k ∗ (> 0) fissato (punto geometrico da cui muove una caratteristik∗2
∗2
ca) esiste un tempo critico t∗ (> 0) per cui 1 − 2k ∗ t∗ e−k = 0: t∗ = e2k∗ ,
s’innescano soluzioni multivoche, in altri termini, non esistono più soluzioni
classiche.
Altro esempio, continuo 1-dimensionale privo di struttura e in presenza
di viscosità:
∂u
∂u
+u
= −χu,
∂t
∂t
χ > 0,
v̇ = V (v) :
u(0, x) = σ(x) = e−x
2

=1
 ṫ
ẋ
=u

u̇ = −χu
t = t(λ, t0 , x0 , u0 ) = t0 + λ
u = u(λ, t0 , x0 , u0 ) = u0 e−χλ
Rλ
0
x = x(λ, t0 , x0 , u0 ) = x0 + 0 u0 e−χλ dλ0 = x0 +
u0
(1
χ
− e−χλ )
Dati iniziali:
x0 = k ∈ R,
t0 = 0,
2
u0 = e−k ,
t = t̄(λ, k) = λ
2
u = ū(λ, k) = e−k e−χλ
x = x̄(λ, k) = k +
e−k
χ
2
(1 − e−χλ ), x = k +
2
e−k
χ
2
(1 − e−χt )
2
∂
e−k
e−k
[−x + k +
(1 − e−χt )] = 1 − 2k
(1 − e−χt )
∂k
χ
χ
e per χ sufficientemente grande non è mai nulla: la soluzione classica globale
esiste.
11
1.2.1
Un’analisi dettagliata delle singolarità. La genesi delle galassie secondo il modello di ZeldovicArnol’d
In accordo con le moderne teorie cosmologiche, al tempo t = 0 la distribuzione
iniziale delle velocità delle particelle y eiettate nella ‘grande esplosione’ (big
bang) da un ‘nocciolo duro’ (hard core) C ∗ ⊂ R3 sia di tipo cosiddetto
‘potenziale’:
∂W ∂W ∂W
∗
3
3
,
v:C ⊂R →R ,
y 7−→ v(y) = ∇y W (y) =
,
,
∂y 1 ∂y 2 ∂y 3
per qualche (non nota) funzione scalare
W : C ∗ ⊂ R3 → R,
y 7−→ W (y).
Quaest’ipotesi è sorretta dal fatto che le osservazioni degli astrofisici sullo
stato primordiale del cosmo non rivelano
alcuna ‘vorticità’ inizale ω,
∂vj
∂vi
1
ω := skw(∇v)ij := 2 ∂y
j − ∂y i
dunque nel nostro caso
1 ∂vi
∂vj
skw(∇v)ij =
− i =0
2 ∂y j
∂y
e questo implica2 che
vi =
∂W
∂y i
i = 1, 2, 3
È facile notare la compatibilità dell’ultima relazione con l’ipotesi di assenza
di vorticità: basta p.e. ricordare che le derivate parziali miste di funzioni C 2
2W
∂2W
sono simmetriche3 , cioè, ∂y∂ i ∂y
j = ∂y j ∂y i .
Inoltre, altra grande semplificazione, riterremo che tali particelle primordiali interagiscano tra loro solo mediante collisioni, ritenendo quindi
trascurabili gli effetti gravitazionali rispetto all’altissima energia (velocità)
coinvolta; per la velocità euleriana v(t, x):
3
∂vi X ∂vi j
+
v = 0,
j
∂t
∂x
j=1
2
3
nei domini semplicemente connessi
teorema di Schwartz
12
v(0, x) = ∇W (x)
Il moto di tale mezzo continuo è pertanto descritto da
x = x(t, y) = y + v(y)t = y + ∇y W (y)t
Si noti che ogni particella y ∈ C ∗ viaggia con velocità costante:
∂
∂
x(t, y) = ∂t
x(0, y) = v(y) = ∇y W (y)
∂t
Questa funzione-moto x(t, y) esprime in che punto geometrico x dello
spazio R3 si trova al tempo t ∈ R la particella y ∈ C ∗ .
L’ulteriore idea è che nelle collisioni le particelle si condensarono e
formarono strutture evolute (galassie, ecc.).
Dal punto di vista matematico: la ricerca della genesi di tali strutture
è esattamente equivalente alla descrizione della caduta di invertibilità della
funzione-moto sopra scritta. Infatti, se per ogni fissato t ≥ 0, la mappa
C ∗ 3 y 7−→ x(t, y) ∈ x(t, C ∗ )
|{z}
| {z }
dominio
immagine
fosse invertibile, cioè esistesse l’inversa
x 7−→ ỹ(t, x)
tale che
x(t, ỹ(t, x)) = x
allora, evidentemente, nessuna collisione avrebbe luogo.
Dobbiamo dunque indagare sulle ‘patologie’ del moto, cioè indagare sui
tempi e sulle particelle coinvolti nella ‘caduta’ della condizione algebrica nel
teorema di inversione locale, e cioè osservare quando la matrice jacobiana
delle derivate parziali del moto diventa degenere:
∂ 2W
∂xi
(t, y) = det δij + i j (y)t = det(1 + ∇2yy W (y)t) = 0
det
∂yj
∂y ∂y
Notiamo che la matrice 1 + ∇2yy W (y)t è simmetrica. Dunque, esiste4
una rotazione opportuna degli assi (dello spazio geometrico delle x) per cui
questa matrice si rappresenta ora in forma diagonale e gli elementi di tale
diagonale sono esattamente gli autovalori della matrice in studio, che sono
(data la simmetria della matrice) numeri reali.
Si osservi che tale diagonalizzazione è proprio possibile grazie all’ipotesi
di assenza di vorticità effettuata. In tale nuova base
4
Mediante semplice algebra e/o geometria elementare delle f. quadratiche
13
det 1 + ∇2yy W (y)t =

 
 
1 0 0
a1 (y)
0
0
a2 (y)
0  t = Π3j=1 1 + aj (y)t
det 0 1 0 +  0
0 0 1
0
0
a3 (y)
e supponiamo ora che ad un tempo t0 , per un indice j 0 e per una particella
y0 , si abbia:
1
aj 0 (y0 ) = − ,
t0

 
 
1 0 0
a1 (y0 )
0
0
a2 (y0 )
0  t0  = Π3j=1 1 + aj (y0 )t0 = 0
det 0 1 0 +  0
0 0 1
0
0
a3 (y0 )


a1 (y0 )
0
0
a2 (y0 )
0 , e dunque pure
Si noti che − t10 è autovalore di  0
0
0
a3 (y0 )
2
di ∇yy W (y0 ) (più avanti sarà utile). Accade dunque un fenomeno locale di
collisione al tempo t0 e coinvolgente la particella y0 .
• Se affermiamo che al tempo t0 questa è la prima collisione, allora y0 è
un minimo locale per C ∗ 3 y 7→ aj 0 (y) ∈ R. Infatti, se in un aperto locale
ad y0 esistesse un y1 tale che
aj 0 (y1 ) < aj 0 (y0 ) = −
1
,
t0
allora esisterebbe t1 < t0 per cui:
aj 0 (y1 ) = −
1
1
< − = aj 0 (y0 ) ,
t1
t0
ma ciò è assurdo, perché stiamo supponendo che al tempo t0 avvenga la prima
collisione (o singolarità), che è coinvolgente y0 .
Supponiamo genericamente5 che tale minimo sia ‘leggibile’ mediante il test
delle derivate seconde, cioè:
∇y aj 0 (y0 ) = 0,
5
∇2yy aj 0 (y0 ) : definita positiva
si dimostra che non è una ipotesi severa
14
• Vorremmo ora capire cosa accade per tempi immediatamente successivi
a t0 . Indaghiamo prima di tutto sulle particelle (e quali) coinvolte negli urti
ad un tempo t0 + , per piccolo > 0. Pratichiamo uno sviluppo di Taylor
per aj 0 (y) con polo in y0 :
1
aj 0 (y) = aj 0 (y0 ) + ∇2yy aj 0 (y0 )(y − y0 )(y − y0 ) + O(|y − y0 |3 ),
2
1
1
+ ∇2yy aj 0 (y0 )(y − y0 )(y − y0 ) + O(|y − y0 |3 ),
t0 2
e consideriamo le particelle y, vicine ad y0 , coinvolte nelle collisioni al tempo
t0 + , cosicché
1
aj 0 (y) = −
,
t0 + 1
1
1
−
= − + ∇2yy aj 0 (y0 )(y − y0 )(y − y0 ) + O(|y − y0 |3 ),
t0 + t0 2
aj 0 (y) = −
Ora, a meno dei termini O(|y −y0 |3 ), e trascurando inoltre termini dell’ordine
O(2 ), per cui approssimiamo
−
1
1
+ =
t0 + t0
d
=
=
+
+ O(2 ) ≈ 2 ,
(t0 + )t0
(t0 + )t0 =0 d (t0 + )t0 =0
t0
riscriviamo l’ultima relazione nella forma:
1
= ∇2yy aj 0 (y0 )(y − y0 )(y − y0 )
2
t0
2
dove, genericamente, ∇2yy aj 0 (y0 ) è supposta definita positiva.
Rappresenteremo l’ellissoide delle particelle y (in C ∗ ⊂ R3y ) coinvolte nelle
collisioni al tempo t0 + nel seguente modo:
√
y = y0 + n k(n) dove per ogni fissato n ∈ S2 , |n| = 1, esiste un k(n) > 0, indipendente da ,
k : S2 → R+ , per cui si realizza la relazione di cui sopra.
Questo ellissoide è nello spazio ‘materiale’ , C ∗ , qual è la sua forma nello
spazio ‘geometrico’ R3x ?
Per vederlo, dobbiamo far agire la funzione-moto al tempo t0 + .
√
√ x = x(t0 + , y)|y=... = y0 + n k(n) +∇y W y0 + n k(n) (t0 + ),
|
{z
}
|
{z
}
=y
=y
15
∇y W y0 + n k(n)
√
√
= ∇y W (y0 ) + ∇2yy W (y0 ) n k(n) + O()
Inserendo nel moto:
√
√
x = y0 + n k(n) + ∇y W (y0 ) + ∇2yy W (y0 ) n k(n) + O() (t0 + ),
ordinando:
x = y0 + ∇y W (y0 )(t0 + ) + O()t0 + (non dipende linearmente da n)
|
{z
} | {z }
O()
O(1)
√
+ ∇2yy W (y0 ) n k(n) 3/2 + t0 ∇2yy W (y0 ) + 1 n k(n) +O(2 )
|
{z
} |
{z
}
O(3/2 )
O(1/2 )
infine, a meno dei termini O(2 ), x = x(n) è dato da
n
o
x = y0 + ∇y W (y0 )(t0 + ) + O()t0 +
√
+∇2yy W (y0 ) n k(n) 3/2 + t0 ∇2yy W (y0 ) + 1 n k(n) .
Qualora scegliamo per n esattamente l’autovettore di ∇2yy W (y0 ) relativo al
l’autovalore − t10 , allora il termine t0 ∇2yy W (y0 ) + 1 n = 0 cosicché la forma
del luogo di collissione nello spazio R3x è quella di un ellissoide con due assi di
ordine 1/2 (grande!) ed un terzo asse, parallelo a n, di ordine 3/2 (piccolo!):
Questa è precisamente la forma di un ellissoide molto schiacciato, un
flying saucer, proprio come una galassia (o un cluster, ammasso di galassie).
Interazione tra singolarità in R2 (da “Catastrophe theory”, V.I. Arnol’d):
16
Arnol’d V.I., Catastrophe theory. Third edition. Springer-Verlag, Berlin,
1992. xiv+150 pp. (tradotto in italiano da Bollati-Boringhieri)
Arnol’d V.I., Zeldovich Ya. B., Shandarin S. F. The large-scale structure
of the universe. I. General properties. One-dimensional and two-dimensional
models. (Russian) Akad. Nauk SSSR Inst. Prikl. Mat. Preprint 1981, no.
100, 31 pp.
Arnol’d V.I., Reconstructions of singularities of potential flows in a collisionfree medium and caustic metamorphoses in three-dimensional space. (Russian) Trudy Sem. Petrovsk. No. 8, (1982), 21–57.
Zeldovich Ya. B., Gravitational instability: an approximate theory for
large density perturbation. (Russian) Astron. Astrophys. 5 (1970) 84–89.
17
1.3
Teoria Non-Lineare
1.3.1
Equazione di Hamilton-Jacobi
Siamo ora interessati allo studio dell’equazione6
(HJ) H(q,
∂u
(q)) = 0,
∂q
dove H : T ∗ Rn = R2n → R,
(q, p) 7→ H(q, p)
è una funzione Hamiltoniana, possibilmente non lineare. Il caso in cui x =
(t, q) è nello spazio-tempo sarà considerato in seguito. Tale equazione prende
il nome di equazione di Hamilton-Jacobi, e non è naturalmente la più generale
equ. non lineare del primo ordine che, infatti, è del tipo: F (q, u(q), ∂u
(q)) =
∂q
0. La teoria delle caratteristiche finora sviluppata è insufficiente per tale
equazione e per i problemi di Cauchy associati. Per tratteggiare, motivare,
una nuova teoria, supponiamo che u(q) sia una soluzione classica di HamiltonJacobi; consideriamone il grafico del differenziale nello spazio delle fasi R2n :
Λ := {(q, p) : p =
∂u
(q), q ∈ Rn } ⊂ T ∗ Rn
∂q
Prima di indagare sulle proprietà di Λ, introduciamo7 nelle spazio delle fasi
(il ‘fibrato co-tangente’) T ∗ Rn = R2n la seguente 1-forma differenziale8 (detta
di Liouville)
n
X
θ=
pi dq i
i=1
Ritorniamo a Λ, notiamo i seguenti fatti:
(i) dimΛ = n = 12 dimT ∗ Rn ,
(ii) θ|Λ è esatta,
(iii) Λ, dato che ha la struttura di un grafico, è trasversale9 alle fibre della
proiezione π : R2n → Rn , (q, p) 7→ π(q, p) = q.
P
α
Ricordiamo che la restrizione (‘pull-back’) di una 1-forma ω = 2n
α=1 ωα (x)dx
2n
2n
su R di una sotto-varietà n-dim. S, j : S ,→ R , λ 7→ x = j(λ), è data
dalla 1-forma
6
Non cambierebbe nulla concettualmente se fosse H(q, ∂u
(q)) = e, con e 6= 0, basta ridefinire
∂q
l’Hamiltoniana per ricadere nel caso sopra descritto.
7
in realtà, richiamiamo un oggetto già introdotto nel corso introduttivo di Fisica Matematica.
8
La più generale 1-forma in R2n è del tipo:
Ψ=
n
X
Ai (q, p)dq i +
i=1
9
n
X
i=1
cioè, ∀q ∈ Rn , Λ ∩ π −1 (q) contiene un unico punto.
18
B i (q, p)dpi
ω|S =
2n
X
ωα (x)dxα |S =
α=1
2n
X
ωα (j(λ))
α=1
n
X
∂j α
i=1
∂λi
(λ)dλi
10
Dunque, ritornando alla verifica della (ii), e pensando che l’inclusione
(q)) —in altre parole, Λ è
di Λ in R2n è semplicemente q 7→ (q, p = ∂u
∂q
parametrizzata dalle q ∈ Rn : Λ è diffeomorfa a Rn — si ha:
θ|Λ =
n
X
i=1
n
X
∂u
pi dq |Λ =
(q)dq i = du.
i
∂q
i=1
i
Dire infine che u(q) risolve Hamilton-Jacobi in questo linguaggio geometrico
significa affermare che
(HJ geom.)
Λ ⊂ H −1 (0)
La strategia di costruzione di nuove soluzioni generalizzate di (HJ) e di
tipo globale (soluzioni classiche sono in generale costruibili solo localmente data la non linearità dell’equazione) sarà la seguente: definiremo prima
di tutto le sottovarietà Lagrangiane di T ∗ Rn (che generalizzano i grafici di
differenziali):
Λ ⊂ T ∗ Rn è sottovarietà Lagrangiana se
i) dimΛ = n = 21 dimT ∗ Rn ,
ii) θ|Λ è chiusa.
Si noti che è una definizione più debole di quanto osservato per i grafici di differenziali: ‘esatto’ si rilassa in ‘chiuso’ e non si richiede la globale
trasversalità.
Definizione: Diremo che Λ è una soluzione geometrica di Hamilton-Jacobi se
è una sottovarietà Lagrangiana contenuta in H −1 (0).
Si tratta ora di definire un metodo per costruire sottovarietà Lagrangiane Λ ⊂ T ∗ Rn . Una generica sottovarietà Lagrangiana non sarà in tutta
generalità identificabile con Rn , come nel caso del grafico di differenziale,
bensı́
j
π
Λ ,→ T ∗ Rn −→ Rn
k 7→ (q(k), p(k)) 7→ q(k)
10
la verifica delle altre due proprietà (i) e (iii) è invece immediata.
19
A volte scriveremo: z(k) = (q(k), p(k)). Richiamiamo qui che
n
i
X
XhX
∂q i
θΛ=
pi (k)dq i (k) =
(k) dkj ,
pi (k)
∂kj
i=1
j
i
dunque θΛ è chiusa se e solo se, ∀j, l,
∂ h X ∂q i i
∂ h X ∂q i i
=
,
pi
pi
∂kl i
∂kj
∂kj i
∂kl
e, sviluppando, θΛ è chiusa se e solo se, ∀j, l,
X ∂pi ∂q i X ∂pi ∂q i
−
= 0.
∂kl ∂kj
∂kj ∂kl
i
i
(∗)
Tale condizione si può riassumere introducendo la seguente matrice 2n × 2n:
i
O I
q
Γ
E=
,
z= z =
∈ R2n
−I O
pj
e si verifica che (∗) si riscrive
(∗)0
EΓ∆
∂z ∆
∂z Γ
(k)
(k) = 0.
∂ki
∂kj
Realizziamo ora un test sulla nuova definizione di soluzione: se vale Λ ⊂
H −1 (0) e se, inoltre, Λ è trasversale alle fibre di T ∗ Rn , cioè ‘al di sopra’ di
ogni q ∈ Rn esiste uno ed un unico punto di Λ, in altri termini, π ◦ j è un
diffeomorfismo,
Λ 3 k 7→ q(k) ∈ Rn ,
(?)
e ne indicheremo con k(q) l’inverso, allora considerata una primitiva11 di θ|Λ ,
ū(k)
i
XhX
∂q i
(k) dkj ,
dū(k) =
pi (k)
∂kj
j
i
definiamo
u(q) := ū(k(q)).
Si ha che
du =
11
∂ ū ∂k
∂q ∂k
∂u
dq = p(k)|k=k(q)
dq ⇒ p|Λ (q) =
(q),
∂k ∂q
∂k ∂q
∂q
ogni forma chiusa è localmente esatta, lemma di Poincaré.
20
cioè Λ è proprio il grafico del differenziale della funzione u = u(q). In queste
ipotesi di esattezza e trasversalità, la s.varietà Lagrangiana Λ porge soluzioni
classiche u = u(q) nei sottoinsiemi semplicemente connessi di Λ.
Come si costruiscono le s.v. Lagrangiane Λ ⊂ H −1 (0)?
Il seguente teorema (dopo il lemma) è il motore fondamentale per la costruzione di Λ Lagrangiane in H −1 (0). Faremo delle premesse, definiremo
(richiameremo) i campi vettoriali Hamiltoniani. Data la generica funzione
Hamiltoniana H(q, p), x ∈ Rn , z = (q, p) ∈ R2n , il campo vettoriale XH è
data da
XH : T ∗ Rn → T (T ∗ Rn ) ≡ R4n
∂H
∂H
(q, p), −
(q, p))
(z) 7→ (z; X(z)) = (z; E∇z H(z)) = (q, p;
∂p
∂q
e dunque l’equazione differenziale associata a tale campo vettoriale XH si
scrive
q̇ = ∂H
(q, p),
∂p
∂H
ṗ = − ∂q (q, p).
Nel nostro caso,
∂H ∂H O I
∂q
∂p
XH =
=
∂H
∂H
−I O
−
∂p
∂q
ż = XH (z) = E∇z H(z)
Lemma ∀k ∈ Λ, s.v. Lagrangiana, i vettori di Tk (T ∗ Rn ) che sono E-ortogonali
a Tk Λ sono esattamente
tutti e soli i vettori di Tk Λ.
X
Prova. Infatti
∈ Tz(k) (T ∗ Rn ) è E-ortogonale ai vettori di Tk Λ se
Y
X̄
X
X̄
=0
∀
∈ Tk Λ,
E
,
Y
Ȳ
Ȳ
X̄
sono del tipo (rem: Tk Λ = im[dz(k)] ):
ove
Ȳ
X̄
= dz(k)K̄,
per K̄ arbitrari in Rn .
Ȳ
La condizione
∂q K̄
X
E
, ∂k
=0
∂p
Y
K̄
∂k
è sicuramente soddisfatta da vettori del tipo (cf. (∗)0 )
∂q X
K
= ∂k
,
per K arbitrari in Rn .
∂p
Y
K
∂k
21
Non ce ne sono altri: infatti, E è non degenere, cosicché la dimensione dello
spazio E-ortogonale a Tk Λ è
dim Tz(k) (T ∗ Rn ) − dim Tk Λ = 2n − n = n;
dato che Tk Λ è E-ortogonale a Tk Λ, non esistono ulteriori vettori (e dunque
sottospazi di Tz(k) (T ∗ Rn )) E-ortogonali a Tk Λ.
Ecco quindi il teorema sopra annunciato.
Teorema: Sia Λ una generica sottovarietà Lagrangiana contenuta in H −1 (0):
Λ ⊂ H −1 (0),
allora il campo vettoriale Hamiltoniano XH è tangente a Λ:
XH ∈ T Λ
Prova. Dalla definizione data di campo vettoriale Hamiltoniano, XH =
E∇H, notando che E2 = −I, si ottiene la definizione equivalente (è un’uguaglianza tra 1-forme):
(E XH , ·) = −dH(·).
(#)
Ora, per ogni v ∈ Tk Λ si ha
(E XH , v) = −dH(v) = 0,
dove la prima uguaglianza vale per (#), la seconda perché se v ∈ Tk Λ, dato
che Λ ⊂ H −1 (0), v è pure tangente a H −1 (0) e dunque v ∈ ker dH|H −1 (0) ,
cioè XH è E-ortogonale a Λ (ai vettori di Tk Λ), dunque XH (per il Lemma)
è tangente a Λ.
Osservazioni:
1) Questo teorema ci suggerisce il modo di estendere l’idea del “metodo delle
caratteristiche”, operante nel caso lineare, all’attuale equazione non lineare
di H-J, e cioè, costruire sottovarietà Lagrangiane Λ in H −1 (0) mediante un
‘tessuto’ composto di curve risolventi le equazioni di Hamilton.
Pd
α
2) Nel caso di Hamiltoniano lineare nelle p: H(q, p) =
α=0 a(q) pα −
b(q), mostrare che si ‘riproduce’ la teoria lineare delle caratteristiche vista
precedentemente, cercando soluzioni geometriche in H = 0:
α
α
q̇ = a (q),
ṗα = −
d
X
∂aβ
β=0
22
∂q α
(q)pβ +
∂b
(q).
∂q α
1.3.2
Equazione di Hamilton-Jacobi di tipo evolutivo.
Problema di Cauchy
Applicheremo quanto sopra visto per studiare i problemi di Cauchy delle
equazioni di Hamilton-Jacobi di tipo evolutivo. Consideriamo la funzione
Hamiltoniana
H : R × R2d −→ R
(t, q, p) 7−→ H(t, q, p)
L’equazione differenziale non lineare del primo ordine che intendiamo studiare
è della forma tipica dell’equazione di evoluzione di Hamilton-Jacobi:
∂u
∂u
+ H t, q,
=0
(HJ)
∂t
∂q
nell’incognita u(t, q) = u(x), x = (t, q) ∈ Rd+1 : spazio-tempo. Introduciamo
il seguente Hamiltoniano nello spazio delle fasi dello spazio-tempo R2d+2 3
(t, q; τ, p) = (x, y),
H : R2d+2 −→ R
(t, q; τ, p) 7−→ H(x, y) = H(t, q; τ, p) := τ + H(t, q, p),
in tal caso l’equazione sopra scritta assume la struttura:
∂u
0
(HJ)
H x,
= 0.
∂x
Quest’ultima si dice versione omogenea dell’equazione differenziale iniziale:
è del tipo descritto nel paragrafo precedente.
Consideriamone un problema di Cauchy: determinare u(t, q) tale che
∂u
∂u
+ H t, q,
=0
(i)
∂t
∂q
e tale che sull’ipersuperficie Σd ≡ {t = t(0) } × Rd dello spazio-tempo Rd+1
valga
(ii)
u(t(0) , q) = σ(q).
La strategia di ricerca e costruzione della soluzione è la seguente. In T ∗ Rd+1 ≡
R2d+2 , lo spazio delle fasi dello spazio-tempo, si cercherà la soluzione u =
23
u(t, q) come grafico del suo differenziale in H−1 (0) –cf. (HJ)0 . Più debolmente, si cercherà una sotto-varietà Lagrangiana Λd+1 , cosı̀ globalmente parametrizzata (rem: x = (t, q), y = (τ, p)) dalla seguente mappa di immersione
z(t, k):
Rd+1 3 (t, k) 7→ z(t, k) = (x(t, k), y(t, k)) ∈ R2d+2 ,
con le proprietà:
(i) dimensione: dim (Λd+1 ) = 1/2 dim (T ∗ Rd+1 ) = d + 1,
(ii) Λd+1 è tale che la seguente 1-forma differenziale (di Liouville)
X
θ=
yα dxα
α
ristretta a Λd+1 , θΛ , sia chiusa.
Infine, il fatto che cercheremo
Λd+1 ⊂ H−1 (0)
significa proprio che vogliamo ‘risolvere’ l’equazione differenziale di partenza:
∂u
(x, (x))|x∈Rd+1 ⊂ H−1 (0)
∂x
∂u
∂u
∂u
∂u
=
,
= L,
H = τ + H,
L
∂x0
∂t
∂x
∂q
∂u
∂u
+ H(t, q, (t, q)) = 0.
∂t
∂q
————
Osservazione: Si noti che dovremo fare i conti con l’ulteriore richiesta di
trasversalità supposta in (?), cioè (t, k L ) 7→ xα (t, k L ) sia diffeom.
————
Le equazioni di Hamilton per H si scrivono:

ṫ
=1







∂H

 q̇ = ∂p


τ̇ = − ∂H


∂t





ṗ = − ∂H
∂q
e scriveremo ΦtXH il flusso associato a tale equazione differenziale Hamiltoniana.
24
Osservazione: Il Teorema del paragrafo precedente ci permette finalmente
di generalizzare in modo utile il punto di vista adottato nel caso lineare: in
T ∗ Rd+1 rappresenteremo i dati iniziali con la sottovarietà d-dimensionale Λ0 ,
Λ0 =
o
n
∂σ ∂σ (k) , p =
(k) , k ∈ Rd
t = t(0) , q = k; τ = −H t(0) , k,
∂q
∂q
e a partire da essa considereremo le nuove caratteristiche ora date dalle
curve che risolvono le equazioni canoniche di Hamilton, la superficie d +
1-dimensionale che otterremo12 sarà sicuramente una (la) Λd+1 cercata:
[
Λd+1 =
ΦtXH (Λ0 ),
t∈R
infatti: ha la dimensione giusta, è in H−1 (0), e, per costruzione, XH vi è
tangente.
(In effetti, si deve infine dimostrare che la 1-forma di Liouville ristretta a
Λd+1 è chiusa: solo in tal caso possiamo dire che Λd+1 è s.v. Lagrangiana; è
un conto un po’ lungo, ma semplice13 .)
Data tale Λd+1 , che possiamo chiamarla soluzione ‘geometrica’ del problema, come si opera per ottenere una funzione u = u(t, q)?
Sappiamo che la 1-forma di Liouville ristretta a Λd+1 è chiusa, diciamo
pure esatta nel caso sia semplicemente connessa: calcoliamone una primitiva,
direttamente integrando θ|Λd+1 sulla sottovarietà Λd+1 , parametrizzata da
(t, k).
Osserviamo che, la 1-forma di Liouville da considerare dev’essere prima
di tutto, ristretta a H−1 (0) (ricordiamo che q 0 = t, p0 = τ )
= pdq − Hdt
θ
= ydx
= (pL dq L + p0 dq 0 )
−1
−1
−1
H
H
(0)
H
(0)
(0)
Si costruisce dunque la seguente funzione u(t, k) globalmente definita
sopra Λd+1 :
Z t
dt0 ,
ū(t, k) = σ(k)+ [p(t0 , t(0) , q(0) , p(0) )q̇(t0 , t(0) , q(0) , p(0) )−H(...)]
∂σ
(q(0) ,p(0) )=(k, ∂q (k))
t0
dove per brevità si è scritto H(...) = H(t0 , q(t0 , t(0) , q(0) , p(0) ), p(t0 , t(0) , q(0) , p(0) )).
12
Bisogna naturalmente accertare che il campo Hamiltoniano non sia tangente in nessun punto a Λ0 :
questo è vero perché ṫ = 1.
13
Lo studente Francesco De Anna, nel 2010/11, ha proposto una soluzione elegante a tale problema,
senza introdurre le k-forme differenziali.
25
Quest’ultima non rappresenta ancora la soluzione cercata: Λd+1 è trasversale14 alle fibre del fibrato cotangente dello spazio-tempo? Se infatti ‘sopra
ogni’ x = (t, q) ∈ Rd+1 c’è uno ed un unico punto di Λd+1 , cosicché
Λd+1 3 (t, k) 7−→ (t, q(t, t(0) , k,
∂σ
(k)) ∈ Rd+1
∂q
è globalmente invertibile mediante delle funzioni
Rd+1 3 (t, q) 7−→ (t, k = k̆(t, q)) ∈ Λd+1 ,
allora la soluzione sarà infine data da:
u(t, q) = ū(t, k)
.
k=k̆(t,q)
Osservazione 1 La struttura della soluzione finale è della forma (ricordando
la trasformazione di Legendre)
Z t
Z t
0
u(t, q) = σ +
(pq̇ − H)dt = σ +
L(q(t0 , ...)dt0 ,
t0
t0
cioè il funzionale stesso (l’“Azione”) del Calcolo delle Variazioni fornisce la
struttura della soluzione.
Osservazione 2 Qual è il significato geometrico dell’esistenza del diffeomorfismo ipotizzato tra Λd+1 e lo spazio-tempo Rd+1 ? Pensiamo a Λd+1 immersa nello spazio delle fasi dello spazio-tempo, il fibrato co-tangente dello
spazio-tempo:
Λd+1 ⊂ T ∗ Rd+1 = R2d+2 .
Se esiste il diffeomorfismo, allora le componenti q delle caratteristiche uscenti
dalla varietà base non si intersecano mai, fatto che potrebbe certamente accadere in tutta generalità: l’unica proprietà di cui siamo sicuri è il non-intreccio
delle caratteristiche (x, y) in R2d+2 (per il teorema di esistenza e unicità delle
O.D.E.). Questo possibile fenomeno di ‘intreccio’ delle q-componenti delle
caratteristiche rappresenta la presenza di una ‘caustica’ e tale nomenclatura
è mutuata dall’applicazione della presente teoria ai fenomeni di propagazione
in Ottica Geometrica.
A differenza dal caso lineare, tale costruzione delle soluzioni mediante
le curve caratteristiche mostra che soluzioni regolari sono possibili solo localmente; le caustiche rappresentano l’ostruzione topologica all’esistenza di
soluzioni globali.
14
Cioè, ∀(t, q) ∈ Rd+1 , Λd+1 interseca la fibra {(p0 , p)} sopra (t, q) in un unico punto.
26
Osservazione 3 Quando il sopra accennato diffeomorfismo esiste, la ‘soluzione geometrica’ Λd+1 ⊂ R2d+2 è esattamente il ‘grafico del differenziale’
della soluzione analitica u(t, q):
o
n
∂u
∂u
Λd+1 = (t, q; τ, p) : τ =
(t, q), p =
(t, q) ⊂ H−1 (0) ⊂ R2d+2 .
∂t
∂q
Osservazione 4 Si provi a generalizzare la costruzione sopra sviluppata al
caso in cui si debba trattare con un’equazione di Hamilton-Jacobi H = 0
con gli stessi dati iniziali dove ora l’Hamiltoniana H : T ∗ Rd+1 → R sia
di struttura più generale, cioè non necessariamente della forma H = p0 +
H(t, q, p). Ci si renderà conto che l’unica sostanziale differenza risiede nel
∂H
fatto che q̇ 0 = ∂p
6= 1 cosicché q 0 non è ora identificabile col parametro di
0
evoluzione t delle soluzioni delle equazioni canoniche; inoltre, θ|H=0 non avrà
la struttura sopra utilizzata pdq − Hdt, e la soluzione geometrica Λd+1 avrà
una più generale forma
ū(t, k) = σ(k)+
Z tX
d
0
α 0
+
pα (t , q(0) , p(0) )q̇ (t , q(0) , p(0) )
dt0 ,
∂σ
(q(0) ,p(0) )=(t(0) ,k;p̆0 (t(0) ,k), ∂q (k))
t0 α=0
dove con p̆0 (t(0) , k) si intende la soluzione data dal teorema della funzione
implicita per p0 dell’equazione H(t(0) , k; p0 , ∂σ
(k)) = 0. L’ulteriore ipotesi di
∂q
trasversalità permetterà di giungere alla soluzione analitica u(t, q).
27
Capitolo 2
Ottica Ondulatoria asintotica
elementare e Ottica Geometrica
2.1
Da Maxwell a Fermat
Le equazioni di Maxwell si

∂B

 ∂D ∂t + rot E =

+ J − rot H =
∂t
div B =



div D − ρ =
scrivono (c è la velocità della luce nel vuoto):
0
0
0
0
(legge dell0 induzione di Faraday)
(legge della circuitazione di Ampère)
(assenza di carica magnetica)
(legge di Gauss)
(1)
e l’equazione di continuità:
∂ρ
+ div J = 0 (conservazione della carica elettrica)
∂t
(2)
Queste equazioni coinvolgono i campi:

E : campo elettrico




D
: vettore spostamento







B : vettore induzione
H : campo magnetico








ρ : densità di carica elettrica



J : vettore corrente elettrica
Si assegnano le equazioni costitutive che riguardano la natura materiale del
mezzo attraverso il quale evolve il campo elettro-magnetico:
D = E,
B = µH,
(J = σE : legge di Ohm)
28
= (q) (costante dielettrica), ≥ 0 > 0 : nel vuoto
µ = µ(q) > 0 (permeabilità magnetica), µ0 : nel vuoto
Può accadere: sia µ > µ0 (materiali paramagnetici), sia µ < µ0 (materiali
diamagnetici).
———
Nel vuoto, considerando il caso di assenza di cariche e correnti, ρ =
0, J = 0, inserendo nelle (prime due) equazioni di Maxwell ≡ 0 , µ ≡ µ0 ,
E, H :
µ0
∂H
+ rot E = 0,
∂t
0
∂E
− rot H = 0,
∂t
derivando rispetto al tempo e utilizzando l’identità (facilmente verificabile
con ijk , si veda l’Appendice alla fine del capitolo):
rot rot V = grad div V − ∆ V,
∆ = div grad V,
e per div V = 0 (ultime due equ. di Maxwell), otteniamo
1 ∂2
H = ∆H,
v 2 ∂t2
1
v := √
= c (equazione delle onde)
0 µ0
(e analogamente per E). Si ottengono soluzioni elementari del seguente tipo
“onde progressive”: prendiamo un’arbitraria funzione C 2
Ĥ : R → R3
e verifichiamo che, per fissato vettore k ∈ R3 ,
H(q, t) = Ĥ(k · q − ωt)
è soluzione a patto che
|k|2 =
ω2
,
v2
dunque
1
H(q, t) = Ĥ ω( vers k · q − t)
v
L’interpretazione è immediata: al tempo t = 0 il vettore costante Ĥ(0) è
il valore di H su tutto il piano passante per q = 0 e ortogonale al fissato
k; questo stesso valore vettoriale Ĥ(0) si propaga, si ritrova essere il valore
costante vettoriale di H, dopo un tempo T > 0, nei punti del piano, ancora
ortogonale a k, ma ora affine e lontano vT dall’origine:
1
( vers k · q − t) = 0
v
per t = 0 e vers k · q = 0
29
1
per t = T e vers k · q = vT
( vers k · q − t) = 0
v
Osservazione Tale velocità scalare di propagazione v dei fronti d’onda è
stata cosı̀ dedotta supponendo spazialmente costanti e µ: v = √10 µ0 . Questo
legame/significato puntuale tra v e , µ lo riterremo valido anche in situazioni
di non uniformità.
La linearità dell’equazione delle onde mostra naturalmente la validità
del ‘principio di sovrapposizione’. R-combinazioni di soluzioni è ancora
soluzione. Si noti che k-sovrapposizioni di soluzioni del tipo “onde piane”:
H(q, t) = Hk ei(k·q−ωt)
con |k| = ωv , cioè
1
H(q, t) = Hk eiω( v vers k·q−t)
porta decisamente alla ricerca di soluzioni mediante la teoria della ‘trasformata di Fourier’.
Pensando al più generale caso di non uniformità di e µ, e nella ricerca
di soluzioni significative più generali dell’onda piana sopra scritta, si iniziò
coll’estendere il termine lineare spaziale
ω
i vers k · q,
v
a più generali funzioni 1-omogenee in q; ed infine, a completamente generali
funzioni1 iωΦ(q), posto
E(q) = E0 (q)eiωΦ(q) ,
H(q) = H0 (q)eiωΦ(q)
(3)
si propone:
E(t, q) = E(q) e−iωt = E0 (q)eiω[Φ(q)−t]
H(t, q) = H(q) e−iωt = H0 (q)eiω[Φ(q)−t]
Le considerate soluzioni test di cui sopra, con termine temporale del tipo iωt, sono dette monocromatiche; inoltre le considereremo tali che siano
soddisfacenti (per le ultime due equazioni di Maxwell) a div E = 0 = div H.
Dalle prime due equazioni di Maxwell:

 ∂B
 −iωµ H + rot E = 0
 ∂t + rot E = 0
⇒

 ∂D
−iω E − rot H = 0
−
rot
H
=
0
∂t
1
Tale evoluzione di costruzione delle soluzioni è stata percorsa dalla teoria degli ‘operatori pseudo-
differenziali’ e infine dagli ‘operatori integrali di Fourier’.
30
Usando ancora l’identità:
rot rot V = grad div V − ∆ V,
∆ = div grad V
e
rot (φV) = grad φ × V + φ rot V,
si ottiene

 −iω(µ rot H + grad µ × H) − ∆E = 0

−iω( rot E + grad × E) + ∆H = 0

 −iω(−iωµ E + grad µ × H) − ∆E = 0

−iω(iωµ H + grad × E) + ∆H = 0

 −ω 2 µ E − iωgrad µ × H − ∆E = 0

(•)
2
ω µ H − iωgrad × E + ∆H = 0
Ricordiamo ora le (3),
E(q) = E0 (q)eiωΦ(q) ,
H(q) = H0 (q)eiωΦ(q) ,
e deduciamo

 −ω 2 µ E0 eiωΦ(q) − iω grad µ × H0 eiωΦ(q) − ∆(E0 eiωΦ(q) ) = 0

ω 2 µ H0 eiωΦ(q) − iω grad × E0 eiωΦ(q) + ∆(H0 eiωΦ(q) ) = 0
Sviluppiamo la prima equazione:
−ω 2 µ E0 eiωΦ(q) + iω grad µ × H0 eiωΦ(q) −
(∆E0 + 2iω∇Φ · ∇E0 + iωE0 ∆Φ − ω 2 |∇Φ|2 E0 ) eiωΦ(q) = 0
Analogo conto per la seconda equazione. A questo punto introduciamo l’unica approssimazione che adotteremo: nel limite dell’alta frequenza, cioè per
ω → +∞, le ultime equazioni diventano un’unica equazione per la fase Φ, in
sostanza, dividendo le equazioni per ω 2 , trascureremo i termini 1/ω rispetto
31
ai termini finiti
2
|∇Φ|2 = µ
(equ. iconale)
L’equ. iconale è chiaramente un’equazione di Hamilton-Jacobi
H(q,
∂Φ
1
(q)) =
∂q
2
(5)
di Hamiltoniana (l’introduzione del termine 1/2 è, come si vedrà, di reminescenza meccanica):
c
1 c 2 2
√
|p| ,
n(q) := c µ, v = , n : Rn → [1, +∞)
H(q, p) =
2 n(q)
n
c
ove n è l’indice di rifrazione, vale 1 nel vuoto, e v(q) := n(q)
è la velocità dei
n
fronti d’onda e.m. transitanti per il punto q ∈ R del mezzo ottico.
Una rilettura ‘meccanica’ è immediata: i fotoni si propagano lungo ‘raggi’
che soddisfano alle equ. di Hamilton con H = 21 oppure alle equ. di Lagrange
di Lagrangiana (realizzando la trasf. di Legendre)
1 n(q) 2 2
|q̇|
L(q, q̇) =
2 c
con dati per cui l’energia vale E = L = 21 .
Digressione di Meccanica Analitica Si dimostra mediante un conto diretto il seguente fatto: se q(t) risolve le equ. di Lagrange per L(q, q̇) =
1
a (q)q̇ i q̇ j , aij def. pos., allora q(t) risolve le equ. di Lagrange per L(q, q̇) =
2 ij
p
L(q, q̇). Prova. L’integrale primo di Jacobi, l’energia, è coincidente con L,
dunque:
√
√
d∂ L ∂ L
d
1 ∂L
1 ∂L
1
∂L
d ∂L
−
= ( √
)− √
= √ (
− i ) = 0.
i
i
i
i
i
dt ∂ q̇
∂q
dt 2 L ∂ q̇
∂q
2 L ∂q
2 L dt ∂ q̇
Viceversa,
2
Proviamo a perfezionare ulteriormente la nostra scelta di soluzioni asintotiche, tentiamo con generiche
‘sovrapposizioni continue’ (visto che il sistema è lineare) del tipo appena descritto. in sostanza, ci si
cimenta nel tentativo di generalizzare ciò che accade per la trasformata di Fourier, precisamente q ·
u ... → ... ωφ(q, u), per qualche φ da determinarsi, ove ora permettiamo a u di appartenere ad uno spazio
parametrico Rk non necessariamente di dimensione uguale a quella di Q = Rn :
Z
Z
E(q) =
E0 (q, u)eiωΦ(q,u) du,
H(q) =
H0 (q, u)eiωΦ(q,u) du,
(4)
u∈Rk
u∈Rk
ed ancora una volta, nel limite dell’alta frequenza ω → +∞, otteniamo che, affinché esistano soluzioni
ampiezze E0 e H0 non banali, la fase Φ(q, u) deve soddisfare all’equ. iconale.
32
p
Data una soluzione q(t) delle equ. di Lagrange per L(q, q̇), lo è pure ogni
sua arbitraria riparametrizzazione del tempo q̄(τ ) = q(t(τ )), t : [0, T ] →
[0, T ], dt/dτ > 0.
Questo è equivalente all’affermazione che
Il funzionale del principio variazionale di Hamilton per L =
Z Tr
dq
I(q(·)) =
L(q(t), (t)) dt
dt
0
p
L(q, q̇),
è invariante per riparametrizzazioni del tempo q̄(τ ) = q(t(τ )), t : [0, T ] →
[0, T ], dt/dτ > 0.
Prova. Si osserva che L è positivamente 1-omogenea nelle variabili q̇: L(q, λq̇) =
λL(q, q̇), ∀λ > 0.
Z T d
I[q̄(·)] = I[q(t(·))] =
L q(t(τ )), q(t(τ )) dτ =
dτ
0
Z T Z
dt
T d
d
=
L q(t(τ )), q(t)t=t(τ )
(τ )dτ =
L q(t), q(t) dt = I[q(·)].
dt
dτ
dt
0
0
Fine della digressione di Meccanica Analitica
Dunque il principio variazionale il cui funzionale integrale ha come integranda
1 n(q) L(q, q̇) = √
q̇
2 c
misura, individua, le curve geometriche dei ‘raggi’ ottici, indipendentemente
dalla loro parametrizzazione temporale. Fissati due punti nello spazio, q(0)
e q(1) , consideriamo l’insieme Γ le curve C 2 tra queste due configurazioni e
parametrizzate nell’intervallo [0, 1],
Z 1
n(q(λ)) dq
1
I:Γ→R
q(·) 7→ I[q(·)] = √
(λ) dλ
c
dλ
2 0
Dalla teoria della rettificazioneR delle
curve
si ha che la lunghezza della curva
λ dq
λ 7→ q(λ) è data da: s(λ) = 0 dλ
(λ0 ) dλ0 , e la velocità scalare del fotone
lungo il raggio è
dλ
ds
ds dλ dq
=
= (λ) (t)|t=t(λ)
(∗)
v(λ) =
dt
dλ dt
dλ
dt
33
d’altra parte (vedi L’Oss. indietro), riterremo che
c
,
n(q(λ))
v(λ) =
(∗∗)
cosicché il differenziale della funzione ‘tempo’ t = t(λ) è
dq dq (λ)
(λ)
n(q(λ)) dq
0
(∗) dλ
(∗∗) dλ
dt = t (λ)dλ =
dλ =
dλ =
(λ) dλ
c
v(λ)
c
dλ
n(q(λ))
Giungiamo cosı̀ ad un’interpretazione del funzionale I:
Z 1
Z 1
n(q(λ)) dq
dt
1
1
1
(λ)dλ = √ T [q(·)],
I[q(·)] = √
(λ) dλ = √
c
dλ
2 0
2 0 dλ
2
dove T [q(·)] è il funzionale Tempo speso dal fotone lungo la curva [0, 1] 3
λ 7→ q(λ) ∈ Rn . Dunque, i fotoni stazionarizzano il funzionale ‘tempo’ (a
volte, ma non sempre, lo ‘minimizzano’, tra le due configurazioni prefissate): ritroviamo esattamente in questa interpretazione il principio variazionale
noto come Principio di Fermat (o del tempo minimo).
2.1.1
Esempio: caustiche
• Consideriamo il problema di Cauchy per la seguente equazione di HamiltonJacobi detta “iconale” (ottica geometrica) per q ∈ R2
H(q,
∂S
(q, t)) = 1
∂q
j : R ,→ R2 ,
H(q, p) = |p|2
k 7→ q̃(k) = (
σ : R −→ R,
k2
, k),
2A
σ(k) ≡ 0.
La superficie iniziale “di emissione” è una parabola (A > 0) con il vertice
nell’origine e asse di simmetria coincidente con l’asse x = q1 .
|∇R2 S(q)|2 = 1,
S(q̃(k)) = 0.
Indaghiamo sulla proiezione sulla varietà base R2 del suo ‘ciclo singolare’,
ostruzione alla locale costruzione della soluzione classica: questo luogo è ‘la
caustica’ della soluzione.
34
Scriviamo il sistema delle caratteristiche:
q̇i =
∂H
,
∂pi
ṗi = −
q̇ i = 2pi ,
∂H
,
∂qi
ṗi = 0,
Inserendo il dato iniziale nel flusso, si ottiene cosı̀ q̄(λ, k), p̄(λ, k), infine, quando q = q̄(λ, k) è invertibile con (λ(q), k(q)), la soluzione classica si ottiene
integrando la 1-forma di Liouville:
Z λ
˙ 0 , k)dλ p̄(λ0 , k)q̄(λ
S(q) = σ(k) +
|{z}
(λ(q),k(q))
0
≡0
(0)
(0)
(0)
qi = qi (λ, q (0) , p(0) ) = qi + λ2pi ,
q1 = q̄1 (λ, k) =
k2
(0)
+ λ2p1 ,
2A
pi (λ, q (0) , p(0) ) = pi
(0)
q2 = q̄1 (λ, k) = k + λ2p2 ,
(0)
p̄i = pi (λ, k)?
∂S dq1
∂S dq2
+
=0
∂q1 dk
∂q2 dk
S(q(k)) = σ(k) = 0 :
k
(0)
(0)
(0)
+ p2 = 0,
(p1 )2 + (p2 )2 = 1
A
(nel seguito, non scriviamo più l’esponente (...)(0) )
(0)
p1
p2 = −p1
k
A
p2
k
=−
p1
A
1
|p1 | = q
1+
q1 −
p21 + p21
k2
=1
A2
k2
A2
k2
= 2p1 λ
q2 − k = 2p2 λ
2A
p2
k
=−
p1
A
da cui
−
k
q2 − k
=
.
k2
A
q1 − 2A
Riordinando,
k 3 + 2A(A − q1 )k − 2A2 q2 = 0.
35
(∗)
Ci chiediamo se riusciamo a costruire soluzioni classiche, cioè se riusciamo
ad esplicitare k = k(q1 , q2 ). La (∗) è una cubica del tipo:
k 3 + αk + β = 0,
β = −2A2 q2
α = 2A(A − q1 )
le cui soluzioni si determinano nel seguente modo. (Cardano) sia una radice
cubica dell’unità, per esempio
=e
2πi
3
1 i√
=− +
3,
2 2
allora, posto
s
u=
β
− +
2
r β 2
β
− −
2
r β 2
3
s
v=
3
2
2
+
+
α 3
3
α 3
3
,
,
le radici nel loro complesso sono:
η1 = u + v
η2 = u + 2 v,
η3 = 2 u + v.
Pertanto la condizione di realtà di almeno una soluzione (e sarà η1 la nostra
candidata soluzione) si legge
4A4 (q2 )2 8A3 (A − q1 )3
+
≥ 0,
4
27
la frontiera di tale luogo, la caustica, dove vale l’uguaglianza, è data da
(q2 )2 =
8
(q1 − A)3 ,
27A
36
una (ben nota) “parabola semi-cubica”.
37
of
in
all
in
ceial
na
powith
nes
the
ndithe
The
hed
the
the
l in
point on this spatial optical caustic or ray envelope is the
focus of light rays reflected from a small portion of the circular inner surface of the cup.
In Figs. 4–7 the caustic for a family of worldlines !or
paths" represents a limit for those worldlines !or paths". No
38
Fig. 8. The coffee-cup optical caustic.
The caustic shape in panel !b" !a
nephroid" was derived by Johann Bernoulli in 1692 !Ref. 44".
C. G. Gray and E. F. Taylor
437
2.1.2
Altro esempio: da Fermat alla legge di rifrazione
di Snellius
Si considerano raggi luminosi nel piano Oxy. Nel semi-piano y ≥ 0 l’indice
di rifrazione sia il numero n1 ∈ [1, +∞), mentre in y < 0 valga n2 ∈ [1, +∞).
Posto c la velocità della luce, qualunque raggio luminoso in y ≥ 0 è rettilineo
e con velocità costante v1 = nc1 , analogamente, in y < 0, v2 = nc2 . Fissato
un punto P1 = (x1 , y1 ) con y1 > 0 e un punto P2 = (x2 , y2 ) con y2 < 0,
Il Principio di Fermat afferma che gli eventuali raggi luminosi da P1 a P2
devono minimizzare il tempo di percorrenza. Da quanto sopra descritto, le
eventuali traiettorie geometriche dei possibili raggi da P1 a P2 sono dunque
delle spezzate, composte da due segmenti, eventualmente distinti nell’asse
delle x.
(i) Scrivere la funzione ‘tempo’ T (x) impiegato da un generico candidato raggio luminoso da P1 a P2 in funzione del punto di passaggio x (più
precisamente (x, 0)) tra i due semi-piani.
(ii) Determinare l’esistenza del minimo x∗ di tale funzione T (x).
(iii) In corrispondenza a x∗ , transita dunque il reale, secondo Fermat,
raggio luminoso da P1 a P2 . Mostrare che in corrispondenza ad esso vale
sin α1
n2
=
n1
sin α2
dove αi , i = 1, 2, è l’angolo tra la verticale, parallela ad y, e il segmento da
Pi a (x∗ , 0).
Soluzione
|P1 , (x, 0)| |P2 , (x, 0)|
+
,
T (x) =
v1
v2
q
q
n1
n2
T (x) =
(x1 − x)2 + y12 +
(x − x2 )2 + y22 ,
c
c
cerchiamo tra i punti stazionari per T ,
c
dT
−(x1 − x)
−(x − x2 )
= n1 p
+ n2 p
= 0,
2
2
dx
(x1 − x) + y1
(x − x2 )2 + y22
cioè:
−n1 sin α1 + n2 sin α2 = 0
Considerazioni di geometria elementare (scriverle in dettaglio!) mostrano che
il punto stazionario è unico ed è un minimo.
Appendice: Il Simbolo di Ricci
39
In R3 , il seguente oggetto completamente emisimmetrico ijk è a volte chiamato tensore o simbolo di Ricci (attenzione: c’è la somma sottintesa sugli
indici doppi):
123 = n 1,
1,
ijk =
−1,
ijk =
0,
se ijk si ottiene mediante una permutazione pari di 123,
se ijk si ottiene mediante una permutazione dispari di 123,
appena due indici sono uguali.
Si verifica che ∀ U, V ∈ R3 , ∀ matrice (3 × 3) A, ∀ campo vettoriale differenziabile W : R3 −→ R3 , e funzione scalare differenziabile f , valgono:
(U × V )i
det A ijk
(rot W )i
V(1) · V(2) × V(3)
rot(f W )
= ijk U j V k
= lmn Ail Ajm Akn
= ijk ∂x∂ j Wk
j
i
k
= ijk V(1)
V(2)
V(3)
= ∇f × W + f rotW
Infine:
ijk klm = δil δjm − δim δjl
Esercizio: con quest’ultima formula dimostrare la formula del doppio prodotto vettore e la formula del doppio rotore, rot rot V, sopra usata.
40
Capitolo 3
Propagazione per Onde nei
Sistemi di PDE di Leggi di
Bilancio
3.1
Onde di Discontinuità deboli
Nello Spazio-Tempo Rd+1 , α, β = 0, 1, 2, ..., d, x0 = t, L = 1, ..., d, sia
ui = ui (x) una funzione a n componenti:
u : Rd+1 −→ Rn
x = (xα ) 7−→ u(x) = (ui (x)),
Per esempio, u(x) sia la soluzione di un sistema di leggi di conservazione in
forma quasi-lineare1 che scriveremo
∂ i X ∂ iL
u+
f (u) = g i (u),
L
∂t
∂x
L
X ∂f iL
∂ i
∂uj
u (x)+
(u(x))
(u(x)) = g i (u),
j
L
∂t
∂u
∂x
j,L
oppure, per F i0 = ui , e F iL = f iL ,
X ∂
F iα (u) = g i (u).
α
∂x
α
Sia Φ(x) = 0, Φ(t, x1 , ..., xd ) = 0, dove Φ : Rd+1 → R, una iper-superficie
(cioè, di co-dimensione uno) nello spazio tempo. Per ogni tempo t fissato, essa
rappresenta una iper-superficie nello spazio d-dimensionale, cosicché Φ(x) =
1
Si dice quasi-lineare perché è lineare nelle derivate d’ordine massimo (le prime) mentre i coefficienti
possono dipendere non linearmente da u.
41
0 rappresenta l’evoluzione temporale di una superficie mobile St in Rd , di
dimensione d − 1.
Ipotesi: sia ui = ui (x, t) una soluzione Lipschitziana del sistema, e dunque
(per il teorema di Rademacher) quasi ovunque differenziabile, più precisamente:

ui (·) siano continue attraverso la sup. Φ(x) = 0,
1)
2)
∂ui
(·)
∂xα
siano discontinue attraverso la sup. Φ(x) = 0.
Naturalmente si suppone che ∇Φ
6= 0 (questo, tra l’altro, ci dice che
Φ=0
Φ = 0 è una varietà regolare), cosicché rimane orientata tale superficie e lo
d+1
spazio-tempo: la direzione di ∇Φ va da Rd+1
(−) a R(+) ,

d+1
Rd+1 = Rd+1
(−) ∪ {Φ = 0} ∪ R(+) .
Sia x ∈ {Φ = 0}, e sia h un generico vettore tangente a {Φ = 0} in x,
∇Φ(x)h = 0.
Per > 0 e |h| sufficientemente piccoli, si ha che (è utile abbozzare un
disegno)
x − ∇Φ(x) + h ∈ Rd+1
(−)
x + ∇Φ(x) + h ∈ Rd+1
(+)
d+1
Rispettivamente in Rd+1
(−) e R(+) valgono i due seguenti sviluppi
u(x − ∇Φ(x) + h) = u(x − ∇Φ(x)) +
∂u
(x − ∇Φ(x))h + o(h)
∂x
∂u
(x + ∇Φ(x))h + o(h)
∂x
per → 0+ le due espressioni coincidono perché u è continua in {Φ = 0},
sottraendo m. a m.:
∂u
[ (x)]h + o(h) = 0
∂x
dove si è indicato con
u(x + ∇Φ(x) + h) = u(x + ∇Φ(x)) +
[
∂u
∂u
∂u
(x)] := lim
(x + ∇Φ(x)) −
(x − ∇Φ(x))
→0 ∂x
∂x
∂x
42
il ‘salto’ della derivata. Più precisamente, la formula sopra dedotta vale nella
forma (senza l’o(h), perché?):
[
∂u
(x)]h = 0
∂x
∀h ∈ Tx ({Φ = 0}).
In altri termini, vale l’implicazione:
h ∈ ker ∇Φ(x)
⇒
h ∈ ker[
∂u
(x)]
∂x
Il ‘primo teorema di omomorfismo’ per spazi vettoriali (in altre parole, la
teoria dei moltiplicatori di Lagrange) ci dice che esiste una mappa lineare, le
cui componenti le indicheremo con λ = λ(x), per cui
(∗)
[
∂ui
(x)] = λi ∇α Φ(x)
∂xα
(Condizioni di Hugoniot − Hadamard).
Torniamo alla descrizione della geometria dell’onda Φ = 0. Consideriamo
un punto geometrico che si muove nello spazio-tempo restando sopra Φ = 0:
t 7→ x = (t, x̄L (t)) ∈ Rd+1 ,
Φ(t, x̄L (t)) = 0, ∀t ∈ R.
Deriviamo in t,
0=
X ∂Φ
∂Φ
dx̄L
d
Φ(t, x̄(t)) =
(t, x̄(t)) +
(t,
x̄(t))
(t),
dt
∂t
∂xL
dt
L
Notiamo che il versore ortogonale a Φ(t, ·) = 0 in Rd è
nL (t, x) = P
( M
∂Φ
∂xL
.
∂Φ ∂Φ 1/2
)
∂xM ∂xM
Otteniamo cosı̀
dx̄L
∂Φ
L ∂xL (t, x̄(t)) dt (t)
P ∂Φ ∂Φ 1/2
( M ∂x
M ∂xM )
P
=
∂Φ
(t, x̄(t))
− P ∂t ∂Φ ∂Φ 1/2 ,
( M ∂xM ∂xM )
∂Φ
dx̄
n·
= − ∂t
dt
|∇Rd Φ|
Dunque il primo membro della formula appena scritta rappresenta la proiezione della velocità di x̄(t) lungo la normale alla superficie mobile in studio;
43
tale quantità, come si nota dalle formule appena scritte, non dipende dalle
derivate della curva x̄(t) arbitrariamente scelta, ma solo dal posto e dal tempo
t, la chiameremo velocità di avanzamento dell’onda:
vn (t, xL ) := −
(?)
∂Φ
∂t
|∇Rd Φ|
.
Supponiamo dunque che una soluzione u(t, x) del sistema di leggi di bilancio
∂ i X ∂ iL
u +
f (u) = g i (u),
L
∂t
∂x
L
ammetta una discontinuità debole, solo sulle derivate, come quella finora
descritta.
Da un punto di vista strettamente analitico, stiamo precisamente considerando soluzioni Lipschitziane le quali per il teorema di Rademacher sono
quasi ovunque differenziabili e con Φ = 0 denotiamo la localizzazione (di
misura nulla) del possibile salto (finito) delle derivate.
Indicando ancora con le parentesi quadrate [...] il salto della discontinuità,
[
X
∂uj
∂ i
f,jiL (u)[ L ] = 0,
u]+
∂t
∂x
Lj
usando (∗) e (?),
∂Φ X iL
∂Φ
+
f,j (u)λj L = 0,
∂t
∂x
Lj
XX
f,jiL (u)nL − vn δji λj = 0.
λi
j
L
Pertanto la soluzione ammette in t, x una discontinuità non banale (λ 6= 0)
nelle derivate se e solo se
X
iL
i
(†)
det
f,j (u)nL − vn δj = 0
L
Riassumiamo il significato conoscitivo della (†): una possibile onda di
discontinuità debole transita al tempo t per x ∈ Rd , ove ivi il campo soluzione
vale u = u(t, x), e nella direzione spaziale nL , solo e soltanto se la
velocità
Psua iL
i
di avanzamento vn è un autovalore della n×n-matrice aj (u) := L f,j (u)nL .
Il sistema in studio si dice iperbolico se lo spettro di f,jiL (u)nL risulta reale
per ogni u e per ogni direzione n.
44
E’ chiaro che quest’ultima informazione è stata dedotta senza risolvere il
sistema in studio, è in effetti una relazione di compatibilità tra gli oggetti
geometrici e fisici in gioco.
Più in dettaglio, ancora senza risolvere il sistema di PDE (compito in
generale arduo), cosa possiamo dire sulla generale struttura delle onde di discontinuità debole? Tornando alle formule che hanno prodotto (†), possiamo
scrivere (a meno del fattore 1/|∇Rd Φ|, il ché non crea problemi)
X
∂Φ i ∂Φ
δj = 0
det
f,jiL (u) L +
∂x
∂t
L
Quest’ultima è un’equazione di Hamilton-Jacobi, H = 0, dove compare
un’Hamiltoniana dipendente parametricamente da u:
X
H(u, p0 , pL ) := det
f,jiL (u)pL + p0 δji
L
Si apprende dunque che una soluzione ũ(t, x) continua con una discontinuità
sulle derivate evolventesi nello spazio e nel tempo secondo Φ(t, x) = 0 risulta
compatibile con Φ se, data l’Hamiltoniana
X
H̃(t, x, p0 , pL ) := det
f,jiL (ũ(t, x))pL + p0 δji ,
L
, ∂Φ ) = 0,
la funzione scalare Φ(t, x) soddisfa l’equazione di H-J: H̃(t, x, ∂Φ
∂t ∂xL
X
∂Φ
∂Φ
(#)
det
f,jiL (ũ(t, x)) L (t, x) +
(t, x) δji = 0
∂x
∂t
L
La teoria delle caratteristiche riduce lo studio di questa PDE scalare allo studio delle curve risolventi il sistema di ODE canonico Hamiltoniano associato
a H̃(t, xL , p0 , pL ).
Nel caso generale non-lineare il risultato di cui sopra potrebbe apparire poco
soddisfacente, lo diventa realmente importante invece nel caso semi-lineare:
∂ i X iL
∂uj
u +
Aj (t, x) L = g i (u),
∂t
∂x
jL
in tale situazione la teoria porta all’equazione di HJ, che è indipendente dalle
soluzioni ũ(x, t),
X
∂Φ
∂Φ
i
(##)
det
AiL
(t,
x)
(t,
x)
+
(t,
x)
δ
j
j = 0
∂xL
∂t
L
(Possibili applicazioni: equazioni di Maxwell, elasticità lineare.)
45
3.2
Onde Asintotiche ad Alta Frequenza
Riconsideriamo il sistema di leggi di bilancio
∂ l X ∂ lL
u +
f (u) = g l (u).
L
∂t
∂x
L
P
(Oppure, più in generale, α ∂x∂α f lα (u) = g l (u), dove f l0 (u) non è necessariamente ul .)
Sia u∗ : g(u∗ ) = 0, soluzione costante, d’equilibrio per il nostro sistema. Supponiamo di voler cercare soluzioni approssimate, in un senso che si
preciserà, della forma
ūl (t, x) = u∗ +
√
v l (t, x) exp(i
Φ(t, x)
),
dove → 0, e la fase Φ e l’ampiezza v l non dipendono da . Otteniamo
i X l ∂Φ X lL ∗ ∂Φ j
Φ(t, x)
√
f,j (u ) L v exp(i
δj
+
)+
∂t
∂x
j
L
+ termini di ordine O(1) che non coinvolgono derivate di Φ.
Asintoticamente, per 1/ → +∞ l’equazione da studiare risulta ancora della
forma analoga a quella incontrata nelle onde di discontiunità deboli:
X ∂Φ X
∂Φ f,jlL (u∗ ) L v j = 0
+
δjl
∂t
∂x
j
L
Si noti il ruolo ben diverso che ha nell’attuale contesto la funzione fase Φ,
che ora ha senso per ogni valore del suo co-dominio, rispetto al significato
assunto da Φ nelle onde di discontinuità deboli, dove invece ha senso solo per
Φ = 0.
3.3
Onde d’Urto (Shock waves)
Consideriamo ora possibili soluzioni discontinue ancora del sistema di leggi
di bilancio
d
∂ i X ∂ iL
u +
f (u) = g i (u),
L
∂t
∂x
L=1
oppure
46
d
X
∂ iα
F (u) = g i (u).
α
∂x
α=0
(∗)
Il modo moderno di studiare queste equazioni è quello nel ‘senso delle distribuzioni’. In dettaglio, procediamo cosı̀: moltiplichiamo ogni i-componente
dell’equazione (∗) per generiche funzioni φi (x) ∈ C0∞ a supporto compatto,
sommiamo su i, integriamo in x ∈ Rd+1 , e alla fine, la seguente affermazione,
nel caso di soluzioni regolari, è esattamente equivalente al sistema (∗):
Z
n X
d
X
∂ iα
F (u) − g i (u)]φi (x)dd+1 x = 0,
[
α
Rd+1 i=1 α=0 ∂x
∀φ = (φi (x))i=1,...,n ∈ C0∞ (supporto compatto)
Ma ora quest’ultima versione ci consente di ‘scaricare’ le derivate sulle funzioni test φ e scrivere (somma sottintesa sugli indici ripetuti),
Z
Z
∂ iα
iα ∂
i
F
F
(u)φ
−
φ
+
g
φ
i
i
i = 0,
α
∂xα
supp φ
supp φ ∂x
il primo integrale si annulla (con il teorema della divergenza in domini spaziotemporali), cosı̀ (∗) ora si può sostituire, più debolmente, senza richiedere la
derivabilità del campo incognito, con la seguente:
Z
∂
F iα (u) α φi + g i (u)φi = 0, ∀(φi (x))i=1,...,n ∈ C0∞
(∗∗)
∂x
supp φ
Diciamo che
• u(·) risolve (∗) nel senso delle distribuzioni se la condizione (∗∗) è soddisfatta.
La teoria di esistenza e unicità globale per tale tipo di sistemi di PDE è
stata definitivamente completata da pochi anni e solo per x ∈ R1 (Alberto
Bressan e collaboratori). Il giusto ambiente per u risulta lo spazio delle
funzioni BV (‘Variazione Limitata’) e opportuni Lp . Ogni considerazione per
d > 1 ha dunque attualmente un valore solo locale.
Sia dunque Σd nello spazio tempo Rd+1 una superficie orientata di discontinuità per u(t, x). Valga:
d+1
d
Rd+1 = Rd+1
(−) ∪ Σ ∪ R(+) .
L’idea per estrarre informazioni sugli urti è la seguente: per ogni dominio
stokesiano2 Ω ∈ Rd+1 , intersecante Σd , e dunque Ω = Ω(−) ∪ {Ω ∩ Σd } ∪ Ω(+) ,
si considera il bilancio integrale3
2
tale cioè che per esso valga il teorema di Stokes, nelle sue varie forme: t. della
divergenza, ecc.
3
si può pensare alla formulazione distribuzionale prima accennata, con delle φ tali che:
φj = 0, j 6= i, e le φi che valgono 1 in Ω e zero fuori; ovviamente, approssimazioni C ∞ ,
fini quanto vogliamo, di tale appena descritte funzioni a gradino.
47
Z X
d
∂ iα
F (u) − g i (u)]dd+1 x,
0= [
α
Ω α=0 ∂x
Z
(1)
d
X
iα
Z
d
F (u)Nα d x =
g i (u)dd+1 x,
Ω
∂Ω α=0
ove N è il versore esterno, devono pure valere i bilanci integrali in Ω(−) e
Ω(+) :
d
X
Z
(2)
iα
Z
d
F (u)Nα d x =
Ω(−)
∂Ω(−) α=0
Z
(3)
d
X
g i (u)dd+1 x,
iα
d
Z
F (u)Nα d x =
∂Ω(+) α=0
g i (u)dd+1 x,
Ω(+)
sommando m.a m. (2) con (3) i termini a sinistra relativi alle superfici
orientate {Ω ∩ Σd }(−) e a {Ω ∩ Σd }(+) (con versori normali N e −N ; N punta
da Ω(−) a Ω(+) ) non si elidono data la discontinuità, producendo
Z
d
X
∂Ω α=0
iα
d
Z
F (u)Nα d x −
{Ω∩Σd }
d
X
α=0
48
[F iα (u(+) ) − F iα (u(−) )]Nα dd x =
Z
(4)
g i (u)dd+1 x,
=
Ω
confrontando con (1) otteniamo infine
d
X
Z
[F iα (u(+) ) − F iα (u(−) )]Nα dd x = 0
{Ω∩Σd } α=0
ma questo dev’essere vero per ogni Ω scelto e dunque su Σd :
d
X
[F iα (u(+) ) − F iα (u(−) )]Nα = 0
(Condizioni di Rankine − Hugoniot).
α=0
Ora se F i0 (u) = ui e se Σd = {(t, x) : Φ(t, x) = 0} si ha che
N= 2
∂Φ
∂t
+
∂Φ
∂t
1/2
P
∂Φ ∂Φ
M ( ∂xM ∂xM )
, 2
∂Φ
∂t
+
∂Φ
∂xL
1/2
P
∂Φ ∂Φ
M ( ∂xM ∂xM )
e infine, ricordando le definizioni della velocità vn di avanzamento dell’onda,
che ora scriveremo s, e del versore spaziale nL ,
[u(+) − u(−) ]s =
d
X
[f iL (u(+) ) − f iL (u(−) )]nL .
L=1
Usando la notazione [u] := u(+) − u(−) e [f iL (u)] := f iL (u(+) ) − f iL (u(−) )
scriveremo infine
i
(RH)
[u ]s =
d
X
[f iL (u)]nL .
L=1
———
Quando nasce, quando si crea un urto, che velocità s può avere? La (RH) si
scrive per hi = [ui ]
i
hs=
d
X
f iL (u(−) + h) − f iL (u(−) )]nL .
L=1
Quest’ultima equazione nell’incognita hi è sicuramente risolta per hi = 0 pertanto, affinché si generi un urto (a partire dall’urto banale, nullo) è necessario
che il teorema della funzione implicita fallisca per hi = 0, cioè
X
(†)0
det
f,jiL (u(−) )nL − sδji = 0
L
49
Si individuano cosı̀ dei punti di biforcazione tra la soluzione h(s) ≡ 0 e
possibili h = h(s) 6= 0 . Dunque, se un urto nasce, questo inizia a propagarsi
con una velocità di discontinuità debole, e se si estingue nell’urto nullo accade
lo stesso fenomeno.
3.4
Velocità del suono
E’ un esempio importante, l’elasticità (per semplicità, consideriamo il caso
omogeneo: µ∗ ≡ 1) L,M =1,2,3 :
L
u := (FM
, v L ) ∈ R12 ,
F : gradiente di deformazione, v : velocità materiale,
T LM : tensore di stress
Il sistema di leggi di conservazione per l’elasticità si scrive:
 ∂ L
N
) = 0
(compatibilità)
 ∂t FM + ∂x∂N (−v L δM

∂ L
v
∂t
+
∂
T LN (F )
∂xN
= bL (v, F ) (Equ. di Cauchy)
Si noti che le equazioni di compatibilità (è una sorta di condizione di chiusura)
ci permettono di dire che esiste una mappa (xL , t) 7→ χM (xL , t), il moto, tale
che
∂ M L
∂ M L
χ (x , t) = v M ,
χ (x , t) = FNM .
∂t
∂xN
• Calcoliamo le velocità caratteristiche (velocità di avanzamento di onde
deboli) per una versione semplificata e 1-dim del modello appena visto.

∂
∂
F − ∂x
v = 0

∂t
1
2
u = (u , u ) = (F, v)
 ∂
∂
v + ∂x
p(F ) = b (p : pressione)
∂t
 F
 f (F, v) = −v




∂
F
∂t
+
∂
v
∂t
+
∂f F
∂F
f v (F, v) = p(F )
F,x +
∂f v
F
∂F ,x
+
∂f F
∂v
v,x = 0
∂f v
v
∂v ,x
50
= b
det
0
−1
− s I2×2 = 0,
p0(F ) 0
s1,2 = ±
s2 + p0(F ) = 0,
p
−p0(F ) :
sono le (sperimentalmente misurate) velocità del suono.
Alcune precisazioni (p0 (F ) < 0):
Dall’equazione di continuità µ(t, x) det F (t, x) = µ∗ (x), µ(t, x) F (t, x) =
1, µ(t, x) = 1/F (t, x). Un’equazione costitutiva naturale per p = p(µ) è
una funzione monotona crescente (grande densità implica grande pressione)
e dunque p = p(F ) è una funzione monotona decrescente e dunque con
p0 (F ) < 0.
51
Capitolo 4
La teoria di Friedrichs - Lax Godounov - Boillat
Riconsideriamo i sistemi di leggi di conservazione in forma quasi-lineare
∂ i X ∂ iL
u +
f (u) = g i (u).
L
∂t
∂x
L
(1)
Supponiamo che
Ogni soluzione regolare (C 1 ) u = u(t, x) del sistema (1) soddisfi alla
ulteriore (dis)equazione1
S(u),t + hL (u),L ≥ 0
(2)
Questa affermazione è talvolta considerata come una formulazione astratta
del ‘secondo principio della termodinamica’; nella (2) il campo S = S(u) è
una densità di entropia (o, in qualche caso di energia), e hL (u) è il vettore
flusso di entropia.
Mostriamo che l’introduzione della ‘termodinamica’ si rivela regolarizzante: più precisamente, supposta convessa la funzione densità di entropia
S = S(u), l’affermazione di cui sopra comporta che il sistema (1) è equivalente ad un sistema simmetrico iperbolico, dunque un sistema il cui lo studio
delle onde (ma anche delle soluzioni globali deboli) risulta ben posto.
Il primo passo sarà il seguente: il fatto che (1) ⇒ (2), comporterà delle
‘restrizioni costitutive’ tra le funzioni f iL (u), g i (u), S(u), hL (u).
Accettiamo preliminarmente il seguente asserto: localmente (cioè, in un
opportuno intorno) ad ogni prefissato punto dello spazio tempo (t̄, x̄) si può
sempre costruire una soluzione classica (C 1 ), ũ(·, ·) con arbitrari prefissati
1
scriveremo talvolta S,t =
∂
S,
∂t
ecc., e continueremo a sottintendere la sommatoria sugli indici doppi.
52
valori del campo ū = ũ(t̄, x̄) e delle sue derivate spaziali ūL = ũ,L (t̄, x̄).
L’equazione (1) ci dirà, mediante semplice calcolo algebrico, quanto vale
ũ,t (t̄, x̄). L’esistenza di tale soluzione soluzione regolare, locale in un opportuno piccolo intorno di (t̄, x̄), si può costruire per esempio col teorema di
Cauchy-Kowaleskaya, non entreremo nel merito.
Le (1) e (2) si scrivono
(10 )
ui,t + f,jiL (u)uj,L = g i (u)
(20 )
S,i (u)ui,t + hL,j (u)uj,L ≥ 0
Moltiplichiamo ambo i membri del sistema (10 ) per S,i (u), sommiamo sull’indice i, e dall’espressione cosı̀ ottenuta eliminiamo con (20 ) il termine S,i (u)ui,t ,
otteniamo infine
−S,i (u)f,jiL (u) + hL,j (u) uj,L + S,i (u)g i (u) ≥ 0
e dato che possiamo scegliere arbitrariamente le derivate spaziali uj,L e il
campo u in un punto (x, t), l’affermazione ‘(1) ⇒ (2)’ è equivalente alle
seguenti Restrizioni Costitutive che legano le funzioni che definiscono il sistema:
S,i (u)f,jiL (u) = hL,j (u)
(3)
S,i (u)g i (u)
≥0
La nostra ipotesi fondamentale è la C 2 -convessità di S, cioè che la funzione
matriciale Hessiana
u 7→ S,ij (u)
sia definita positiva2 . Allora la mappa
Rn 3 u 7→ v = S 0 (u) ∈ Rn ,
vi = S,i (u) =
∂S
(u),
∂ui
stabilisce diffeomorfismi globali sui convessi3 aperti di Rn . Indicheremo con
v = v(u) e u = u(v) questa mappa e la sua inversa. Consideriamo ora la
seguente Trasformazione (parziale) di Legendre:
ΦL (v) := f jL (u(v))vj − hL (u(v))
2
Si osservi che se A è definita positiva, pure lo è A−1 .
Si utilizza lo stesso teorema di inversione globale che ci è servito per stabilire Trasformazioni di
Legendre globali.
3
53
e calcoliamone le derivate
∂ΦL
(v) = f iL (u(v)) + f,kjL (u(v)) uk,i (v) vj − hL,k (u(v)) uk,i (v),
∂vi
osservando che vj = S,j e utilizzando le restrizioni costitutive otteniamo
∂ΦL
(v) = f iL (u(v)).
∂vi
Riscriviamo infine il sistema (1) utilizzando il nuovo campo incognito v:
L ∂ui
∂Φ
00
(1 )
(v) vk,t +
(v)
= g i (u(v)),
∂vk
∂vi
,L
iik
∂ 2 ΦL
(u(v)) vk,t +
(v) vk,L = g i (u(v)),
∂vk ∂vi
h
iik
00 −1
(S ) (u(v)) : è i k simmetrica e definita positiva
h
(S 00 )
−1
∂ 2 ΦL
(v) : è i k simmetrica
∂vk ∂vi
pertanto il calcolo delle velocità caratteristiche porta all’equazione
ik 00 −1
L ik
(††)
det Φ nL − vn S
=0
ΦL ik =
che ammette solo soluzioni reali in vn , si tratta infatti del problema degli
autovalori relativi della matrice simmetrica ΦL ik nL rispetto alla ‘metrica’
00 −1
(def. pos.) S .
54
Capitolo 5
Primi Elementi di Teoria
Qualitativa dei Sistemi
Dinamici
5.1
Integrali primi, dipendenti dal tempo, di
campi vettoriali che dipendono possibilmente dal tempo
Dato il campo vettoriale dipendente dal tempo
X : R × Rm → Rm
(t, x) 7→ X(t, x),
l’equazione differenziale ad esso associata è
ẋ(t) = X(t, x(t)),
x(t0 ) = x0 .
Una funzione a valori reali f ,
f : R × Rm → R
è un integrale primo, dipendente dal tempo, se lungo le soluzioni t 7→ x(t) è
costante:
f (t, x(t)) = costante
Non è difficile vedere che per integrali primi differenziabili tale condizione è
equivalente a
m
X
∂f
∂f
(t, x) +
(t, x)Xi (t, x) = 0.
(∗)
∂t
∂x
i
i=1
55
5.2
Intermezzo: Derivata di determinante
Consideriamo la matrice quadrata (N × N ) :
a11



















...
a1N 

...
..
.
..
.
aij
..
aN 1
.
...
aN N

















i cui elementi aij sono i valori assunti dalle N 2 funzioni aij = ãij (λ) di R in R.
P
Sia J = det(aij ). Com’è noto J = N
j=1 Aij aij (“sviluppo del determinante
rispetto alla i-esima riga”), dove Aij sono i complementi algebrici relativi agli
elementi aij ; valgono pure le relazioni:
(1)
J=
N
X
Aih aih =
N
X
Akj akj
∀i, j = 1, . . . , N.
k=1
h=1
Inoltre sappiamo che:
N
X
(2)
h=1
Aih ajh
(
J se i = j
=
0 se i 6= j ,
cosı̀ si può scrivere:
(3)
Jδij =
N
X
Aih ajh .
h=1
Calcoliamo la derivata di J pensato come funzione di R in R tramite le
˘
N 2 ãij (λ) : J(λ)
= J (ã11 (λ), . . . , ãij (λ), . . . , ãN N (λ)).
(4)
N
X
∂J
d
d ˘
J(λ) =
(. . . , ãhk (λ), . . . ) ãhk (λ).
dλ
∂aij
dλ
i,j=1
∂J
. A tale scopo sviluppiamo J
Restano da esprimere le derivate parziali ∂a
ij
rispetto alla
P i-esima riga (oppure rispetto alla j-esima colonna, è lo stesso): J = N
h=1 Aih aih ; dato che, per i fissato e per h = 1, . . . , N, Aih non
dipendono da aij , si ottiene subito:
(5)
∂J
= Aij .
∂aij
56
Ritorniamo alla (4), si ha infine:
N
X
dJ˘
d
(λ) =
Aij ãij (λ).
dλ
dλ
i,j=1
(6)
5.3
Teorema del Trasporto
Ritorniamo al campo vettoriale dipendente dal tempo
X : R × Rm → Rm
(t, x) 7→ X(t, x),
e all’equazione differenziale ad esso associata
ẋ(t) = X(t, x(t)),
x(0) = x0
Supponiamo che l’equazione differenziale in studio ammetta flusso con estensione massimale su tutta la retta reale dei tempi. Indichiamo tale operatore
flusso con:
Φ : R × Rm → Rm
(t, y) 7→ Φt y := x(t, y),
(2)
d
x(t, y) = X(t, x(t, y)) e x(0, y) = y.
dt
Se, come supponiamo, vale un teorema di esistenza e unicità, allora Φt è
iniettivo. Dunque Φt : Rm → Rm è noto se, equivalentemente, sappiamo
risolvere i problemi di Cauchy: ẋ(t) = X(t, x(t)), ẋ(0) = y, ∀y ∈ Rm , che è
estremamente difficile, e, in un certo senso, non significativo: l’insieme dei
sistemi dinamici che si lasciano integrare mediante tecniche standard, quali
calcolo di primitive e inversioni di funzioni (si parla, appunto, di ‘sistemi
integrabili’, il cui prototipo non lineare è ẍ = f (x)) è estremamente ‘piccolo’
in ogni ragionevole topologia.
Sia Ω ⊂ Rm un sottoinsieme misurabile ed interpretiamolo come un insieme di possibili “dati iniziali” per la nostra equazione differenziale. Cerchiamo
allora di indagare su un aspetto meno forte ma, ciononostante, sufficientemente significativo e interessante. Studiamo l’evoluzione della “misura” (cioè,
del “volume” in Rm ) di Ω tramite Φt :
Z
mis (Φt (Ω)) :=
dx (dx := dx1 dx2 ... dxm , elemento di volume in Rm )
ove
Φt (Ω)
57
Preliminarmente al calcolo di dtd mis (Φt (Ω)) operiamo un cambio di variabili
di integrazione: invece di integrare nelle x ∈ Φt (Ω), integreremo nelle y ∈ Ω
e il diffeomorfismo tra le x e le y sia proprio dato dal flusso (per t fissato),
Z
Z d
d
∂(x1 , . . . , xm )
dx =
(t, y)dy
dt Φt (Ω)
dt Ω ∂(y1 , . . . , ym )
Posto1
m
X
∂(x1 , . . . , xm )
∂xi
J(t, y) :=
Aih (t, y)
(t, y) =
(t, y)
∂(y1 , . . . , ym )
∂yh
h=1
si ha che: J(0, y) = 1 e J(t, y) > 0 ∀t ∈ R. Dunque:
Z
Z
d
∂
dx =
J(t, y)dy =
dt Φt (Ω)
Ω ∂t
=
Z X
m
Aij (t, y)
Ω i,j=1
Z X
m
∂ ∂xi
=
Aij (t, y)
(t, y)dy =
∂yj ∂t
Ω i,j=1
=
Z X
m
Aij (t, y)
Ω i,j=1
ricordando che
Pm
(3)
d
dt
Z X
m
Ω i,j=1
m
X
∂Xi
k=1
Aij (t, y)
∂xk
(t, x(t, y))
∂
Xi (t, x(t, y))dy =
∂yj
∂xk
(t, y)dy,
∂yj
k
j=1
Aij ∂x
= δik J, si ottiene:
∂yj
Z
Z
dx =
Φt (Ω)
Com’è noto: divX :=
1
∂ 2 xi
(t, y)dy =
∂t∂yj
J(t, y)
Ω
∂X i
i=1 ∂xi
Pm
m
X
∂X i
i=1
∂xi
(t, x(t, y))dy.
(operatore “divergenza”).
Aih : complemento algebrico della matrice Jacobiana
58
Infine ritornando alle variabili x, otteniamo:
Z
Z
d
dx =
divX(t, x)dx
(Teorema del Trasporto).
(4)
dt Φt (Ω)
Φt (Ω)
Esempio 1. Supponiamo ora che l’equazione (1) sia lineare,
(5)
Xi (x) =
m
X
(Aij : matrice reale costante m × m)
Aij xj
j=1
In tal caso divX =
Pm
Aii = trA (tr: traccia), allora la (4) diviene:
Z
Z
d
dx = trA
dx.
dt Φt (Ω)
Φt (Ω)
i=1
(6)
La (6) si integra facilmente:
mis(Φt (Ω)) = mis(Ω)et(trA) .
(7)
Dunque il segno della traccia di A ci dà una indicazione sul modo con cui le
traiettorie uscenti da Ω “invadono” (trA > 0) o meno (trA < 0) lo spazio
delle fasi Rm .
Esempio 2. Consideriamo ora la (4) nel caso che ẋ(t) = X(x(t)) sia un
sistema della meccanica classica di n particelle2 con forze che non dipendono
dalle velocità.
(9)
q̇i = vi ,
v̇i = Fi (q) i = 1, . . . , 3n,
Si noti che in tal caso m = 6n, x = (q, v) ∈ R3n × R3n = R6n . Calcoliamo la
divergenza del campo vettoriale:
div X =
3n
3n
X
X
∂
∂
=
vi +
Fi (q) = 0
∂xh
∂qi
∂vi
i=1
i=1
m
X
∂Xh
h=1
cioè, Teorema di Liouville: il flusso associato alle equazioni della meccanica classica con forze puramente posizionali mappa nello spazio delle fasi
R6n misurabili Ω in misurabili Φt (Ω) di ugual misura.
2
per semplicità, tutte di massa unitaria.
59
Esempio 3. Supponiamo ora che ci sia pure della viscosità (k > 0):
(10)
q̇i = vi ,
v̇i = Fi (q) − kvi i = 1, . . . , 3n,
ora il calcolo della divergenza del campo vettoriale:
div X =
m
X
∂Xh
h=1
∂xh
=
3n
3n
X
X
∂
∂
vi +
(Fi (q) − kvi ) = −3nk < 0
∂q
∂v
i
i
i=1
i=1
Dunque:
mis(Φt (Ω)) = e−3nk t mis(Ω)
pertanto:
mis(Φt (Ω)) → 0 per t → ∞,
comportamento, questo, tipico dei sistemi dissipativi.
Avvertenza: non si pensi che necessariamente Φt (Ω) collassi asintoticamente
nel tempo sempre ad un (solo) punto nello spazio delle fasi.....
5.4
Leggi di Conservazione
Pensando ad un esempio che ci aiuti a fissare le idee, supponiamo che il campo
vettoriale X(t, x) sia il campo di velocità di un fluido (dunque: m = 3):
X(t, x) rappresenti la velocità di quel punto materiale (particella) del fluido
che al tempo t sta transitando per il punto geometrico (dello spazio) x ∈ R3 .
Supponiamo ora che il fluido ‘trasporti’ qualche proprietà, tipo: massa, oppure carica elettrica, che si ‘conserva’. Questo vuol dire che c’è una densità
f (t, x) per cui
Z
d
f (t, x)dx = 0, ∀Ω ⊂ Rm
dt Φt (Ω)
Impostiamo un conto analogo a quello che ci ha portato al teorema del
trasporto, dove scriveremo y = y(t, x) per l’inversa di x(t, y):
Z
Z
∂(x , . . . , x )
d
d
1
m
f (t, x)dx =
f (t, x(t, y))
(t, y)dy =
dt Φt (Ω)
dt Ω
∂(y1 , . . . , ym )
Z nh
i
X ∂
∂f
∂xi
=
(t, x(t, y)) +
f (t, x(t, y))
(t, y) J(t, y)+
∂t
∂xi
∂t
Ω
i
o
∂
+f (t, x(t, y)) J(t, y) dy =
∂t
Z n
X
∂f
∂
∂xi
=
(t, x(t, y)) +
f (t, x(t, y))
(t, y)+
∂t
∂xi
∂t
Ω
i
60
o
+f (t, x(t, y)) divX(t, x(t, y)) J(t, y)dy =
Z
n ∂f
X ∂
(t, x) +
f (t, x)Xi (t, x)+
=
∂t
∂x
i
Φt (Ω)
i
o
+f (t, x) divX(t, x) dx = 0
e questo
n peroogni Ω scelto, dunque, supposta continua in x la funzione di cui
sopra . . . , è esattamente tale funzione integranda che deve essere nulla:
X ∂
∂f
(t, x) +
f (t, x)Xi (t, x) + f (t, x) divX(t, x) = 0,
∂t
∂xi
i
equivalentemente,
X ∂ ∂f
(t, x) +
f (t, x)Xi (t, x) = 0,
∂t
∂xi
i
(∗∗)
∂f
(t, x) + div f (t, x)X(t, x) = 0
∂t
Importante: si noti che le densità che si conservano per flussi isocori (cioè
divX = 0) sono degli integrali primi.
5.5
(Verso la) Diffusione
Come nella sezione precedente continuiamo a supporre che il campo vettoriale
X(t, x) sia il campo di velocità di un fluido e supponiamo ora che il fluido
‘trasporti’ qualche altro tipo di proprietà (temperatura, ‘probabilità’ ?) che
propone un comportamento di dispersione col seguente meccanismo 3 . Esiste
dunque una f (t, x) per cui,
per qualche costante ν > 0,
dove scriviamo con ∂Φt (Ω) la superficie-bordo di Φt (Ω) ⊂ Rm ,
dove denotiamo con ∇x f (t, x) il gradiente (rispetto alle variabili x),
e dove indichiamo con n il versore esterno normale al bordo ∂Φt (Ω),
∀Ω ⊂ Rm :
3
Tale modo di introdurre le equazioni di diffusione lo si può ritrovare per esempio nel
libro: H. Amann, Ordinary differential equations. An introduction to nonlinear analysis.
Studies in Mathematics, 13. Walter de Gruyter & Co., Berlin, 1990.
61
d
dt
Z
Z
∇x f (t, x) · n(x) da
f (t, x)dx = ν
Φt (Ω)
∂Φt (Ω)
Indaghiamo sul significato del secondo membro. Naturalmente, per ν = 0
riotteniamo per f il significato di densità conservata. Ricordiamo il significato geometrico del gradiente ∇x f (t, x) di una funzione scalare: è un vettore che in quel punto x e in quell’istante t in cui è valutato indica la direzione spaziale di massima crescita locale per la funzione. Dunque, se ad
un istante t e in un punto x ∈ ∂Φt (Ω) si ha che p.e. il prodotto scalare
∇x f (t, x) · n(x) > 0 significa che localmente f esternamente a Φt (Ω) è maggiore dunque c’è un contributo di crescita, f tende a fluire all’interno, mentre
invece se ∇x f (t, x) · n(x) < 0 si ha che all’interno di Φt (Ω), localmente in
x, f è maggiore rispetto all’esterno e dunque ci sarà una tendenza al riequilibrio con un flusso uscente e conseguente contributo di bordo negativo alla
derivata espressa nel primo membro. L’uso del teorema di Gauss (o ‘della
divergenza’) sul secondo membro ci dà:
Z
Z
d
div∇x f (t, x) dx
f (t, x)dx = ν
dt Φt (Ω)
Φt (Ω)
X ∂2
div∇x f =
f = ∆f : Operatore di Laplace, o Laplaciano
∂x2i
i
procedendo con conti analoghi alle precedenti sezioni,
Z
n ∂f
X ∂
(t, x) +
f (t, x)Xi (t, x)+
∂t
∂x
i
Φt (Ω)
i
o
+f (t, x) divX(t, x) − ν∆f (t, x) dx = 0 ∀Ω
dunque ancora una volta è la quantificazione ∀Ω che forza la funzione integranda debba essere nulla:
X ∂ ∂f
(t, x) +
f (t, x)Xi (t, x) − ν∆f (t, x) = 0,
∂t
∂xi
i
(∗ ∗ ∗)
∂f
+ div f X = ν∆f
∂t
Esempi:
Equazione di diffusione del calore (f = T ), temperatura.
Equazione di diffusione di Fick,
Equazione di Fokker-Planck (f = p), densità di propabilità.
62
5.6
Il fenomeno del Large Damping nelle equazioni di Newton
Nelle prossime pagine studieremo aspetti tecnici dell’equazione di FokkerPlanck emergente da possibili sistemi dinamici deterministici tipici dalla meccanica classica di n particelle. Il drift Z, cioè il campo vettoriale che regge la
dinamica rappresentata al primo ordine, è un campo vettoriale nello spazio
delle fasi R6n = {z = (x, v)}:
ẋ = v, v̇ = F(x, v)
ż = Z(z) :
Nella sezione 5.6.1 si introdurrà un’importante approssimazione dovuta alla
presenza di ‘grande viscosità’, che ridurrà radicalmente il drift da campo
vettoriale di R6n ad un campo vettoriale nello spazio delle configurazioni
R3n . A volte viene citata come approssimazione di Smoluchowski.
5.6.1
Large Damping lineare
Consideriamo l’equazione differenziale lineare
mẍ = −hx − k ẋ,
m, h, k > 0
Nel caso
k >> m, h,
cosicché
2
∆ = k − 4mh > 0,
λ1 =
−k +
√
k 2 − 4mh
,
2m
λ2 =
−k −
la generica soluzione, nel piano delle fasi, è data da:
x = c1 eλ1 t + c2 eλ2 t
ẋ = c1 λ1 eλ1 t + c2 λ2 eλ2 t
Osservando che nelle nostre ipotesi λ2 < λ1 < 0,
limt→+∞
ẋ
x
= limt→+∞
c1 λ1 eλ1 t +c2 λ2 eλ2 t
,
c1 eλ1 t +c2 eλ2 t
= limt→+∞
c1 λ1 +c2 λ2 e(λ2 −λ1 )t
,
c1 +c2 e(λ2 −λ1 )t
= λ1 (< 0), la radice più grande.
63
√
k 2 − 4mh
,
2m
Cosa accade a questa pendenza di retta asintotica quando k → +∞?
limk→+∞ λ1 = limk→+∞
√
−k+ k2 −4mh
,
2m
√
= limk→+∞
= limk→+∞
(−k+
√
k2 −4mh)(k+ k2 −4mh)
√
,
2m(k+ k2 −4mh)
−4mh
√
2m(k+ k2 −4mh)
=0
Un’osservazione interessante ora è che la funzione k 7→ λ1 (k) =
−4mh
√
2m(k+ k2 −4mh)
è (infinitesima ed è) asintotica, per k → +∞, alla funzione
h
k 7→ − ,
k
infatti:
lim
k→+∞
−4mh
√
2m(k+ k2 −4mh)
− hk
= lim
k→+∞
k+
√
2k
=1
k 2 − 4mh
Quest’ultima asintoticità giustifica la riduzione di “large damping” (cioè, per
k → +∞) che segue: introdotto il “tempo lento” τ := kt , e definito
y(τ ) := x(kτ ),
si ha
y = x,
y 0 = k ẋ,
y 00 = k 2 ẍ
cosicché dalla nostra equazione di partenza otteniamo
m 00
y = −hy − y 0
k2
per grande k > 0 si ‘trascura’ il membro di sinistra e si studia l’equazione
approssimata (chiamata appross. di ‘large damping’)
y 0 = −hy
ma questa è esattamente
h
ẋ = − x
k
Abbiamo appena visto che
ẋ
x
≈
t→+∞
λ1
≈
k→+∞
64
−
h
k
Dunque, nel caso lineare tale approssimazione appare giustificata, ha
senso per grandi tempi e grande viscosità (damping) sostituire
mẍ = −hx − k ẋ
h
ẋ = − x
k
=⇒
o meglio, in tutta generalità, se esiste un minimo assoluto per U che diventa
equ. asint. stabile con la viscosità,
mẍ = −∇U (x) − k ẋ
=⇒
1
ẋ = − ∇U (x)
k
Quest’ultima estensione al caso non lineare, cioè energia potenziale non necessariamente quadratica come nel caso lineare-elastico, è motivata dal fatto
che per tempi lunghi il sistema evolve verso tale equilibrio e dunque diventa
essenziale la (sola) parte lineare dell’equazione differenziale.
5.7
5.7.1
Funzionali di Lyapunov per Fokker-Planck:
entropia relativa e energia libera
Generalità sull’equazione di Fokker-Planck
Consideriamo l’equazione di Fokker-Planck in un dominio Ω ⊂ Rn , dove il
campo (drift) X(x) è gradiente ed è generato da un’energia potenziale U ,
X(x) = −gradU (x),
con la condizione:
gradU (x) · n(x) = 0, ∀x ∈ ∂Ω
che ci avverte che le curve integrali di X non escono da Ω:
∂p
+ div pX = ν∆p
∂t
(F okker − P lanck)
Tipico problema di Cauchy:
Determinare p(t, x) risolvente F-P, tale che
gradp(t, x) · n(x) = 0, ∀x ∈ ∂Ω,
Z
p(0, x) = p0 (x),
con la proprietà sul dato iniziale :
p0 (x) dx = 1.
Ω
Mostriamo inizialmente che
pe (x) := e−
65
U (x)
ν
è una soluzione stazionaria di F-P, cioè:
div pe X = ν∆pe
(staz)
Naturalmente penseremo che U , dato che è definita a meno di costante
R
U (x)
additiva, sia tale per cui vale la normalizzazione: Ω e− ν dx = 1.
gradU · gradU
U
0
−U
1 membro : div −e ν gradU =
− ∆U e− ν ,
ν
0
2 membro : ν∆ e
−U
ν
U
gradU − U
∆U
gradU · gradU
ν
= ν div −
e
=ν −
+
e− ν .
2
ν
ν
ν
Mostriamo ora che la proprietà di normalizzazione è invariante nel tempo:
Z
Z
Z
d
p(t, x)dx =
div (−pX + νgradp) dx =
(−pX + νgradp)·n dxn−1 = 0.
dt Ω
Ω
∂Ω
Questo ci garantirà che se il dato iniziale è una densità normalizzata, cosı̀
sarà tale la corrispondente soluzione ∀t ≥ 0.
5.7.2
L’Entropia
U (x)
Introduciamo l’entropia (relativa, a pe (x) = e− ν ),
Z
p(t, x)
H[p](t) :=
p(t, x) ln
dx
pe (x)
Ω
e mostriamo che risulta essere una funzione di Lyapunov per tale soluzione
stazionaria:
Teorema Il funzionale H[p] lungo le soluzioni4 di F-P è non crescente:
d
H[p](t) ≤ 0,
dt
(i)
inoltre,
(ii)
H[pe ] = 0,
H[p] > 0, per p 6= pe .
4
Un argomento classico, detto principio del massimo, mostra che le nostre soluzioni
sono p ≥ 0.
66
Prova Richiamiamo che gradpe = − gradU
pe =
ν
X
p.
ν e
Z
d
p
H[p](t) =
div (−pX + νgrad p) ln + 1 dx =
dt
pe
Ω
Z
p
=
div (−pX + νgrad p) ln + 1 dx −
pe
Ω
|
{z
}
=0: grad p·n|∂Ω =0=X·n|∂Ω
Z
−
(−pX + νgradp) grad ln
Ω
p
dx =
pe
Z gradpe
p
−p
= −ν
+ gradp grad ln dx =
pe
pe
Ω
Z gradp gradpe
gradpe
+ gradp
−
= −ν
−p
=
pe
p
pe
Ω
Z gradp gradpe 2
= −ν
p − pe p dx ≤ 0,
Ω
e
d
H[p](t) = 0 solo se p = pe ,
dt
gradp gradpe
−
= 0 se e solo se grad ln p = grad ln pe .
infatti :
p
pe
e
Infine, dalla disuguaglianza (classica): x ln x ≥ x−1, ∀x > 0, e utilizzandolo
per x := p/pe ,
Z
Z
Z
Z
p
p
p ln dx ≥
pe
p dx − pe dx ≡ 0.
− 1 dx =
pe
pe
Ω
Ω
Ω
Ω
Non solo l’entropia è definita positiva, come appena dimostrato, ma
ammette pe come suo unico punto critico ed è pure convessa:
Z
Z
∀δp :
(p + δp) dx = 1, dunque tale che
δp dx = 0,
Ω
Ω
Z
d
p d H[p]δp =
p ln
dx =
p+λδp
dλ Ω
pe
λ=0
Z
Z
p
p
=
δp ln + 1 dx =
δp ln dx = 0,
pe
pe
Ω
Ω
67
se e solo se: p = pe . Infine, la convessità:
Z
∂2
p 2
d H[p](δp, δp) =
p ln
dx =
p+λδp+µδp
∂µ ∂λ Ω
pe
λ=0, µ=0
Z
Z
p + µδp
|δp|2
1
∂
δp ln
+ 1 dx =
dx ≥
k δp k2L2 .
=
∂µ Ω
pe
p
maxΩ p
µ=0
Ω
5.7.3
Fokker-Planck e termodinamica di non-equilibrio
In questa sezione si propone una nuova funzione (funzionale) di Lyapunov per
l’equazione di Fokker-Planck, ancora con le condizioni esposte in 5.7.1, con
un significato termodinamico più immediato e fruibile dell’entropia relativa
appena introdotta. Nell’ipotesi di lavoro in cui operiamo, ‘large damping’
e conseguente rilassamento della componente cinetica dell’energia, possiamo
affermare che l’energia al tempo t che compete al nostro sistema con densità
di probabilità p(t, x) sia
Z
E = E[p](t) =
U (x)p(t, x)dx
Ω
mentre l’entropia (assoluta) è –prendendo ancora a prestito dall’ambientazione Shannon & Jaynes–
Z
S = S[p](t) = − p(t, x) ln p(t, x)dx
Ω
Infine, assimileremo –a meno di costanti aggiustanti la dimensionalità– il
parametro di viscosità ν > 0 con la temperatura assoluta θ,
ν=θ
relazione detta a volte di Einstein-Smoluchowsky, benché sia interamente
ascrivibile ad Einstein. I nostri processi sono isolati, dunque isotermi, e ha
quindi senso definire l’energia libera F con temperatura costante:
Z
F = E − θS,
F = (U + ν ln p)pdx
Ω
e quindi cimentarsi nel verificare se il ben noto aspetto quantitativo della
seconda legge della termodinamica, che asserisce che F tende al suo minimo
assoluto, sia ricostruibile nell’attuale assetto.
Z
dF [p]δp = (U + ν ln p + ν)δpdx
Ω
68
come abbiamo visto,
R
δp dx = 0, pertanto:
Z
dF [p]δp = (U + ν ln p)δpdx
Ω
Ω
L’energia libera ammette dunque l’unico punto stazionario nell’equilibrio p =
U (x)
pe = e ν , che è pure il minimo assoluto data la uniforme L2 -convessità qui
sotto verificata. Il calcolo segue sostanzialmente linee analoghe a quelle viste
precedentemente per H,
Z
|δp|2
ν
2
d F [p](δp, δp) = ν
dx ≥
k δp k2L2
p
max
p
Ω
Ω
Infine verifichiamo
Z
d
F [p](t) = (U + ν ln p + ν)div (−pX + νgrad p) dx =
dt
Ω
Z
= − grad(U + ν ln p) · (p grad U + ν grad p) dx =
Ω
Z 2
2
2 |grad p|
=−
p|gradU | + 2ν grad p · grad U + ν
dx =
p
Ω
2
Z √
grad
p
= − p gradU + ν √ dx ≤ 0,
p
Ω
U
√
p
√
e si vede che p gradU + ν grad
= 0 se e solo se p = e− ν = pe .
p
5.7.4
Fokker-Planck e teoria delle Grandi Deviazioni
Consideriamo la varietà compatta e senza bordo Ω, p.e. il toro Tn , ed un
campo vettoriale di drift su di esso,
X : Ω −→ Rn
La struttura della distribuzione di probabilità di equilibrio che abbiamo inU
contrato nel caso di drift gradiente, X = −∇U , cioè pe = e− ν , ci spinge a
cercare di risolvere 5
ν
∂p
+ div pX = ∆p
∂t
2
ponendo
S(t,x)
p(t, x) = e− ν
(Cole-Hopf)
La presenza di ν2 invece di ν è semplicemente dettata da un motivo tecnico: rendere
simmetrica una trasformata di Legendre che seguirà a tale impostazione.
5
69
e sostituendo nell’equazione di Fokker-Planck. Il risultato finale che inseguiamo in questa sezione è la costruzione di una teoria asintotica, per ν → 0,
delle soluzioni dei problemi di Cauchy per Fokker-Planck.
Otteniamo
S,t ∇S · X
∇S − S
ν
−S
−
−
+∇·X e ν = ∇· −
e ν
ν
ν
2
ν
S,t ∇S · X
ν
∆S |∇S|2 − S
−S
−
−
+∇·X e ν = ∇· −
+
e ν
ν
ν
2
ν
ν2
|∇S|2
ν
S,t +
+ ∇S · X − ν∇ · X = ∆S
2
2
supporremo che il campo vettoriale di drift sia solenoidale:
∇·X =0
cosı̀
ν
|∇S|2
+ ∇S · X = ∆S
(H-J con viscosità)
2
2
quest’ultima è un’equazione di Hamilton-Jacobi, con termine di viscosità
ν
∆S, di Hamiltoniana:
2
S,t +
1
H(x, p) = |p|2 + p · X(x)
2
Un semplice calcolo mostra che la funzione di Lagrange, correlata mediante
la trasformazione di Legendre ad H(x, p), è
1
L(x, ẋ) = |ẋ − X(x)|2
2
La formula di Lax-Oleinik6 , rappresentante le soluzioni di viscosità (che sono
Lipschitziane) del problema di Cauchy per l’equazione:
S,t +
|∇S|2
+ ∇S · X = 0
2
con dato iniziale:
S(0, x) = σ(x),
6
σ : Ω → R,
Vedi p.e. Albert Fathi, Weak KAM Theorem in Lagrangian Dynamics, Preliminary
Version
70
si scrive:
S(t, x) =
inf
x̄(·)∈C 1 ([0,t];Ω):x̄(t)=x
Z
σ(x̄(0) +
t
0
1
˙ ) − X(x̄(τ ))|2 dτ
|x̄(τ
2
Infine, pensando all’inversa della Cole-Hopf, otteniamo la formula asintotica rigorosa che cercavamo per p(t, x):
lim (−ν ln p(t, x)) =
ν→0
inf
x̄(·) ∈ C 1 ([0, t]; Ω) :
x̄(t) = x
Z
σ(x̄(0)) +
0
t
1
˙ ) − X(x̄(τ ))|2 dτ
|x̄(τ
2
(‘Grandi Deviazioni’)
per dato iniziale:
p(0, x) = e−
σ(x)
ν
Tale formula è la giustificazione rigorosa della rappresentazione approssimata asintotica che a volte si ritrova per p:
p(t, x) ≈ν→0
Z t
1
1
2
˙ ) − X(x̄(τ ))| dτ
inf
|x̄(τ
exp −
σ(x̄(0)) +
ν x̄(·) ∈ C 1 : x̄(t) = x
0 2
71
Capitolo 6
Serie di Fourier ed equazione
del calore: la diffusione
6.1
Euristica: Teorema di rappresentazione
di vettori negli spazi finito-dimensionale
Consideriamo Rn dotato del prodotto scalare euclideo
h·, ·i : Rn × Rn −→ R
hu, vi =
n
X
ui vj δij =
i,j=1
n
X
ui vi = u · v
i=1
In tale struttura vettoriale si considera la base naturale orto-normale di vettori generante tutto lo spazio: si scrive {ei }i=1,...,n , ei = (0, . . . 0, 1, . . . 0) con
{z
}
|
1 è nell’i-esimo posto
la proprietà (detta, appunto, di orto-normalità):
hei , ej i = δij
Vale il seguente teorema di rappresentazione per ogni vettore generico u
di Rn nella base {ei }i=1,...,n :
u=
n
X
hu, ei iei
(∗)
i=1
In altri termini: il prodotto scalare di u con ei è esattamente la componente
i-esima del vettore u, lungo il vettore ei della base {ej }j=1,...,n .
72
La validità della (∗) va al di là della scelta ovvia della base sopra scritta:
per ogni altro1 prodotto scalare hu, vi, e per ogni altra scelta di base {Ei }i=,...,n
ortonormale rispetto a quel prodotto scalare, cioè
hEi , Ej i = δij ,
vale ancora
u=
n
X
hu, Ei iEi
(∗∗)
i=1
Si ricordi infine che con un prodotto scalare si introduce in modo naturale
una norma:
p
|u| := hu, ui
Tale ordine di idee vorremmo estenderlo a spazi infinito-dimensionali coinvolgenti oggetti (funzioni, curve,...) che intervengono nelle equazioni differenziali.
6.2
Lo spazio delle funzioni L2([0, T ]; C)
Consideriamo l’insieme delle funzioni definite su di un intervallo [0, T ] della
retta reale e possibilmente a valori nei numeri complessi C. Per il momento
non ci impegnamo ancora su di una classe di regolarità richiesta: sarà la
teoria via via evolventesi che guiderà la scelta. Una prima cosa da osservare
è che tale insieme si atteggia naturalmente a C-spazio vettoriale, nel senso
che combinazioni di funzioni, con coeff. complessi, è ancora una funzione del
tipo considerato.
Indichiamo al solito con z̄ := x − iy il complesso coniugato di z = x + iy
e introduciamo il seguente (candidato) prodotto scalare:
Z
1 T
f (x)ḡ(x)dx
(?)
hf, gi :=
T 0
La norma che tale pr. scalare introduce2
Z
Z
i
1 T
1 Th
2
¯
||f ||L2 := hf, f i =
f (x)f (x)dx =
Re{f (x)}2 + Im{f (x)}2 dx
T 0
T 0
La presenza di T1 serve per poter affermare, come appare naturale, che la
norma della funzione f ≡ 1 sia uguale ad 1.
P
1
Pper es., hu v i := ij aij ui vj , dove aij è una matrice (simmetrica) definita positiva:
ij aij λi λj > 0 ∀λ 6= (0, . . . , 0).
2
Si ricordi che z z̄ = (x + iy)(x − iy) = x2 + y 2 .
73
Infine, vorremmo affermare3 che f è in L2 ([0, T ], C) se
||f ||L2 < +∞
Ma tale definizione ha un grave difetto. Se infatti modifichiamo la funzione
f in un insieme finito di punti, o meglio in un insieme di punti isolati4 ,
costruendo cosı̀ una nuova funzione f 0 , si ha che (l’integrale non li ‘vede’)
||f ||2L2 = ||f 0 ||2L2
e questo pregiudica la possibilità di usare tale prodotto scalare come norma,
infatti:
||f − f 0 ||2L2 = 0,
ma f 6= f 0
Questo problema si risolve affermando che gli oggetti del nostro spazio sono
non tanto delle funzioni ma delle ‘classi di equivalenza’ di funzioni, dove la
relazione di equivalenza è esattamente questa:
Z
1 T
0
|f (x) − f 0 (x)|2 dx = 0
f ∼f
se e solo se
T 0
Dunque, quando diciamo che una ‘funzione’ è in L2 dobbiamo sempre pensare
ad una classe di equivalenza e non ad una funzione in senso standard. In altri
termine, una funzione in L2 non ha un significato puntuale.
Introduciamo una base ortonormale in L2 ([0, T ]; C):
n
o
i 2πk
x
iα
T
{Ek }k∈Z := x 7→ e
ricordare che e = cos α + i sin α
k∈Z
Mostriamo infatti che
hEk , Eh iL2 = δkh
hEk , Eh iL2 =
1
T
Z
0
T
ei
2π(k−h)
x
T
dx =





T
2π(k−h) 1
T
ei T x T i2π(k−h)
1,
= 0,
k 6= h
0
k=h
Otteniamo cosı̀ un teorema5 di rappresentazione per funzioni (classi di equivalenza) di L2 :
X
f (x) =
hf, Ek iL2 Ek (x),
k∈Z
3
o, se vogliamo, definire delle regole affinché una funzione-vettore f appartenga o meno
allo spazio L2 in costruzione.
4
più in generale, in un insieme di ‘misura nulla’ rispetto all’integrale di Lebesgue.
5
accettiamolo, l’abbiamo solo reso plausibile.
74
f (x) =
X
fk e i
2πk
x
T
(◦)
k∈Z
dove fk è la componente di f lungo il ‘vettore’ base ei
1
fk =
T
Z
T
f (x)e−i
2πk
x
T
2πk
x
T
: fk = hf, Ek iL2 ,
dx
(◦◦)
0
La serie (◦) è detta serie di Fourier della funzione f ∈ L2 .
Possiamo riscrivere la serie di Fourier mettendo in evidenza parte reale e
immaginaria:
f (x) = f0 +
X
2πk
2πk
x + i sin
x) =
T
T
fk (cos
k∈Z\0
= f0 +
X
fk (cos
k∈N
f (x) = Re(f0 ) +
X
2πk
2πk
2πk
2πk
f−k (cos
x + i sin
x) +
x − i sin
x),
T
T
T
T
k∈N
X
Re(fk + f−k ) cos
k∈N
X
2πk
2πk
x−
Im(fk − f−k ) sin
x+
T
T
k∈N
n
X
X
2πk
2πk o
Im(fk + f−k ) cos
Re(fk − f−k ) sin
+i Im(f0 ) +
x+
x
T
T
k∈N
k∈N
Le quattro successioni reali in N sopra coinvolte sono indipendenti e pertanto
possiamo riscrivere
f (x) = a0 +
X
k∈N
ak cos
X
2πk
2πk
x+
bk sin
x+
T
T
k∈N
n
X
X
2πk
2πk o
+i b0 +
Ak cos
x+
Bk sin
x
T
T
k∈N
k∈N
ove ak , bk , Ak , Bk sono reali. Supponiamo che f sia reale, allora
Z
Z
1 T
1 T
2πk
2πk
−i 2πk
x
f (x)e T dx =
f (x)(cos
x − i sin
x)dx
k ∈ N : fk =
T 0
T 0
T
T
Z
Z
1 T
1 T
2πk
2πk
i 2πk
x
T
k ∈ N : f−k =
f (x)e
dx =
f (x)(cos
x + i sin
x)dx
T 0
T 0
T
T
Z
2 T
2πk
ak = Re(fk + f−k ) =
f (x) cos
x dx
T 0
T
75
analogamente
2
bk = Im(f−k − fk ) =
T
Z
T
f (x) sin
0
2πk
x dx
T
Si noti inoltre che (◦) vale su tutta la retta reale e dunque tale formula
estende per periodicità, con periodo T , una funzione f , definita solo su [0, T ],
ad una funzione periodica definita su tutta la retta R.
6.2.1
Serie di soli coseni (o di soli seni)
Consideriamo ora, sempre pensando a serie di Fourier di funzioni reali, la
seguente nuova rappresentazione (sarà utile poi nell’applicazione all’equazione del calore): data una funzione f : [0, T ] → R estendiamone per parità la
definizione nell’intervallo [−T, T ], questo significa che definiamo
∀x ∈ [−T, 0] :
f (x) := f (−x)
La funzione in [−T, T ] che cosı̀ otteniamo continueremo a chiamarla f ed è
pari 6 per ovvia costruzione. Essendo il periodo/intervallo uguale a 2T , essa
sarà rappresentata da
X
X
πk
πk
Bk sin
x+
x
x ∈ [−T, T ]
Ak cos
f (x) = A0 +
T
T
k∈N
k∈N
e i coefficienti Ak e Bk si ottengono nel solito modo, p.e.
Z
1 T
πk
Bk =
f (x) sin
x dx
T −T
T
ma f è pari, sin πk
x è dispari, e cosi’ infine la funzione integranda f (x) sin πk
x
T
T
è dispari, questo basta per dire che l’integrale è nullo, ∀k ∈ N: Bk = 0. In
definitiva, abbiamo costruito una rappresentazione di f usando solo i coseni:
X
πk
f (x) = A0 +
Ak cos
x
(†)
T
k∈N
Notiamo subito che se la serie dei termini derivati converge alla derivata di
f ∈ C 1 ([−T, T ]; R), cioè se
X πk
df
πk
(x) = −
Ak sin
x,
dx
T
T
k∈N
6
appunto: f (−x) = f (x), es.: f (x) = cos x; si dice invece dispari una funzione in
[−T, T ] per cui f (−x) = −f (x), es.: f (x) = sin x.
76
allora necessariamente
df
df
(0) = 0 =
(T )
dx
dx
Vedremo tra poco la forte utilità d’uso di tali serie di soli coseni per il
problema al bordo che studieremo per l’equazione del calore.
Esercizio: estendere per disparità in [−T, T ] funzioni f inizialmente definite in [0, T ], introducendo cosı̀ serie di soli seni. Constatare che tali serie
sono le più opportune per rappresentare funzioni che sono nulle nel bordo di
[0, T ].
6.2.2
Qualche teorema e stima
Abbozziamo una semplice (parziale) classificazione delle funzioni che ammettono una rappresentazione in serie di Fourier.
(i) Le funzioni analitiche, cioè le funzioni la cui serie di Taylor converge
alla funzione stessa, ammettono rappresentazione in serie di Fourier dove
vale, per qualche C > 0 e σ > 0, la seguente stima sui coefficienti di Fourier:
|fk | ≤ C e−σ|k|
(ii) Le funzioni C s , per esse vale
|fk | ≤
C
|k|s+1
(iii) Le funzioni C 1 a ‘tratti’, cioè con un numero finito di discontinuità
(a salto finito) sia nella funzione sia nella derivata, per esse vale la rappresentazione in serie di Fourier in [0, T ], e, sebbene possa essere che f (0) 6= f (T ),
la serie di Fourier esiste e converge su tutto R: nei punti nT ∈ R, n ∈ Z,
(T )
essa converge a f (0)+f
; tale comportamento di convergenza sussiste in ogni
2
altro punto x0 di discontinuità della f in studio: la serie converge a
limx→x−0 f (x) + limx→x+0 f (x)
2
6.3
6.3.1
Equazione del calore
Una (rapida) deduzione dell’equazione del calore
Consideriamo una sbarretta metallica [0, L] e supponiamo che nelle estremità
la temperatura θ (> 0) possa pure cambiare, ma in modo che non sussistano ‘scambi energetici’ con l’esterno della sbarretta (condizioni di isolamento
77
adiabatico). Assumeremo che l’energia interna della sbarretta sia descritta
da una densità di energia (per unità di lunghezza) che dipende linearmente
dalla temperatura θ,
E = Ẽ(θ) = c θ
(c > 0)
(densita0 d0 energia)
Suo significato fisico: per ogni fissato x, il contenuto energetico della sbarretta, localmente a x, è tanto più elevato quanto più alta è la temperatura.
L’energia sotto forma di calore si diffonde, fluisce nella sbarretta, e si
ammette che il flusso7 di energia q in transito, da sn a dx, nel punto x della
sbarretta, sia dato da
q(t, x) = −K
∂θ
(t, x)
∂x
(K > 0)
(f lusso di energia − calore)
Suo significato fisico: per ogni fissato x, il calore fluisce dalle regioni ‘calde’
immediatamente vicine a x a quelle più ‘fredde’.
(Le costanti c, K > 0 sono, come si usa dire, costitutive, fenomenologiche,
dipendono dal materiale che stiamo considerando.)
Infine, stabiliamo il generale bilancio dell’energia (è una legge di conservazione) riferito ad un qualsiasi pezzo di sbarretta tra x1 e x2 , 0 ≤ x1 < x2 ≤ L:
diremo che nel pezzetto di sbarretta [x1 , x2 ] la variazione di energia per
unità di tempo è precisamente data dal bilancio del flusso di energia-calore
transitante alle sue estremità8 :
Z
d x2
Ẽ(θ(t, x)) dx = q(t, x1 ) − q(t, x2 )
(bilancio energia)
dt x1
E dunque:
Z
x2
∂θ
∂θ
∂θ
(t, x)) dx = K( (t, x2 ) −
(t, x1 ))
∂t
∂x
∂x
x1
Z x2
Z x2 2
∂θ
∂ θ
(t, x) dx
c (t, x)) dx = K
2
∂t
x1 ∂x
x1
c
posto χ :=
K
,
c
x2
i
∂ 2θ
(t,
x)
dx = 0
∀x1 , x2 ∈ [0, L]
(?)
∂t
∂x2
x1
i
h
d2 θ
affermiamo che ∂θ
(t,
x)−χ
(t,
x)
= 0: infatti, se per assurdo cosı̀ non fos2
∂t
dx
h
i
∂θ
d2 θ
∗
∗
∗
se, allora esisterebbe un (qualche) punto x per cui ∂t (t, x )−χ dx2 (t, x ) 6=
Z
7
8
h ∂θ
(t, x) − χ
è un’energia per unità di tempo
naturalmente la sbarretta è dentro una guaina termicamente isolante
78
h
0, per esempio sia > 0, allora, supposta la continuità della funzione ∂θ
(t, x)−
∂t
i
d2 θ
χ dx
2 (t, x) rispetto a x, per il teorema della permanenza del segno esisterebbe
i
h
d2 θ
(t,
x)
−
χ
(t,
x)
> 0;
un intervallo (piccolo) [a, b] contenente x∗ in cui ∂θ
∂t
dx2
ma in tal caso si avrebbe
Z bh
i
∂θ
d2 θ
(t, x) − χ 2 (t, x) dx > 0
∂t
dx
a
contro l’affermazione (?) prima dimostrata.
∂θ
))
Le ipotesi costitutive sul materiale in studio (la legge Ẽ(θ) e la legge q( ∂x
ci hanno condotto ad affermare che il bilancio energetico è equivalente alla
equazione alle derivate parziali:
∂θ
∂ 2θ
(t, x) = χ 2 (t, x)
∂t
∂x
6.3.2
(χ > 0)
(Equazione del calore)
Soluzione dell’equazioni del calore con le serie di
Fourier
La condizione condizione di flusso q nullo sul bordo x = 0 e x = L si scrivono
ora:
∂θ
∂θ
(t, 0) = 0 =
(t, L) ∀t ∈ [0, +∞)
∂x
∂x
(CB : Condizioni al bordo)
Oltre alle condizioni al bordo sopra scritte, dette anche condizioni di
Neumann, dobbiamo considerare le seguenti condizioni iniziali; in sostanza,
supponiamo che al tempo iniziale t = 0 la sbarretta abbia un certo ‘profilo’
assegnato di temperature θ(0) (x) ed esso ammetta una rappresentazione di
Fourier:
X (0) 2πk
θk ei L x
∀x ∈ [0, L]
θ(0, x) = θ(0) (x) =
k∈Z
(CI : Condizioni iniziali)
A questo punto il criterio di ricerca di soluzioni ci è offerto dall’ambiente funzionale appena costruito: ricercheremo una soluzione θ(t, x) che sia
rappresentabile come serie di Fourier rispetto alla variabile spaziale x ∈ [0, L],
X
2πk
θ(t, x) =
θk (t)ei L x
k∈Z
Dato che il nostro campo incognito è reale (temperatura), useremo le rappresentazioni reali sopra viste: osserviamo subito che date le condizioni al bordo
79
che la nostra soluzione θ(t, x) deve soddisfare è utile usare la rappresentazione in soli coseni. Infatti, dato che la nostra θ(t, x) deve avere derivata nulla
rispetto ad x in x = 0 e x = L, si vede bene che la sua estensione per parità
all’intervallo [−L, L] è una funzione con la derivata rispetto ad x continua e
la serie dei soli coseni sopra studiata ammette automaticamente tal proprietà
di bordo CB auspicata. Dunque:
θ(t, x) = a0 (t) +
X
ak (t) cos
k∈N
CI
(0)
: θ(0, x) = θ(0) (x) = a0 +
CB :
P
πk
x
L
(∗)
(0)
k∈N
ak cos πk
x
L
automaticamente soddisfatte
x
Inserendo la (∗) nell’equazione del calore, ricordando che le funzioni cos πk
L
sono tutte indipendenti tra loro, componente per componente otteniamo le
infinite equazioni differenziali ordinarie separate9 del primo ordine, ∀k ∈ N:
(0)
ȧ0 (t) = 0 :
a0 (t) = a0
πk 2
πk 2
(0)
ȧk (t) = −χ ak (t) :
ak (t) = ak e−χ| L | t
L
Riassumendo:
X
πn −χ| πn |2 t
(0)
a(0)
x e L
θ(t, x) = a0 +
n cos
L
n∈N
(Soluzione)
Infine, si osserva il comportamento asintotico nel tempo del profilo della
temperatura: esso tende spazialmente ad uniformizzarsi sul valor medio del
profilo delle temperature iniziali, è il fenomeno della ‘termalizzazione’:
Z L
Z
1 L (0)
1
(0)
(0)
θ (x)dx =
θ (x)dx.
lim θ(t, x) = a0 =
t→+∞
2L −L
L 0
6.3.3
Equazione di Diffusione
L’equazione del calore sopra scritta si può interpretare (ed usare) per lo studio
di processi generali di diffusione. Si pensi ad un tubicino 1-dimensionale [0, L]
di solvente in cui si introduce al tempo t = 0 un piccola macchia di soluto
9
cioè, ogni k-equazione coinvolge solo la k-componente di θ. Sono equazioni del tipo:
ẋ = ax, lo spazio vettoriale delle soluzioni di tale equazione lineare è 1-dimensionale e per
costuire la base si prova con x(t) = eλt , si vede subito che λ = a e l’integrale generale è:
x(t, c) = ceat .
80
di densità µ(0) (x) ≥ 0. Questo vuol dire che la quantità totale di massa di
soluto al tempo t = 0 (ma vorremmo che sia tale anche per ogni altro tempo
t > 0!) vale:
Z L
m=
µ(0) (x) dx
0
µ(0) (x) =
1
L
Z
L
µ(0) (x)dx +
0
X
a(0)
n cos
n∈N
2πn 2πn X (0)
x +
x
bn sin
L
L
n∈N
Considerazioni fisiche conducono alla seguente equazione di diffusione spaziotemporale del soluto nel solvente (Equazione della diffusione):
∂µ
∂ 2µ
(t, x) = D 2 (t, x)
∂t
∂x
(D > 0)
Se le estremità del tubicino sono chiuse, la soluzione dovrà soddisfare a condizioni al bordo analoghe a quelle sopra viste per la temperatura. La soluzione
sarà
Z
X
1 L (0)
πn −D| πn |2 t
L
(Soluzione)
µ(t, x) =
µ (x)dx +
a(0)
x e
n cos
L 0
L
n∈N
Si noti che vale quanto poco sopra auspicato: la massa di soluto ad ogni
istante t ≥ 0 è costante,
Z L
Z L
m(t) =
µ(t, x) dx =
µ(0) (x) dx = m(0)
0
0
poiché
Z
0
6.3.4
L
X
n∈N
a(0)
n cos
πn 2
πn x dx e−D| L | t = 0.
L
Effetto grotta-cantina
Pensiamo all’asse x come ad un asse puntante verso l’interno del suolo, x = 0:
la superficie terrestre.
∂ϑ
∂ 2ϑ
(x, t) = χ 2 (x, t)
∂t
∂ x
t ∈ [0, T ],
x≥0
con dato al bordo (x = 0) t-periodico:
ϑ(0, t) = ϑ(0) (t)
X (0) 2πk
ϑ(0) (t) =
ϑk ei T t
k∈Z
81
ϑ0 (t+T ) = ϑ0 (t)
cercheremo sol. con la stessa t-periodicità ϑ(x, t) =
X
ϑk (x)ei
2πk
t
T
k∈Z
2πk
2πk
∂2 X
∂ X
ϑk (x)ei T t = χ 2
ϑk (x)ei T t
∂t k∈Z
∂ x k∈Z
2πk
d2
ϑk (x) = χ 2 ϑk (x)
T
dx
s
2πk
ϑk = eλk x ⇒ λk +,− = ± i
χT
s
s
1
2πk
1
2π|k|
i
i
k>0:
λk +,− = ±( √ + √ )
k<0:
λk +,− = ±( √ − √ )
χT
χT
2
2
2
2
s
s
1
i
2π|k|
π|k|
∀k :
λk +,− = ±( √ −sgn(k) √ )
= ±(1−i sgn(k))
=: ±ck
χT
χT
2
2
∀k ∈ Z :
i
ϑk (x; αk , βk ) = αk eck x + βk e−ck x
X
2πk
(αk eck x + βk e−ck x ) ei T t
ϑ(x, t) =
|
{z
}
k∈Z
ϑk (x)
Per x = 0 otteniamo un’informazione che è insufficiente alla completa determinazione di una soluzione:
(0)
x=0:
αk +βk = ϑk
come determinare completamente i coeff. αk e βk ?
richiederemo che ||ϑ(·, ·)||∞ :=
|ϑ(x, t)| < +∞ :
sup
x≥0 t∈[0,T ]
1
ϑk (x) =
T
Z
T
ϑ(x, t)e−i
2πk
t
T
dt ⇒ |ϑk (x)| ≤ ||ϑ||∞ < +∞ ⇒ αk = 0, infatti:
0
q
|ϑk (x)| ≥ (|αk |e
π|k|
x
χT
−|βk |e
q
π|k|
− χT x
infine: ϑ(x, t) =
X
(0)
|ϑk (x)| < +∞ ⇔ αk = 0 , βk = ϑk
)
(0)
ϑk e−
q
π|k|
x
χT
q
π|k|
2π|k|
i sgn(k)( χT x+ T t)
e
k∈Z
Esempio:
ϑ(x, t) =
X
ϑk e−
(0)
q
π|k|
x
χT
q
ei sgn(k)(
π|k|
2π|k|
x+ T t)
χT
k∈Z
materiale “tipo suolo”: χ = 2 · 10−7 m2 /sec (...controllare...)
(0)
ϑ0 = 15 0 C,
(0)
ϑ1 = 20 0 C,
82
ϑ(0) (t) = 15 + 20 cos ωt,
dove ω =
2π
2π
=
≈ 2 · 10−7 sec−1
T
365
| · 24
{z· 3600}
un anno
r
π
≈
χT
r
10−7
≈ 0.7 m−1 ,
−7
2 · 10
2π|k| 2π
= ω = 2 · 10−7 sec−1
=
T k=1
T
ad una profondità di x = 4.5 m :
r
π
sfasamento temporale:
x = 0.7 · 4.5 ≈ π (scambio “stagionale”)
χT
fattore di smorzamento del termine oscillante: e−π ≈ 0.04
83
(temperatura quasi costante)
Capitolo 7
Riduzione finito-dimensionale
esatta in teoria dei campi
Sia Ω ⊂ Rn un dominio ‘Stokesiano’, tale cioè che per esso valga il teorema
di Stokes (p.e., frontiera C 1 a tratti) Vogliamo studiare il problema
• Per assegnata funzione non lineare F : R → R,
∆u
= εF (u)
(#)
u∂Ω = 0
dove
n
X
∂2
u
∆u :=
∂x2j
j=1
è l’operatore differenziale di Laplace, il Laplaciano.
Questo problema ammette formulazione variazionale1 :
H := {C ∞ (Ω̄; R) : u|∂Ω = 0} → R
Z h
Z u
i
1
2
J : u(·) 7→
|∇u| +
εF (λ)dλ dx
Ω 2
ū
Infatti:
dJ(u)h = 0 ∀h ∈ H se e solo se u risolve (#)
dJ(u(·))h(·) =
d
J(u(·) + ξh(·))|ξ=0 =
dξ
1
Il problema della scelta del più opportuno spazio funzionale non sarà certamente qui
affrontato: un’indagine accurata mostra che lo spazio più adatto è lo spazio di Sobolev
W 1,2 = H 1 .
84
dn
=
dξ
Z u(x)+ξh(x)
Z h
i o
1
2
εF (λ)dλ dx |ξ=0 =
|∇u(x) + ξ∇h(x)| +
ū
Ω 2
Z h
i
=
∇u(x) · ∇h(x) + εF (u(x))h(x) dx =
Ω
( rem : ∇ · u := div u, ∇ · ∇ = div grad = ∆)
Z h
i
∇ · (∇u(x) h(x)) − ∆u(x) h(x) + εF (u(x))h(x) dx =
=
Ω
Z
=
h
Z
(∇u(x) h(x) · n(x)ds −
[∆u(x) − εF (u(x))]h(x)dx.
∂Ω
Ω
sul bordo ∂Ω vale h = 0, dunque
Z
[∆u − εF (u)]hdx
dJ(u)h = −
Ω
e si conclude col lemma fondamentale del Calcolo delle Variazioni.
• Il problema degli autovalori del Laplaciano su di un dominio limitato Ω
(problema spettrale) è un ben noto, il Laplaciano è un classico esempio di
operatore ellittico:
−∆uj = λj uj ,
hui , uj iL2
1
=
meas(Ω)
Z
ui (x)uj (x)dx = δij ,
Ω
λ0 = 0 < λ1 ≤ λ2 ≤ ....
2
d
Esempio 1-dim: Ω = [0, L]: − dx
uj (x) =
2 uj = λj uj ,
2
e {uj }j∈N è una base di {L ([0, L]; R) : u(0) = 0 = u(L)},
λj =
πj
L
2
,
huj , uk iL2
2
=
L
Z
L
sin
0
√
2 sin
πj
πk
x sin
x dx = δjk
L
L
• Per ogni f ∈ L2 , il problema lineare (equazione di Poisson):
X uj
∆u
=f
è
risolto
da
:
g(f
)
=
−
hf, uj iL2
u∂Ω = 0
λ
j>0 j
85
πj
x
L
,
• Fissiamo: m ∈ N (cut-off). Per ogni u ∈ H,
X
µ := Pm u =
uj hu, uj iL2 ,
η := Qm u =
X
uj hu, uj iL2 ,
m<j<+∞
0<j≤m
H = Pm H ⊕ Qm H.
• Fissiamo: µ ∈ Pm H. Consideriamo la seguente mappa:
Qm H −→ H
η 7−→ g̃(η) := g(µ + η)
Questa mappa è Lipschitz con Lip(g̃) ≤
g̃(η2 ) − g̃(η1 ) = 1
:
λm+1
uj
1 η2 − η1 .
hη2 − η1 , uj iL2 ≤
λ
λm+1
m<j<+∞ j
X
• Ancora, per m ∈ N e µ ∈ Pm H fissati, consideriamo la nuova seguente
mappa
Qm H −→ Qm H
η 7−→ εQm F g(µ + η) .
Questa mappa, sotto l’ulteriore ipotesi su F ,
sup |F 0 (u)| = C < +∞,
u∈R
è una contrazione,
i) per piccole perturbazioni ε, oppure
ii) per convenientemente grande cut-off m:
εC
< 1.
λm+1
Infatti:
εC
|η2 − η1 |.
εQm F g(µ + η2 ) − εQm F g(µ + η1 ) ≤
λm+1
Banach-Caccioppoli: funzione punto fisso d(m, µ),
(∗)
d(m, µ) = εQm F g(µ + d(m, µ)) .
86
Se oltre a (∗), we consideriamo l’equazione finita per µ ∈ Pm H ∼
= Rm :
(∗∗)
µ = εPm F g(µ + d(m, µ)) .
Concretamente, in corrispondenza ad ogni soluzione µ di (∗∗), notiamo che,
sommando membro a membro (∗) e (∗∗), otteniamo una soluzione di
∆u = εF (u), u|∂Ω = 0, mediante la formula:
u = g(µ + d(m, µ)).
Il problema è ridotto, diventa finito-dimensionale.
Inoltre, per m ∈ N fissato, definita la funzione (generatrice)
W : Pm H ≈ Rm −→ R
µ 7−→ J ◦ g(µ + d(m, µ)),
essa (Teorema) genera esattamente tutte e sole le soluzioni del problema
di Dirichlet originale:
µ̄ è un punto critico di W , W 0 (µ̄) = 0,
se e solo se
ū è un punto critico di J, J 0 (ū) = 0, ove ū = g(µ̄ + d(m, µ̄)) .
Osservazioni:
• W è nota non appena si conosce la funzione punto fisso d(m, µ): questa
si determina mediante limite di una successione iterata (⇒ metodi numerici
approssimati).
•• Lo studio della topologia dei punti critici di una funzione finito-dimensionale, quale W , si può realizzare con tecniche alla Morse e LusternikSchnirelman.
• • • Questa tecnica, apparentemente simile alla riduzione di LyapunovSchmidt, mostra abbastanza facilmente la crescita gerarchica del numero delle
soluzioni all’aumentare del parametro variazionale ε:
εC
< 1,
λm+1
C = sup |F 0 |,
∆u = ε F (u).
[Quando il parametro variazionale ε cresce, bisogna utilizzare un numero via
via crescente m di autovalori dell’operatore ellittico lineare L; e dunque la
ricerca delle soluzioni va operata in spazi finito-dimensionali di dimensione
via via crescente.]
87
Teorema. Sia
sup |F 0 (u)| = C < +∞.
u∈R
Allora, per fissato ε > 0 e conseguentemente fissato m tale che ε < λm+1 /C,
i punti stazionari di W : Rm → R, producono esattamente i punti stazionari
di J.
Prova.
∂W
(µ)dµ = dJ(u)
dµ g(µ + d(m, µ)),
dW =
∂µ
u=g(µ+d(m,µ))
dW = h ∆u − εF (u) , dµ g(µ + d(m, µ))i,
u=g(µ+d(m,µ))
ora, dal ruolo operativo (definizione) del punto fisso d(m, µ) e dalla definizione della mappa g abbiamo
Qm µ + d(m, µ) − εF g(µ + d(m, µ)) = 0,
∆ g(µ + d(m, µ)) = µ + d(m, µ),
quindi:
Qm ∆u − εF (u) = 0.
u=g(µ+d(m,µ))
Pertanto
dW = hµ − εPm F (µ + d(m, µ)), Pm dµ g(µ + d(m, µ))i.
Da g(f ) = −
uj
j>0 λj hf, uj iL2 ,
P+∞
è facile vedere che
Pm dµ g(µ + d(m, µ)) = −
m
X
uj
j>0
λj
dµj ,
cosicché
dW = 0,
se e solo se
µ − εPm F (µ + d(m, µ)) = 0,
che è precisamente l’equazione finita (∗∗) caratterizzante le soluzioni µ.
Esercizio. Dimostrare che per piccoli ε, l’equazione non lineare finito
dimensionale µ − εPm F (µ + d(m, µ)) = 0, ammette soluzioni µ = µ̃(ε) con
µ̃(0) = 0. (Sugg.: usare il t. della funzione implicita, localmente a (ε∗ , µ∗ ) =
(0, 0))
88
Capitolo 8
Trasformata di Fourier e TAC
8.1
Euristica: dalle serie all’integrale di Fourier
Riconsideriamo la serie di Fourier di f su di un intervallo limitato di ampiezza
T , per convenienza, scegliamo [−T /2, T /2]:
X
2πk
(◦)
fk e i T x
f (x) =
k∈Z
dove fk è la componente di f lungo il ‘vettore’ base ei
Z
2πk
1 T /2
fk =
f (x)e−i T t dx
T −T /2
2πk
t
T
:
(◦◦)
Supponiamo ora di avere una funzione x 7→ f (x) definita su tutto l’asse reale,
con delle proprietà di integrabilità che via via preciseremo.
• L’idea è di indagare su cosa accade quando si fa tendere T → +∞.
Premessa tecnica/euristica: Consideriamo una funzione R 3 ξ 7→ g(ξ) ∈
R sommabile su R; per T grande, la seguente quantità qui sotto (nella sinistra) appare una approssimazione (‘somma di Riemann’ su intervalli (piccoli)
di ampiezza 1/T ) via via sempre più fedele dell’integrale qui sotto scritto
(nella destra):
Z +∞
X 1 k
g
≈T →+∞
g(ξ)dξ.
T T
−∞
k∈Z
Dunque, tornando alla rappresentazione di Fourier:
i 2πk
X h 1 Z T /2
−i 2πk
t
T
f (x) =
f (t)e
dt ei T x ,
T −T /2
k∈Z
89
Z
T /2
T → +∞ : f (x) =
X 1 2πk
ei T (x−t)
T
k∈Z
{z
}
|
f (t)
−T /2
dt =
qui si identifica: gt,x (ξ) := ei2πξ(x−t)
!
T /2
Z ξ=+∞
Z t=+∞
X1
k
f (t)
=
ei2πξ(x−t) dξ dt =
f (t)
gt,x
dξ dt =T →+∞
T
T
−T /2
ξ=−∞
t=−∞
k∈Z
Z ξ=+∞
Z t=+∞
f (t)e−i2πξt dt
ei2πξx dξ
=
ξ=−∞
| t=−∞ {z
}
Z
fˆ(ξ): fˆ è detta trasformata di Fourier di f
8.2
8.2.1
Trasformata di Fourier
Serie e Trasformate di Fourier multiple: rispettivamente in [0, T ]n e in Rn
Data una funzione
f : [0, T ]n → C,
x = (x1 , . . . , xn ) 7→ f (x) ∈ C
si introduce (estendendo) la rappresentazione in serie di Fourier multi-dimensionale:
f (x) =
X
2π
fk e i T
k·x
(k · x :=
k∈Zn
n
X
k j xj )
j=1
dove ora le componenti di Fourier sono date da
Z
2π
1
fk = n
f (x)e−i T k·x dx
T [0,T ]n
Analogamente, per funzioni f : Rn → R, velocemente decrescenti all’infinito
(come nel caso 1-dim, si veda subito qui sotto), si definisce la trasformata di
Fourier
Z
ˆ
f (ξ) :=
f (x)e−i2πξ·x dx,
fˆ : Rn → C
x∈Rn
cosicché vale la rappresentazione
Z
f (x) =
fˆ(x)ei2πξ·x dξ
ξ∈Rn
90
8.2.2
Generalità analitiche & topologiche
La Trasformata di Fourier in Rn agisce ‘naturalmente’ in uno spazio di funzioni C ∞ molto decrescenti all’infinito, assieme alle loro derivate, più di qualunque inverso di polinomio, di ogni grado. Tale spazio di funzioni è detto di
Schwartz S(Rn ; R): f ∈ S(Rn ; R) se e solo se, per ogni k, m ∈ N e per ogni
h1 + h2 + · · · = k, esistono costanti Ck,m > 0 per cui
1
∂k
f
(x)
≤
C
k,m
h
h
∂ 1 x1 ∂ 2 x2 ....
1 + |x|m
La trasformata di Fourier è cosı̀ definita
fˆ(ξ) = F(f )(ξ) =
n
∀f ∈ S(R ; R) :
Z
f (x)e−i2πξ·x dx
x∈Rn
Si verifica che
F :S→S
Denotiamo con ∗ la convoluzione in S:
Z
f (x − y)g(y)dy
(f ∗ g)(x) :=
y∈Rn
Valgono:
||fˆ||L2 = ||f ||L2
\
(f
∗ g)(ξ) = fˆ(ξ) ĝ(ξ)
F è unitaria
F è un morf. d’alg. : F : (S, ∗) → (S, ·)
L’Anti-trasformata è, ∀fˆ ∈ S:
F
−1
(fˆ)(x) =
Z
fˆ(ξ)ei2πξ·x dξ
ξ∈Rn
E vale la fondamentale Formula di inversione:
F −1 ◦ F = idS(Rn ;R)
Z
Z
−1
(F ◦ Ff )(x) =
f (y)e−i2πξ·y dy ei2πξ·x dξ =
ξ∈Rn
Z
=
y∈Rn
Z
ei2πξ·(x−y) dξ f (y)dy = f (x)
n
y∈Rn
| ξ∈R {z
}
:=δ(y−x)
91
da cui una rappresentazione del (funzionale) δ di Dirac:
Z
δ(y − x)f (y)dy = f (x)
y∈Rn
Le funzioni regolari a supporto compatto Cc∞ (Rn ; R) sono evidentemente un
sottoinsieme di S(Rn ; R), e poiché Cc0 (Rn ; R) è denso in L2 (Rn ; R), si trae che
S(Rn ; R) è denso in L2 (Rn ; R). Inoltre l’isomorfismo (cioè, lineare e biiettivo)
F : S→S è un omeomorfismo ove pensiamo alla topologia della struttura di
Frechet indotta su S dalle costanti Ck,m .
8.3
Tomografia Assiale Computerizzata
8.3.1
Teorema di invarianza per rotazioni di F
Sia
f : R2 → R
(x1 , x2 ) 7→ f (x1 , x2 ) ∈ R
una funzione definita in R2 con un fissato sistema cartesiano (x1 , x2 ). Consideriamo un nuovo sistema (x̃1 , x̃2 ), con ugual origine, ottenuto dal precedente
mediante una rotazione degli assi di un angolo Θ in senso anti-orario,
x1
cos Θ − sin Θ
x̃1
x = R(Θ)x̃
in dettaglio:
=
x2
sin Θ cos Θ
x̃2
Si osserva che R(Θ) è una matrice di rotazione (
cambiare righe con colonne: ATij = Aji ),
R(Θ)T R(Θ) = 1,
cioè R−1 = RT
T
denota la ‘trasposizione’,
e det R(Θ) = +1.
Denotiamo con fΘ , fΘ (x̃), la nuova rappresentazione della stessa funzione
f, f (x), nel sistema ruotato:
fΘ (·) := f (R(Θ)·),
fΘ (x̃) := f (R(Θ)x̃)
e consideriamo la medesima rotazione anche nello spazio (il piano R2 ) degli
impulsi (forme) ξ,
ξ = R(Θ)ξ˜
Teorema (d’invarianza) Sulla base della costruzione sopra indicata, vale:
˜ = fˆ(R(Θ)ξ)
˜
fˆΘ (ξ)
92
In altre parole: la trasformata ˆ di Fourier della funzione rappresentata nel sistema ruotato, fΘ , è esattamente la trasformata
di Fourier della
˜
rappresentazione originale di f , valutata in ξ = R(Θ)ξ.
Prova. Qui n = 2,
˜ =
fˆΘ (ξ)
Z
f (R(Θ)x̃)e−i2πξ̃·x̃ dx̃
x̃∈Rn
realizziamo il cambio di variabili d’integrazione x = R(Θ)x̃,
Z
T
ˆ
˜
fΘ (ξ) =
f (x)e−i2πξ̃·R(Θ) x | det R| dx =
x∈Rn
vale: ξ˜ · R(Θ)T x = R(Θ)ξ˜ · x,
Z
˜
f (x)e−i2πR(Θ)ξ̃·x dx = fˆ(R(Θ)ξ)
=
x∈Rn
8.3.2
TAC: ricostruzione della densità
Siamo ora interessati (sarà chiaro il motivo tra poco) al calcolo della trasformata di Fourier, nel sistema Θ-ruotato, valutata per vettori-impulsi del
seguente tipo: sono solo sull’asse delle ascisse ruotato, cioè per impulsi del
tipo
ξ˜ = (ξ˜1 , ξ˜2 ) = (R, 0)
Si osservi che
per
− ∞ < R < +∞
R cos Θ
cos Θ − sin Θ
R
=
sin Θ cos Θ
0
R sin Θ
{z
} | {z }
| {z } |
R(Θ)
ξ
ξ̃
Il teorema di invarianza ci dice che
ξˆ = (R, 0) :
˜ = fˆΘ ((R, 0)) = fˆ(R(Θ)(R, 0)) = fˆ(R cos Θ, R sin Θ)
fˆΘ (ξ)
(?)
D’altra parte, mediante la definizione diretta di trasformata, tale quantità si
scrive pure nel seguente modo:
Z
ˆ
fΘ ((R, 0)) =
fΘ (x̃)e−i2π(R x̃1 +0·x̃2 ) dx̃1 dx̃2 =
x̃∈R2
93
Z
hZ
=
x̃1 ∈R
i
fΘ (x̃1 , x̃2 )dx̃2 e−i2πR x̃1 dx̃1
x̃2 ∈R
Ecco un punto importante: nell’espressione (?) interpretiamo

ξ1 = R cos Θ

ξ2 = R sin Θ
R ∈ (−∞, +∞),
Θ ∈ [0, π)
come alla rappresentazione del piano (non ruotato) dei vettori impulsi (ξ1 , ξ2 )
in coordinate Polari (R, Θ)!
Sia ora f (x1 , x2 ) ≥ 0, a supporto compatto, la densità superficiale di massa
(p.e. grammi/cm2 ) di una ‘fetta’ (slide) di un corpo 3-dim. B ottenuta (matematicamente) intersecando B con un ben preciso e fissato piano. La TAC
si propone di ricostruire la densità f mediante misure opportune sulla slide;
più precisamente, per ogni fissato angolo Θ vengono emessi raggi X parallelamente all’asse (Θ-ruotato) x̃2 e, per ogni fissato x̃1 , su di uno schermo
(ortogonale a x̃2 ), si rileva quando complessivamente è densa la materia dello
slide percorsa da tale radiazione, in sostanza si misura su di uno schermo la
quantità:
Z
fΘ (x̃1 , x̃2 ) dx̃2
PΘ (x̃1 ) :=
x̃2 ∈R
che
h èi esattamente l’espressione sopra scritta entro le parentesi quadrate
. . . . Poi, si cambia Θ, si rifanno le analoghe misure, ecc.
Procediamo infine da queste informazioni, avendo misurato PΘ (x̃1 ) per
ogni Θ ∈ [0, π), nel ricostruire f (x1 , x2 ) mediante la formula dell’anti-trasformata:
Z
f (x1 , x2 ) =
fˆ(ξ1 , ξ2 )ei2πξ·x dξ,
(ξ1 ,ξ2 )∈R2
usiamo la rappresentazione in coordinate polari sopra introdotte per il piano
(non ruotato) delle (ξ1 , ξ2 ),
f (x1 , x2 ) =
Z
Z
i2π R cos Θ x1 +R sin Θ x2
ˆ
=
f (R cos Θ, R sin Θ)e
|R| dR dΘ,
R∈(−∞,+∞)
Θ∈[0,π)
abbiamo
poco sopra interpretato il termine fˆ(R cos Θ, R sin Θ) come
R
P (x̃ )e−i2πR x̃1 dx̃1 , cosı̀ infine:
x̃1 ∈R Θ 1
f (x1 , x2 ) =
94
Z
=
Z
nZ
−i2πR x̃1
PΘ (x̃1 )e
o
dx̃1 ei2π
x1 R cos Θ+x2 R sin Θ
|R| dR dΘ,
Schema sintetico di acquisizione dati
R∈(−∞,+∞)
Θ∈[0,π)
x̃1
la funzione integranda è nota, PΘ (x̃1 ) è dedotta da misure sperimentali,
dunque possiamo infine realizzare il calcolo e ottenere esattamente f (x1 , x2 ).
Il calcolo
ora esposto
è undi
esempio
cosiddetta
trasformata
Sia K una
sezione
piana
C, didella
densit
à f (x,
y). di Radon.
Paolo Dulio, Politecnico di Milano
Seminario di cultura matematica
95
Programma di Modelli
Fisico-Matematici: 2012/13
Parte svolta da F. Cardin:
• Metodo delle Caratteristiche: Cap. 1.
• Ottica Ondulatoria asintotica elementare e Ottica Geometrica: Cap. 2.
Della deduzione dell’equazione iconale è sufficiente sapere le premesse, cioè
le equ. di Maxwell e le ipotesi di struttura sulla soluzione asintotica che si
ricerca.
• Propagazione per Onde nei Sistemi di PDE di Leggi di Bilancio: Cap.
3, tranne 3.2.
• Cap. 4 (Friedrichs - Lax - Godounov - Boillat): No.
• Cap. 5: Dal 5.4 compreso, tutto, tranne il 5.7.4.
• Serie di Fourier ed equazione del calore: Cap. 6, tutto (Grotta-cantina:
leggere).
• Riduzione finito-dimensionale esatta in teoria dei campi: Cap. 7, tutto.
• Cap. 8 (Tr. di Fourier e TAC).
96
Fly UP