Metodi di stima per il filtraggio e l`identificazione dei sistemi

by user

on 06-07-2016

Category: Documents

>> Downloads: 11

views

Report

Comments

Description

Download Metodi di stima per il filtraggio e l`identificazione dei sistemi

Transcript

Metodi di stima per il filtraggio e l`identificazione dei sistemi

Carlo Bruni
Claudia Ferrone
Metodi di stima
per il filtraggio
e l’identificazione
dei sistemi
Copyright © MMVIII
ARACNE editrice S.r.l.
www.aracneeditrice.it
[email protected]
via Raffaele Garofalo, 133 A/B
00173 Roma
(06) 93781065
ISBN
978–88–548–2273–3
I diritti di traduzione, di memorizzazione elettronica,
di riproduzione e di adattamento anche parziale,
con qualsiasi mezzo, sono riservati per tutti i Paesi.
Non sono assolutamente consentite le fotocopie
senza il permesso scritto dell’Editore.
I edizione: dicembre 2008
Indice
Introduzione ........................................................................................7
1. Elementi di teoria della stima ....................................................13
1.1
Introduzione .........................................................................13
1.2
Problema di stima statico .....................................................14
1.3
Problema di stima dinamico.................................................25
1.4
Proprietà degli stimatori.......................................................35
1.5
Limite inferiore di Cramer Rao............................................40
2. Stimatori ottimi ...........................................................................73
2.1
Introduzione .........................................................................73
2.2
Stimatori dei minimi quadrati e di Markov
per problemi lineari statici ...................................................76
2.3
Stimatori dei minimi quadrati e di Markov
per problemi lineari dinamici............................................114
2.4
Stimatore di massima verosimiglianza ..............................138
2.5
Stimatori di Bayes ..............................................................212
3. Stima dello stato di un sistema dinamico lineare:
problema di Kalman .................................................................271
3.1
Formulazione generale del problema.................................271
3.2
Filtro di Kalman .................................................................275
3.3
Predittore di Kalman ..........................................................289
3.4
Interpolatore di Kalman .....................................................292
3.5
Problema di filtraggio stazionario e soluzione di regime ..321
3.6
Filtraggio ottimo con rumori di ingresso
e di misura correlati............................................................366
3.7
Linearizzazione di problemi di filtraggio non lineari:
il filtro di Kalman esteso....................................................372
4. Identificazione parametrica di sistemi
lineari stazionari........................................................................393
4.1
Introduzione .......................................................................393
5
Indice
6
4.2
4.2.1
4.2.2
4.2.3
4.3
4.3.1
4.3.2
4.3.3
4.3.4
4.3.5
4.4
4.4.1
4.4.2
Metodi classici di identificazione mediante
l’uso di segnali di prova .................................................... 397
Identificazione dei campioni della risposta impulsiva
mediante segnale di prova impulsivo ................................ 397
Identificazione dei campioni della risposta armonica
mediante segnale di prova sinusoidale.............................. 406
Identificazione dei campioni della risposta impulsiva
mediante rumore di prova: equazione di Wiener Hopf ..... 415
Identificazione durante il normale funzionamento
con ingresso deterministico noto ...................................... 417
Identificazione dei campioni della risposta impulsiva ...... 418
Identificazione dei parametri della risposta impulsiva ..... 426
Identificazione dei coefficienti del modello
ingresso-uscita................................................................... 433
Identificazione dei coefficienti del modello
ingresso-stato- uscita......................................................... 447
Identificazione dello stato e dei parametri
di un modello non lineare.................................................. 467
Identificazione durante il normale funzionamento
con ingresso stocastico ...................................................... 470
Identificazione dei coefficienti del modello
ingresso-stato -uscita......................................................... 471
Identificazione dei coefficienti del modello
ingresso-uscita ARMA ....................................................... 481
Appendice: Elementi di Teoria della Probabilità ....................... 499
A.1 Modello probabilistico: spazio di probabilità.................... 499
A.2 Variabile aleatoria. Funzione di distribuzione
e densità di probabilità....................................................... 501
A.3 Valore medio e matrice di covarianza ............................... 506
A.4 Densità di probabilità congiunta e marginale .................... 511
A.5 Condizionamento statistico................................................ 515
A.6 Indipendenza statistica....................................................... 523
A.7 Sequenze aleatorie e convergenza stocastica..................... 525
Indice analitico................................................................................ 531
Bibliografia...................................................................................... 535
1. Elementi di teoria della stima:
definizioni e proprietà generali
1.1 Introduzione
Il problema della stima consiste nella individuazione delle operazioni da effettuare sui risultati di una serie di misure allo scopo di attribuire un valore a un insieme di parametri incogniti i quali influenzano l’esito delle misure stesse. Poiché le operazioni di misura introducono inevitabilmente incertezze (errori di misura, rumori), le operazioni che costituiscono la procedura di stima debbono tenere in conto
le informazioni di carattere statistico disponibili che caratterizzano tali
incertezze. In alcuni casi anche i parametri incogniti possono avere
una interpretazione di tipo statistico, nel senso che sono disponibili a
priori informazioni relative ai valori che essi possono assumere e alla
probabilità con cui tali valori sono assunti. In tal caso il procedimento
di stima dovrà anche incorporare in maniera opportuna queste ulteriori
informazioni.
La valenza applicativa della teoria della stima è vastissima: problemi di stima possono presentarsi nei contesti più disparati,
dall’ingegneria alla fisica, dall’economia alle scienze biologiche e
13
14
Capitolo 1
mediche e in definitiva in ogni possibile settore in cui la statistica applicata può esser utilizzata.
Verrà qui di seguito data una formulazione più precisa al problema di stima, distinguendo il caso in cui l’insieme dei parametri incogniti sia costante nel tempo da quello in cui esso sia variabile.
1.2 Problema di stima statico
Sia θ il vettore dei parametri incogniti a µ componenti, costante
nel tempo. Nel caso in cui non siano disponibili informazioni a priori
circa i valori ammissibili per tale vettore e circa le corrispondenti probabilità, esso deve essere considerato come un vettore deterministico
incognito variabile in ℝ µ . Nel caso in cui informazioni di tale tipo
siano disponibili, θ deve essere invece considerato come un vettore aleatorio e, come tale, deve essere caratterizzato mediante la relativa
densità di probabilità pθ o almeno mediante i corrispondenti momenti di ordine sufficientemente elevato (valore medio, matrice di covarianza). Procedure di stima che tengano conto di tali informazioni a
priori si dicono di tipo Bayesiano. Il primo dei due casi considerati
può essere concettualmente interpretato come limite del secondo, corrispondentemente al caso di un vettore aleatorio di distribuzione uniforme su un supporto che si estende a tutto lo spazio ℝ µ . Una situazione intermedia rispetto alle due precedentemente considerate è quella in cui sul vettore incognito siano presenti vincoli matematici di varia struttura, che tipicamente derivano dal significato fisico delle variabili che lo costituiscono, e che individuano un sottoinsieme
D ⊂ ℝ µ di valori per esso ammissibili. Tali vincoli, ove presenti, costituiscono concettualmente altrettante informazioni a priori sul vetto-
Elementi di teoria della stima
15
re incognito. In assenza di ulteriori informazioni relative alla densità
di probabilità dei valori di θ su tale insieme ammissibile sono possibili due approcci alternativi al problema di stima. Il vettore θ può essere
considerato come aleatorio, con una densità di probabilità uniforme
sul suo supporto che coincide con l’insieme ammissibile D e conseguentemente occorre utilizzare una procedura di stima di tipo Bayesiano. In alternativa il vettore può essere considerato di natura deterministica, tenendo conto dei vincoli presenti nella procedura di stima
adottata, come sarà meglio chiarito nel seguito.
Sul vettore dei parametri incogniti viene effettuata una serie di misure negli istanti discreti j = 1, 2,..k , corrotte da errori di misura
v ( j ) . L’equazione di misura assume in generale la forma:
z ( j ) = g (θ , v ( j ), j )
j = 1, 2,..k
dove z ( j ) è il vettore delle osservazioni effettuate nell’istante j, che
si suppone a dimensione q , mentre il rumore di misura v ( j ) è un
vettore aleatorio di dimensioni fissate e con densità di probabilità
p v ( j ) . Nella maggior parte dei problemi applicativi di interesse il rumore v( j ) figura in forma additiva nell’equazione di misura:
(1.1)
z ( j ) = g (θ , j ) + v( j )
j = 1, 2,..k
e in tal caso il problema di stima è in genere notevolmente più semplice da trattare. Nel seguito tale ipotesi semplificativa verrà sistematicamente assunta, riservando brevi cenni al caso più generale di non linearità dell’equazione di misura rispetto al relativo rumore. Si assumerà inoltre che la funzione g sia sufficientemente regolare rispetto a
θ e in particolare che essa sia derivabile per ogni j fissato. Una ulte-
Capitolo 1
16
riore ipotesi semplificativa, che verrà usualmente adottata, è quella relativa alla indipendenza statistica della sequenza aleatoria {v ( j )} .
In forma compatta le precedenti equazioni (1.1) possono essere riscritte come segue:
z ( k ) = g ( k ) (θ ) + v ( k )
(1.2)
dove
z (k )
 z (1) 
 z (2) 

=
 ⋮ 


 z (k ) 
 g (θ ,1) 
 g (θ , 2) 

g ( k ) (θ ) = 
 ⋮



 g (θ , k ) 
ν (k )
 v(1) 
 v(2) 

=
 ⋮ 


 v(k ) 
Si può a questo punto formulare il seguente problema di stima statico:
Problema 1.1 Considerata l’equazione di misura (1.2), definire una
funzione γ : ℝ kq → ℝ µ , che fornisca una stima θɶ|k del vettore incognito θ , utilizzando le misure disponibili fino all’istante k:
(1.3)
( )
θɶ|k = γ z ( k )
La funzione γ si definisce stimatore e θɶ|k è un vettore aleatorio essendo dipendente dalle misure che sono a loro volta aleatorie sia per
l’aleatorietà dei rumori v ( j ) , sia eventualmente per l’aleatorietà di θ.
⌣
Stima è più propriamente il vettore deterministico γ ( z ( k ) ) che fornisce
⌣
lo stimatore in corrispondenza al risultato effettivo delle misure z ( k ) .

Elementi di teoria della stima
17
Una interpretazione alternativa del problema di stima consiste nel
considerare θ come un vettore di parametri incogniti che caratterizza
la distribuzione statistica delle misure z ( j ) ; il problema di stima, in
tal senso, è quello di valutare la distribuzione statistica delle misure utilizzando il risultato delle misure stesse.
È ragionevole assumere che l’operazione di stima utilizzi tutte le
informazioni disponibili e quindi non soltanto quelle a posteriori (ri⌣
sultato delle misure z ( k ) ) ma anche quelle a priori (relative alla caratterizzazione statistica dei vettori v ( j ) , j=1,2,..k ed eventualmente di
θ). Pertanto lo stimatore γ sarà in genere dipendente anche da
quest’ultime informazioni.
Come già accennato, eventuali vincoli matematici per il vettore θ,
che definiscano un insieme ammissibile D ⊂ ℝ µ , possono essere trasferiti sulla stima cercata sia che si utilizzi un approccio Bayesiano
(assumendo D come supporto della densità di probabilità a priori pθ )
sia che si utilizzi una procedura di stima per variabili deterministiche
(imponendo esplicitamente che il risultato fornito dallo stimatore appartenga a D). Al fine di semplificare la procedura di stima è anche
possibile rinunciare a utilizzare l’informazione a priori costituita dai
vincoli, assumendo θ come vettore deterministico incognito che può
assumere valore su tutto ℝ µ . In tal caso i risultati ottenuti sono generalmente meno affidabili e non è garantito che la stima ottenuta soddisfi i vincoli. Tuttavia, se le misure sono sufficientemente precise e
numerose, è lecito aspettarsi che, con elevata probabilità, il risultato
fornito dallo stimatore soddisfi i vincoli o li violi in misura modesta.
Con riferimento al Problema 1.1, per la densità di probabilità delle
misure condizionata al vettore incognito θ, qualora esso sia di natura
stocastica, risulta:
18
Capitolo 1
pz ( k ) |θ ( ζ , θ ) = pv( k ) ( ζ − g ( k ) (θ )) ∀θ ∈ Ωθ
dove Ωθ ⊂ ℝ µ è il supporto della densità di probabilità a priori pθ .
Analogamente, se θ è di natura deterministica si ha:
pz ( k ) (ζ , θ ) = pv( k ) (ζ − g ( k ) (θ ))
∀θ ∈ D
Una proprietà importante ai fini della risolubilità del problema di stima considerato è che la p z ( k ) |θ o la pz( k ) sia sensibile alle variazioni di
θ in Ω θ o in D (o eventualmente in tutto ℝ µ se θ non è sottoposto a
vincoli). Si hanno in proposito le seguenti definizioni.
Definizione 1.2 Con riferimento al Problema 1.1, qualora θ sia di natura aleatoria, due vettori θ ', θ " ∈ Ωθ , con θ ' ≠ θ " , si dicono indistinguibili mediante k misure, qualora risulti:
pz ( k ) |θ (ζ , θ ′) = p z ( k ) |θ (ζ , θ ′′)
Analoga definizione vale qualora θ sia di natura deterministica e sia
caratterizzato da un insieme ammissibile D (eventualmente coincidente con ℝ µ ): in tal caso, considerati θ ' , θ " ∈ D con θ ' ≠ θ ′′ , essi si dicono indistinguibili mediante k misure, qualora risulti:
pz ( k ) (ζ , θ ′) = pz ( k ) (ζ , θ ′′)
In entrambi i casi, ricordando le precedenti espressioni di p z ( k ) |θ e di
pz( k ) , si può affermare che θ ' e θ ′′ sono indistinguibili mediante k misure se:
Elementi di teoria della stima
19
g ( k ) (θ ') = g ( k ) (θ ")
Ovviamente due vettori diversi che violano la precedente equazione si
dicono distinguibili mediante k misure.

Definizione 1.3 Con riferimento al Problema 1.1, qualora il vettore
incognito sia di natura aleatoria esso è identificabile mediante k misure (il problema di stima è ben formulato) se ogni θ ' ∈ Ω θ è distinguibile da ogni altro θ " ∈ Ωθ , con θ ' ≠ θ " . Tale proprietà equivale alla
proprietà di invertibilità1 della funzione g ( k ) su Ω θ . Qualora il vettore
incognito sia di natura deterministica esso è identificabile mediante k
misure qualora il valore vero θ sia distinguibile da ogni altro θ ' ∈ D ,
con θ ' ≠ θ . Evidentemente tale proprietà è garantita dalla invertibilità
della funzione g ( k ) su D.

Si noti che, nel caso deterministico, il valore vero del vettore incognito, unico nell’ipotesi di identificabilità, può essere definito come il
valore di θ che corrisponde a un insieme di misure esatte (con
v( k ) = 0 ). Nel caso in cui θ sia aleatorio perde di significato il concetto di valore vero.
Si osservi anche che l’ipotesi di invertibilità di g ( k ) su ℝ µ , o su un
suo sottoinsieme (D o Ω θ ), richiede che i dati disponibili siano in
Una funzione f che trasferisce un insieme DB ⊂ ℝ n in un insieme DA ⊂ ℝ m ,
con m ≥ n , è invertibile su DB se è possibile definire la funzione inversa
1
f −1 : DA → DB , tale che, considerando un qualunque x ∈ D ed essendo y = f ( x ) ,
risulti f −1 ( y ) = x . Equivalentemente f è invertibile su DB se non assume mai lo
stesso valore in punti diversi di DB .
Capitolo 1
20
numero sufficientemente elevato (non inferiore al numero delle incognite) e cioè che kq ≥ µ .
Sia che il vettore incognito sia di natura aleatoria che di natura deterministica, esso si dice localmente identificabile mediante k misure,
qualora la funzione g ( k ) sia localmente invertibile e cioè qualora, fissato un qualunque vettore c ∈ ℝ kq , le soluzioni dell’equazione:
g ( k ) (θ ) = c
costituiscano un insieme di punti isolati in Ω θ o in D oppure costituiscano un insieme vuoto. Una condizione sufficiente a garantire
l’invertibilità locale della funzione g ( k ) nell’intorno di un qualunque
punto θ , come noto, è:
 dg ( k ) (θ ) 
rg 
= µ
 dθ θ 
che implica ancora kq ≥ µ .
È opportuno notare che la Definizione 1.2 di distinguibilità mediante k misure fra due vettori θ ' e θ ′′ equivale alla condizione che
tutti i momenti di p z ( k ) |θ o di pz( k ) siano coincidenti in corrispondenza
a θ ' e a θ ′′ . Nel caso frequente in cui le suddette densità di probabilità
siano gaussiane la proprietà di distinguibilità mediante k misure richiede che il valor medio e la matrice di covarianza di z ( k ) condizionata a θ o di z ( k ) non siano coincidenti in corrispondenza ai due vettori θ ' e θ ′′ considerati. Più in particolare, ricordando l’equazione
(1.2), poiché per θ aleatorio risulta Ψ ( k ) = Ψ ( k ) e ancora per θ dez |θ
v
terministico risulta Ψ ( k ) = Ψ ( k ) , che sono entrambe indipendenti da
z
v
θ , la proprietà di dististinguibilità e quindi di identificabilità mediante
Elementi di teoria della stima
21
k misure va riferita al solo valor medio di z ( k ) condizionato a θ o non
condizionato. In entrambi i casi tale valor medio è pari a g ( k ) ( θ ) e
pertanto resta confermato, come è ovvio, che le proprietà in esame richiedono l’invertibilità di g ( k ) su Ω θ o su D.
Si vuole anche osservare che la Definizione 1.2 e conseguentemente la Definizione 1.3 in termini di densità di probabilità delle misure
z ( k ) , eventualmente condizionata a θ , sussiste anche per problemi di
stima statici caratterizzati da un’equazione di misura più generale della (1.2). A titolo di esempio si può brevemente considerare il caso in
cui il rumore di misura sia moltiplicativo, anziché additivo, supponendo per semplicità che esso sia gaussiano, bianco, a media nulla e varianza σ v2 e che le misure siano scalari (q=1). Si suppone cioè che
l’equazione di misura sia:
z ( j ) = g (θ , j )v ( j )
j = 1, 2,..k
che in forma compatta può essere scritta:
z ( k ) = G ( k ) (θ )v ( k )
dove G ( k ) è la matrice diagonale delle g (θ , j ) . Nel caso in esame il
vettore z ( k ) è ancora gaussiano ma il suo valor medio, eventualmente
condizionato a θ , è nullo e quindi indipendente da θ . La proprietà di
identificabilità mediante k misure va pertanto analizzata considerando
il momento del secondo ordine. La covarianza di z ( k ) , eventualmente
condizionata a θ , vale:
G ( k ) (θ )Ψ
k G
v( )
( k )T
{
}
(θ ) = σ v2 diag g 2 (θ , j )
22
Capitolo 1
Si può quindi concludere che θ è identificabile mediante k misure
qualora la funzione vettoriale costituita dalle k componenti g 2 (θ , j ) ,
j=1,2,…k, sia invertibile su Ω θ o su D. La stessa conclusione sussiste
ovviamente se, nell’equazione di misura considerata, è presente anche
un secondo rumore gaussiano additivo, incorrelato con quello moltiplicativo.
Il problema generale di stima statico precedentemente considerato
(Problema 1.1) può essere particolarizzato in diversi modi introducendo opportune ipotesi limitative.
Un problema di stima statico si dice stazionario se g non dipende
dalla variabile temporale j e se la sequenza {v ( j )} è statisticamente
stazionaria (cioè se pv ( j ) è costante rispetto a j). Si osservi che, nel
caso in cui g non dipende da j, risulta:
 g (θ ) 
 g (θ ) 

g ( k ) (θ ) = 
 ⋮ 


 g (θ ) 
e pertanto la proprietà di identificabilità non dipende dal numero k
delle misure effettuate: il vettore incognito è identificabile (con un
qualunque numero di misure) se e solo se esso è identificabile con
una sola misura. Lo studio dell’identificabilità si riduce cioè allo studio della invertibilità della funzione g (su Ω θ o su D ) e condizione
necessaria è che sia q ≥ µ . Ovviamente, supposta verificata tale proprietà di identificabilità la disponibilità di un numero elevato di misure
dà luogo in genere a stime più affidabili.
Elementi di teoria della stima
23
Un problema di stima statico si dice lineare se g è funzione lineare
di θ e quindi l’equazione di misura (1.1) si particolarizza nella :
z ( j ) = C ( j )θ + v ( j )
j = 1, 2,...k
e, in forma compatta, nella:
(1.4)
z ( k ) = C ( k )θ + v ( k )
con:
C (k )
C (1) 
C (2) 

=
 ⋮ 


C ( k ) 
Nel caso di problemi lineari la condizione di identificabilità con k
misure si riduce evidentemente alla condizione di rango:
(1.5)
{ }
rg C ( k ) = µ
che implica kq ≥ µ . Infatti, poiché nel caso considerato risulta
g ( k ) (θ ) = C ( k )θ , la precedente condizione di rango garantisce
l’invertibilità di g ( k ) su tutto ℝ µ o su un suo qualunque sottoinsieme.
Anche al generico stimatore γ introdotto nel Problema 1.1 possono
essere attribuite particolari proprietà strutturali di interesse.
Uno stimatore γ è lineare se esso è linearmente dipendente da z ( k )
e quindi l’equazione (1.3) si particolarizza nella:
Capitolo 1
24
k
θɶ|k = Λ ( k ) z ( k ) = ∑ Λ( j ) z ( j )
j =1
dove Λ ( k ) è una matrice di dimensioni µ × kq , mentre
Λ ( j ), j = 1, 2,...k sono matrici di dimensioni µ × q . Nel caso in cui
sia:
θɶ|k = Λ( k ) z ( k ) + λ(k )
dove λ ( k ) è un vettore costante a µ componenti, lo stimatore si dice
affine.
Se a uno stimatore si attribuisce una struttura del tipo:
θɶ| j = γ (θɶ| j −1 , z ( j ), j ),
j = 1, 2,...k
esso si dice iterativo. Si osservi che, qualora nella precedente formula
si consideri l’istante j=1, la quantità θɶ|0 va intesa come una stima a
priori del vettore incognito e cioè come una stima di θ effettuata
senza l’utilizzazione di misure ma soltanto in base alle informazioni a
priori. Ovviamente lo stimatore può anche essere di tipo iterativo solo
a partire da un istante fissato j > 1 . Una struttura di tipo iterativo è generalmente interessante dal punto di vista computazionale, in quanto
non richiede la memorizzazione di tutti i dati misurati e corrisponde
tipicamente a una elaborazione in linea degli stessi.
v
θ
S
M
z
Fig. 1.1
θ
Elementi di teoria della stima
25
In Fig. 1.1 è schematicamente rappresentato il problema di stima
statico: il blocco M rappresenta l’operazione di misura e cioè
l’equazione (1.1) il blocco S rappresenta l’operazione di stima e cioè
l’equazione (1.2), le connessioni tratteggiate rappresentano il flusso
delle informazioni a priori (relative alla statistica dei disturbi di misura
ed eventualmente dei parametri incogniti).
1.3 Problema di stima dinamico
Sia θ ( j ) ∈ ℝ µ il vettore dei parametri incogniti variabili nel tempo. Le variazioni temporali di θ saranno descritte da una equazione di
evoluzione dinamica tempo discreto del tipo:
(1.6)
θ ( j + 1) = f (θ ( j ), j ) + u ( j )
j = 0,1,...( k − 1)
dove il forzamento u ( j ) ∈ ℝ µ si è supposto per semplicità di tipo additivo. La funzione f si suppone derivabile rispetto a θ ( j ) per ogni j
fissato.
La situazione in cui la sequenza {u ( j )} è deterministica e nota
corrisponde in realtà a un problema di stima concettualmente di tipo
statico, in quanto l’unico vettore di parametri effettivamente incognito
è il valore iniziale θ ( 0 ) ( noto θ ( 0 ) e nota la sequenza {u ( j )} il
modello (1.6) consente infatti di determinare i valori di θ ( j ) per
j = 1, 2, ...k ). In alternativa, un effettivo problema di stima di tipo dinamico prevede che la sequenza {u ( j )} sia di tipo stocastico e, come
tale, sia caratterizzata mediante opportune informazioni a priori. In
tal caso si supporrà nel seguito che {u ( j )} sia una sequenza aleatoria
statisticamente indipendente e pertanto le informazioni a priori saran-
26
Capitolo 1
no costituite dalle densità di probabilità pu ( j ) , j = 0,1...( k − 1) o più
semplicemente da un certo numero di momenti di ordine successivo
dei vettori aleatori u ( j ) (tipicamente dai momenti del primo e del secondo ordine). Anche per il valore iniziale θ ( 0 ) si assumerà in tal caso una interpretazione di tipo statistico con le relative informazioni a
priori. Per un problema dinamico così formulato la sequenza {θ ( j )}
è di natura stocastica e pertanto il corrispondente problema di stima
ottima va affrontato nel contesto Bayesiano.
Accanto alla equazione dinamica (1.6) occorre considerare
l’equazione di misura istantanea che, nell’ipotesi di rumori additivi
sarà del tipo:
(1.7)
z ( j ) = g (θ ( j ), j ) + v ( j )
j = 1, 2,...k
con z ( j ) ∈ ℝ q . Essa fornisce l’informazone a posteriori. Si assumerà
in genere nel seguito che {v( j )} sia statisticamente indipendente e
che le sequenze {u ( j )} , {v ( j )} siano tra loro indipendenti ed entrambe indipendenti da θ ( 0 ) . Si può a questo punto formulare il seguente problema di stima dinamico:
Problema 1.4
Considerata l’equazione di evoluzione (1.6) e
l’equazione di misura (1.7), definire una funzione γ : ℝ kq → ℝ µ , che
fornisca una stima θɶ ( i | k ) del vettore incognito θ ( i ) utilizzando le
misure disponibili fino all’istante k:
(1.8)
(
θɶ ( i | k ) = γ z ( k ) , i
)
La funzione γ si definisce stimatore e θɶ ( i | k ) è un vettore aleatorio,
mentre si definisce stima il valore che assume lo stimatore in corri⌣
spondenza al risultato effettivo delle misure z ( k ) .
Elementi di teoria della stima
27
Più propriamente il problema di stima dinamico si dice di filtraggio, di previsione o di interpolazione a seconda che sia
i = k , i > k , i < k rispettivamente; corrispondentemente lo stimatore si
dirà filtro, predittore o interpolatore.

Ovviamente lo stimatore γ deve dipendere, oltre che dalle informazioni a posteriori z ( k ) , da tutte le informazioni a priori relative alle
statistiche di {u ( j )} , {v ( j )} e θ ( 0 ) nonché dagli eventuali vincoli
matematici che interessano il vettore incognito θ ( i ) .
Anche per problemi di stima di tipo dinamico è possibile considerare una formulazione più generale in cui il rumore di forzamento e
quello di misura entrano in maniera non lineare nelle rispettive equazioni (1.6) e (1.7). Lo studio di tali problemi risulta ovviamente più
complesso e ad esso verranno riservati nel seguito brevi cenni.
A problemi di stima dinamici si può estendere il concetto di identificabilità già fornito per problemi statici, considerando la sequenza dei
vettori incogniti θ ( j ) , j = 1, 2, ...k . Definiti i vettori:
θ (k )
 θ (1) 


θ (2) 
=
⋮ 


 θ (k ) 
( )
g (k ) θ (k )
 g (θ (1),1) 


g (θ (2), 2) 
=


⋮


 g (θ (k ), k ) 
l’equazione di misura (1.15) può esser riscritta in forma compatta:
z (k ) = g (k ) (θ (k ) ) + v(k )
Capitolo 1
28
e sia Ω ( k ) il supporto della densità di probabilità a priori p ( k ) . Si ha
θ
θ
la seguente definizione.
Definizione 1.5 Con riferimento al Problema 1.4, le sequenze incognite θ ( k ) ′ , θ ( k ) ′′ ∈ Ω θ ( k ) , con θ ( k ) ′ ≠ θ ( k ) ′′ , sono indistinguibili mediante
k misure se risulta:
p
(ζ ,θ ′ ) = p
(k )
z ( k ) |θ ( k )
( ζ , θ ′′ )
(k )
z ( k ) |θ ( k )
e conseguentemente se risulta:
( )
(
g ( k ) θ ( k )′ = g ( k ) θ ( k ) ′′
)
Inoltre la sequenza di vettori incogniti è identificabile mediante k
misure (il problema di stima è ben formulato) se ogni θ ( k ) ′ ∈ Ω θ ( k ) è
distinguibile da ogni altro θ ( k ) ′′ ∈ Ω θ ( k ) , con θ ( k ) ′ ≠ θ ( k ) ′′ . Equivalentemente la sequenza incognita è identificabile mediante k misure se
la funzione g ( k ) è invertibile su Ωθ ( k ) .

L’estensione al caso dinamico della definizione di identificabilità
mediante k misure del singolo vettore incognito θ ( i ) è complessa dal
punto di vista operativo. Essa richiederebbe di esprimere i singoli
campioni θ ( j ) , j = 1, 2, ...k , in funzione di θ ( i ) e dei campioni
dell’ingresso u ( r ) , r = i, i +1, ... ( j −1) , utilizzando l’equazione dinamica (1.6), invertendo la funzione f per i valori j minori di i. Successivamente tali espressioni andrebbero sostituite nell’equazione di misura (1.7) che quindi, in forma compatta, avrebbe una struttura del tipo:
z ( k ) = ϕ (θ ( i ) , u ( 0 ) , u (1) , ...u ( k −1) ) + v( k )
Elementi di teoria della stima
29
Occorrerebbe quindi calcolare p ( k ) ( ζ , θ ( i ) ) , operazione complesz |θ ( i )
sa data la dipendenza non lineare dai campioni dell’ingresso, e verificare la condizione:
p
z ( k ) |θ ( i )
( ζ , θ ′ ( i ) ) ≠ pz
(k )
|θ ( i )
( ζ , θ ′′ ( i ) )
per ogni coppia θ ′ ( i ) , θ ′′ ( i ) ∈ Ω θ ( i ) ,, con θ ′ ( i ) ≠ θ ′′ ( i ) .
Come già fatto per il problema statico si possono introdurre alcune
particolarizzazioni significative per il problema di stima dinamico e
per il corrispondente stimatore.
Un problema di stima dinamico si dice stazionario se le funzioni f e
g non dipendono esplicitamente dalla variabile temporale j e se le sequenze {u ( j )} e {v ( j )} sono statisticamente stazionarie.
Un problema di stima dinamico si dice lineare se le funzioni f e g
che compaiono nelle (1.6) e (1.7) sono entrambe lineari in θ ( j ) e
cioè se le suddette equazioni assumono la struttura:
θ ( j + 1) = A( j )θ ( j ) + u ( j )
j = 0,1,...( k − 1)
z ( j ) = C ( j )θ ( j ) + v ( j )
j = 1, 2,...k
dove A ( j ) e C ( j ) sono matrici di dimensioni opportune.
Uno stimatore dinamico è lineare se la funzione γ è linearmente
dipendente da z ( k ) :
k
θɶ (i | k ) = Λ ( k ) (i) z ( k ) = ∑ Λ(i, j ) z ( j )
j =1
Capitolo 1
30
dove Λ( k ) (i ) e Λ(i, j ), j = 1, 2,...k sono rispettivamente matrici di dimensioni µ × kq e µ × q . Nel caso in cui sia:
θɶ (i | k ) = Λ( k ) (i ) z ( k ) + λ(i, k )
con λ(i, k ) vettore a µ componenti, lo stimatore si dice affine.
Se a uno stimatore dinamico si attribuisce una struttura del tipo:
θɶ (i + 1| j + 1) = γ (θɶ (i | j ), z ( j + 1), i, j )
j = 0,1,...(k − 1)
esso si dice iterativo. Stimatori di tipo iterativo possono anche essere
definiti assumendo fissato l’istante i in cui si effettua la stima del vettore incognito; in tal caso si ha:
θɶ (i | j + 1) = γ (θɶ (i | j ), z ( j + 1), i, j )
j = 0,1,...(k − 1)
Anche nel caso dinamico, in corrispondenza alla scelta j = 0 , per
θɶ (i | 0) si intende uno stimatore a priori di θ ( i ) , indipendente dalle
misure.
θ (0)
v
M
E
u
θ
S
z
Fig.1.2
θ
Elementi di teoria della stima
31
La Fig. 1.2 rappresenta uno schema a blocchi del problema di stima
dinamico: il blocco E rappresenta l’equazione di evoluzione (1.6)
mentre i blocchi M ed S rappresentano rispettivamente l’equazione di
misura (1.7) e lo stimatore (1.8). Le connessioni tratteggiate rappresentano il flusso delle informazioni statistiche a priori.
Esempio 1.1
Un esempio di problema di stima può essere fornito considerando
il problema di localizzazione di una nave, ferma o in movimento, mediante elaborazione di dati ottenuti per mezzo di radiofari in posizione
fissa e nota. Con riferimento alla Fig. 1.3, sia N una nave che prelimiT
narmente si suppone ferma in una posizione θ = ( θ1 θ2 ) incognita,
interpretabile come un vettore deterministico. Siano Rs , s = 1,2, due
T
radiofari, le cui posizioni α ( s ) = α1( s ) α2( s ) , s = 1, 2, sono note. A
bordo della nave si misurano nel generico istante j i tempi zs(j), s =
1,2, che un segnale emesso impiega per raggiungere il radiofaro Rs e
tornare indietro dopo essere stato riflesso. A bordo della nave si misurano nel generico istante j i tempi zs(j), s = 1,2, che un segnale emesso
impiega per raggiungere il radiofaro Rs e tornare indietro dopo essere
stato riflesso. Indicando con ds la distanza fra N ed Rs e con c la velocità di propagazione del segnale, risulta:
(
zs ( j) =
2ds
2
+ vs ( j) =
c
c
)
(θ −α ) +(θ −α )
1
(s) 2
1
2
(s) 2
2
+ vs ( j) = gs (θ ) + vs ( j) s =1,2
dove con vs ( j ) si è indicato l’errore aleatorio commesso nella misura del tempo zs nell’istante j .
Capitolo 1
32
R2
α2
r
(2)
d2
θ2
N
d1
α2(1)
R1
α1(1)
α1(2)
θ1
Fig. 1.3
Considerando vettori bidimensionali la precedente equazione può essere riscritta:
z ( j ) = g (θ ) + v ( j )
Se le due misure sono ripetute in diversi istanti di tempo j=1,2,..k, con
notazioni vettoriali si avrà:
z ( k ) = g ( k ) (θ ) + v ( k )
dove ovviamente:
Elementi di teoria della stima
33
 g (θ ) 


g (θ ) 
(k )

g (θ ) =
 ⋮ 


 g (θ ) 


Il problema di stimare θ a partire dai risultati delle misure effettuate z ( k ) e dalle informazioni disponibili sugli errori v( k ) , costituisce evidentemente un problema di stima statico, non lineare.
Poiché la funzione g non dipende dalla variabile temporale j,
l’identificabilità del vettore θ sussiste se e solo se essa si verifica con
una sola misura. Si osserva preliminarmente che la condizione necessaria q ≥ µ è verificata essendo q = µ = 2 . Poiché si ha:
g1 (θ ) =
2d1 (θ )
c
g 2 (θ ) =
2d 2 (θ )
c
la proprietà di identificabilità sussiste ovviamente rispetto alle variabili ( d1 (θ ) , d 2 (θ ) ). Pertanto il problema si riconduce a quello della invertibilità rispetto a θ della funzione
 d (θ ) 
d (θ ) =  1

 d 2 (θ ) 
Se θ può assumere qualunque valore in ℝ 2 (vettore deterministico
incognito non vincolato) ci si convince facilmente che la risposta è
negativa poiché considerati due punti θ ' e θ " diversi e simmetrici rispetto alla retta r che congiunge i due radiofari, risulta d (θ ') = d (θ ") .
34
Capitolo 1
Una eventuale informazione a priori, che riduce l’insieme dei possibili
valori di θ da ℝ 2 a un suo opportuno sottoinsieme D , potrebbe garantire la proprietà di identificabilità, rendendo il problema di stima
ben posto. In particolare, l’informazione a priori che la nave si trovi da
una parte o dall’altra della retta r (cioè che D sia costituito dall’uno o
dall’altro dei due semipiani individuati da r) garantirebbe
l’identificabilità di θ .
Si supponga ora che la nave si muova e sia θ ( j ) la posizione incognita che essa occupa nell’istante j. Indicando con us ( j ), s = 1, 2 ,
la velocità della nave secondo l’asse s nell’istante j, nota con incertezza e quindi caratterizzata come una variabile aleatoria, con notazioni
vettoriali bidimensionali, risulta:
θ ( j + 1) = θ ( j ) + u ( j )
j = 0,1,..( k − 1)
La posizione iniziale θ ( 0 ) , incognita, può essere anch’essa interpretata come un vettore aleatorio. L’equazione di misura diventa ovviamente:
z ( j ) = g (θ ( j )) + v ( j )
j = 1, 2,...k
Il problema di stimare θ (i ) date le misure z ( k ) nonché le informazioni a priori sui rumori {u ( j )} , {v ( j )} e sulla posizione iniziale
θ (0) , è chiaramente un esempio di problema di stima dinamico non
lineare. Più in particolare se i < k si tratta di un problema di interpolazione, se i = k di un problema di filtraggio, se i > k di un problema di
previsione.
Anche nel caso dinamico la sequenza incognita:
Elementi di teoria della stima
θ (k )
35
 θ (1) 


θ (2) 

=
 ⋮ 


 θ (k ) 
è non identificabile se il modello dinamico del moto consente che nel
supporto Ωθ ( k ) della densità di probabilità a priori pθ ( k ) siano presenti
traiettorie θ ( k )′ , θ ( k ) ′′ diverse e simmetriche rispetto alla retta r.
1.4 Proprietà degli stimatori
La “bontà” di uno stimatore può essere valutata in base ad opportune proprietà che possono caratterizzare lo stimatore stesso. Poiché lo
stimatore è un vettore aleatorio essendo dipendente dalle misure, tali
proprietà non possono che essere di natura statistica e, in particolare,
esse si riferiscono al valor medio e alla matrice di covarianza dello
stimatore stesso.
Una prima proprietà interessante si riferisce all’idea intuitiva che,
ripetendo più volte l’operazione di stima utilizzando diversi vettori di
misura, si possa ricostruire più fedelmente il vettore incognito, mediante una operazione di media sulle stime ottenute. In effetti, sotto
opportune ipotesi, per la legge dei grandi numeri tale media converge
al valore medio della stima ed è quindi importante confrontare
quest’ultimo col valore incognito θ . In particolare si ha la seguente
definizione.