Metodi di stima per il filtraggio e l`identificazione dei sistemi
by user
Comments
Transcript
Metodi di stima per il filtraggio e l`identificazione dei sistemi
Carlo Bruni Claudia Ferrone Metodi di stima per il filtraggio e l’identificazione dei sistemi Copyright © MMVIII ARACNE editrice S.r.l. www.aracneeditrice.it [email protected] via Raffaele Garofalo, 133 A/B 00173 Roma (06) 93781065 ISBN 978–88–548–2273–3 I diritti di traduzione, di memorizzazione elettronica, di riproduzione e di adattamento anche parziale, con qualsiasi mezzo, sono riservati per tutti i Paesi. Non sono assolutamente consentite le fotocopie senza il permesso scritto dell’Editore. I edizione: dicembre 2008 Indice Introduzione ........................................................................................7 1. Elementi di teoria della stima ....................................................13 1.1 Introduzione .........................................................................13 1.2 Problema di stima statico .....................................................14 1.3 Problema di stima dinamico.................................................25 1.4 Proprietà degli stimatori.......................................................35 1.5 Limite inferiore di Cramer Rao............................................40 2. Stimatori ottimi ...........................................................................73 2.1 Introduzione .........................................................................73 2.2 Stimatori dei minimi quadrati e di Markov per problemi lineari statici ...................................................76 2.3 Stimatori dei minimi quadrati e di Markov per problemi lineari dinamici............................................114 2.4 Stimatore di massima verosimiglianza ..............................138 2.5 Stimatori di Bayes ..............................................................212 3. Stima dello stato di un sistema dinamico lineare: problema di Kalman .................................................................271 3.1 Formulazione generale del problema.................................271 3.2 Filtro di Kalman .................................................................275 3.3 Predittore di Kalman ..........................................................289 3.4 Interpolatore di Kalman .....................................................292 3.5 Problema di filtraggio stazionario e soluzione di regime ..321 3.6 Filtraggio ottimo con rumori di ingresso e di misura correlati............................................................366 3.7 Linearizzazione di problemi di filtraggio non lineari: il filtro di Kalman esteso....................................................372 4. Identificazione parametrica di sistemi lineari stazionari........................................................................393 4.1 Introduzione .......................................................................393 5 Indice 6 4.2 4.2.1 4.2.2 4.2.3 4.3 4.3.1 4.3.2 4.3.3 4.3.4 4.3.5 4.4 4.4.1 4.4.2 Metodi classici di identificazione mediante l’uso di segnali di prova .................................................... 397 Identificazione dei campioni della risposta impulsiva mediante segnale di prova impulsivo ................................ 397 Identificazione dei campioni della risposta armonica mediante segnale di prova sinusoidale.............................. 406 Identificazione dei campioni della risposta impulsiva mediante rumore di prova: equazione di Wiener Hopf ..... 415 Identificazione durante il normale funzionamento con ingresso deterministico noto ...................................... 417 Identificazione dei campioni della risposta impulsiva ...... 418 Identificazione dei parametri della risposta impulsiva ..... 426 Identificazione dei coefficienti del modello ingresso-uscita................................................................... 433 Identificazione dei coefficienti del modello ingresso-stato- uscita......................................................... 447 Identificazione dello stato e dei parametri di un modello non lineare.................................................. 467 Identificazione durante il normale funzionamento con ingresso stocastico ...................................................... 470 Identificazione dei coefficienti del modello ingresso-stato -uscita......................................................... 471 Identificazione dei coefficienti del modello ingresso-uscita ARMA ....................................................... 481 Appendice: Elementi di Teoria della Probabilità ....................... 499 A.1 Modello probabilistico: spazio di probabilità.................... 499 A.2 Variabile aleatoria. Funzione di distribuzione e densità di probabilità....................................................... 501 A.3 Valore medio e matrice di covarianza ............................... 506 A.4 Densità di probabilità congiunta e marginale .................... 511 A.5 Condizionamento statistico................................................ 515 A.6 Indipendenza statistica....................................................... 523 A.7 Sequenze aleatorie e convergenza stocastica..................... 525 Indice analitico................................................................................ 531 Bibliografia...................................................................................... 535 1. Elementi di teoria della stima: definizioni e proprietà generali 1.1 Introduzione Il problema della stima consiste nella individuazione delle operazioni da effettuare sui risultati di una serie di misure allo scopo di attribuire un valore a un insieme di parametri incogniti i quali influenzano l’esito delle misure stesse. Poiché le operazioni di misura introducono inevitabilmente incertezze (errori di misura, rumori), le operazioni che costituiscono la procedura di stima debbono tenere in conto le informazioni di carattere statistico disponibili che caratterizzano tali incertezze. In alcuni casi anche i parametri incogniti possono avere una interpretazione di tipo statistico, nel senso che sono disponibili a priori informazioni relative ai valori che essi possono assumere e alla probabilità con cui tali valori sono assunti. In tal caso il procedimento di stima dovrà anche incorporare in maniera opportuna queste ulteriori informazioni. La valenza applicativa della teoria della stima è vastissima: problemi di stima possono presentarsi nei contesti più disparati, dall’ingegneria alla fisica, dall’economia alle scienze biologiche e 13 14 Capitolo 1 mediche e in definitiva in ogni possibile settore in cui la statistica applicata può esser utilizzata. Verrà qui di seguito data una formulazione più precisa al problema di stima, distinguendo il caso in cui l’insieme dei parametri incogniti sia costante nel tempo da quello in cui esso sia variabile. 1.2 Problema di stima statico Sia θ il vettore dei parametri incogniti a µ componenti, costante nel tempo. Nel caso in cui non siano disponibili informazioni a priori circa i valori ammissibili per tale vettore e circa le corrispondenti probabilità, esso deve essere considerato come un vettore deterministico incognito variabile in ℝ µ . Nel caso in cui informazioni di tale tipo siano disponibili, θ deve essere invece considerato come un vettore aleatorio e, come tale, deve essere caratterizzato mediante la relativa densità di probabilità pθ o almeno mediante i corrispondenti momenti di ordine sufficientemente elevato (valore medio, matrice di covarianza). Procedure di stima che tengano conto di tali informazioni a priori si dicono di tipo Bayesiano. Il primo dei due casi considerati può essere concettualmente interpretato come limite del secondo, corrispondentemente al caso di un vettore aleatorio di distribuzione uniforme su un supporto che si estende a tutto lo spazio ℝ µ . Una situazione intermedia rispetto alle due precedentemente considerate è quella in cui sul vettore incognito siano presenti vincoli matematici di varia struttura, che tipicamente derivano dal significato fisico delle variabili che lo costituiscono, e che individuano un sottoinsieme D ⊂ ℝ µ di valori per esso ammissibili. Tali vincoli, ove presenti, costituiscono concettualmente altrettante informazioni a priori sul vetto- Elementi di teoria della stima 15 re incognito. In assenza di ulteriori informazioni relative alla densità di probabilità dei valori di θ su tale insieme ammissibile sono possibili due approcci alternativi al problema di stima. Il vettore θ può essere considerato come aleatorio, con una densità di probabilità uniforme sul suo supporto che coincide con l’insieme ammissibile D e conseguentemente occorre utilizzare una procedura di stima di tipo Bayesiano. In alternativa il vettore può essere considerato di natura deterministica, tenendo conto dei vincoli presenti nella procedura di stima adottata, come sarà meglio chiarito nel seguito. Sul vettore dei parametri incogniti viene effettuata una serie di misure negli istanti discreti j = 1, 2,..k , corrotte da errori di misura v ( j ) . L’equazione di misura assume in generale la forma: z ( j ) = g (θ , v ( j ), j ) j = 1, 2,..k dove z ( j ) è il vettore delle osservazioni effettuate nell’istante j, che si suppone a dimensione q , mentre il rumore di misura v ( j ) è un vettore aleatorio di dimensioni fissate e con densità di probabilità p v ( j ) . Nella maggior parte dei problemi applicativi di interesse il rumore v( j ) figura in forma additiva nell’equazione di misura: (1.1) z ( j ) = g (θ , j ) + v( j ) j = 1, 2,..k e in tal caso il problema di stima è in genere notevolmente più semplice da trattare. Nel seguito tale ipotesi semplificativa verrà sistematicamente assunta, riservando brevi cenni al caso più generale di non linearità dell’equazione di misura rispetto al relativo rumore. Si assumerà inoltre che la funzione g sia sufficientemente regolare rispetto a θ e in particolare che essa sia derivabile per ogni j fissato. Una ulte- Capitolo 1 16 riore ipotesi semplificativa, che verrà usualmente adottata, è quella relativa alla indipendenza statistica della sequenza aleatoria {v ( j )} . In forma compatta le precedenti equazioni (1.1) possono essere riscritte come segue: z ( k ) = g ( k ) (θ ) + v ( k ) (1.2) dove z (k ) z (1) z (2) = ⋮ z (k ) g (θ ,1) g (θ , 2) g ( k ) (θ ) = ⋮ g (θ , k ) ν (k ) v(1) v(2) = ⋮ v(k ) Si può a questo punto formulare il seguente problema di stima statico: Problema 1.1 Considerata l’equazione di misura (1.2), definire una funzione γ : ℝ kq → ℝ µ , che fornisca una stima θɶ|k del vettore incognito θ , utilizzando le misure disponibili fino all’istante k: (1.3) ( ) θɶ|k = γ z ( k ) La funzione γ si definisce stimatore e θɶ|k è un vettore aleatorio essendo dipendente dalle misure che sono a loro volta aleatorie sia per l’aleatorietà dei rumori v ( j ) , sia eventualmente per l’aleatorietà di θ. ⌣ Stima è più propriamente il vettore deterministico γ ( z ( k ) ) che fornisce ⌣ lo stimatore in corrispondenza al risultato effettivo delle misure z ( k ) . Elementi di teoria della stima 17 Una interpretazione alternativa del problema di stima consiste nel considerare θ come un vettore di parametri incogniti che caratterizza la distribuzione statistica delle misure z ( j ) ; il problema di stima, in tal senso, è quello di valutare la distribuzione statistica delle misure utilizzando il risultato delle misure stesse. È ragionevole assumere che l’operazione di stima utilizzi tutte le informazioni disponibili e quindi non soltanto quelle a posteriori (ri⌣ sultato delle misure z ( k ) ) ma anche quelle a priori (relative alla caratterizzazione statistica dei vettori v ( j ) , j=1,2,..k ed eventualmente di θ). Pertanto lo stimatore γ sarà in genere dipendente anche da quest’ultime informazioni. Come già accennato, eventuali vincoli matematici per il vettore θ, che definiscano un insieme ammissibile D ⊂ ℝ µ , possono essere trasferiti sulla stima cercata sia che si utilizzi un approccio Bayesiano (assumendo D come supporto della densità di probabilità a priori pθ ) sia che si utilizzi una procedura di stima per variabili deterministiche (imponendo esplicitamente che il risultato fornito dallo stimatore appartenga a D). Al fine di semplificare la procedura di stima è anche possibile rinunciare a utilizzare l’informazione a priori costituita dai vincoli, assumendo θ come vettore deterministico incognito che può assumere valore su tutto ℝ µ . In tal caso i risultati ottenuti sono generalmente meno affidabili e non è garantito che la stima ottenuta soddisfi i vincoli. Tuttavia, se le misure sono sufficientemente precise e numerose, è lecito aspettarsi che, con elevata probabilità, il risultato fornito dallo stimatore soddisfi i vincoli o li violi in misura modesta. Con riferimento al Problema 1.1, per la densità di probabilità delle misure condizionata al vettore incognito θ, qualora esso sia di natura stocastica, risulta: 18 Capitolo 1 pz ( k ) |θ ( ζ , θ ) = pv( k ) ( ζ − g ( k ) (θ )) ∀θ ∈ Ωθ dove Ωθ ⊂ ℝ µ è il supporto della densità di probabilità a priori pθ . Analogamente, se θ è di natura deterministica si ha: pz ( k ) (ζ , θ ) = pv( k ) (ζ − g ( k ) (θ )) ∀θ ∈ D Una proprietà importante ai fini della risolubilità del problema di stima considerato è che la p z ( k ) |θ o la pz( k ) sia sensibile alle variazioni di θ in Ω θ o in D (o eventualmente in tutto ℝ µ se θ non è sottoposto a vincoli). Si hanno in proposito le seguenti definizioni. Definizione 1.2 Con riferimento al Problema 1.1, qualora θ sia di natura aleatoria, due vettori θ ', θ " ∈ Ωθ , con θ ' ≠ θ " , si dicono indistinguibili mediante k misure, qualora risulti: pz ( k ) |θ (ζ , θ ′) = p z ( k ) |θ (ζ , θ ′′) Analoga definizione vale qualora θ sia di natura deterministica e sia caratterizzato da un insieme ammissibile D (eventualmente coincidente con ℝ µ ): in tal caso, considerati θ ' , θ " ∈ D con θ ' ≠ θ ′′ , essi si dicono indistinguibili mediante k misure, qualora risulti: pz ( k ) (ζ , θ ′) = pz ( k ) (ζ , θ ′′) In entrambi i casi, ricordando le precedenti espressioni di p z ( k ) |θ e di pz( k ) , si può affermare che θ ' e θ ′′ sono indistinguibili mediante k misure se: Elementi di teoria della stima 19 g ( k ) (θ ') = g ( k ) (θ ") Ovviamente due vettori diversi che violano la precedente equazione si dicono distinguibili mediante k misure. Definizione 1.3 Con riferimento al Problema 1.1, qualora il vettore incognito sia di natura aleatoria esso è identificabile mediante k misure (il problema di stima è ben formulato) se ogni θ ' ∈ Ω θ è distinguibile da ogni altro θ " ∈ Ωθ , con θ ' ≠ θ " . Tale proprietà equivale alla proprietà di invertibilità1 della funzione g ( k ) su Ω θ . Qualora il vettore incognito sia di natura deterministica esso è identificabile mediante k misure qualora il valore vero θ sia distinguibile da ogni altro θ ' ∈ D , con θ ' ≠ θ . Evidentemente tale proprietà è garantita dalla invertibilità della funzione g ( k ) su D. Si noti che, nel caso deterministico, il valore vero del vettore incognito, unico nell’ipotesi di identificabilità, può essere definito come il valore di θ che corrisponde a un insieme di misure esatte (con v( k ) = 0 ). Nel caso in cui θ sia aleatorio perde di significato il concetto di valore vero. Si osservi anche che l’ipotesi di invertibilità di g ( k ) su ℝ µ , o su un suo sottoinsieme (D o Ω θ ), richiede che i dati disponibili siano in Una funzione f che trasferisce un insieme DB ⊂ ℝ n in un insieme DA ⊂ ℝ m , con m ≥ n , è invertibile su DB se è possibile definire la funzione inversa 1 f −1 : DA → DB , tale che, considerando un qualunque x ∈ D ed essendo y = f ( x ) , risulti f −1 ( y ) = x . Equivalentemente f è invertibile su DB se non assume mai lo stesso valore in punti diversi di DB . Capitolo 1 20 numero sufficientemente elevato (non inferiore al numero delle incognite) e cioè che kq ≥ µ . Sia che il vettore incognito sia di natura aleatoria che di natura deterministica, esso si dice localmente identificabile mediante k misure, qualora la funzione g ( k ) sia localmente invertibile e cioè qualora, fissato un qualunque vettore c ∈ ℝ kq , le soluzioni dell’equazione: g ( k ) (θ ) = c costituiscano un insieme di punti isolati in Ω θ o in D oppure costituiscano un insieme vuoto. Una condizione sufficiente a garantire l’invertibilità locale della funzione g ( k ) nell’intorno di un qualunque punto θ , come noto, è: dg ( k ) (θ ) rg = µ dθ θ che implica ancora kq ≥ µ . È opportuno notare che la Definizione 1.2 di distinguibilità mediante k misure fra due vettori θ ' e θ ′′ equivale alla condizione che tutti i momenti di p z ( k ) |θ o di pz( k ) siano coincidenti in corrispondenza a θ ' e a θ ′′ . Nel caso frequente in cui le suddette densità di probabilità siano gaussiane la proprietà di distinguibilità mediante k misure richiede che il valor medio e la matrice di covarianza di z ( k ) condizionata a θ o di z ( k ) non siano coincidenti in corrispondenza ai due vettori θ ' e θ ′′ considerati. Più in particolare, ricordando l’equazione (1.2), poiché per θ aleatorio risulta Ψ ( k ) = Ψ ( k ) e ancora per θ dez |θ v terministico risulta Ψ ( k ) = Ψ ( k ) , che sono entrambe indipendenti da z v θ , la proprietà di dististinguibilità e quindi di identificabilità mediante Elementi di teoria della stima 21 k misure va riferita al solo valor medio di z ( k ) condizionato a θ o non condizionato. In entrambi i casi tale valor medio è pari a g ( k ) ( θ ) e pertanto resta confermato, come è ovvio, che le proprietà in esame richiedono l’invertibilità di g ( k ) su Ω θ o su D. Si vuole anche osservare che la Definizione 1.2 e conseguentemente la Definizione 1.3 in termini di densità di probabilità delle misure z ( k ) , eventualmente condizionata a θ , sussiste anche per problemi di stima statici caratterizzati da un’equazione di misura più generale della (1.2). A titolo di esempio si può brevemente considerare il caso in cui il rumore di misura sia moltiplicativo, anziché additivo, supponendo per semplicità che esso sia gaussiano, bianco, a media nulla e varianza σ v2 e che le misure siano scalari (q=1). Si suppone cioè che l’equazione di misura sia: z ( j ) = g (θ , j )v ( j ) j = 1, 2,..k che in forma compatta può essere scritta: z ( k ) = G ( k ) (θ )v ( k ) dove G ( k ) è la matrice diagonale delle g (θ , j ) . Nel caso in esame il vettore z ( k ) è ancora gaussiano ma il suo valor medio, eventualmente condizionato a θ , è nullo e quindi indipendente da θ . La proprietà di identificabilità mediante k misure va pertanto analizzata considerando il momento del secondo ordine. La covarianza di z ( k ) , eventualmente condizionata a θ , vale: G ( k ) (θ )Ψ k G v( ) ( k )T { } (θ ) = σ v2 diag g 2 (θ , j ) 22 Capitolo 1 Si può quindi concludere che θ è identificabile mediante k misure qualora la funzione vettoriale costituita dalle k componenti g 2 (θ , j ) , j=1,2,…k, sia invertibile su Ω θ o su D. La stessa conclusione sussiste ovviamente se, nell’equazione di misura considerata, è presente anche un secondo rumore gaussiano additivo, incorrelato con quello moltiplicativo. Il problema generale di stima statico precedentemente considerato (Problema 1.1) può essere particolarizzato in diversi modi introducendo opportune ipotesi limitative. Un problema di stima statico si dice stazionario se g non dipende dalla variabile temporale j e se la sequenza {v ( j )} è statisticamente stazionaria (cioè se pv ( j ) è costante rispetto a j). Si osservi che, nel caso in cui g non dipende da j, risulta: g (θ ) g (θ ) g ( k ) (θ ) = ⋮ g (θ ) e pertanto la proprietà di identificabilità non dipende dal numero k delle misure effettuate: il vettore incognito è identificabile (con un qualunque numero di misure) se e solo se esso è identificabile con una sola misura. Lo studio dell’identificabilità si riduce cioè allo studio della invertibilità della funzione g (su Ω θ o su D ) e condizione necessaria è che sia q ≥ µ . Ovviamente, supposta verificata tale proprietà di identificabilità la disponibilità di un numero elevato di misure dà luogo in genere a stime più affidabili. Elementi di teoria della stima 23 Un problema di stima statico si dice lineare se g è funzione lineare di θ e quindi l’equazione di misura (1.1) si particolarizza nella : z ( j ) = C ( j )θ + v ( j ) j = 1, 2,...k e, in forma compatta, nella: (1.4) z ( k ) = C ( k )θ + v ( k ) con: C (k ) C (1) C (2) = ⋮ C ( k ) Nel caso di problemi lineari la condizione di identificabilità con k misure si riduce evidentemente alla condizione di rango: (1.5) { } rg C ( k ) = µ che implica kq ≥ µ . Infatti, poiché nel caso considerato risulta g ( k ) (θ ) = C ( k )θ , la precedente condizione di rango garantisce l’invertibilità di g ( k ) su tutto ℝ µ o su un suo qualunque sottoinsieme. Anche al generico stimatore γ introdotto nel Problema 1.1 possono essere attribuite particolari proprietà strutturali di interesse. Uno stimatore γ è lineare se esso è linearmente dipendente da z ( k ) e quindi l’equazione (1.3) si particolarizza nella: Capitolo 1 24 k θɶ|k = Λ ( k ) z ( k ) = ∑ Λ( j ) z ( j ) j =1 dove Λ ( k ) è una matrice di dimensioni µ × kq , mentre Λ ( j ), j = 1, 2,...k sono matrici di dimensioni µ × q . Nel caso in cui sia: θɶ|k = Λ( k ) z ( k ) + λ(k ) dove λ ( k ) è un vettore costante a µ componenti, lo stimatore si dice affine. Se a uno stimatore si attribuisce una struttura del tipo: θɶ| j = γ (θɶ| j −1 , z ( j ), j ), j = 1, 2,...k esso si dice iterativo. Si osservi che, qualora nella precedente formula si consideri l’istante j=1, la quantità θɶ|0 va intesa come una stima a priori del vettore incognito e cioè come una stima di θ effettuata senza l’utilizzazione di misure ma soltanto in base alle informazioni a priori. Ovviamente lo stimatore può anche essere di tipo iterativo solo a partire da un istante fissato j > 1 . Una struttura di tipo iterativo è generalmente interessante dal punto di vista computazionale, in quanto non richiede la memorizzazione di tutti i dati misurati e corrisponde tipicamente a una elaborazione in linea degli stessi. v θ S M z Fig. 1.1 θ Elementi di teoria della stima 25 In Fig. 1.1 è schematicamente rappresentato il problema di stima statico: il blocco M rappresenta l’operazione di misura e cioè l’equazione (1.1) il blocco S rappresenta l’operazione di stima e cioè l’equazione (1.2), le connessioni tratteggiate rappresentano il flusso delle informazioni a priori (relative alla statistica dei disturbi di misura ed eventualmente dei parametri incogniti). 1.3 Problema di stima dinamico Sia θ ( j ) ∈ ℝ µ il vettore dei parametri incogniti variabili nel tempo. Le variazioni temporali di θ saranno descritte da una equazione di evoluzione dinamica tempo discreto del tipo: (1.6) θ ( j + 1) = f (θ ( j ), j ) + u ( j ) j = 0,1,...( k − 1) dove il forzamento u ( j ) ∈ ℝ µ si è supposto per semplicità di tipo additivo. La funzione f si suppone derivabile rispetto a θ ( j ) per ogni j fissato. La situazione in cui la sequenza {u ( j )} è deterministica e nota corrisponde in realtà a un problema di stima concettualmente di tipo statico, in quanto l’unico vettore di parametri effettivamente incognito è il valore iniziale θ ( 0 ) ( noto θ ( 0 ) e nota la sequenza {u ( j )} il modello (1.6) consente infatti di determinare i valori di θ ( j ) per j = 1, 2, ...k ). In alternativa, un effettivo problema di stima di tipo dinamico prevede che la sequenza {u ( j )} sia di tipo stocastico e, come tale, sia caratterizzata mediante opportune informazioni a priori. In tal caso si supporrà nel seguito che {u ( j )} sia una sequenza aleatoria statisticamente indipendente e pertanto le informazioni a priori saran- 26 Capitolo 1 no costituite dalle densità di probabilità pu ( j ) , j = 0,1...( k − 1) o più semplicemente da un certo numero di momenti di ordine successivo dei vettori aleatori u ( j ) (tipicamente dai momenti del primo e del secondo ordine). Anche per il valore iniziale θ ( 0 ) si assumerà in tal caso una interpretazione di tipo statistico con le relative informazioni a priori. Per un problema dinamico così formulato la sequenza {θ ( j )} è di natura stocastica e pertanto il corrispondente problema di stima ottima va affrontato nel contesto Bayesiano. Accanto alla equazione dinamica (1.6) occorre considerare l’equazione di misura istantanea che, nell’ipotesi di rumori additivi sarà del tipo: (1.7) z ( j ) = g (θ ( j ), j ) + v ( j ) j = 1, 2,...k con z ( j ) ∈ ℝ q . Essa fornisce l’informazone a posteriori. Si assumerà in genere nel seguito che {v( j )} sia statisticamente indipendente e che le sequenze {u ( j )} , {v ( j )} siano tra loro indipendenti ed entrambe indipendenti da θ ( 0 ) . Si può a questo punto formulare il seguente problema di stima dinamico: Problema 1.4 Considerata l’equazione di evoluzione (1.6) e l’equazione di misura (1.7), definire una funzione γ : ℝ kq → ℝ µ , che fornisca una stima θɶ ( i | k ) del vettore incognito θ ( i ) utilizzando le misure disponibili fino all’istante k: (1.8) ( θɶ ( i | k ) = γ z ( k ) , i ) La funzione γ si definisce stimatore e θɶ ( i | k ) è un vettore aleatorio, mentre si definisce stima il valore che assume lo stimatore in corri⌣ spondenza al risultato effettivo delle misure z ( k ) . Elementi di teoria della stima 27 Più propriamente il problema di stima dinamico si dice di filtraggio, di previsione o di interpolazione a seconda che sia i = k , i > k , i < k rispettivamente; corrispondentemente lo stimatore si dirà filtro, predittore o interpolatore. Ovviamente lo stimatore γ deve dipendere, oltre che dalle informazioni a posteriori z ( k ) , da tutte le informazioni a priori relative alle statistiche di {u ( j )} , {v ( j )} e θ ( 0 ) nonché dagli eventuali vincoli matematici che interessano il vettore incognito θ ( i ) . Anche per problemi di stima di tipo dinamico è possibile considerare una formulazione più generale in cui il rumore di forzamento e quello di misura entrano in maniera non lineare nelle rispettive equazioni (1.6) e (1.7). Lo studio di tali problemi risulta ovviamente più complesso e ad esso verranno riservati nel seguito brevi cenni. A problemi di stima dinamici si può estendere il concetto di identificabilità già fornito per problemi statici, considerando la sequenza dei vettori incogniti θ ( j ) , j = 1, 2, ...k . Definiti i vettori: θ (k ) θ (1) θ (2) = ⋮ θ (k ) ( ) g (k ) θ (k ) g (θ (1),1) g (θ (2), 2) = ⋮ g (θ (k ), k ) l’equazione di misura (1.15) può esser riscritta in forma compatta: z (k ) = g (k ) (θ (k ) ) + v(k ) Capitolo 1 28 e sia Ω ( k ) il supporto della densità di probabilità a priori p ( k ) . Si ha θ θ la seguente definizione. Definizione 1.5 Con riferimento al Problema 1.4, le sequenze incognite θ ( k ) ′ , θ ( k ) ′′ ∈ Ω θ ( k ) , con θ ( k ) ′ ≠ θ ( k ) ′′ , sono indistinguibili mediante k misure se risulta: p (ζ ,θ ′ ) = p (k ) z ( k ) |θ ( k ) ( ζ , θ ′′ ) (k ) z ( k ) |θ ( k ) e conseguentemente se risulta: ( ) ( g ( k ) θ ( k )′ = g ( k ) θ ( k ) ′′ ) Inoltre la sequenza di vettori incogniti è identificabile mediante k misure (il problema di stima è ben formulato) se ogni θ ( k ) ′ ∈ Ω θ ( k ) è distinguibile da ogni altro θ ( k ) ′′ ∈ Ω θ ( k ) , con θ ( k ) ′ ≠ θ ( k ) ′′ . Equivalentemente la sequenza incognita è identificabile mediante k misure se la funzione g ( k ) è invertibile su Ωθ ( k ) . L’estensione al caso dinamico della definizione di identificabilità mediante k misure del singolo vettore incognito θ ( i ) è complessa dal punto di vista operativo. Essa richiederebbe di esprimere i singoli campioni θ ( j ) , j = 1, 2, ...k , in funzione di θ ( i ) e dei campioni dell’ingresso u ( r ) , r = i, i +1, ... ( j −1) , utilizzando l’equazione dinamica (1.6), invertendo la funzione f per i valori j minori di i. Successivamente tali espressioni andrebbero sostituite nell’equazione di misura (1.7) che quindi, in forma compatta, avrebbe una struttura del tipo: z ( k ) = ϕ (θ ( i ) , u ( 0 ) , u (1) , ...u ( k −1) ) + v( k ) Elementi di teoria della stima 29 Occorrerebbe quindi calcolare p ( k ) ( ζ , θ ( i ) ) , operazione complesz |θ ( i ) sa data la dipendenza non lineare dai campioni dell’ingresso, e verificare la condizione: p z ( k ) |θ ( i ) ( ζ , θ ′ ( i ) ) ≠ pz (k ) |θ ( i ) ( ζ , θ ′′ ( i ) ) per ogni coppia θ ′ ( i ) , θ ′′ ( i ) ∈ Ω θ ( i ) ,, con θ ′ ( i ) ≠ θ ′′ ( i ) . Come già fatto per il problema statico si possono introdurre alcune particolarizzazioni significative per il problema di stima dinamico e per il corrispondente stimatore. Un problema di stima dinamico si dice stazionario se le funzioni f e g non dipendono esplicitamente dalla variabile temporale j e se le sequenze {u ( j )} e {v ( j )} sono statisticamente stazionarie. Un problema di stima dinamico si dice lineare se le funzioni f e g che compaiono nelle (1.6) e (1.7) sono entrambe lineari in θ ( j ) e cioè se le suddette equazioni assumono la struttura: θ ( j + 1) = A( j )θ ( j ) + u ( j ) j = 0,1,...( k − 1) z ( j ) = C ( j )θ ( j ) + v ( j ) j = 1, 2,...k dove A ( j ) e C ( j ) sono matrici di dimensioni opportune. Uno stimatore dinamico è lineare se la funzione γ è linearmente dipendente da z ( k ) : k θɶ (i | k ) = Λ ( k ) (i) z ( k ) = ∑ Λ(i, j ) z ( j ) j =1 Capitolo 1 30 dove Λ( k ) (i ) e Λ(i, j ), j = 1, 2,...k sono rispettivamente matrici di dimensioni µ × kq e µ × q . Nel caso in cui sia: θɶ (i | k ) = Λ( k ) (i ) z ( k ) + λ(i, k ) con λ(i, k ) vettore a µ componenti, lo stimatore si dice affine. Se a uno stimatore dinamico si attribuisce una struttura del tipo: θɶ (i + 1| j + 1) = γ (θɶ (i | j ), z ( j + 1), i, j ) j = 0,1,...(k − 1) esso si dice iterativo. Stimatori di tipo iterativo possono anche essere definiti assumendo fissato l’istante i in cui si effettua la stima del vettore incognito; in tal caso si ha: θɶ (i | j + 1) = γ (θɶ (i | j ), z ( j + 1), i, j ) j = 0,1,...(k − 1) Anche nel caso dinamico, in corrispondenza alla scelta j = 0 , per θɶ (i | 0) si intende uno stimatore a priori di θ ( i ) , indipendente dalle misure. θ (0) v M E u θ S z Fig.1.2 θ Elementi di teoria della stima 31 La Fig. 1.2 rappresenta uno schema a blocchi del problema di stima dinamico: il blocco E rappresenta l’equazione di evoluzione (1.6) mentre i blocchi M ed S rappresentano rispettivamente l’equazione di misura (1.7) e lo stimatore (1.8). Le connessioni tratteggiate rappresentano il flusso delle informazioni statistiche a priori. Esempio 1.1 Un esempio di problema di stima può essere fornito considerando il problema di localizzazione di una nave, ferma o in movimento, mediante elaborazione di dati ottenuti per mezzo di radiofari in posizione fissa e nota. Con riferimento alla Fig. 1.3, sia N una nave che prelimiT narmente si suppone ferma in una posizione θ = ( θ1 θ2 ) incognita, interpretabile come un vettore deterministico. Siano Rs , s = 1,2, due T radiofari, le cui posizioni α ( s ) = α1( s ) α2( s ) , s = 1, 2, sono note. A bordo della nave si misurano nel generico istante j i tempi zs(j), s = 1,2, che un segnale emesso impiega per raggiungere il radiofaro Rs e tornare indietro dopo essere stato riflesso. A bordo della nave si misurano nel generico istante j i tempi zs(j), s = 1,2, che un segnale emesso impiega per raggiungere il radiofaro Rs e tornare indietro dopo essere stato riflesso. Indicando con ds la distanza fra N ed Rs e con c la velocità di propagazione del segnale, risulta: ( zs ( j) = 2ds 2 + vs ( j) = c c ) (θ −α ) +(θ −α ) 1 (s) 2 1 2 (s) 2 2 + vs ( j) = gs (θ ) + vs ( j) s =1,2 dove con vs ( j ) si è indicato l’errore aleatorio commesso nella misura del tempo zs nell’istante j . Capitolo 1 32 R2 α2 r (2) d2 θ2 N d1 α2(1) R1 α1(1) α1(2) θ1 Fig. 1.3 Considerando vettori bidimensionali la precedente equazione può essere riscritta: z ( j ) = g (θ ) + v ( j ) Se le due misure sono ripetute in diversi istanti di tempo j=1,2,..k, con notazioni vettoriali si avrà: z ( k ) = g ( k ) (θ ) + v ( k ) dove ovviamente: Elementi di teoria della stima 33 g (θ ) g (θ ) (k ) g (θ ) = ⋮ g (θ ) Il problema di stimare θ a partire dai risultati delle misure effettuate z ( k ) e dalle informazioni disponibili sugli errori v( k ) , costituisce evidentemente un problema di stima statico, non lineare. Poiché la funzione g non dipende dalla variabile temporale j, l’identificabilità del vettore θ sussiste se e solo se essa si verifica con una sola misura. Si osserva preliminarmente che la condizione necessaria q ≥ µ è verificata essendo q = µ = 2 . Poiché si ha: g1 (θ ) = 2d1 (θ ) c g 2 (θ ) = 2d 2 (θ ) c la proprietà di identificabilità sussiste ovviamente rispetto alle variabili ( d1 (θ ) , d 2 (θ ) ). Pertanto il problema si riconduce a quello della invertibilità rispetto a θ della funzione d (θ ) d (θ ) = 1 d 2 (θ ) Se θ può assumere qualunque valore in ℝ 2 (vettore deterministico incognito non vincolato) ci si convince facilmente che la risposta è negativa poiché considerati due punti θ ' e θ " diversi e simmetrici rispetto alla retta r che congiunge i due radiofari, risulta d (θ ') = d (θ ") . 34 Capitolo 1 Una eventuale informazione a priori, che riduce l’insieme dei possibili valori di θ da ℝ 2 a un suo opportuno sottoinsieme D , potrebbe garantire la proprietà di identificabilità, rendendo il problema di stima ben posto. In particolare, l’informazione a priori che la nave si trovi da una parte o dall’altra della retta r (cioè che D sia costituito dall’uno o dall’altro dei due semipiani individuati da r) garantirebbe l’identificabilità di θ . Si supponga ora che la nave si muova e sia θ ( j ) la posizione incognita che essa occupa nell’istante j. Indicando con us ( j ), s = 1, 2 , la velocità della nave secondo l’asse s nell’istante j, nota con incertezza e quindi caratterizzata come una variabile aleatoria, con notazioni vettoriali bidimensionali, risulta: θ ( j + 1) = θ ( j ) + u ( j ) j = 0,1,..( k − 1) La posizione iniziale θ ( 0 ) , incognita, può essere anch’essa interpretata come un vettore aleatorio. L’equazione di misura diventa ovviamente: z ( j ) = g (θ ( j )) + v ( j ) j = 1, 2,...k Il problema di stimare θ (i ) date le misure z ( k ) nonché le informazioni a priori sui rumori {u ( j )} , {v ( j )} e sulla posizione iniziale θ (0) , è chiaramente un esempio di problema di stima dinamico non lineare. Più in particolare se i < k si tratta di un problema di interpolazione, se i = k di un problema di filtraggio, se i > k di un problema di previsione. Anche nel caso dinamico la sequenza incognita: Elementi di teoria della stima θ (k ) 35 θ (1) θ (2) = ⋮ θ (k ) è non identificabile se il modello dinamico del moto consente che nel supporto Ωθ ( k ) della densità di probabilità a priori pθ ( k ) siano presenti traiettorie θ ( k )′ , θ ( k ) ′′ diverse e simmetriche rispetto alla retta r. 1.4 Proprietà degli stimatori La “bontà” di uno stimatore può essere valutata in base ad opportune proprietà che possono caratterizzare lo stimatore stesso. Poiché lo stimatore è un vettore aleatorio essendo dipendente dalle misure, tali proprietà non possono che essere di natura statistica e, in particolare, esse si riferiscono al valor medio e alla matrice di covarianza dello stimatore stesso. Una prima proprietà interessante si riferisce all’idea intuitiva che, ripetendo più volte l’operazione di stima utilizzando diversi vettori di misura, si possa ricostruire più fedelmente il vettore incognito, mediante una operazione di media sulle stime ottenute. In effetti, sotto opportune ipotesi, per la legge dei grandi numeri tale media converge al valore medio della stima ed è quindi importante confrontare quest’ultimo col valore incognito θ . In particolare si ha la seguente definizione.