Comments
Description
Transcript
Elaborazione delle Immagini
CLASSIFICAZIONE DELLE IMMAGINI • Immagini visibili: percepibili dall'occhio • Immagini fisiche (non visibili): distribuzioni bidimensionali di parametri (proprietà fisiche misurabili) • Funzioni matematiche: funzioni continue di due variabili (immagini “analogiche”) e funzioni discrete di due indici (immagini “discrete”, sequenze bidimensionali) • Immagini digitali: funzioni (bidimensionali) a valori discreti di variabili discrete L11/1 CLASSIFICAZIONE DELLE IMMAGINI (Cont.) Ci si riferirà nel seguito: • Alle immagini in contesto di ottica non coerente (l’informazione è contenuta nell’intensità del campo e.m. = intensità luminosa: non si utilizza l’informazione di fase) • Alle lunghezze d’onda del visibile (0.4 ÷ 0.7 μm) • E, normalmente, si farà una trattazione su singola lunghezza d’onda (omettendo quindi tale quantità nelle espressioni matematiche). L11/2 NATURA ONDULATORIA DELLA LUCE (1/2) L11/3 ELABORAZIONE NUMERICA • Insieme di azioni compiute da appositi algoritmi su una immagine numerica per modificarla in modo da raggiungere un prefissato obiettivo, producendo un risultato che è ancora una immagine. • Inoltre, sono temi di image processing and understanding anche: • Compressione di immagini (image coding) • Analisi di immagini (image analysis) • Riconoscimento di forme (pattern recognition) • Trattamento del segnale video (video processing) L11/4 ELABORAZIONE NUMERICA ⎧ A Basso Livello ⎪ ELABORAZIONE NUMERICA DELLE IMMAGINI ⎨ ⎪ Ad Alto Livello ⎩ “Basso livello”: Filtraggio del disturbo, estrazione dei contorni, esaltazione di contrasti. Si ha “basso livello” fino alla segmentazione inclusa (partizione di un’immagine in regioni significative). “Alto livello”: Estrazione dei parametri di interesse, riconoscimento di forme, riconoscimento di cambiamenti in sequenze di immagini, classificazione, identificazione. L11/5 SEGMENTAZIONE DI UN’IMMAGINE Segmentazione: processo di partizionamento di un’immagine in regioni disgiunte e omogenee. R. Nock, F. Nielsen: Statistical Region Merging. IEEE Trans. Pattern Anal. Mach. Intell. 26(11): 1452-1458 (2004). L11/6 TRATTAMENTO DEL SEGNALE IN AMBITO DI IMAGE PROCESSING Si svolgono, tipicamente in sequenza, le seguenti funzioni (o parte di esse): • Formazione (acquisizione) e caratterizzazione • Filtraggio • Estrazione di informazioni • Compressione • Descrizione (understanding) • Archiviazione • Trasmissione – diffusione (broadcasting) L11/7 COMPONENTI DI UN SISTEMA DI ELABORAZIONE IMMAGINI L11/8 MODELLO DELL’IMMAGINE (1/3) • Una immagine monocromatica e reale può essere caratterizzata come la distribuzione spaziale di energia radiante prodotta da una sorgente luminosa tramite una funzione spazio-temporale reale, non negativa, finita e limitata (rispetto alle variabili spaziali e temporali). • L'immagine effettivamente percepita (da un osservatore umano) o acquisita (mediante un trasduttore) è la funzione modificata dalla risposta dell'osservatore (coefficiente di visibilità) e/o del trasduttore, tipicamente secondo una media temporale. L11/9 Il coefficiente di visibilità dell’occhio umano L11/10 MODELLO DELL’IMMAGINE (2/3) L'immagine può quindi essere caratterizzata, d’accordo con l’intuizione, come una distribuzione bidimensionale di intensità: f = f ( x, y,t ) Più precisamente, in alcuni testi la illuminanza, ed è definita come: f è detta irradianza o dΦ E= dA Φ è un flusso luminoso (grandezza “fisiologica”) la cui unità è il Lumen (Lm); A indica l’area (m2). ⎡ lumen ⎤ L’irradianza si misura pertanto nella unità fotometrica ⎢ (Lux) 2 ⎥ ⎣ m ⎦ ⎡W ⎤ a cui corrisponde un parametro fisico di intensità espresso in ⎢ 2 ⎥ . ⎣m ⎦ L11/11 MODELLO DELL’IMMAGINE (3/3) Altre grandezze correlate con la radiazione luminosa sono: • Energia radiante Q [W ⋅ s = Joule] alla quale corrisponde l’energia luminosa [ Lm ⋅ s ]. dQ • Potenza Φ = [W ] alla quale corrisponde il flusso luminoso dt misurato in Lumen [Lm]. dΦ ⎡W ⋅ sr −1 ⎤ alla quale corrisponde • Intensità radiante I = ⎦ dΩ ⎣ ⎡ Lm ⎤ = candela ⎥ l’intensità luminosa ⎢ ⎣ sr ⎦ L11/12 Lumen: 1 Lm equivale al flusso luminoso rilevabile in un angolo solido di 1 steradiante emesso isotropicamente in tutte le direzioni da una sorgente con intensità luminosa di 1 candela (cd) Candela: 1 cd è pari all'intensità luminosa emessa in una data direzione da una sorgente monocromatica di frequenza pari a 540 × 1012 Hz 1 ( λ = 555 nm ) con una intensità radiante in detta direzione di W 683 per steradiante L11/13 ACQUISIZIONE DELL’IMMAGINE • E’ il processo di rivelazione e registrazione che "ferma" l'immagine su un supporto adatto agli usi successivi. • Tecnologie principali: fotochimiche (es. pellicola fotografica) e optoelettroniche (es. telecamera + dispositivo di memoria). • L'acquisizione di una immagine digitale deve produrre come risultato una immagine numerica su un supporto accessibile da parte di un dispositivo di calcolo. L11/14 FASI DELL’ACQUISIZIONE L11/15 INTENSITÀ DELLE IMMAGINI (1/2) • L’irradianza di una scena (intensità) è caratterizzata dal prodotto di due termini: l’illuminazione i ( x, y ) e la riflettanza r ( x, y ) f ( x, y ) = i ( x, y ) ⋅ r ( x, y ) con 0 < f ( x, y ) < ∞ , 0 < i ( x, y ) < ∞ , 0 < r ( x, y ) < 1 • L’immagine è costituita da una componente dovuta alla luce proveniente dalla sorgente di illuminazione che è modulata da una componente dovuta alla luce riflessa dagli oggetti presenti nella scena. • La componente di illuminazione è responsabile delle variazioni lente di luminosità (basse frequenze spaziali), mentre la componente di riflettanza dà luogo alle variazioni brusche di luminosità, spesso in corrispondenza ai contorni o bordi degli oggetti (alte frequenze spaziali). L11/16 INTENSITÀ DELLE IMMAGINI (2/2) L’effettiva natura di i ( x, y ) è determinata dalla sorgente luminosa, mentre r ( x, y ) dipende dalle caratteristiche degli oggetti presenti nella scena, e varia tra 0 (assorbimento totale) e 1 (riflessione completa) I limiti di cui sopra sono ovviamente teorici, valori reali (tipici) sono: Sorgente luminosa Chiaro di luna Interno (ambiente di lavoro, almeno) Cielo nuvoloso Luce solare Oggetto Velluto nero Grigio di riferimento (cartoncino Kodak) Parete bianca a calce Argento e altri metalli chiari Neve fresca i (candele) 0.01 100 1000 9000 r 0.01 0.18 0.80 0.90 0.93 L11/17 INTENSITÀ DELLE IMMAGINI E SCALA DI GRIGI • Si può pertanto assumere che Lmin < f ( x, y ) < Lmax , dove valori ragionevoli per Lmin e Lmax sono: Lmin ≅ 0.005 cd Lmax ≅ 200 cd (interni) Lmax ≅ 10000 cd (esterni) • Per una immagine monocromatica, l’intervallo [ Lmin ,Lmax ] prende il nome di scala dei grigi, mentre l’intensità f ( x, y ) è detta anche livello di grigio dell’immagine nel punto di coordinate ( x, y ) . • In pratica si usa una scala dei grigi convenzionalmente compresa in [0,L − 1] , in cui 0 corrisponde al nero e L − 1 rappresenta il bianco, nella quale si considerano L livelli discreti di grigio per tenere conto del carattere digitale della f ( x.y ) dopo la quantizzazione dell’intensità. L11/18 IMMAGINE COME MATRICE DI PIXEL(1/3) • Tenendo conto anche del campionamento spaziale che rende discreti gli intervalli di variazione delle due dimensioni dell’immagine, x e y, e assumendo che l’immagine continua sia approssimata mediante M × N campioni equispaziati lungo x e y, con: 0 ≤ x ≤ M −1 0 ≤ y ≤ N −1 si ha: ⎡ f ( 0,0 ) ⎢ f 1,0 ( ) ⎢ f ( x, y ) = ⎢ # ⎢ ⎣ f ( M − 1,0 ) f (0,1) ... f ( 1,1) ... ... # f ( M − 1,1) ... f (0,N − 1) ⎤ f ( 1,N − 1) ⎥ ⎥ ⎥ # ⎥ f ( M − 1,N − 1) ⎦ L11/19 IMMAGINE COME MATRICE DI PIXEL(2/3) • Un'immagine digitale monocromatica pertanto è una matrice f ( x, y ) di valori discreti di intensità luminosa (livelli di grigio). • Essa è costituita da M × N pixel (picture elements) ciascuno dei quali ha un valore appartenente all'intervallo [0,L − 1] essendo L i livelli possibili di intensità (o di grigio). • Si ha tipicamente L = 2b , dove b è il numero di bit usato per codificare ciascun pixel (profondità del pixel). L11/20 IMMAGINE COME MATRICE DI PIXEL(3/3) • Per esempio, con 8 bit si ha la possibilità di rappresentare un numero di livelli (256) tale da consentire una discriminazione dei grigi accettabile nella maggior parte delle applicazioni, in quanto abbastanza prossima a quella dell'occhio umano. • Una immagine monocromatica tipica (1024 × 768 × 8 ) occupa pertanto circa 6 Mbit di memoria; con “tre” piani di colore si arriva a circa 18 Mbit, tali valori comportano spesso necessità di “compressione” dell’immagine. L11/21 LA DINAMICA DELL’IMMAGINE (1/3) • Si è fatta l’ipotesi implicita di una quantizzazione lineare per la produzione degli L livelli discreti di grigio a partire dalla intensità luminosa • La risposta del sistema visivo umano, tuttavia, non è lineare, bensì logaritmica: l’occhio può discriminare un numero enorme di livelli di luminosità, ben maggiore dei 256 precedentemente ipotizzati. • Pertanto una immagine digitalizzata ha spesso una dinamica molto meno ampia di quella del sistema visivo umano, o in altri termini c’è l’esigenza, per immagini di qualità, di usare più di 8 bit. L11/22 LA DINAMICA DELL’IMMAGINE (2/3) • Le limitazioni di dinamica sono evidenti quando la scena è ad elevato contrasto: se il sensore è lineare, le parti scure risulteranno sottoesposte (ripresa effettuata con obiettivo poco aperto), oppure le parti chiare risulteranno sovraesposte (obiettivo molto aperto): L11/23 LA DINAMICA DELL’IMMAGINE (2/3) • Una soluzione più generale al problema delle scene caratterizzate da una dinamica troppo ampia è adottata nelle videocamere, in cui la grandezza quantizzata non è direttamente l’intensità, ma una sua funzione esponenziale. • Se g è il livello di grigio e f l’intensità, si ha cioè: • g= fγ con γ<1 • Questa correzione permette di approssimare la caratteristica logaritmica del sistema visivo umano. • Il valore γ che meglio realizza questa condizione è (tipicamente): γ = 0.4 L11/24 RISOLUZIONE SPAZIALE E PIXEL (1/6) • Ogni pixel rappresenta l’intensità nella corrispondente posizione della griglia di campionamento. • Un pixel rappresenta in realtà non soltanto un punto dell’immagine, ma piuttosto una regione rettangolare coincidente con una cella della griglia. • Il valore associato al pixel rappresenta pertanto la intensità media. L11/25 RISOLUZIONE SPAZIALE E PIXEL (2/6) L11/26 RISOLUZIONE SPAZIALE E PIXEL (3/6) • Se si fanno variare le dimensioni dei pixel, le dimensioni dell’immagine restano invariate al variare della risoluzione. • Se la dimensione dei pixel resta invariata, la variazione di risoluzione provoca invece una variazione delle dimensioni dell’immagine. • Con pixel di grande dimensione, non solo la risoluzione spaziale è scadente, ma appaiono ben visibili le discontinuità di grigio al confine tra i pixel. L11/27 RISOLUZIONE SPAZIALE E PIXEL (4/6) L11/28 RISOLUZIONE SPAZIALE E PIXEL (5/6) • Man mano che le dimensioni dei pixel si riduce, l’effetto diventa meno visibile, fino al punto che si ha l’impressione di un’immagine continua, quando la dimensione dei pixel diventa più piccola della risoluzione spaziale del sistema visivo umano. • Siccome quest’ultima dipende dalla distanza e dalle altre condizioni di osservazione, in generale non è definibile a priori il numero di pixel necessari a garantire una buona qualità dell’immagine. • Sicuramente la dimensione dei pixel deve essere piccola in relazione alla scala degli oggetti rappresentati nell’immagine. L11/29 RISOLUZIONE SPAZIALE E PIXEL (6/6) • In realtà è la tecnologia dei sensori che determina la dimensione dei pixel e la risoluzione dell’immagine, piuttosto che i requisiti dell’applicazione. • D’altra parte anche la condizione di “immagine di buona qualità” è strettamente dipendente dall’applicazione, nel caso generale, e fortemente soggettiva, nel caso dell’osservazione visuale. • Si noti che altre disposizioni spaziali, oltre alla griglia rettangolare, sono teoricamente possibili: Triangolare Quadrata Esagonale L11/30 EFFETTI DEL NUMERO DI LIVELLI DI QUANTIZZAZIONE (1/3) L11/31 EFFETTI DEL NUMERO DI LIVELLI DI QUANTIZZAZIONE (2/3) • La riduzione del numero di livelli provoca il peggioramento della qualità dell’immagine: appaiono falso contorni, e non è possibile distinguere oggetti che differiscono per variazioni di grigio lente. • Si noti che 16 livelli di grigio possono sembrare sufficienti nelle immagini stampate, ma non lo sono per immagini visualizzate a monitor. • Nell’esempio mostrato in seguito si noterà come le immagini a 256, 128 e 64 livelli di grigio siano praticamente simili dal punto di vista visuale. • Nelle altre immagini si manifesta (in misura crescente al diminuire del numero di livelli) il fenomeno dei falsi contorni nelle zone di lenta variazione dei grigi, fino al caso limite delle immagini a due livelli (bi-livello o binarie). L11/32 EFFETTI DEL NUMERO DI LIVELLI DI QUANTIZZAZIONE (3/3) L11/33 TRASFORMATA DI FOURIER BIDIMENSIONALE (1/2) La trasformata di Fourier della funzione bidimensionale (2D) f ( x, y ) reale o complessa è definita dalla relazione: F ( ωx ,ω y ) = ∫∫ ∞ −∞ f ( x, y ) e − j ( ω x x + jω y y ) dxdy Dove ωx e ω y sono le frequenze angolari o pulsazioni spaziali. L11/34 TRASFORMATA DI FOURIER BIDIMENSIONALE (2/2) E’ bene sottolineare che con il termine, frequenza spaziale: ωx vx = 2π Si indica la rapidità della variazione della luminanza o livello di grigio in una certa direzione e si misura in numero di oscillazioni (cicli) per unità di lunghezza (date le dimensioni limitate delle immagini si possono usare unità di misura più piccole del metro, come il cm o il mm). L11/35 CAMPIONAMENTO SPAZIALE (1/6) • Consideriamo un’immagine in bianco e nero, rappresentata dalla funzione 2D continua f ( x.y ) (livello di grigio o intensità). • In un’operazione di campionamento spaziale ideale, i campioni dell’immagine sono ottenuti moltiplicando la funzione f ( x.y ) per una funzione di campionamento c ( x.y ) , costituita da impulsi ideali disposti su una griglia rettangolare di passo Δx e Δy . L11/36 CAMPIONAMENTO SPAZIALE (2/6) L11/37 CAMPIONAMENTO SPAZIALE (3/6) Per il teorema della convoluzione lo spettro Fc ( ωx ,ω y ) dell’immagine campionata f c ( x, y ) risulta essere definito come la ( ) ( ) convoluzione degli spettri F ωx ,ω y della f ( x, y ) e C ωx ,ω y della c ( x, y ) . Fc ( ωx ,ω y ) = F ( ωx ,ω y ) ⊗ C ( ωx ,ω y ) Fc ( ωx ,ω y ) = ∞ ∞ ∑ ∑ F (ω x − n1ωxc ,ω y − n2 ω yc ) ) n1 =−∞ n2 =−∞ Dove: ωxc = 2πν xc ω yc = 2πν yc Sono le pulsazioni spaziali di campionamento. L11/38 CAMPIONAMENTO SPAZIALE (4/6) Lo spettro dell’immagine campionata è costituito dalla ripetizione infinita dello spettro dell’immagine continua secondo ωx e ω y sulla griglia rettangolare di passo, rispettivamente, ωxc e ω yc . L11/39 CAMPIONAMENTO SPAZIALE (5/6) In effetti in analogia a quanto noto per il campionamento di funzioni 1D (segnali), si possono definire le condizioni di campionamento corretto (teorema del campionamento) di una immagine in funzione delle frequenze spaziali massime: ν xM ν yM 1 Δx ≤ 2ν xM ν xc ≥ 2ν xM ovvero 1 Δy ≤ 2ν yM ν yc ≥ 2ν yM L11/40 CAMPIONAMENTO SPAZIALE (6/6) QUESTA MATRICE RAPPRESENTA L’IMMAGINE CAMPIONATA ⎡ f ( 0,0 ) ⎢ f 0,1 ( ) ⎢ ⎢ # ⎢ ⎣ f ( 0,M − 1) f ( 1,0 ) ... f ( 1,1) ... ... # f (1,M − 1) ... f ( N − 1,0 ) ⎤ ⎥ f ( N − 1,1) ⎥ ⎥ # ⎥ f ( N − 1,M − 1) ⎦ L11/41 GENERALITÀ SULLE TRASFORMAZIONI NUMERICHE 2D (1/2) La trasformazione numerica 2D di una matrice di dati di ingresso (immagine campionata) è definita dalla relazione: F ( k1 ,k2 ) = N1 N2 ∑∑ f ( n ,n ) A ( n ,n ; k ,k ) 1 2 1 2 1 2 n1 =1 n2 =1 dove: • f ( n1 ,n2 ) sono i dati di ingresso • A ( n1 ,n2 ; k1 ,k 2 ) rappresentano la base o nucleo (Kernel) dell’operazione di trasformazione. L11/42 GENERALITÀ SULLE TRASFORMAZIONI NUMERICHE 2D (2/2) La trasformata inversa è espressa da: f ( n1 ,n2 ) = N1 N2 ∑∑ F ( k ,k ) B ( n ,n ; k ,k ) 1 2 1 2 1 2 k1 =1 k2 =1 dove • B ( n1 ,n2 ; k1 ,k 2 ) rappresenta l’inverso della base o nucleo dell’operatore di trasformazione. L11/43 TRASFORMATA DI FOURIER DI UN’IMMAGINE (1/3) La trasformazione o trasformata di Fourier 2D disscreta o numerica di una matrice di dati di ingresso è definita dalla relazione: F ( k1 ,k2 ) = N 1 −1 N 2 −1 ∑∑ f ( n ,n ) e 1 2 −j 2π ( k1n1 + k2n2 ) N n1 =0 n2 =0 dove gli indici k1 e k 2 corrispondono alle frequenze spaziali: ν x e ν y . In particolare: ν x = k1 Δν , ν y = k2 Δν essendo: Δν un incremento costante di frequenza (passo di campionamento nelle frequenze spaziali). L11/44 TRASFORMATA DI FOURIER DI UN’IMMAGINE (2/3) Una delle proprietà interessanti della trasformata 2D numerica di Fourier è rappresentata dal significato della componente spettrale nell’origine: F ( 0,0 ) = N 1 −1 N 2 −1 ∑∑ f ( n ,n ) 1 2 n1 =0 n2 =0 che risulta uguale a dell’immagine. N 2 volte la media spaziale dei dati L11/45 TRASFORMATA DI FOURIER DI UN’IMMAGINE (3/3) Immagine Modulo della trasformata L11/46 SISTEMI NUMERICI 2D (1/2) In analogia a quanto già visto riguardo ai sistemi 1D discreti, si possono definire sistemi 2D discreti spazialmente invarianti, per i quali la sequenza d’uscita è indipendente dalla posizione della sequenza d’ingresso. Cioè vale: g ( n1 ,n2 ) = ∞ ∞ ∑ ∑ f ( k ,k ) h ( n − k ,n 1 2 1 1 2 − k2 ) n1 =−∞ n2 =−∞ L11/47 SISTEMI NUMERICI 2D (2/2) Nel dominio delle frequenze spaziali la funzione di trasferimento H ( ωx ,ω y ) è espressa da: H ( ωx ,ω y ) = ∞ ∞ ∑∑ h ( n1 ,n2 ) e − jn1ωx e − jn2 ω y k1 =−∞ n2 =−∞ L11/48 FILTRI 2D (1/2) I sistemi numerici espressi dalla relazione: g ( n1 ,n2 ) = N 1 −1 N 2 −1 ∑∑ a ( k ,k ) f ( n − k ,n 1 2 1 1 2 − k2 ) k1 =0 k2 =0 sono “senza reazione” è vengono anche chiamati FIR, cioè con risposta impulsiva finita. L11/49 FILTRI 2D (2/2) I sistemi numerici “con reazione” sono espressi dalla relazione: g ( n1 ,n2 ) = N 1 −1 N 2 −1 ∑∑ a ( k ,k ) f ( n − k ,n 1 2 1 1 2 − k2 ) − k1 =0 k2 =0 M 1 −1 M 2 −1 − ∑ ∑ b ( k ,k ) g ( n − k ,n 1 2 1 1 2 − k2 ) k1 =0 k2 =0 k1 + k2 ≠0 L11/50 ESEMPI DI ELABORAZIONI (1/3) ESEMPIO DI APPLICAZIONE DI UN FILTRO 2D FIR di tipo passa-alto sul volto della Venere Effetto estrazione di contorni L11/51 ESEMPI DI ELABORAZIONI (2/3) ESEMPIO DI APPLICAZIONE DI UN FILTRO 2D FIR di tipo passa-basso sul volto della Venere EFFETTO RIDUZIONE DEL RUMORE L11/52 ESEMPI DI ELABORAZIONI (3/3) ESEMPIO DI APPLICAZIONE DI UN FILTRO 2D FIR di tipo passa-basso (con frequenza di taglio inferiore) sul volto della Venere Effetto riduzione del rumore ma peggioramento della definizione L11/53 ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE Elaborazioni semplici: o Variazione della quantizzazione dei campioni dell’immagine. o Espansione della scala dei livelli di grigio (esaltazione dei contrasti). o Espansione dell’immagine (zoom). o Istogramma delle ampiezze dei livelli di grigio. o Media aritmetica (filtraggio passa-basso). o Differenza dei livelli di grigio ed estrazione dei contorni (filtraggio passa-alto). L11/54 ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE o Variazione della quantizzazione dei campioni dell’immagine Aumento del passo di quantizzazione ⇓ Riduzione del numero dei livelli di grigio ⇓ Immagine più “economica” o Quantizzazione non uniforme: si riduce il numero di livelli di grigio dove si hanno forti variazioni di contrasto e lo si aumenta dove il contrasto è poco variabile. L11/55 ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE o Espansione della scala dei livelli di grigio (esaltazione dei contrasti): aumento della nitidezza, o Espansione dell’immagine (zoom): si ripete stesso dato campionato (pixel) in forma di matrice quadrata 2 × 2 o 3 × 3 . Istogramma dei livelli di Grigio o Istogramma delle ampiezze dei livelli di grigio 0 50 100 Livelli di Grigio 150 200 250 L11/56 ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE o Media aritmetica (filtraggio passa-basso) L11/57 ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE o Media aritmetica (filtraggio passa-basso) L11/58 ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE o Differenza dei livelli di grigio ed estrazione dei contorni (filtraggio passa-alto) gradiente del livello di grigio: ⎛ ∂f ∂f ⎞ ∇f ( x, y ) = ⎜ , ⎟ = ( Dx ,Dy ) ⎝ ∂x ∂y ⎠ in modulo e direzione: D= D +D 2 x 2 y , ⎛ Dy ⎞ ϕ = tan ⎜ ⎟ ⎝ Dx ⎠ −1 Se il pixel ha coordinate ( n1 ,n2 ) con intensità f ( n1 ,n2 ) , la stima più semplice del gradiente è: Dx = f ( n1 ,n2 + 1) − f ( n1 ,n2 ) , Dy = f ( n1 ,n2 ) − f ( n1 + 1,n2 ) L11/59 L11/60 ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE o Differenza dei livelli di grigio ed estrazione dei contorni (filtraggio passa-alto) la maschera con i suoi coefficienti indica il peso da applicare al corrispondente livello di grigio con relativo segno: −1 1 Dx = 0 0 , 1 0 Dy = −1 0 o Metodo di Roberts: D1 = f ( n1 ,n2 + 1) − f ( n1 + 1,n2 ) , D2 = f ( n1 ,n2 ) − f ( n1 + 1,n2 + 1) con maschere: 0 1 D1 = −1 0 , 1 0 D2 = 0 −1 L11/61 ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE Stima più accurata (maschere 3 × 3 ): −1 0 1 Dx = −1 0 1 −1 0 1 1 , 1 1 Dy = 0 0 0 −1 −1 −1 Operatore di Prewitt o gradiente “smoothed” −1 0 1 Dx = −2 0 2 −1 0 1 1 , 2 1 Dy = 0 0 0 −1 −2 −1 Operatore di Sobel L11/62 ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE Rilevazione dei contorni: originale (in alto a sinistra), algoritmo di Roberts (in alto a destra), Prewitt (in basso a sinistra), Sobel (in basso a destra). L11/63 LA TRASFORMATA DI HOUGH Nelle immagini si distinguono: o Proprietà di tipo globale: livello di grigio medio, distribuzione di colore, ... o Proprietà speciali: presenza di linee o di particolari figure geometriche (rette, circonferenze, ellissi, …) o L’identificazione di features locali permettono di interpretare e riconoscere il tipo di immagine. L11/64 LA TRASFORMATA DI HOUGH Rilevazione di linee tramite: 1. Template matching, utilizzando un insieme di maschere che modellino l’andamento locale di una retta. 2. Trasformata di Hough. L11/65 Rilevazione di linee o Nel Template matching si cercano i picchi nella correlazione tra l’immagine e un insieme di maschere che modellano la struttura locale di rette. o Se una maschera M in un punto P ritorna una risposta superiore ad una soglia, in quel punto passa un segmento di retta la cui orientazione e spessore è modellato da M. -1 -1 -1 2 2 2 -1 -1 -1 L11/66 La Trasformata di Hough o E’ un esempio di operatore globale che permette di riconoscere particolari configurazioni di punti presenti nell’immagine, come segmenti, curve o altre forme prefissate. o Si basa sul principio che la forma cercata può essere espressa tramite una funzione nota che fa uso di un insieme di parametri. L11/67 La Trasformata di Hough o Riconoscimento di rette y = ax + b La retta è nota se lo sono i parametri (a, b) In alternativa (forma normale di Hesse): ρ = x cos ϑ + y sin ϑ se sono noti i parametri ( ρ ,ϑ ) . y = −0.5x + 0.5 in funzione dei parametri ( ρ = 0.447 , ϑ = 1.107 ) L11/68 La Trasformata di Hough Un punto P è identificato dall’intersezione di più rette: Se nell’immagine ci sono punti allineati su una stessa retta, sul piano dei parametri, le curve che corrispondono alle trasformazioni dei vari punti si intersecano in un punto del piano trasformato che è l’immagine della retta L11/69 La Trasformata di Hough Trasformazione delle rette passanti per un punto nel piano dei parametri L11/70 La Trasformata di Hough Tre punti allineati A, B e C nello spazio dei parametri. L11/71 La Trasformata di Hough I punti nello spazio dei parametri indicano rette: L11/72 222 SEGNALI Figura 11.39 – Esempi di trasformazione dal piano x,y (I e III colonna) al piano ρ ,ϑ (II e IV). Figura 11.40 – Piano dell’immagine e piano trasformato. La Trasformata di Hough Immagine costituita da un quadrato, in assenza di rumore: Esempio di matrice di accumulazione di una figura piana (quadrato) in assenza di rumore. L11/73 La Trasformata di Hough Se l’immagine è alterata dal rumore (tipo “sale e pepe” al 10 %), Immagine affetta da rumore “sale e pepe” al 10 % e trasformata di Hough per una figura piana (quadrato). L11/74 La Trasformata di Hough Esempio di matrice di accumulazione di un quadrato in presenza di rumore sale e pepe al 10 %. L11/75 La Trasformata di Hough Ricostruzione del quadrato mediante sogliatura della matrice di accumulazione. L11/76 Immagine complessa di cui si vogliono rivelare i tratti rettilinei. L11/77 Edge decection dell’immagine e relativa Trasformata di Hough. L11/78 Ricostruzione delle componenti rettilinee dell’immagine mediante tre diversi valori di sogliatura. L11/79