...

Elaborazione delle Immagini

by user

on
Category: Documents
15

views

Report

Comments

Transcript

Elaborazione delle Immagini
CLASSIFICAZIONE DELLE IMMAGINI
• Immagini visibili: percepibili dall'occhio
• Immagini fisiche (non visibili): distribuzioni bidimensionali di
parametri (proprietà fisiche misurabili)
• Funzioni matematiche: funzioni continue di due variabili
(immagini “analogiche”) e funzioni discrete di due indici
(immagini “discrete”, sequenze bidimensionali)
• Immagini digitali: funzioni (bidimensionali) a valori discreti di
variabili discrete
L11/1
CLASSIFICAZIONE DELLE IMMAGINI (Cont.)
Ci si riferirà nel seguito:
• Alle immagini in contesto di ottica non coerente (l’informazione è
contenuta nell’intensità del campo e.m. = intensità luminosa: non
si utilizza l’informazione di fase)
• Alle lunghezze d’onda del visibile (0.4 ÷ 0.7 μm)
• E, normalmente, si farà una trattazione su singola lunghezza
d’onda (omettendo quindi tale quantità nelle espressioni
matematiche).
L11/2
NATURA ONDULATORIA DELLA LUCE (1/2)
L11/3
ELABORAZIONE NUMERICA
• Insieme di azioni compiute da appositi algoritmi su una immagine
numerica per modificarla in modo da raggiungere un prefissato
obiettivo, producendo un risultato che è ancora una immagine.
• Inoltre, sono temi di image processing and understanding
anche:
• Compressione di immagini (image coding)
• Analisi di immagini (image analysis)
• Riconoscimento di forme (pattern recognition)
• Trattamento del segnale video (video processing)
L11/4
ELABORAZIONE NUMERICA
⎧ A Basso Livello
⎪
ELABORAZIONE NUMERICA DELLE IMMAGINI ⎨
⎪ Ad Alto Livello
⎩
“Basso livello”: Filtraggio del disturbo, estrazione dei contorni,
esaltazione di contrasti. Si ha “basso livello” fino
alla segmentazione inclusa (partizione di
un’immagine in regioni significative).
“Alto livello”:
Estrazione
dei
parametri
di
interesse,
riconoscimento di forme, riconoscimento di
cambiamenti
in
sequenze
di
immagini,
classificazione, identificazione.
L11/5
SEGMENTAZIONE DI UN’IMMAGINE
Segmentazione: processo di partizionamento di un’immagine in regioni
disgiunte e omogenee.
R. Nock, F. Nielsen: Statistical Region Merging. IEEE Trans. Pattern Anal. Mach.
Intell. 26(11): 1452-1458 (2004).
L11/6
TRATTAMENTO DEL SEGNALE IN AMBITO
DI IMAGE PROCESSING
Si svolgono, tipicamente in sequenza, le seguenti funzioni
(o parte di esse):
• Formazione (acquisizione) e caratterizzazione
• Filtraggio
• Estrazione di informazioni
• Compressione
• Descrizione (understanding)
• Archiviazione
• Trasmissione – diffusione (broadcasting)
L11/7
COMPONENTI DI UN SISTEMA DI ELABORAZIONE IMMAGINI
L11/8
MODELLO DELL’IMMAGINE (1/3)
• Una immagine monocromatica e reale può essere caratterizzata
come la distribuzione spaziale di energia radiante prodotta da
una sorgente luminosa tramite una funzione spazio-temporale
reale, non negativa, finita e limitata (rispetto alle variabili spaziali
e temporali).
• L'immagine effettivamente percepita (da un osservatore umano)
o acquisita (mediante un trasduttore) è la funzione modificata
dalla risposta dell'osservatore (coefficiente di visibilità) e/o del
trasduttore, tipicamente secondo una media temporale.
L11/9
Il coefficiente di visibilità dell’occhio umano
L11/10
MODELLO DELL’IMMAGINE (2/3)
L'immagine può quindi essere caratterizzata, d’accordo con
l’intuizione, come una distribuzione bidimensionale di intensità:
f = f ( x, y,t )
Più precisamente, in alcuni testi la
illuminanza, ed è definita come:
f
è detta irradianza o
dΦ
E=
dA
Φ è un flusso luminoso (grandezza “fisiologica”) la cui unità è il
Lumen (Lm); A indica l’area (m2).
⎡ lumen ⎤
L’irradianza si misura pertanto nella unità fotometrica ⎢
(Lux)
2 ⎥
⎣ m ⎦
⎡W ⎤
a cui corrisponde un parametro fisico di intensità espresso in ⎢ 2 ⎥ .
⎣m ⎦
L11/11
MODELLO DELL’IMMAGINE (3/3)
Altre grandezze correlate con la radiazione luminosa sono:
• Energia radiante Q [W ⋅ s = Joule] alla quale corrisponde l’energia
luminosa [ Lm ⋅ s ].
dQ
• Potenza Φ =
[W ] alla quale corrisponde il flusso luminoso
dt
misurato in Lumen [Lm].
dΦ
⎡W ⋅ sr −1 ⎤ alla quale corrisponde
• Intensità radiante I =
⎦
dΩ ⎣
⎡ Lm
⎤
= candela ⎥
l’intensità luminosa ⎢
⎣ sr
⎦
L11/12
Lumen:
1 Lm equivale al flusso luminoso rilevabile in un angolo solido di 1
steradiante emesso isotropicamente in tutte le direzioni da una
sorgente con intensità luminosa di 1 candela (cd)
Candela:
1 cd è pari all'intensità luminosa emessa in una data direzione da
una sorgente monocromatica di frequenza pari a 540 × 1012 Hz
1
( λ = 555 nm ) con una intensità radiante in detta direzione di
W
683
per steradiante
L11/13
ACQUISIZIONE DELL’IMMAGINE
• E’ il processo di rivelazione e registrazione che "ferma"
l'immagine su un supporto adatto agli usi successivi.
• Tecnologie principali: fotochimiche (es. pellicola fotografica) e
optoelettroniche (es. telecamera + dispositivo di memoria).
• L'acquisizione di una immagine digitale deve produrre come
risultato una immagine numerica su un supporto accessibile da
parte di un dispositivo di calcolo.
L11/14
FASI DELL’ACQUISIZIONE
L11/15
INTENSITÀ DELLE IMMAGINI (1/2)
• L’irradianza di una scena (intensità) è caratterizzata dal prodotto
di due termini: l’illuminazione i ( x, y ) e la riflettanza r ( x, y )
f ( x, y ) = i ( x, y ) ⋅ r ( x, y )
con
0 < f ( x, y ) < ∞ ,
0 < i ( x, y ) < ∞ ,
0 < r ( x, y ) < 1
• L’immagine è costituita da una componente dovuta alla luce
proveniente dalla sorgente di illuminazione che è modulata da
una componente dovuta alla luce riflessa dagli oggetti presenti
nella scena.
• La componente di illuminazione è responsabile delle variazioni
lente di luminosità (basse frequenze spaziali), mentre la
componente di riflettanza dà luogo alle variazioni brusche di
luminosità, spesso in corrispondenza ai contorni o bordi degli
oggetti (alte frequenze spaziali).
L11/16
INTENSITÀ DELLE IMMAGINI (2/2)
L’effettiva natura di i ( x, y ) è determinata dalla sorgente luminosa,
mentre r ( x, y ) dipende dalle caratteristiche degli oggetti presenti
nella scena, e varia tra 0 (assorbimento totale) e 1 (riflessione
completa)
I limiti di cui sopra sono ovviamente teorici, valori reali (tipici) sono:
Sorgente luminosa
Chiaro di luna
Interno (ambiente di lavoro, almeno)
Cielo nuvoloso
Luce solare
Oggetto
Velluto nero
Grigio di riferimento (cartoncino Kodak)
Parete bianca a calce
Argento e altri metalli chiari
Neve fresca
i (candele)
0.01
100
1000
9000
r
0.01
0.18
0.80
0.90
0.93
L11/17
INTENSITÀ DELLE IMMAGINI E SCALA DI GRIGI
• Si può pertanto assumere che Lmin < f ( x, y ) < Lmax , dove valori
ragionevoli per Lmin e Lmax sono:
Lmin ≅ 0.005 cd Lmax ≅ 200 cd (interni)
Lmax ≅ 10000 cd (esterni)
• Per una immagine monocromatica, l’intervallo [ Lmin ,Lmax ] prende
il nome di scala dei grigi, mentre l’intensità f ( x, y ) è detta anche
livello di grigio dell’immagine nel punto di coordinate ( x, y ) .
• In pratica si usa una scala dei grigi convenzionalmente
compresa in [0,L − 1] , in cui 0 corrisponde al nero e L − 1
rappresenta il bianco, nella quale si considerano L livelli discreti
di grigio per tenere conto del carattere digitale della f ( x.y ) dopo
la quantizzazione dell’intensità.
L11/18
IMMAGINE COME MATRICE DI PIXEL(1/3)
• Tenendo conto anche del campionamento spaziale che rende
discreti gli intervalli di variazione delle due dimensioni
dell’immagine, x e y, e assumendo che l’immagine continua sia
approssimata mediante M × N campioni equispaziati lungo x e y,
con:
0 ≤ x ≤ M −1
0 ≤ y ≤ N −1
si ha:
⎡ f ( 0,0 )
⎢ f 1,0
( )
⎢
f ( x, y ) =
⎢
#
⎢
⎣ f ( M − 1,0 )
f (0,1)
...
f ( 1,1)
...
...
#
f ( M − 1,1) ...
f (0,N − 1) ⎤
f ( 1,N − 1) ⎥
⎥
⎥
#
⎥
f ( M − 1,N − 1) ⎦
L11/19
IMMAGINE COME MATRICE DI PIXEL(2/3)
• Un'immagine digitale monocromatica pertanto è una matrice
f ( x, y ) di valori discreti di intensità luminosa (livelli di grigio).
• Essa è costituita da M × N pixel (picture elements) ciascuno dei
quali ha un valore appartenente all'intervallo [0,L − 1] essendo L i
livelli possibili di intensità (o di grigio).
• Si ha tipicamente L = 2b , dove b è il numero di bit usato per
codificare ciascun pixel (profondità del pixel).
L11/20
IMMAGINE COME MATRICE DI PIXEL(3/3)
• Per esempio, con 8 bit si ha la possibilità di rappresentare un
numero di livelli (256) tale da consentire una discriminazione dei
grigi accettabile nella maggior parte delle applicazioni, in quanto
abbastanza prossima a quella dell'occhio umano.
• Una immagine monocromatica tipica (1024 × 768 × 8 ) occupa
pertanto circa 6 Mbit di memoria; con “tre” piani di colore si arriva
a circa 18 Mbit, tali valori comportano spesso necessità di
“compressione” dell’immagine.
L11/21
LA DINAMICA DELL’IMMAGINE (1/3)
• Si è fatta l’ipotesi implicita di una quantizzazione lineare per la
produzione degli L livelli discreti di grigio a partire dalla intensità
luminosa
• La risposta del sistema visivo umano, tuttavia, non è lineare,
bensì logaritmica: l’occhio può discriminare un numero enorme di
livelli di luminosità, ben maggiore dei 256 precedentemente
ipotizzati.
• Pertanto una immagine digitalizzata ha spesso una dinamica
molto meno ampia di quella del sistema visivo umano, o in altri
termini c’è l’esigenza, per immagini di qualità, di usare più di 8
bit.
L11/22
LA DINAMICA DELL’IMMAGINE (2/3)
• Le limitazioni di dinamica sono evidenti quando la scena è ad
elevato contrasto: se il sensore è lineare, le parti scure
risulteranno sottoesposte (ripresa effettuata con obiettivo poco
aperto), oppure le parti chiare risulteranno sovraesposte
(obiettivo molto aperto):
L11/23
LA DINAMICA DELL’IMMAGINE (2/3)
• Una soluzione più generale al problema delle scene
caratterizzate da una dinamica troppo ampia è adottata nelle
videocamere, in cui la grandezza quantizzata non è direttamente
l’intensità, ma una sua funzione esponenziale.
• Se g è il livello di grigio e f l’intensità, si ha cioè:
• g= fγ
con
γ<1
• Questa correzione permette di approssimare la caratteristica
logaritmica del sistema visivo umano.
• Il valore γ che meglio realizza questa condizione è (tipicamente):
γ = 0.4
L11/24
RISOLUZIONE SPAZIALE E PIXEL (1/6)
• Ogni pixel rappresenta l’intensità nella
corrispondente posizione della griglia
di campionamento.
• Un pixel rappresenta in realtà non
soltanto un punto dell’immagine, ma
piuttosto una regione rettangolare
coincidente con una cella della griglia.
• Il valore associato al pixel rappresenta
pertanto la intensità media.
L11/25
RISOLUZIONE SPAZIALE E PIXEL (2/6)
L11/26
RISOLUZIONE SPAZIALE E PIXEL (3/6)
• Se si fanno variare le dimensioni dei pixel, le dimensioni
dell’immagine restano invariate al variare della risoluzione.
• Se la dimensione dei pixel resta invariata, la variazione di
risoluzione provoca invece una variazione delle dimensioni
dell’immagine.
• Con pixel di grande dimensione, non solo la risoluzione spaziale
è scadente, ma appaiono ben visibili le discontinuità di grigio al
confine tra i pixel.
L11/27
RISOLUZIONE SPAZIALE E PIXEL (4/6)
L11/28
RISOLUZIONE SPAZIALE E PIXEL (5/6)
• Man mano che le dimensioni dei pixel si riduce, l’effetto diventa
meno visibile, fino al punto che si ha l’impressione di
un’immagine continua, quando la dimensione dei pixel diventa
più piccola della risoluzione spaziale del sistema visivo umano.
• Siccome quest’ultima dipende dalla distanza e dalle altre
condizioni di osservazione, in generale non è definibile a priori il
numero di pixel necessari a garantire una buona qualità
dell’immagine.
• Sicuramente la dimensione dei pixel deve essere piccola in
relazione alla scala degli oggetti rappresentati nell’immagine.
L11/29
RISOLUZIONE SPAZIALE E PIXEL (6/6)
• In realtà è la tecnologia dei sensori che determina la dimensione
dei pixel e la risoluzione dell’immagine, piuttosto che i requisiti
dell’applicazione.
• D’altra parte anche la condizione di “immagine di buona qualità”
è strettamente dipendente dall’applicazione, nel caso generale, e
fortemente soggettiva, nel caso dell’osservazione visuale.
• Si noti che altre disposizioni spaziali, oltre alla griglia
rettangolare, sono teoricamente possibili:
Triangolare
Quadrata
Esagonale
L11/30
EFFETTI DEL NUMERO DI LIVELLI DI QUANTIZZAZIONE (1/3)
L11/31
EFFETTI DEL NUMERO DI LIVELLI DI QUANTIZZAZIONE (2/3)
• La riduzione del numero di livelli provoca il peggioramento della
qualità dell’immagine: appaiono falso contorni, e non è possibile
distinguere oggetti che differiscono per variazioni di grigio lente.
• Si noti che 16 livelli di grigio possono sembrare sufficienti nelle
immagini stampate, ma non lo sono per immagini visualizzate a
monitor.
• Nell’esempio mostrato in seguito si noterà come le immagini a
256, 128 e 64 livelli di grigio siano praticamente simili dal punto
di vista visuale.
• Nelle altre immagini si manifesta (in misura crescente al
diminuire del numero di livelli) il fenomeno dei falsi contorni nelle
zone di lenta variazione dei grigi, fino al caso limite delle
immagini a due livelli (bi-livello o binarie).
L11/32
EFFETTI DEL NUMERO DI LIVELLI DI QUANTIZZAZIONE (3/3)
L11/33
TRASFORMATA DI FOURIER BIDIMENSIONALE (1/2)
La trasformata di Fourier della funzione bidimensionale (2D) f ( x, y )
reale o complessa è definita dalla relazione:
F ( ωx ,ω y ) =
∫∫
∞
−∞
f ( x, y ) e
− j ( ω x x + jω y y )
dxdy
Dove ωx e ω y sono le frequenze angolari o pulsazioni spaziali.
L11/34
TRASFORMATA DI FOURIER BIDIMENSIONALE (2/2)
E’ bene sottolineare che con il termine, frequenza spaziale:
ωx
vx =
2π
Si indica la rapidità della variazione della luminanza o livello di grigio
in una certa direzione e si misura in numero di oscillazioni (cicli) per
unità di lunghezza (date le dimensioni limitate delle immagini si
possono usare unità di misura più piccole del metro, come il cm o il
mm).
L11/35
CAMPIONAMENTO SPAZIALE (1/6)
• Consideriamo un’immagine in bianco e nero, rappresentata dalla
funzione 2D continua f ( x.y ) (livello di grigio o intensità).
• In un’operazione di campionamento spaziale ideale, i campioni
dell’immagine sono ottenuti moltiplicando la funzione f ( x.y ) per
una funzione di campionamento c ( x.y ) , costituita da impulsi
ideali disposti su una griglia rettangolare di passo Δx e Δy .
L11/36
CAMPIONAMENTO SPAZIALE (2/6)
L11/37
CAMPIONAMENTO SPAZIALE (3/6)
Per
il
teorema
della
convoluzione
lo
spettro
Fc ( ωx ,ω y )
dell’immagine campionata f c ( x, y ) risulta essere definito come la
(
)
(
)
convoluzione degli spettri F ωx ,ω y della f ( x, y ) e C ωx ,ω y della
c ( x, y ) .
Fc ( ωx ,ω y ) = F ( ωx ,ω y ) ⊗ C ( ωx ,ω y )
Fc ( ωx ,ω y ) =
∞
∞
∑ ∑ F (ω
x
− n1ωxc ,ω y − n2 ω yc ) )
n1 =−∞ n2 =−∞
Dove:
ωxc = 2πν xc
ω yc = 2πν yc
Sono le pulsazioni spaziali di campionamento.
L11/38
CAMPIONAMENTO SPAZIALE (4/6)
Lo spettro dell’immagine campionata è costituito dalla ripetizione
infinita dello spettro dell’immagine continua secondo ωx e ω y sulla
griglia rettangolare di passo, rispettivamente, ωxc e ω yc .
L11/39
CAMPIONAMENTO SPAZIALE (5/6)
In effetti in analogia a quanto noto per il campionamento di funzioni
1D (segnali), si possono definire le condizioni di campionamento
corretto (teorema del campionamento) di una immagine in funzione
delle frequenze spaziali massime:
ν xM
ν yM
1
Δx ≤
2ν xM
ν xc ≥ 2ν xM
ovvero
1
Δy ≤
2ν yM
ν yc ≥ 2ν yM
L11/40
CAMPIONAMENTO SPAZIALE (6/6)
QUESTA MATRICE RAPPRESENTA L’IMMAGINE CAMPIONATA
⎡ f ( 0,0 )
⎢ f 0,1
( )
⎢
⎢
#
⎢
⎣ f ( 0,M − 1)
f ( 1,0 )
...
f ( 1,1)
...
...
#
f (1,M − 1) ...
f ( N − 1,0 ) ⎤
⎥
f ( N − 1,1)
⎥
⎥
#
⎥
f ( N − 1,M − 1) ⎦
L11/41
GENERALITÀ SULLE TRASFORMAZIONI NUMERICHE 2D (1/2)
La trasformazione numerica 2D di una matrice di dati di ingresso
(immagine campionata) è definita dalla relazione:
F ( k1 ,k2 ) =
N1
N2
∑∑ f ( n ,n ) A ( n ,n ; k ,k )
1
2
1
2
1
2
n1 =1 n2 =1
dove:
• f ( n1 ,n2 ) sono i dati di ingresso
• A ( n1 ,n2 ; k1 ,k 2 )
rappresentano la base o nucleo (Kernel)
dell’operazione di trasformazione.
L11/42
GENERALITÀ SULLE TRASFORMAZIONI NUMERICHE 2D (2/2)
La trasformata inversa è espressa da:
f ( n1 ,n2 ) =
N1
N2
∑∑ F ( k ,k ) B ( n ,n ; k ,k )
1
2
1
2
1
2
k1 =1 k2 =1
dove
• B ( n1 ,n2 ; k1 ,k 2 )
rappresenta l’inverso della base o nucleo
dell’operatore di trasformazione.
L11/43
TRASFORMATA DI FOURIER DI UN’IMMAGINE (1/3)
La trasformazione o trasformata di Fourier 2D disscreta o
numerica di una matrice di dati di ingresso è definita dalla
relazione:
F ( k1 ,k2 ) =
N 1 −1 N 2 −1
∑∑ f ( n ,n ) e
1
2
−j
2π
( k1n1 + k2n2 )
N
n1 =0 n2 =0
dove gli indici k1 e k 2 corrispondono alle frequenze spaziali: ν x e ν y .
In particolare:
ν x = k1 Δν ,
ν y = k2 Δν
essendo:
Δν un incremento costante di frequenza (passo di campionamento
nelle frequenze spaziali).
L11/44
TRASFORMATA DI FOURIER DI UN’IMMAGINE (2/3)
Una delle proprietà interessanti della trasformata 2D numerica di
Fourier è rappresentata dal significato della componente spettrale
nell’origine:
F ( 0,0 ) =
N 1 −1 N 2 −1
∑∑ f ( n ,n )
1
2
n1 =0 n2 =0
che risulta uguale a
dell’immagine.
N 2 volte la media spaziale dei dati
L11/45
TRASFORMATA DI FOURIER DI UN’IMMAGINE (3/3)
Immagine
Modulo della trasformata
L11/46
SISTEMI NUMERICI 2D (1/2)
In analogia a quanto già visto riguardo ai sistemi 1D discreti, si
possono definire sistemi 2D discreti spazialmente invarianti, per i
quali la sequenza d’uscita è indipendente dalla posizione della
sequenza d’ingresso.
Cioè vale:
g ( n1 ,n2 ) =
∞
∞
∑ ∑ f ( k ,k ) h ( n − k ,n
1
2
1
1
2
− k2 )
n1 =−∞ n2 =−∞
L11/47
SISTEMI NUMERICI 2D (2/2)
Nel dominio delle frequenze spaziali la funzione di trasferimento
H ( ωx ,ω y ) è espressa da:
H ( ωx ,ω y ) =
∞
∞
∑∑
h ( n1 ,n2 ) e − jn1ωx e
− jn2 ω y
k1 =−∞ n2 =−∞
L11/48
FILTRI 2D (1/2)
I sistemi numerici espressi dalla relazione:
g ( n1 ,n2 ) =
N 1 −1 N 2 −1
∑∑ a ( k ,k ) f ( n − k ,n
1
2
1
1
2
− k2 )
k1 =0 k2 =0
sono “senza reazione” è vengono anche chiamati FIR, cioè con
risposta impulsiva finita.
L11/49
FILTRI 2D (2/2)
I sistemi numerici “con reazione” sono espressi dalla relazione:
g ( n1 ,n2 ) =
N 1 −1 N 2 −1
∑∑ a ( k ,k ) f ( n − k ,n
1
2
1
1
2
− k2 ) −
k1 =0 k2 =0
M 1 −1 M 2 −1
−
∑ ∑ b ( k ,k ) g ( n − k ,n
1
2
1
1
2
− k2 )
k1 =0
k2 =0
k1 + k2 ≠0
L11/50
ESEMPI DI ELABORAZIONI (1/3)
ESEMPIO DI APPLICAZIONE DI UN FILTRO 2D FIR
di tipo passa-alto sul volto della Venere
Effetto estrazione di contorni
L11/51
ESEMPI DI ELABORAZIONI (2/3)
ESEMPIO DI APPLICAZIONE DI UN FILTRO 2D FIR
di tipo passa-basso sul volto della Venere
EFFETTO RIDUZIONE DEL RUMORE
L11/52
ESEMPI DI ELABORAZIONI (3/3)
ESEMPIO DI APPLICAZIONE DI UN FILTRO 2D FIR
di tipo passa-basso (con frequenza di taglio inferiore)
sul volto della Venere
Effetto riduzione del rumore
ma peggioramento della definizione
L11/53
ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE
Elaborazioni semplici:
o Variazione della quantizzazione dei campioni dell’immagine.
o Espansione della scala dei livelli di grigio (esaltazione dei
contrasti).
o Espansione dell’immagine (zoom).
o Istogramma delle ampiezze dei livelli di grigio.
o Media aritmetica (filtraggio passa-basso).
o Differenza dei livelli di grigio ed estrazione dei contorni (filtraggio
passa-alto).
L11/54
ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE
o Variazione della quantizzazione dei campioni dell’immagine
Aumento del passo di quantizzazione
⇓
Riduzione del numero dei livelli di grigio
⇓
Immagine più “economica”
o Quantizzazione non uniforme: si riduce il numero di livelli di
grigio dove si hanno forti variazioni di contrasto e lo si aumenta
dove il contrasto è poco variabile.
L11/55
ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE
o Espansione della scala dei livelli di grigio (esaltazione dei
contrasti): aumento della nitidezza,
o Espansione dell’immagine (zoom): si ripete stesso dato
campionato (pixel) in forma di matrice quadrata 2 × 2 o 3 × 3 .
Istogramma dei livelli di Grigio
o Istogramma delle ampiezze dei livelli di grigio
0
50
100
Livelli di Grigio
150
200
250
L11/56
ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE
o Media aritmetica (filtraggio passa-basso)
L11/57
ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE
o Media aritmetica (filtraggio passa-basso)
L11/58
ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE
o Differenza dei livelli di grigio ed estrazione dei contorni
(filtraggio passa-alto)
gradiente del livello di grigio:
⎛ ∂f ∂f ⎞
∇f ( x, y ) = ⎜ , ⎟ = ( Dx ,Dy )
⎝ ∂x ∂y ⎠
in modulo e direzione:
D= D +D
2
x
2
y
,
⎛ Dy ⎞
ϕ = tan ⎜ ⎟
⎝ Dx ⎠
−1
Se il pixel ha coordinate ( n1 ,n2 ) con intensità f ( n1 ,n2 ) , la stima
più semplice del gradiente è:
Dx = f ( n1 ,n2 + 1) − f ( n1 ,n2 )
,
Dy = f ( n1 ,n2 ) − f ( n1 + 1,n2 )
L11/59
L11/60
ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE
o Differenza dei livelli di grigio ed estrazione dei contorni
(filtraggio passa-alto)
la maschera con i suoi coefficienti indica il peso da applicare al
corrispondente livello di grigio con relativo segno:
−1 1
Dx =
0 0
,
1 0
Dy =
−1 0
o Metodo di Roberts:
D1 = f ( n1 ,n2 + 1) − f ( n1 + 1,n2 ) , D2 = f ( n1 ,n2 ) − f ( n1 + 1,n2 + 1)
con maschere:
0 1
D1 =
−1 0
,
1 0
D2 =
0 −1
L11/61
ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE
Stima più accurata (maschere 3 × 3 ):
−1 0 1
Dx = −1 0 1
−1 0 1
1
,
1
1
Dy = 0 0 0
−1 −1 −1
Operatore di Prewitt o gradiente “smoothed”
−1 0 1
Dx = −2 0 2
−1 0 1
1
,
2
1
Dy = 0 0 0
−1 −2 −1
Operatore di Sobel
L11/62
ELABORAZIONI LOCALI SPAZIALI DI UN’IMMAGINE
Rilevazione dei contorni: originale (in alto a sinistra), algoritmo di
Roberts (in alto a destra), Prewitt (in basso a sinistra), Sobel (in
basso a destra).
L11/63
LA TRASFORMATA DI HOUGH
Nelle immagini si distinguono:
o Proprietà di tipo globale: livello di grigio medio, distribuzione di
colore, ...
o Proprietà speciali: presenza di linee o di particolari figure
geometriche (rette, circonferenze, ellissi, …)
o L’identificazione di features locali permettono di interpretare e
riconoscere il tipo di immagine.
L11/64
LA TRASFORMATA DI HOUGH
Rilevazione di linee tramite:
1. Template matching, utilizzando un insieme di maschere che
modellino l’andamento locale di una retta.
2. Trasformata di Hough.
L11/65
Rilevazione di linee
o Nel Template matching si cercano i picchi nella correlazione tra
l’immagine e un insieme di maschere che modellano la struttura
locale di rette.
o Se una maschera M in un punto P ritorna una risposta superiore
ad una soglia, in quel punto passa un segmento di retta la cui
orientazione e spessore è modellato da M.
-1
-1
-1
2
2
2
-1
-1
-1
L11/66
La Trasformata di Hough
o E’ un esempio di operatore globale che permette di riconoscere
particolari configurazioni di punti presenti nell’immagine, come
segmenti, curve o altre forme prefissate.
o Si basa sul principio che la forma cercata può essere espressa
tramite una funzione nota che fa uso di un insieme di parametri.
L11/67
La Trasformata di Hough
o Riconoscimento di rette
y = ax + b
La retta è nota se lo sono i parametri (a, b)
In alternativa (forma normale di Hesse):
ρ = x cos ϑ + y sin ϑ
se sono noti i parametri ( ρ ,ϑ ) .
y = −0.5x + 0.5 in funzione dei parametri ( ρ = 0.447 , ϑ = 1.107 )
L11/68
La Trasformata di Hough
Un punto P è identificato dall’intersezione di più rette:
Se nell’immagine ci sono punti allineati su una stessa retta, sul
piano dei parametri, le curve che corrispondono alle trasformazioni
dei vari punti si intersecano in un punto del piano trasformato che è
l’immagine della retta
L11/69
La Trasformata di Hough
Trasformazione delle rette passanti per un punto nel piano dei
parametri
L11/70
La Trasformata di Hough
Tre punti allineati A, B e C nello spazio dei parametri.
L11/71
La Trasformata di Hough
I punti nello spazio dei parametri indicano rette:
L11/72
222
SEGNALI
Figura 11.39 – Esempi di trasformazione dal piano x,y (I e III colonna) al piano ρ ,ϑ (II e IV).
Figura 11.40 – Piano dell’immagine e piano trasformato.
La Trasformata di Hough
Immagine costituita da un quadrato, in assenza di rumore:
Esempio di matrice di accumulazione di una figura piana (quadrato)
in assenza di rumore.
L11/73
La Trasformata di Hough
Se l’immagine è alterata dal rumore (tipo “sale e pepe” al 10 %),
Immagine affetta da rumore “sale e pepe” al 10 % e trasformata di
Hough per una figura piana (quadrato).
L11/74
La Trasformata di Hough
Esempio di matrice di accumulazione di un quadrato in presenza di
rumore sale e pepe al 10 %.
L11/75
La Trasformata di Hough
Ricostruzione del quadrato mediante sogliatura della matrice di
accumulazione.
L11/76
Immagine complessa di cui si vogliono rivelare i tratti rettilinei.
L11/77
Edge decection dell’immagine e relativa Trasformata di Hough.
L11/78
Ricostruzione delle componenti rettilinee dell’immagine mediante tre
diversi valori di sogliatura.
L11/79
Fly UP