Comments
Description
Transcript
Percezione della Forma e dello Spazio
PERCEZIONE DELLA FORMA E DELLO SPAZIO L’informazione raggiunge i nostri sensi frammentata, ma noi invece percepiamo il mondo come composto da oggetti e persone ⇒ un mondo composto da unità integrate. Lo studio della percezione si occupa di capire come noi integriamo l’informazione sensoriale in percetti e di come poi usiamo, manipoliamo e categorizziamo questi percetti nella vita quotidiana. Negli ultimi anni i ricercatori si sono concentrati soprattutto sullo studio di due macroaree nella percezione⇒ i processi w h a t e where ovvero due principali problemi che il sistema percettivo è designato a risolvere. In visione⇒ che cosa sono gli oggetti = processo di riconoscimento del modello; dove sono gli oggetti = localizzazione spaziale. Oltre a riconoscimento e localizzazione un’altra funzione fondamentale del nostro sistema percettivo è quella di mantenere costante l’aspetto degli oggetti, anche se la loro immagine sulla retina cambia continuamente⇒ c o s t a n z a della percezione. Sebbene sia sensato ritenere che il sistema visivo umano si sia evoluto per trattare stimoli tridimensionali, buona parte dei lavori condotti nel campo della visione alla fine del secolo scorso si sono rivolti allo studio di stimoli bidimensionali. Perché? Perché già dagli stimoli bidimensionali è possibile comprendere come il sistema visivo attivi processi di elaborazione la cui comprensione potrebbe aiutarci a penetrare meglio il funzionamento del sistema anche in condizioni più complesse. Questo è particolarmente evidente in tre casi: 1) il mascheramento percettivo; 2) le superfici anomale; 3) il completamento amodale. Divisione del lavoro nel cervello La parte del cervello interessata alla visione - la corteccia visiva - opera secondo il principio di divisione del lavoro ⇒ presenta differenti regioni specializzate per espletare differenti funzioni percettive. Sistema di riconoscimento e sistema di localizzazione L’idea che localizzazione e riconoscimento sono compiti qualitativamente diversi è sostenuta dalla scoperta che essi sono effettuati da differenti regioni della corteccia visiva. Il riconoscimento degli oggetti dipende da un ramo del sistema visivo che include l’area corticale ricevente per la visione e un’area presso la base della corteccia cerebrale. La localizzazione degli oggetti invece dipende da un ramo del sistema visivo che comprende l’area corticale ricevente per la visione e una regione della corteccia presso la sommità del cervello. Gli studi sui primati dimostrano che se il ramo del riconoscimento visivo di un animale viene danneggiato, l’animale può ancora eseguire compiti di localizzazione e viceversa. In uno studio basato sulla PET i soggetti eseguivano due compiti: (1) un test di riconoscimento dei volti, che probabilmente implica il riconoscimento degli oggetti (2) un test di rotazione mentale, che presumibilmente riflette la localizzazione mentre erano impegnati nel compito (1) vi era un aumento di flusso sanguigno nella regione corticale del riconoscimento; mentre erano impegnati nel compito (2) vi era un aumento di flusso sanguigno nella regione corticale della localizzazione. Componenti del riconoscimento La suddivisione del lavoro nella corteccia visiva non finisce con la separazione tra localizzazione e riconoscimento ⇒ ad esempio i differenti tipi di informazione che vengono usati nel riconoscimento come colore, forma e tessitura - sembrano essere elaborati da differenti subregioni o cellule della regione corticale del riconoscimento. Nell’area ricevente primaria della corteccia visiva, alcune cellule rispondono solo a forme semplici come linee ed angoli, ed altre rispondono solo ai colori, altre ancora solo al movimento. Il risultato è che la corteccia visiva consiste di numerosi moduli di elaborazione, ciascuno specializzato per un compito in particolare. Localizzazione Per sapere dove sono gli oggetti intorno a noi dobbiamo: 1) separare gli oggetti l’uno dall’altro e dallo sfondo; 2 ) determinare la posizione degli oggetti in un mondo tridimensionale sulla base della loro distanza da noi; 3 ) determinare la posizione degli oggetti in un mondo tridimensionale sulla base delle loro modalità di movimento. Figura e sfondo Se uno stimolo contiene due o più aree distinte, generalmente vediamo parte di esso come una figura e il resto come sfondo. L’organizzazione figura-sfondo non fa parte dello stimolo fisico, ma è una costruzione del nostro sistema percettivo. In un campo visivo totalmente omogeneo (Ganzfeld) si vede una sorta di nebbia bianca, parzialmente penetrabile con lo sguardo e posta ad una certa distanza dai nostri occhi ⇒ non ha luogo alcun fenomeno di articolazione figura-sfondo⇒ è però sufficiente far apparire un puntino all’interno del campo omogeneo per creare questa atricolazione⇒ il puntino si trova in primo piano mentre il resto del campo viene visto come situato posteriormente ad esso e non interrotto. Un’analisi approfondita delle caratteristiche di questo fenomeno era già stata condotta agli inizi del secolo dallo psicologo danese Edgar Rubin (1915). Ciò che viene percepito come figura e ciò che viene percepito come sfondo non hanno la stessa forma lo sfondo è privo di forma. Quando due aree hanno un contorno in comune, e una è percepita come figura mentre l’altra è percepita come sfondo, il contorno appartiene alla figura⇒ “effetto di forma”. Caso limite⇒ entrambe le aree diventano figure simultaneamente⇒ solo l’area che gioca il ruolo di figura ha una forma definita. Lo sfondo sembra spesso estendersi dietro alla figura con un’impressione immediata che avviene a dispetto della conoscenza. Effetti funzionali che distinguono le figure dagli sfondi. 1. Le figure hanno carattere oggettuale mentre gli sfondi hanno carattere di sostanza, di semplice materiale. 2 . Tra figure e sfondi esistono delle differenze soggettive di colore⇒ le figure hanno colore oggettuale (aspetto compatto e materiale), gli sfondi colore filmare (uniforme e meno denso). 3. Figure e sfondi appaiono localizzati in posizioni diverse⇒ le figure sono più facili da localizzare e sembrano più vicine. 4 . La figura colpisce di più⇒ è più significativa. Tutto ciò che riguarda la figura viene ricordato meglio. Anche le emozioni sono prevalentemente collegate alle figure e non agli sfondi. Condizioni figurali che influenzano l’emergere di una parte del campo visivo in veste di figura oppure di sfondo. 1. Se tre due aree omogenee e di colore diverso una è più grande e include l’altra, è probabile che la più piccola e inclusa sia vista come figura; 2. In esperimenti con figure costituite da croci, la croce i cui settori sono orizzontali e verticali è vista più facilmente come figura. 3 . Aree simmetriche tendono ad apparire più facilmente come figure. 4 . Aree caratterizzate da costanza di larghezza tendono ad apparire più facilmente come figure. 5. Tra due aree adiacenti quella i cui elementi costituenti fluttuano tende ad essere percepita come sfondo. 6. In caso di rivalità tra due fattori, uno dei due può avere la meglio (ad es. la convessità annulla la simmetria). Separazione e raggruppamento degli oggetti Non solo distinguiamo gli oggetti dallo sfondo, ma anche distinguiamo un oggetto dall’altro, e percepiamo un particolare raggruppamento di oggetti. Gli psicologi della Gestalt proposero un certo numero di fattori determinanti del raggruppamento, molti dei quali furono scoperti per la prima volta da Wertheim e r ⇒ principi di Wertheimer ⇒ principi grazie ai quali le figure che vediamo si segregano dal resto e costituiscono delle unità a sè stanti⇒ l’organizzazione percettiva si impone da sé. I principi di Wertheimer Primo fattore: Vicinanza Gli elementi più vicini tra loro, a parità di altre condizioni, vengono percepiti come appartenenti alla stessa unità. Secondo fattore: Somiglianza Elementi simili tendono ad essere visti come appartenenti alla stessa unità. Terzo fattore: Destino comune. Implica l’entrata in gioco del movimento⇒ elementi dotati di un movimento simile tendono ad essere percepiti come appartenenti alla stessa unità. Quarto fattore: Buona continuazione. Elementi figurali che sono in continuità di direzione tendono ad essere percepiti come appartenenti alla stessa unità. Quinto fattore: Chiusura Elementi figurali chiusi o tendenti alla chiusura vengono più facilmente percepiti come appartenenti alla stessa unità. Sesto fattore: Divisione senza resti Elementi figurali che non danno luogo all’esistenza di “resti” vengono più facilmente percepiti come appartenenti alla stessa unità. Settimo fattore: Esperienza passata Tendono a costituirsi come unità percettive quegli elementi che già in precedenza sono stati frequentemente associati. Non bisogna generalizzare troppo questo fattore⇒ esistono numerosi esempi che ne ridimensionano l’importanza. La Pregnanza. Il concetto di pregnanza (Prägnanz), o di "bontà" di una forma è stato centrale nella teoria della Gestalt. Una figura è pregnante quando è buona, semplice, regolare, simmetrica ecc. Tutte le figure geometriche semplici (cerchi, quadrati, triangoli regolari) sono figure pregnanti⇒ un angolo retto è più pregnante di un ottuso o di un acuto. La pregnanza può essere intesa sia come singolarità che come semplicità e stabilità di una struttura. Per i gestaltisti la pregnanza si identificava con la “buona forma” ⇒ una struttura assumerà l’organizzazione più semplice disponibile nelle circostanze date. L’implementazione di alcuni principi riferibili alla pregnanza delle figure è risultata necessaria anche nella messa a punto di algoritmi per la visione artificiale. Le ipotesi esplicative della pregnanza possono essere divise in almeno due categorie: 1) le spiegazioni che tentano di comprendere perchè il sistema percettivo possieda una tendenza alla pregnanza; 2) le spiegazioni che tentano di analizzare come il sistema elabori l’informazione in modo da ottenere un risultato pregnante. Aspetti funzionali dell'organizzazione figurale. 1 . La mimetizzazione visiva (o mascheramento visivo). Un'ipotesi convincente del perchè le figure mascherate scompaiono è quella che considera il cambiamento di funzione figurale cui vanno soggette, in seguito alla mimetizzazione, le varie parti della configurazione. Il problema degli stimoli mimetizzati si riduce al problema fondamentale dell’organizzazione del campo visivo in unità, quindi allo studio degli effetti dei fattori di unificazione figurale. Il mascheramento avrebbe luogo ogni volta che uno stimolo, inserito in un contesto figurale in grado di inglobarlo, diventa una parte della struttura inglobante. Vi sono due criteri funzionali che servono a distinguere tra i diversi tipi di mimetizzazione: 1 ) la “recuperabilità” della figura mascherata; 2) la “rimascherabilità” della figura mascherata. Esistono infatti tre diversi tipi di situazioni: a) Totale irrecuperabilità della figura mascherata; b) Figure smascherabili, ma facilmente rimascherabili. c) Figure che, una volta smascherate, non possono più essere rimascherate. Vi sono tre diverse procedure che rendono possibile la mimetizzazione: 1. La riduzione di parti della struttura a semplici elementi tissurali; 2 . L’inversione del rapporto figurasfondo; 3 . Lo smembramento fenomenico, sia per sottrazione, sia per aggiunta. 2. Le superfici anomale. Secondo Kanizsa il fattore dinamico che determina l’insorgere di una superficie anomala è la tendenza al completamento amodale delle parti inducenti ⇒ il fattore determinante sarebbe la tendenza alla chiusura di strutture aperte. 3. Il completamento amodale. L’aspetto più significativo del completamento amodale è la permanenza percettiva di una parte dell’oggetto anche quando questa non produce alcun effetto sugli organi di senso⇒ la presenza fenomenica della parte “non visibile” è tanto forte da contrastare addirittura con ciò che si sa. Il primo studioso che si occupò sistematicamente di questo fenomeno fu lo psicologo belga Michotte, che applicò il concetto di completamento amodale non solo a figure bidimensionali statiche, ma anche ad oggetti solidi ed in movimento. Funzione adattiva del completamento a m o d a l e ⇒ vivendo in un mondo tridimensionale dove gli oggetti appaiono occludersi parzialmente, è frequente imbattersi in oggetti solo parzialmente visibili⇒ di qui l’importanza dei fenomeni di completamento di strutture parzialmente visibili. I meccanismi che determinano il completamento amodale sono puramente percettivi⇒ spesso il completamento amodale avviene proprio in direzione opposta a quella che sarebbe apparentemente logica se il processo sottostante fosse un processo di pensiero. Percezione della distanza Per sapere dove si trova un oggetto dobbiamo conoscere la sua distanza o profondità. La retina, punto di partenza della visione, è una superficie bidimensionale ⇒ l’immagine retinica è piatta e non ha alcuna profondità. Come è possibile che il nostro cervello, a partire da un’immagine piatta, riesca a dare origine all’esperienza di un mondo tridimensionale? Indici di profondità Gli indici della distanza sono quegli aspetti bidimensionali che un osservatore usa per trasferire la distanza in un mondo tridimensionale (cioè in profondità). Possono essere classificati in tre categorie fondamentali: indizi fisiologici, pittorici e cinetici. Gli Indizi Fisiologici Di Profondità. Gli indizi fisiologici di profondità sono accomodazione, convergenza e disparità binoculare, che è il più importante. Accomodazione. E’ il processo in cui il grado di convessità del cristallino (lente dell'occhio che mette a fuoco sulla retina l'oggetto fissato) cambia automaticamente a seconda della distanza cui si trova l'oggetto da mettere a fuoco. L’accomodazione è un indizio di profondità, o distanza, perché la curvatura del cristallino dipende dalla distanza dell’oggetto fissato ⇒ il sistema visivo è in grado di “calcolare” tale distanza basandosi sul grado di tensione dei muscoli ciliari. Quando fissiamo un punto luminoso da una distanza di sei metri o più, i raggi che raggiungono il nostro occhio possono essere considerati paralleli. I muscoli ciliari in questo caso sono rilassati, e i raggi vanno automaticamente a fuoco sulla retina. Ma se il punto luminoso si avvicina i raggi diventano divergenti ed il fuoco si sposta dietro la retina ⇒ i muscoli ciliari si tendono aumentando la convessità del cristallino: i raggi vengono piegati in misura maggiore e messi a fuoco sulla retina. Il raggio d’azione dell’accomodazione è quindi limitato a sei metri. Convergenza Quando fissiamo un oggetto, gli occhi devono convergere di un certo angolo perché l’immagine di un oggetto cada sulla fovea di ciascun occhio⇒ tale attività è svolta dai muscoli oculomotori ed è accompagnata da una sensazione di tensione muscolare ben avvertibile. La convergenza è un indizio di profondità perchè l’angolo in cui gli occhi devono convergere dipende dalla distanza dell’oggetto fissato⇒ è tanto più grande quanto più vicino l’oggetto si trova. Il nostro sistema visivo sarebbe in grado di “calcolare” tale distanza basandosi sul grado di tensione dei muscoli oculomotori. Anche il raggio d’azione della convergenza è limitato a 6 metri circa⇒ quando l’oggetto fissato si trova ad una distanza superiore l’angolo formato dai due occhi è pari a zero. Disparità binoculare Un’accurata percezione delle distanze fra gli oggetti dipende anche dal fatto di avere due occhi che vedono il mondo da due punti di vista lievemente diversi. Normalmente non ce ne accorgiamo perchè il cervello combina le informazioni provenienti dai due occhi. La differenza tra le informazioni provenienti da ciascun occhio è detta disparità binoculare⇒ rappresenta un indizio di profondità perchè dipende dalla distanza cui è situato l’oggetto fissato⇒ è tanto più grande quanto più l’oggetto è vicino. La capacità di calcolare la profondità cui diversi oggetti si trovano basandosi sull’entità della disparità binoculare corrispondente è detta stereopsi. Gli Indizi Pittorici Di Profondità. Nessuno dei tre indizi fisiologici di profondità è efficace quando guardiamo una fotografia o un dipinto ma è innegabile che fotografie e dipinti possano dare origine ad una vivida impressione di tridimensionalità. Questo effetto viene comunemente spiegato ricorrendo all'esistenza dei cosiddetti indizi pittorici di profondità: interposizione, grandezza, ombreggiatura e prospettiva. Questi indizi, naturalmente, non sono presenti solo nei quadri, ma anche nelle scene reali. Interposizione. Un oggetto che occluda parte di un altro oggetto viene automaticamente visto come il più vicino dei due. Grandezza (relativa e familiare). La grandezza di un oggetto può rappresentare un indicatore di distanza in due sensi diversi. 1 ) grandezza relativa⇒ oggetti più grandi tendono ad apparire più vicini di oggetti identici ma più piccoli; 2) grandezza familiare⇒ in assenza di altre informazioni di profondità, la conoscenza delle dimensioni normali di un certo oggetto tende ad influenzare la distanza a cui appare. Ombreggiatura. In generale, più un oggetto contrasta con il proprio sfondo, più vicino appare all’osservatore⇒ la luminosità di una superficie può, di per sé, influenzarne la distanza apparente. Il rapporto tra luci ed ombre è in grado di creare una forte impressione di profondità in rappresentazioni bidimensionali. L’ombreggiatura può anche invertire la profondità percepita⇒ a parità di altre condizioni si assume che la luce provenga dall’alto. Indizi Prospettici Alcune caratteristiche di un oggetto cambiano gradualmente all'aumentare della sua distanza dall'osservatore⇒ queste variazioni costituiscono altrettanti indicatori di profondità. Prospettiva lineare. La rappresentazione prospettica di una scena è caratterizzata dal fatto che le linee che sono fisicamente parallele convergono, nella rappresentazione, verso un punto situato all'orizzonte. Gradiente di tessitura. Quando una tessitura regolare presenta una densità uniforme in ogni sua parte, la superficie si trova davanti a noi su un piano frontale⇒ tanto più gli elementi sono piccoli e fitti, tanto maggiore è la distanza cui la superficie viene percepita. Il progressivo infittirsi della tessitura in una direzione indica che la superficie si allontana da noi in quella direzione e costituisce un indizio di profondità detto gradiente di tessitura. La ripidità del gradiente è legata al grado di inclinazione della superficie: un gradiente molto ripido corrisponde ad una superficie quasi parallela alla linea dello sguardo, mentre un gradiente meno ripido corrisponde ad una superficie più inclinata. Prospettiva aerea La luce, nell’attraversare l’atmosfera, subisce una diffrazione ad opera delle particelle di materia contenute nell’aria. La luce riflessa da oggetti più lontani deve attraversare, prima di giungere al nostro occhio, una quantità d’aria maggiore, per cui subisce una diffrazione maggiore⇒ contorni e dettagli degli oggetti più lontani tendono ad apparire vaghi ed indistinti. Oltre a renderli meno nitidi l’atmosfera fa anche sembrare gli oggetti lontani più azzurrastri, perché le lunghezze d’onda corte vengono diffuse in misura più elevata. Posizione rispetto all’orizzonte. Oggetti che si trovino vicino all’orizzonte appaiono più lontani di oggetti che non lo sono. Indizi Cinetici Di Profondità. Parallasse di movimento Gli oggetti vicini sembrano muoversi rapidamente, mentre quelli lontani sembrano spostarsi più lentamente e quelli lontanissimi appaiono quasi fermi. La differenza di velocità nel movimento apparente di oggetti posti a distanze diverse genera una sorta di gradiente cinetico (analogo al gradiente di tessitura) che è detto parallasse di movimento. Affinché la parallasse di movimento possa operare come indicatore di profondità, le varie regioni della scena debbono essere viste come parti di una struttura unitaria. La primarietà della percezione tridimensionale. Domanda: come facciamo a "vedere" la terza dimensione di una scena se tutto ciò di cui disponiamo è una proiezione bidimensionale di quella scena sulla retina del nostro occhio? Risposta “classica”: il nostro cervello ricostruisce la tridimensionalità di una scena utilizzando una serie di "indizi" di profondità⇒ questa risposta trascina con sè due grossi equivoci: 1) Il concetto di indizio suggerisce che la percezione bidimensionale preceda la percezione tridimensionale, ovvero che sia primaria; 2) Il concetto di indizio suggerisce che, senza di indizi di profondità, una scena visiva debba apparire piatta. Entrambe le implicazioni sono false. Eliminare gli indizi di bidimensionalità: la visione attraverso uno spioncino. Sebbene fotografie e dipinti possano dare origine ad una considerevole impressione di tridimensionalità ad essi manca quel carattere di realtà corporea che si ha invece con oggetti che si estendono effettivamente nella terza dimensione. La possibile contestazione che disegni e fotografie appaiono piatti perché sono fisicamente piatti è sbagliata⇒ la tendenza a vedere una scena come piatta è associata alla presenza, nella scena, di specifiche indicazioni⇒ di indizi di bidimensionalità: 1) una cornice attorno alla scena; 2 ) l’uniformità della grana dello schermo o del foglio (gradiente di tessitura pari a zero); 3) Valori di accomodazione, convergenza e disparità binoculare uguali. Osservatori che scrutano la fotografia di una stanza attraverso uno spioncino sono convinti di vedere una vera stanza. Il modello tridimensionale di una casa, sistemato al di là di un foglio di plastica trasparente teso all’interno di una cornice, risulta indistinguibile da una sua fotografia. L’arte di trasformare figure in oggetti solidi consiste nell’eliminare gli indizi di bidimensionalità⇒ quella di trasformare gli oggetti solidi in figure nell’introdurli. In un Ganzfeld si vede una sorta di densa nebbia che si estende in profondità⇒ esempio di percezione tridimensionale in presenza della stimolazione più semplice possibile⇒ contraddice direttamente l’idea che la percezione tridimensionale richieda l’elaborazione di un’immagine inizialmente piatta. Percezione diretta L’idea che sta alla base degli indici di distanza è che l’osservatore noti un indice caratteristico e poi incosciamente ne deduca un’informazione sulla distanza⇒ inferenza inconscia (Helmoholtz). G i b s o n invece sostiene che noi non deduciamo la profondità, ma piuttosto la percepiamo direttamente⇒ invece di guardare gli indici che caratterizzano gli oggetti le persone colgono l’informazione dallo sfondo stesso (gradiente di tessitura). A differenza degli indici di distanza tradizionali, il gradiente si estende su una larga area visiva e quando ci si muove in avanti l’informazione del gradiente sulla retina rimane costante o invariante. La percezione della profondità e della tridimensionalità, secondo Gibson dipende dal percepire direttamente tali elementi invarianti. La conclusione di Gibson è che l’impostazione tradizionale dello studio della percezione della terza dimensione va rivista radicalmente⇒ non ci sarebbe bisogno di indizi e di calcoli per ricostruire la terza dimensione⇒ le informazioni necessarie a vedere la distanza e la corporeità degli oggetti sono già contenute nell’immagine retinica⇒ la terza dimensione può essere vista direttamente. I gradienti di tessitura e di movimento non solo specificano direttamente l’inclinazione delle superfici e la distanza degli oggetti che su queste superfici giacciono, ma forniscono informazioni sull’esistenza di discontinuità, dislivelli, spigoli, pieghe, curve, e quindi anche sulla struttura tridimensionale delle cose. L'integrazione degli indizi Ritenere che la terza dimensione venga percepita direttamente non implica che i tradizionali indizi di profondità non possano contribuire significativamente alla nostra percezione dello spazio. Tanto le informazioni invarianti presenti in una scena che gli indizi di profondità concorrono alla visione della solidità e della distanza degli oggetti. Il problema è allora quello di capire in che modo i vari indizi vengano integrati dal sistema visivo: gli indizi sono tanti e diversi fra loro, ma la profondità percepita è unica. La necessità di un'integrazione discende anche dal fatto che quasi tutti gli indizi di profondità forniscono solo informazioni sulle distanze relative fra un oggetto e l'altro, non sulla distanza assoluta degli oggetti dai nostri occhi. I risultati delle ricerche in cui due o più indizi di profondità vengono manipolati separatamente suggeriscono che la profondità percepita è il risultato di una media ponderata della profondità segnalata da una varietà di indicatori. Inoltre uno stesso indizio può ricevere pesi molto diversi a seconda di quel che guardiamo. Le origini della percezione dello spazio Un famoso esperimento dimostra che la visione della distanza è presente fin dai primissimi giorni di vita: i piccoli di molte specie, come la nostra, evitano di avvicinarsi troppo ad un apparente precipizio e mostrano segni di forte disagio se vengono posti su una superficie trasparente che lo sovrasta⇒ l’indizio cruciale è la parallasse di movimento Sembra che la maggior parte degli indizi di profondità siano innati ma con la possibilità di venire modificati dall’esperienza. Altri indizi, come la prospettiva lineare, potrebbero non avere alcuna base biologica ma diventare segnali di profondità in seguito a ripetute associazioni con le informazioni fornite da indizi innati, quali disparità binoculare o interposizione.