Comments
Description
Transcript
teoria dei giochi
TEORIA DEI GIOCHI La teoria dei giochi studia l’interazione strategica tra giocatori(situazioni di conflitto o di cooperazione). Negli ultimi anni la teoria dei giochi ha trovato un vasto campo d’applicazione nello studio di problemi economici (oltre che politici, di scienze sociali ecc.). Nel contesto della politica macroeconomica i giocatori sono rappresentati dalle autorità di governo da un lato e dal settore privato dall’altro (persone e imprese).. Il comportamento del settore privato dipende da cosa si aspetta dal governo. A sua volta il comportamento del governo dipende da cosa si aspetta dall’economia (e quindi dal comportamento del settore privato). Noi analizzeremo tre situazioni: 1) GIOCHI AD INFORMAZIONE COMPLETA E PERFETTA 2) GIOCHI AD INFORMAZIONE QUASI PERFETTA (O GIOCHI RIPETUTI) 3) GIOCHI AD INFORMAZIONE INCOMPLETA Per rendere più semplice l’esposizione limitiamoci a considerare giochi tra soli due giocatori, ognuno dei quali ha a disposizione un numero finito di scelte. Ogni coppia di scelte dei due giocatori si definisce strategia. Supponiamo ad esempio che il giocatore 1 possa scegliere fra sinistra s e destra d e che il giocatore 2 possa scegliere fra sinistra S e destra D. Allora le possibili strategie sono: (s, S) (s, D) (d, S) (d, D). Ad ogni possibile scelta del giocatore 1 è associata una funzione di utilità u1 e lo stesso accade per il giocatore 2 al quale sarà associata una funzione di utilità u2 . Ci sono due modi per rappresentare un gioco: I. LA FORMA ESTESA (o ad albero) II. LA FORMA NORMALE (o matriciale) Nella forma estesa si specifica l’ordine del gioco, le possibili scelte di ogni giocatore ed i rendimenti (pay offs) o utilità relativa. La forma estesa si rappresenta con un diagramma ad albero. Facciamo due esempi. Supponiamo di avere due giocatori che giocano in due tempi diversi. Abbiamo quindi il tempo t = 1 e t =2. Al tempo t = 1 gioca il giocatore 1, al tempo t =2, gioca il giocatore 2. Ciascun giocatore gioca una sola volta. All’inizio il giocatore 1 sceglie fra sinistra s e destra d. Al tempo 2 successivo il giocatore 2, dopo aver osservato la scelta del giocatore 1, sceglierà a sua volta tra sinistra S e destra D. Le coppie ordinate indicano rispettivamente il pay off del primo giocatore nella prima coordinata e il pay off del secondo giocatore nella seconda coordinata. Pertanto se denotiamo con u1 ed u2 le funzioni di utilità del primo giocatore e del secondo giocatore, risulta: u1 (s, S) = 2 u1 (s, D) = 2 u1 (d, S) = 1 u1 (d, D) = 3 u2 (s, S) = 0 u2(s, D) = -1 u2(d, S) = 0 u2(d, D) = 1 Vediamo graficamente 1 s d 2 2 S (2,0) GIOCO DINAMICO O SEQUENZIALE D (2,-1) S D (1,0) (3,1) Questo gioco prende il nome di gioco dinamico o sequenziale. In alcuni giochi però non c’è questa sequenzialità nelle scelte, per cui il secondo giocatore gioca dopo aver osservato la scelta del primo giocatore. Ciò accade per esempio nel caso in cui le scelte dei due giocatori sono simultanee. Quindi quando il giocatore 2 deve prendere una decisione, non può osservare il comportamento del giocatore 1 ed in tal caso può fare solo delle congetture. Un gioco di questo tipo è statico. Il modo di rappresentare un gioco statico è quello accanto: un ovale racchiude i nodi del giocatore 2 e sta ad indicare che il giocatore 2 non sa cosa ha scelto 1. 1 s GIOCO STATICO O SIMULTANEO d 2 S (1,2) D S (0,1) (2,1) D (1,0) Le strategie fino ad ora viste sono dette strategie pure, in quanto il giocatore le sceglie con certezza. Può accadere però che le possibili scelte che un giocatore può fare, le fa casualmente con una certa probabilità. Per esempio può accadere che il giocatore 1 scelga s con probabilità p e d con probabilità (1-p). Tali strategie sono dette strategie miste. Una strategia pura può essere riguardata come una strategia mista con probabilità con p =1 (cioè la scelta è fatta con certezza). La forma normale invece di usare il diagramma ad albero, usa una matrice di dati. Vengono scritte le strategie a disposizione dei due giocatori nella prima colonna e nella prima riga. All’interno si scrivono i pay offs o utilità. Nel gioco dell’esempio 2 ogni giocatore gioca indipendentemente dall’altro. Quindi la matrice è: g1 g2 s d S 1,2 2,1 D 0,1 1,0 D’ora in avanti considereremo solo giochi in forma statica e di tipo statico. Vediamo quale sarà la scelta effettuata dal giocatore 1 e dal giocatore 2. Supponiamo che l’utilità di ciascun giocatore corrisponda ai valori riportati nelle quattro caselle. Il primo numero esprime l’utilità del giocatore 1, il secondo numero (in ogni casella) esprime l’utilità del giocatore 2. Guardando i valori nella tabella si vede che il giocatore 1 ha una utilità massima (ossia la più alta) se sceglie d perché può avere un pay off pari a 2 oppure ad 1 indipendentemente da quale sarà la scelta del secondo giocatore (mentre se sceglie s avrà una utilità pari ad 1 oppure 0). Per il giocatore 2 l’utilità è massima se sceglie S perché in tal caso ottiene un pay off di 2 oppure 1 indipendentemente dalla scelta del primo giocatore (se invece scegliesse D otterrebbe un pay off di 1 oppure 0). Quindi si dice che la strategia (d, S) è una strategia dominante. Diamo una definizione di strategia dominante: sia A1 l’insieme delle possibili scelte per il giocatore 1 e A2 l’insieme delle possibili scelte per il giocatore 2, ∃a1* ∈ A1 tale che u1(a1*; a2) = max u1(a1, a2) per ogni a2 ∈A2 a ∈A 1 1 ∃a 2* ∈ A2 tale che u2(a1, a2*) = max u2 (a1, a2) per ogni a1 ∈A1 a ∈A 2 2 (a1*, a2*) è la STRATEGIA DOMINANTE. Se questi equilibri con strategia dominante si verificassero realmente, sarebbero sicuramente ottimali, ma nella realtà una tale situazione è difficile che si realizzi. Generalmente quello che succede è che ciascuno cerchi di ottenere una massima utilità dalla propria scelta , condizionata dal comportamento di altri individui. Quindi quello che sembra più probabile che possa accadere è che ciascun soggetto effettui la propria scelta ottima, condizionata dalla scelta ottima dell’avversario. Quando si ha questa situazione di “OTTIMALITA’ CONDIZIONATA” si ha un equilibrio di Nash (dal nome del matematico statunitense che lo elaborò nel 1951). Diamo quindi la seguente definizione di equilibrio di Nash: sia A1 l’insieme delle possibili scelte per il giocatore 1 e A2 l’insieme delle possibili scelte per il giocatore 2 la strategia (a1*, a2*) si dice che è un equilibro di Nash se: 1) a1* ∈ A1 , a2* ∈ A2 2) u1(a1*, a2*) ≥ u1(a1, a2*) ∀ a1∈ A1 3) u2(a1*, a2*) ≥ u2(a1*, a2) ∀ a2∈ A2 In altre parole è la strategia che consente di dare la massima utilità a ciascun giocatore, data la scelta ottima del secondo giocatore. u1(a1*, a2*) =max u1(a1, a2*) a1∈A1 u2(a1*, a2*) = max u2(a1*, a2) a2∈A2 Se applichiamo questa idea dell’equilibrio di Nash al problema economico potremmo ipotizzare che la scelta sia tra “inflazionare e non inflazionare”. Da un lato immaginiamo di avere il settore privato e dall’altro il policy maker. Il policy maker può scegliere cosa fare. Per il policy maker è ottimale scegliere un tasso di inflazione positivo, perché una volta aver indotto il settore privato a fare delle scelte contrattuali sulla base della politica annunciata, ed aver quindi spinto lavoratori e imprenditori a fissare i salari e i prezzi, può trovare conveniente deviare da tale politica annunciata e fissare un livello di inflazione più elevato per perseguire l’ulteriore obiettivo di riduzione della disoccupazione. Il settore privato però sa che per il policy maker è ottimale scegliere un livello di inflazione più elevato perché conosce la sua funzione di utilità ( o perdita). Siamo infatti in uno stato di informazione completa. Pertanto se il policy maker fissa un tasso di inflazione superiore a quello annunciato (ipoteticamente pari a zero), per il settore privato sarà ottimale adattare le sue aspettative a questo valore. Se non lo facesse otterrebbe una perdita. All’inizio dell’anno infatti quando i lavoratori stipulano i contratti con le imprese, stabilendo i salari, lo fanno sulla base delle aspettative di inflazione. E’ chiaro che quanto più l’inflazione è elevata tanto minore sarà a parità di salario nominale, il salario reale. Quindi è ovvio che il lavoratore che si aspetta un aumento dell’inflazione punterà ad avere un salario nominale più levato. Pertanto se rappresentiamo in una matrice da un lato il policy maker (che rappresenta il giocatore 1) e dall’altro il settore privato, avremo: Pareto ottimale s. privato policy maker π= 0 π = π+ πe = 0 πe = π+ 10,10 11,0 0,11 3,3 Nash Cioè la strategia πe = π = π+ è un equilibrio di Nash. Un equilibrio di Nash può però presentare dei problemi. Uno dei problemi di un equilibrio di Nash è che non sempre comporta soluzioni Pareto efficienti. Cos’è una strategia Pareto ottimale (o Pareto efficiente)? (a , a ) è una strategia pareto ottimale se non è possibile migliorare l’utilità di un giocatore senza guastare (ridurre) quella di un altro giocatore, cioè: 1 2 ( ) ) > u (a , a ) ( ) ) < u (a , a ) se u1(a1, a2 ) > u1 a1 , a 2 allora u2(a1, a2 ) < se u2(a1’, a2’ allora u1(a1’, a2’ 2 1 2 u2 a1 , a 2 1 1 2 Esempio Facciamo un esempio che ci mostri sia un equilibrio di Nash, sia una strategia pareto efficiente. Ipotizziamo quindi di avere sempre i due giocatori con possibilità di scelta tra s e d per il giocatore 1 e tra S e D per il giocatore 2. Supponiamo di avere i seguenti pay off: g1 g2 s d S 10,10 11,0 D 0,11 3,3 Qui l’equilibrio di Nash è dato dalla strategia (d, D), infatti: u1(d,D) = 3 ≥ u1(s,D) = 0 Ferma restando la scelta del giocatore 2, perché per lui è quella che gli da il maggior pay off, se il giocatore 1 scegliesse sinistra s anziché destra d , il suo pay off, sarebbe minore Nel caso del giocatore 2 invece, u2(d,D) = 3 ≥ u2(d,S) = 0 Ferma restando la scelta del giocatore 1 che sceglierebbe sicuramente destra perché gli da un pay off maggiore, il giocatore 2 sceglierà D piuttosto che sinistra S perché in tal caso il suo pay off sarebbe minore. La strategia pareto ottimale invece è (s, S). Se potesse il giocatore 1 sceglierebbe destra perché gli dà un pay off maggiore (qualunque sia la scelta dell’altro). Ma per l’altro se il giocatore 1 sceglie destra avrà sempre dei pay off minori rispetto alla situazione in cui il giocatore 1 gioca s. Quindi quello che fa star bene il giocatore 1 e fa star bene anche il giocatore 2 è (s, S). In teoria dei giochi, un esempio che rappresenta questa inefficienza paretiana è il così detto “dilemma del prigioniero”. Questo gioco considera una situazione in cui due prigionieri complici in un delitto vengono interrogati in due stanze separate. Questi hanno la possibilità di confessare il loro delitto o di negare la loro colpevolezza. Se uno confessa e l’altro no, il primo è libero. Se entrambi dovessero confessare sarebbero condannati a tre mesi. Se entrambi dovessero negare la propria colpevolezza sarebbero condannati a un mese. 1 Confessa Nega 2 Nash Confessa Nega -3,-3 -6,0 0,-6 -1,-1 Pareto efficiente Quindi abbiamo una strategia dominante (Confessare, Confessare), ed è anche un equilibrio di Nash. Se però i due giocatori potessero restare uniti e ciascuno fosse certo che l’altro nega, avrebbero convenienza entrambi a negare. Quindi la strategia (negare, negare) è pareto efficiente , cioè non vi è nessun altro modo per aumentare la soddisfazione di entrambi. Il dilemma del prigioniero trova numerose applicazioni in economia. Se torniamo un attimo al problema della scelta ottimale del livello di inflazione, vediamo che quella soluzione che avevamo trovato non era pareto efficiente. Si avrebbe invece una soluzione pareto efficiente se il policy maker decidesse di non barare e fissasse un livello di inflazione effettiva pari a quella annunciata. Quale può essere allora un modo per indurre il giocatore traditore a non tradire? (nel caso del problema di politica monetaria ci si chiede come poter spingere la banca centrale a non deviare dalla politica annunciata). Fino ad ora abbiamo considerato dei giochi uniperiodali, cioè abbiamo visto dei giochi in cui gli attori si incontravano una sola volta e giocavano una sola volta il gioco del dilemma del prigioniero. La situazione però cambia se il gioco è ripetuto dagli stessi giocatori un numero indefinito di volte . In questo contesto le possibilità strategiche per ciascun giocatore cambiano. Se un giocatore ad un giro tradisce, sa che l’avversario può tradire la volta successiva. Quindi chi tradisce verrà “punito” per il comportamento scorretto. Quindi in un gioco ripetuto si pone il problema di “crearsi una reputazione”. In un gioco ripetuto ciascun giocatore, avendo la possibilità di crearsi la reputazione di individuo che coopera, incoraggia l’altro a comportarsi correttamente. Esiste un modo per influire sul comportamento dell’avversario: se un giocatore rifiuta di cooperare ora, l’altro rifiuterà di cooperare la volta successiva. Finché entrambi si preoccupano dei pay off futuri, la minaccia di non cooperare può costituire una strategia sufficiente per convincere i partecipanti ad adottare una strategia pareto efficiente. Questo tipo di strategia “minacciosa” viene detta “colpo su colpo”. Consiste sostanzialmente in questo. Nel primo giro si coopera, si gioca la strategia negare se facciamo riferimento al gioco del dilemma del prigioniero. Nelle partite successive si coopera se l’avversario ha cooperato nella partita precedente. Se ha tradito, anche l’avversario tradirà. In altre parole ci si comporta esattamente come si è comportato l’avversario nella volta precedente. La strategia del colpo su colpo è molto efficace perché il tradimento viene immediatamente punito. Questa strategia è “leale”, se infatti l’avversario dopo esser stato punito per il tradimento, dovesse tornare a cooperare, la strategia del colpo su colpo lo ricompenserà con la cooperazione dell’altro giocatore. Vediamo come agiscono queste forze reputazionali nel caso di un problema di politica monetaria. Seguendo la regola del “dente per dente”, il pubblico modifica le proprie scelte in termini di aspettative inflazionistiche, sulla base del comportamento assunto in passato dal policy maker. Pertanto se in passato il policy maker ha fissato un livello di inflazione piuttosto basso, il settore privato manterrà basse le proprie aspettative. Non appena però l’inflazione dovesse aumentare, il settore privato adeguerà subito le sue aspettative a tale maggior valore. Pertanto ipotizzando che tale maggior valore corrisponda ad un livello di inflazione pari ad α, se il policy maker annuncia una politica monetaria con inflazione nulla, come si comporterà il settore privato? Tutto, come abbiamo detto, dipenderà dalle scelte al tempo t -1. Pertanto se a t-1 è stato πa = 0,allora al tempo t si avrà πe = πa = 0. Se invece al tempo t-1 la politica annunciata è stata pari a zero ma quella effettiva pari ad α>0, allora le aspettative del settore privato saranno tali per cui πe = πa = α. Quand’è che comunque la banca centrale deciderà di deviare dalla politica annunciata? Quando il beneficio che ottiene dalla deviazione nel periodo dalla politica annunciata , confrontato con la perdita che subisce nel secondo periodo in seguito alla perdita di reputazione, attualizzato al tempo t è positivo e maggiore di zero. Fino ad ora abbiamo visto giochi ad informazione completa e perfetta e giochi ad informazione quasi perfetta. Vediamo ora i giochi ad informazione incompleta. Un giocatore ha informazione incompleta quando non conosce le caratteristiche precise dei propri rivali (preferenze, spazio delle strategie). Supponiamo ad esempio di avere due tipi di policy makers: uno più avverso all’inflazione e l’altro meno preoccupato dell’inflazione. Il settore privato in tal caso non è in grado di distinguere il tipo di polcy maker che ha di fronte. L’interessante conclusione cui giungono alcuni studiosi in letteratura è che il risultato che si ottiene , in termini di “lotta all’inflazione” con informazione incompleta circa le preferenze del policy maker è migliore di quello che si ottiene con informazione completa.