TEORIA DEI GIOCHI E STRUMENTI DELL`ANALISI STRATEGICA
by user
Comments
Transcript
TEORIA DEI GIOCHI E STRUMENTI DELL`ANALISI STRATEGICA
9 maggio 2012 TEORIA DEI GIOCHI E STRUMENTI DELL’ANALISI STRATEGICA (Capitolo 11, escluse appendici) Nella prima parte del corso, dedicata all’analisi dell’equilibrio economico generale ho ripetutamente sottolineato che uno degli assiomi fondamentali di comportamento degli agenti, consumatori e produttori è che effettuino le loro scelte in modo indipendente. Se gli agenti sono razionali e perseguono obiettivi di massimizzazione (dell’utilità o del profitto), ma subordinano le loro scelte a quelle degli altri agenti ovvero si comportano in modo strategico, i risultati delle loro azioni possono essere, e generalmente sono, molto diversi da quelli che abbiamo ottenuto nel contesto di un modello di equilibrio economico generale. In generale, non avranno la proprietà di ottimalità nel senso di Pareto. I comportamenti strategici sono molto frequenti nella realtà, in particolare nei mercati oligopolistici, nei mercati finanziari e nel mercato del lavoro. Questi sono i campi di applicazione più usuali dello strumento di analisi più appropriato all’analisi dei comportamenti strategici: la TEORIA DEI GIOCHI. Questa è stata inventata da John Von Neumann negli anni trenta ed applicata per la prima volta all’analisi economica da John Von Neumann e da Oskar Morgenstern nel volume “The Theory of Games and Economic Behaviour” (1944). 1 9 maggio 2012 Si ha un • GIOCO DI STRATEGIA ogni qualvolta l’esito di un insieme di azioni intraprese da due o più individui, o • PAYOFF o • PREMIO per ciascuno dei giocatori dipende non solo dalle sue scelte ma anche dalle scelte degli altri partecipanti al gioco. Più precisamente il gioco di strategia è l’insieme di regole che vincola le scelte dei giocatori e ne definisce i payoff. Queste regole sono conosciute con certezza da tutti i giocatori. Un esempio, estraneo all’economia, ma appropriato, è il gioco degli scacchi. Il gioco può prevedere anche esiti probabilistici. In questo caso anche la NATURA intesa come generatrice di eventi casuali, o il CASO contribuiscono a determinare l’esito del gioco per ciascun giocatore. I giochi nei quali i payoff dipendono anche da eventi casuali o stati di natura sono detti 2 9 maggio 2012 GIOCHI CONTRO IL CASO, O CONTRO LA NATURA Un esempio, estraneo all’economia ma appropriato, è il gioco del poker, nel quale la distribuzione delle carte fra giocatori è casuale. Qualsiasi gioco di strategia ammette due tipi di rappresentazioni: in forma estesa mediante l’albero del gioco oppure in forma normale Entrambe le rappresentazioni forniscono una descrizione dettagliata delle regole del gioco. Vedremo, tuttavia, che le due rappresentazioni non sono sempre equivalenti. Nel seguito dell’analisi le principali definizioni e proposizioni verranno illustrate mediante esempi, generalmente tratti dal libro di testo. Rappresentazione in forma estesa ESEMPIO 1: Esistono due società informatiche: - IBM - Toshiba Che devono scegliere il sistema operativo per i personal computer che producono e vendono. 3 9 maggio 2012 La scelta è fra - DOS prodotto da IBM, e - UNIX in versione Toshiba. Se entrambe scelgono lo stesso sistema operativo, i computer prodotti dalle due società sono compatibili ed entrambe le società ne traggono beneficio. In questo caso, la società produttrice del software guadagna 600 milioni di dollari e l’altra società 200 milioni di dollari. Se le scelte sono diverse, i computer non sono compatibili ed entrambe guadagnano solo 100 milioni di dollari. Le regole del gioco ed i relativi payoff possono essere rappresentati mediante un albero decisionale (albero del gioco, forma estesa), costituito da un insieme di NODI o punti decisionali, collegati fra loro da segmenti, o RAMI. GRAFICO I IBM 1 DOS Toshiba 2 UNIX 2 Toshiba DOS UNIX DOS UNIX (600,200) (100,100) (100,100) (200,600) 4 9 maggio 2012 Ogni nodo corrisponde ad una scelta da parte di un giocatore. Ogni ramo corrisponde alle possibilità di scelta a disposizione del giocatore. Una data sequenza di nodi e rami è detta STRATEGIA Ad ogni strategia è associato un insieme di payoff, uno per ciascun giocatore, corrispondente ai numeri indicati entro parentesi al termine di ogni percorso (il primo è riferito all’IBM, il secondo alla Toshiba). Il gioco rappresentato nel grafico I è detto: ad informazione perfetta, perché si assume che le sequenze delle scelte corrispondano alla struttura dell’albero e quindi che la prima scelta spetti ad IBM e che, quando è il suo turno di scegliere, Toshiba conosca la scelta dell’IBM. Se la scelta è contemporanea, o se nessuno dei due giocatori conosce la scelta dell’altro nel momento in cui sceglie, il gioco è detto ad informazione imperfetta e può essere rappresentato nel modo seguente: GRAFICO II IBM 1 DOS UNIX Toshiba Toshiba 2 3 DOS UNIX DOS UNIX (600,200) (100,100) (100,100) (200,600) 5 9 maggio 2012 Il segmento tratteggiato che unisce i nodi 2 e 3 significa che la scelta di Toshiba, che può essere o non essere contemporanea a quella di IBM, avviene senza conoscere la scelta di IBM, cioè senza sapere se si trova nel nodo 2 oppure nel nodo 3. Lo stesso vale naturalmente per IBM. Per rappresentare un gioco ad informazione imperfetta in forma estesa si può anche racchiudere i nodi 2 e 3 in un ovale. Noi useremo tuttavia sempre la notazione illustrata nel grafico, perché è più semplice. Un gioco ad informazione imperfetta può essere rappresentato anche in ♦ forma normale mediante una tavola a doppia entrata. TAVOLA I Società IBM Toshiba Sist. Operativo DOS UNIX DOS 600,200 100,100 UNIX 100,100 200,600 La tavola ci dice che: 1. se entrambe le società scelgono DOS, IBM guadagna 600 milioni di dollari e Toshiba 200 milioni di dollari, 2. se IBM sceglie DOS e Toshiba sceglie UNIX, o viceversa, entrambe guadagnano solo 100 milioni di dollari, 3. se entrambe le società scelgono UNIX, Toshiba guadagna 600 milioni di dollari ed IBM solo 200. Si noti che: qualunque sia la scelta dei due giocatori, entrambi hanno un guadagno netto. Quindi, la somma dei payoff è positiva. 6 9 maggio 2012 Quando la somma dei guadagni compensa esattamente la somma delle perdite, il gioco è detto: a somma nulla. ESEMPIO 2: Un esempio di gioco a somma nulla è il gioco dei “matching pennies”: due bambini scelgono contemporaneamente un lato di una moneta. Se entrambi scelgono lo stesso lato il bambino 2 guadagna un penny, perso dall’altro. Se scelgono lati diversi, il bambino 1 guadagna un penny, perso dall’altro. Anche questo gioco può essere rappresentato in forma normale, come nella tavola II: TAVOLA II Bambino 2 Esito Testa Croce 1 Testa -1,+1 +1,-1 Croce +1,-1 -1,+1 (il primo numero è riferito al bambino 1) oppure in forma estesa: GRAFICO III Bambino 1 1 Testa Bambino 2 Testa (-1,+1) Croce Bambino 2 2 3 Croce Testa Croce (+1,-1) (+1,-1) (-1,+1) Si noti che 7 9 maggio 2012 né nell’esempio 1 né nell’esempio 2 le regole del gioco prevedono la possibilità di accordi fra i giocatori. I giochi che escludono questa possibilità sono detti: NON COOPERATIVI. Dobbiamo ora chiederci quali saranno gli esiti dei giochi che abbiamo illustrato nei due esempi? Agli economisti, come è noto, interessano solo gli esiti che hanno le caratteristiche di un equilibrio, definito: • EQULIBRIO DI NASH Nel caso generale di un gioco con n giocatori, una definizione formale dell’equlibrio di Nash è la seguente: un equilibrio di Nash è un vettore di strategie ( s* = s1* , s*2 , K, s*n ) ognuna delle quali è scelta da uno ed un solo giocatore, tale che, avendo definito ( ) πi s1* , s*2 , K, s*n , i = 1, K, n il payoff dell’i-simo giocatore associato a questo vettore, la diseguaglianza ( ) ( πi s1* , L, si ,K, s*n ≤ π s1* , s*2 .K, s*n ) è verificata per tutti gli i=1,…,n e per tutte le possibili scelte si ∈ Si , dove Si è l’insieme delle possibili strategie a disposizione del giocatore i-simo. Il significato di questa definizione è, molto semplicemente che, se i giocatori scelgono il vettore di strategie corrispondente all’equilibrio di 8 9 maggio 2012 Nash, nessuno di essi ha interesse a cambiare la propria strategia. Poiché ogni giocatore persegue un obiettivo di massimizzazione del proprio payoff, il vettore s*, assicura la massimizzazione del payoff di ogni giocatore, subordinatamente alle scelte strategiche di ogni altro giocatore. La soluzione di un gioco corrispondente all’equlibrio di Nash, può essere determinata con procedure diverse, in particolare: mediante eliminazione delle strategie dominate se esiste una strategia dominante. il che non è sempre vero. Per strategia dominante si intende una strategia che risulta la migliore per un giocatore, indipendentemente dalla strategia adottata dall’altro. ESEMPIO 3 Un esempio di equilibrio con strategia dominante è il seguente: TAVOLA III Società Ford Politica di prezzo Prezzo alto Prezzo basso General Motors Prezzo alto Prezzo basso 500,500 100,700 700,100 300,300 Le due società possono scegliere solo fra due politiche di prezzo (prezzo alto e prezzo basso). L’esito della scelta di ciascuna dipende dalla scelta della concorrente. I payoff, in milioni di dollari, sono indicati nella caselle centrali; come sempre il primo numero è riferito alla Ford, il secondo alla General Motors. Il gioco è ad informazione imperfetta e non cooperativo. 9 9 maggio 2012 È facile verificare che la strategia prezzo basso è la migliore per entrambe le società, indipendentemente dalla strategia scelta dal concorrente. Quindi prezzo basso è la strategia scelta da entrambe le società, con un payoff di 300 milioni di dollari per ciascuna. Si noti che: ♦ la strategia dominante non è quella ottima nel senso di Pareto. Infatti entrambe le società potrebbero migliorare i loro risultati economici se stipulassero un accordo e praticassero entrambe una strategia di prezzo alto. Questo è tuttavia impossibile in un gioco non cooperativo. Inoltre, anche nell’ipotesi che l’accordo venisse stipulato, esisterebbe un incentivo per entrambe le società a violarlo (se una sola delle due viola l’accordo il suo payoff aumenta da 500 a 700 milioni di dollari). Il gioco appena illustrato è un esempio del gioco del dilemma del prigioniero. Lascio a voi di rispondere al seguente problema: ♦ esiste una strategia dominante nel gioco della scelta del sistema operativo di IBM e Toshiba e nel gioco dei matching pennies? La soluzione dei giochi mediante eliminazione delle strategie dominate, qualora sia possibile, presuppone la razionalità dei giocatori. L’ipotesi di razionalità non ha trovato conferma nell’economia sperimentale. In particolare, anche i giocatori razionali non scelgono la strategia dominante se non sono certi della razionalità delle scelte dei loro avversari. Il metodo è inoltre inefficace quando una strategia dominante non esiste e quando esistono più equilibri di Nash. Gli equilibri multipli possono, a volte, essere ordinati, in modo da rendere possibile una scelta per i giocatori. Anche in questo caso, tuttavia, non sempre i giocatori sono in grado di riconoscere il più vantaggioso in una molteplicità di equilibri possibili. Il seguente: 10 9 maggio 2012 ESEMPIO 4 illustra un caso in cui un equilibrio di Nash non esiste. TAVOLA IV Generali Generale 1 Strategie Ritirarsi Attaccare Generale 2 Ritirarsi Attaccare 5,8 6,6 8,0 2,3 Nella Tavola VI, i payoff dei due generali sono le loro utilità espresse in termini di una comune unità di misura. L’equilibrio di Nash, se esiste, è costituito da una coppia di strategie, una per ogni generale, tale che, se si realizza, nessuno dei due ha alcun incentivo a modificare la sua scelta. E’ facile verificare che in questo esempio tutte le coppie di strategie comportano un incentivo a modificare la scelta di almeno uno dei due generali. Consideriamo la coppia di strategie secondo cui il generale 1 si ritira ed il generale 2 attacca, con premi pari a (6,6). Questa coppia di strategie non può essere un equilibrio perché, se il generale 1 si ritira, anche al generale due converrebbe ritirarsi, ottenendo un’utilità pari a 8. D’altra parte anche la strategia (5,8), nella quale entrambi i generali si ritirano non può essere un equilibrio perché, se il generale 2 si ritira, al generale 1 converrebbe attaccare, dato che questo porterebbe il suo payoff ad 8. In modo analogo si può dimostrare che neppure le restanti due coppie di strategie sono equilibri di Nash. Un equilibrio di Nash che stabilisce una regola per l’azione che ciascun giocatore deve compiere è detto • EQUILIBRIO CON STRATEGIA PURA Nell’esempio 4 questo equilibrio non esiste, ma l’esempio ammette la possibilità di un • EQUILIBRIO CON STRATEGIE MISTE 11 9 maggio 2012 Le strategie miste definiscono combinazioni probabilistiche di tutte le possibili strategie pure del gioco. Nel caso in cui esistono N strategie pure possibili, una strategia mista è una distribuzione di probabilità associata a queste strategie, ovvero un insieme di numeri reali (p1, p2, …, pN), tali che 0 ≤ p i ≤ 1, per i = 1, K, N e ∑ pi = 1 i Illustriamo il concetto di equilibrio con strategie miste con riferimento all’esempio 4. Supponiamo che il generale 2 scelga la strategia pura “ritirasi” con probabilità q e la strategia pura “attaccare” con probabilità 1-q. I payoff attesi del generale 1 sono quindi: 1) 5q + 6(1 − q) = 6 − q se si ritira, 2) 8q + 2(1 − q) = 2 + 6q se attacca. Quale delle due strategie sia più conveniente per il generale 1 dipende chiaramente da valore di q. Supponiamo che il generale 1 valuti la probabilità che il generale 2 scelga di ritirarsi con q = 0,5. I payoff attesi del generale 1 sono in questo caso pari a: 12 9 maggio 2012 5,5 se si ritira e 5 se attacca. Quindi, se il generale 1 ritiene che il generale 2 adotti una strategia mista con q=0,5, il generale 1 sceglie la strategia pura di ritirarsi, perché questa gli assicura un premio atteso più elevato. Si noti che le equazioni 1 e 2, che definiscono l’utilità attesa di ogni strategia per il generale 1, sono dette: funzioni di utilità attesa. Una funzione di utilità con queste caratteristiche è detta anche funzione di utilità di Von Neumann-Morgenstern. Poiché la strategia mista con q = 0,5 del generale 2 induce la scelta di una strategia pura per il generale 1, questa coppia di strategie non può essere un equilibrio con strategie miste. Continuando ad ipotizzare un gioco con due soli giocatori, si ha un equilibrio con strategie miste quando ciascun giocatore adotta una strategia mista in corrispondenza della quale il premio atteso che l’altro giocatore riceve è sempre lo stesso, qualunque sia la strategia pura che questo giocatore adotta. Supponiamo che, nell’esempio 4, il generale 2 adotti la strategia mista con q= 4 7 , 1− q = 3 7 13 9 maggio 2012 Il premio atteso del generale 1 è 4 3 38 5 +6 = 7 7 7 se si ritira 4 3 38 8 +2 = 7 7 7 se attacca. Poiché il generale 1 è indifferente sulla strategia da adottare, potrebbe affidarsi anche lui al caso ed associare una probabilità p alla ritirata ed una probabilità 1-p all’attacco. Affinché la strategia mista del generale 1 ammetta un equilibrio con strategie miste, il valore di p deve essere tale che il premio atteso del generale 2 per ogni strategia sia lo stesso. Ciò avviene se il generale 1 sceglie la strategia mista con p= 3 2 ; 1− p = 5 5 Infatti i premi attesi del generale 2 diventano: 3 2 24 8 +0 = 5 5 5 se si ritira 3 2 24 6 +3 = 5 5 5 se attacca. 14 9 maggio 2012 Quindi le strategie miste con q= 4 7 , p= 3 5 costituiscono un equilibrio con strategie miste per il gioco illustrato dall’esempio 4. Individuare un’unica soluzione per un gioco con più equilibri di Nash è a volte possibile con il metodo di • INDUZIONE ALL’INDIETRO, che permette di identificare gli • EQUILIBRI PERFETTI NEI SOTTOGIOCHI. Anche nell’esempio seguente, che illustra questi due concetti, i premi sono l’espressione numerica delle utilità dei due giocatori ESEMPIO 5 Il giocatore 1 è un bambino capriccioso, che il sabato pomeriggio vuole andare al cinema. Suo padre, giocatore 2, vuole invece portare tutta la famiglia in visita da zia Sofia. Il bambino può rassegnarsi a visitare la zia payoff (1,1) - oppure rifiutare. Se rifiuta, il padre può adeguarsi e portare la famiglia al cinema - payoff (2,0) - oppure attuare la sua minaccia di punire il bambino, obbigandolo a restare in casa con tutta la famiglia. Se la minaccia viene attuata, tuttavia, il bambino urla e strepita e tormenta tutti payoff (-1,-1). Nel grafico IV il gioco (ad informazione perfetta) è rappresentato in forma estesa: 15 9 maggio 2012 Giocatore 1 Sinistra (zia Sofia) (1,1) 1 Destra (cinema) Giocatore 2 Sinistra 2 Destra (punisce) (non punisce) (-1,-1) (2,0) GRAFICO IV Se il bambino accetta di andare in visita da zia Sofia, cioè sceglie la strategia a Sinistra, il gioco finisce. Quindi questa strategia è un equilibrio di Nash. Se il bambino rifiuta di visitare la zia, cioè sceglie Destra, il gioco arriva al nodo 2 nel quale spetta al padre scegliere fra arrabbiarsi e punire il bambino (strategia Destra-Sinistra), oppure non arrabbiarsi ed andare al cinema (strategia Destra-Destra). Poiché la strategia Destra-Sinistra comporta per lui un payoff negativo, il padre, di fatto, sceglie di non arrabbiarsi e di andare al cinema, cioè Destra-Destra, il che comporta per lui un premio nullo ed un premio pari a 2 per il bambino. Anche in DestraDestra il gioco finisce, quindi anche Destra-Destra è un equilibrio di Nash. Se confrontiamo i due equilibri, notiamo che il primo è sorretto dalla minaccia paterna di chiudere il bambino in casa, ma questa minaccia non è credibile, perché il padre stesso non ha interesse ad attuarla. Solo la strategia DestraDestra corrisponde ad un equilibrio di Nash effettivamente raggiungibile. 16 9 maggio 2012 In pratica, solo la soluzione con payoff (2,0), andare al cinema, è rilevante all’interno del sottogioco costituito dalle strategie possibili a partire dal nodo 2. Possiamo perciò definire il concetto di: equilibrio perfetto nei sottogiochi, come un insieme di strategie, una per ogni giocatore, tale che le azioni prescritte costituiscono un equilibrio di Nash in ciascun sottogioco che possa essere effettivamente raggiunto. Possiamo, a questo punto, anche dare una definizione di induzione all’indietro. Questa consiste nell’individuare gli equilibri caratterizzati da minacce credibili, partendo dalla fine del gioco. Anche il gioco illustrato nell’esempio seguente può essere risolto mediante l’induzione all’indietro. ESEMPIO 6 Giocatore 1 S 1 D Giocatore 2 S Giocatore 2 2 D 3 S D (4,4) (4,4) Gio. 1 5 Gio. 1 S 4 D S D (5,0) (7,1) (2,1) (3,3) 17 9 maggio 2012 Iniziando dai sottogiochi che partono dai nodi 4 e 5 è facile verificare che i payoff (5,0), (7,1) e (2,1) corrispondono a strategie sostenute da minacce non credibili. Infatti in entrambi i nodi il giocatore 1 sceglie D e quindi il giocatore 2, nel nodo 3, non sceglie S, con payoff 1, ma D, che gli garantisce un premio di 3 Procedendo all’indietro, è inoltre facile verificare che, se 1 gioca per primo, non sceglie D, che comporta per lui l’unico premio possibile pari a 3, ma sceglie S che gli assicura un premio pari a 4, sia che 2 scelga S, sia che 2 scelga D. Essendo la scelta di 2, nel nodo 2, irrilevante, il gioco termina con la scelta di 1 nel nodo 1. • DOMINANZA DEBOLE E RICERCA DELLA SOLUZIONE MEDIANTE L’ELIMINAZIONE ITERATA DELLE STRATEGIE DOMINATE Se, in un gioco ad informazione imperfetta, esistono strategie dominate solo in senso debole, la ricerca di una soluzione mediante eliminazione delle strategie dominate, sia in senso forte che in senso debole, può produrre risultati che variano in funzione dell’ordine di eliminazione delle strategie. Ciò è illustrato dall’esempio seguente. ESEMPIO 7: TAVOLA V Giocatore 2 Giocatore 1 Strategie 1 2 1 20 , 0 20 , 2 2 10 , 1 10 , 0 3 4 , -4 2 , -2 Nel caso illustrato nella tavola V, la scelta fra le strategie 1 e 2 sarebbe indifferente per il giocatore 1 se il giocatore 2 scegliesse la strategia 1 o la strategia 2. Se, tuttavia, il giocatore 2 scegliesse la strategia 3, la strategia 1 sarebbe dominante per il giocatore 1. In questo caso si dice che, per il giocatore 1, la strategia 1 domina debolmente la strategia 2, perché 18 9 maggio 2012 fornisce risultati migliori in corrispondenza di alcune scelte strategiche dell’avversario, mentre le due strategie sono indifferenti in corrispondenza di altre scelte dell’avversario. In presenza di casi di dominanza debole l’eliminazione iterata delle strategie dominate, può condurre a soluzioni diverse in funzione dell’ordine in cui le strategie vengono eliminate. Infatti, se supponiamo che il giocatore 2 elimini la strategia 2 dalle possibili scelte del giocatore 1, perché è debolmente dominata, la tavola del gioco si riduce alla riga corrispondente alla strategia 1 per il giocatore 1. Le scelte 1 e 3 da parte del giocatore 2 possono quindi essere eliminate, perché dominate in senso stretto dalla strategia 2 e l’equilibrio di Nash si ha in corrispondenza della coppia di strategie (1 , 2) per i due giocatori. Se tuttavia supponiamo che sia 1 a dover decidere quale strategia eliminare dalle tre possibili alternative di 2, perché è dominata, la sua scelta cade sicuramente sulla strategia 3. La tavola del gioco è perciò ridotta alle righe e colonne corrispondenti alle strategie 1 e 2 per entrambi i giocatori, come nella tavola seguente: Giocatore 2 Giocatore 1 Strategie 1 2 1 20 , 0 20 , 2 2 10 , 1 10 , 0 Nel gioco così ridotto, tuttavia, esistono due equilibri di Nash, corrispondenti alle coppie di strategie (2 , 1) e (1 , 2). Il risultato del gioco dipende quindi dall’ordine in cui le strategie dominate vengono eliminate. 19 9 maggio 2012 Quando un unico equilibrio di Nash può essere individuato mediante l’eliminazione iterata delle strategie dominate, sia in senso forte che debole, si dice che il gioco è risolvibile per dominanza. 20