L`intelligenza artificiale

by user

on 06 июля 2016

Category: Documents

>> Downloads: 6

views

Report

Comments

Description

Download L`intelligenza artificiale

Transcript

L`intelligenza artificiale

Capitolo 6
L’intelligenza artificiale
L’ultimo capitolo del volume è dedicato al più affascinante e controverso tra i temi dell’informatica, l’intelligenza artificiale, cioè il tentativo di creare sistemi artificiali dotati
di intelligenza.264 Si presenterà dapprima una breve introduzione alla storia delle ricerche di intelligenza artificiale, in modo che il lettore possa cogliere le linee evolutive e le
prospettive di sviluppo di questa disciplina. Poi si esamineranno i due principali modelli
impiegati nello sviluppo dei sistemi di intelligenza artificiale, il modello fondato sulla
rappresentazione esplicita della conoscenza e sulla sua elaborazione mediante ragionamento, e il modello fondato sulla rappresentazione implicita della conoscenza, in reti
neurali, e sulla sua elaborazione mediante l’attivazione di tali reti. Ci si soffermerà infine su un’applicazione dell’intelligenza artificiale che già oggi appare matura e capace di
fornire utili risultati al giurista, il modello del sistema basato su regole. Si proporranno
infine alcune considerazioni sulle ricerche in corso e in particolare sulla possibilità di
riprodurre la dialettica giuridica.
6.1
L’intelligenza
Come è noto, manca una definizione univoca e condivisa di intelligenza. Uno dei più autorevoli testi introduttivi in materia, l’Oxford Companion to the Mind, apre la trattazione
della voce “intelligence” dicendo che “sono disponibili innumerevoli test per misurare
l’intelligenza, ma nessuno sa con sicurezza che cosa sia l’intelligenza, e addirittura nessuno sa con sicurezza che cosa misurino i test disponibili”.265 Si suole peraltro convenire
che l’intelligenza si rivela nella capacità di svolgere funzioni come le seguenti: adattamento all’ambiente (o a nuove situazioni), apprendimento dall’esperienza, pensiero
astratto, utilizzo efficiente di risorse limitate, comunicazione, ecc.
Tuttavia, manca l’accordo sulla caratterizzazione della supposta competenza unitaria
(l’intelligenza) cui ineriscono le diverse abilità ricondotte nel concetto di intelligenza.
L’intelligenza è infatti un fenomeno complesso, oggetto di diverse discipline,266 tra cui
possiamo ricordare brevemente le seguenti:
269
270
6.1. L’INTELLIGENZA
• la filosofia, che fin da Platone e Aristotele ha individuato nell’intelligenza o ra-
•
•
•
•
•
zionalità una caratteristica fondamentale dell’uomo e uno dei temi della propria
ricerca,267 e ha studiato i procedimenti del pensiero (logica), i metodi della conoscenza e della scienza (gnoseologia ed epistemologia), e le strutture concettuali
(ontologia);
la matematica, che ha formalizzato i metodi del pensiero nei linguaggi e nelle
tecniche della logica formale e della teoria della probabilità, e ha altresı̀ studiato i
problemi della computabilità;
l’economia, che ha elaborato tecniche per l’uso efficiente di risorse limitate, anche
in contesti nei quali la determinazione e la valutazione delle conseguenze delle
azioni è difficile (teoria delle decisioni) o nei quali il singolo agente deve tener
conto delle scelte altrui (teoria dei giochi);
la medicina, che ha studiato l’elaborazione delle informazioni nel cervello e il
rapporto tra stimoli sensoriali e loro elaborazione neurale (neurologia);
la psicologia, che ha studiato il funzionamento della mente umana, in particolare
nell’apprendimento (psicologia cognitiva), rappresentandola come un processo di
elaborazione di informazioni (scienza cognitiva);
la linguistica, che ha studiato i procedimenti che danno luogo alla formulazione e
alla comprensione del linguaggio, traducendoli talvolta in programmi informatici
(linguistica computazionale).
L’intelligenza artificiale ha tratto ispirazione da tutte le ricerche appena menzionate, ma
ha aggiunto a esse un aspetto ingegneristico: essa non vuole solo studiare l’intelligenza,
ma si propone di costruirla, di dar vita ad artefatti intelligenti. L’obiettivo ingegneristico dell’intelligenza artificiale non esclude che essa possa contribuire alla conoscenza
dell’intelligenza umana. Come osservava Gian Battista Vico [1668-1744] verum esse
ipsum factum (il vero è ciò che è fatto), o verum et factum convertuntur (il vero e il fatto si convertono l’uno nell’altro): come dallo studio dell’intelligenza umana si possono
trarre utili indicazioni al fine della costruzione dell’intelligenza artificiale, cosı̀ la costruzione dell’intelligenza artificiale (il fatto) ci aiuta a cogliere la natura dell’intelligenza
(il vero) e in particolare possiamo trarne ipotesi (da verificare empiricamente) circa il
funzionamento dell’intelligenza umana.268 Infatti, poiché le facoltà conoscitive da realizzare nei sistemi di intelligenza artificiale corrispondono alle facoltà in cui si esplica
l’intelligenza naturale (umana o animale), non dobbiamo stupirci se l’intelligenza artificiale trae ispirazione dall’intelligenza naturale, trovando in essa soluzioni appropriate
alle proprie esigenze di elaborazione dell’informazione, né dobbiamo stupirci se ritroviamo nell’intelligenza naturale (nelle strutture cerebrali o nei processi mentali) alcune
soluzioni ingegneristiche elaborate dall’intelligenza artificiale. Ciò non comporta tuttavia una completa identità, soprattutto perché l’intelligenza umana si realizza mediante
un hardware (le cellule cerebrali) profondamente diverso dall’hardware dell’intelligenza
artificiale (chip di silicio). Pertanto, talune forme di elaborazione dell’informazione (co-
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
271
me l’effettuazione rapida di calcoli aritmetici, con grandi numeri, o il concatenamento
di numerose regole) possono essere più adatte all’intelligenza artificiale che all’intelligenza umana. All’opposto, altre forme di elaborazione dell’informazione (come quelle
attinenti alla connessione di dati percettivi o mnemonici secondo analogie non predeterminate) “naturali” per l’uomo, allo stato dell’arte non sono riproducibili facilmente in
sistemi informatici.
6.1.1
Modelli di intelligenza artificiale
Stuart Russell e Peter Norvig distinguono i diversi modi di accostarsi all’intelligenza
secondo due diverse dimensioni:269
• l’idea che l’intelligenza consista esclusivamente nel pensiero (rappresentazione
della conoscenza e ragionamento) si contrappone all’idea che essa includa altresı̀
l’interazione con l’ambiente (percezione e azione);
• l’obiettivo di riprodurre fedelmente le capacità intellettive dell’uomo (con tutti i
loro limiti) si contrappone all’obiettivo di realizzare sistemi capaci di razionalità
(cioè di elaborare informazioni in modo ottimale) prescindendo dai limiti della
razionalità umana.
Conseguentemente, gli stessi autori propongono lo schema della Figura 6.1, che riporta
diverse autorevoli definizioni di intelligenza artificiale distinguendole a seconda di come si collocano rispetto alle due dimensioni appena indicate. Non posso qui esaminare
approfonditamente queste distinzioni, e ci limiteremo pertanto ad alcune brevi considerazioni. Per quanto attiene alla distinzione tra pensiero e azione, ricordo come anche il
pensiero non possa essere astratto dall’azione. Vi è infatti nel ragionamento di un agente
intelligente un continuo collegamento tra il momento epistemico (volto a determinare
come stanno le cose, come è fatto il contesto nel quale l’agente si trova e quali dinamiche lo caratterizzano) e il momento pratico (volto a determinare il comportamento più
appropriato rispetto agli interessi dell’agente e al contesto della sua azione): i nostri interessi epistemici (quali cose desideriamo conoscere) sono determinati anche dai nostri
obiettivi pratici, e i modi del perseguimento dei nostri obiettivi pratici (e il giudizio preliminare sulla possibilità di raggiungere tali obiettivi) dipendono dalle nostre conoscenze
epistemiche.270
L’attenzione per l’aspetto pratico è cresciuta negli anni più recenti quando—in parallelo con sviluppi tecnologici di cui parleremo nelle pagine seguenti, come in particolare
la creazione di robot fisici ed elettronici e l’emergere dell’intelligenza ambientale—si
sono sviluppate indagini volte a cogliere il comportamento razionale nella relazione tra
l’agente e il suo ambiente. Tali ricerche hanno enfatizzato aspetti dell’intelligenza non
riducibili al ragionamento in senso stretto, come la percezione, la capacità di esplorare
attivamente l’ambiente, e la comunicazione.271
272
6.1. L’INTELLIGENZA
Sistemi che pensano come esseri
umani
Sistemi che pensano razionalmente
“Il nuovo eccitante tentativo di fare in
modo che i calcolatori pensino [. . . ]
di costruire macchine dotate di menti, nel senso pieno e letterale”272
“[L’automazione delle] attività che
associamo con il pensiero umano, attività quali prendere decisioni,
risolvere problemi, imparare”273
“Lo studio di facoltà mentali mediante l’uso di modelli computazionali”274
“Lo studio delle elaborazioni che
rendono possibile percepire, ragionare, e agire”275
Sistemi che agiscono come esseri umani
Sistemi che agiscono razionalmente
“L’arte di creare macchine che svolgono funzioni che richiederebbero
intelligenza quando svolte da persone”276
“Lo studio di come far fare ai calcolatori cose nelle quali, al momento,
le persone sono migliori”277
“L’intelligenza computazionale è lo
studio della progettazione di agenti
intelligenti”278
“L’IA [. . . ] si occupa del comportamento intelligente negli artefatti”279
Figura 6.1: Definizioni dell’intelligenza artificiale (IA)
Per quanto attiene alla distinzione tra l’obiettivo di riprodurre pienamente il pensiero
umano (comprese le sue irrazionalità) e quello di sviluppare invece procedure cognitive
pienamente razionali, molto dipende dall’obiettivo di un’applicazione di intelligenza artificiale: simulare l’uomo o affrontare nel modo migliore certi problemi. Bisogna però di
ricordare che la conoscenza dei procedimenti cognitivi e deliberativi è ancora assai limitata: vi sono molte cose che l’uomo riesce a fare in modo appropriato spontaneamente,
senza sapere in che modo riesca a raggiungere tale risultato. La natura ci ha dotato di
capacità adatte ad affrontare in modo adeguato il mondo in cui ci troviamo280 e siamo in
grado di utilizzare tali facoltà pur senza conoscere le modalità del loro funzionamento, e
quindi, a maggior ragione, senza conoscere le ragioni a sostegno di tali modalità. Ciò vale non solo per capacità specifiche (come quella di riconoscere le facce delle persone che
incontriamo) ma anche per le nostre generali capacità linguistiche, logico-matematiche,
e in generale per le competenze richieste nella soluzione di problemi.
A questo riguardo è opportuno ricordare il concetto di razionalità limitata, elaborato
dallo studioso di intelligenza artificiale (e premio Nobel per l’economia) Herbert Simon.
Scelte che appaiono irrazionali con riferimento a un concetto ideale di razionalità (non
assicurando un risultato ottimale, cioè il migliore risultato possibile) possono invece
apparire appropriate (razionali nella misura in cui ci è possibile esserlo) quando si con-
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
273
siderino i limiti delle nostre capacità conoscitive e la complessità dell’ambiente.281 La
nostra stessa ragione ci vieta di sprecare le nostre energie nell’impossibile ricerca della
scelta ottimale, e ci richiede invece di seguire procedure cognitive fallibili, ma rapide
ed economiche (richiedenti un impegno limitato delle nostre risorse mentali) che conducano a risultati sufficientemente buoni (anche se non ottimi) nella maggior parte dei
casi.282 Queste procedure fallibili tese a economizzare le energie richieste dall’impiego
della ragione sono chiamate euristiche.
In conclusione, ciò che può apparire un difetto della razionalità umana (una forma
di irrazionalità), può invece rivelarsi una procedura cognitiva appropriata per una razionalità limitata: emulare (copiare) l’intelligenza umana, anche in aspetti apparentemente
irrazionali (o solo limitatamente razionali) può talvolta condurre a soluzioni efficaci.
6.1.2
Intelligenza artificiale forte e intelligenza artificiale debole
Una distinzione importante, che si sovrappone a quelle appena tracciate, è quella tra intelligenza artificiale forte (strong artificial intelligence) e intelligenza artificiale debole
(weak artificial intelligence). Secondo la caratterizzazione che ne dà John Searle, illustre
studioso del linguaggio e della mente, l’intelligenza artificiale forte muove dall’assunto
che anche i calcolatori siano capaci di stati cognitivi e di pensiero (nel modo in cui ne
è dotato un essere umano) e conseguentemente si propone di costruire menti artificiali.283 Per questo indirizzo “il calcolatore appropriatamente programmato è realmente
una mente, si può cioè dire letteralmente che i calcolatori dotati dei programmi giusti
capiscono e hanno stati cognitivi”.284 L’intelligenza artificiale debole invece si propone
di realizzare sistemi artificiali capaci di svolgere compiti complessi, sistemi che possono
mimare (simulare) aspetti dei processi cognitivi umani, ma che non possono riprodurre
quegli stessi processi (non sono in grado di pensare, non possiedono una mente).
Il dibattito circa la possibilità di sviluppare, mediante elaboratori elettronici, forme di intelligenza artificiale forte, cioè vere menti artificiali, può essere fatto risalire al
fondamentale contributo di Alan Turing, che già nel 1936 si interrogava non solo sulla
possibilità di sviluppare macchine intelligenti, ma anche su come verificare quando e in
quale misura questo risultato potesse considerarsi raggiunto. A tale fine egli proponeva
un test ispirato a un gioco di società. il “gioco dell’imitazione”, nel quale una persona
interroga due interlocutori di sesso diverso, al fine di determinare chi di questi sia l’uomo
e chi la donna (senza avere contatto diretto con gli stessi). Nel gioco di Turing lo scopo
dell’interrogante è invece quello di distinguere l’interlocutore umano e l’interlocutore
elettronico, il calcolatore (Figura 6.2).285 Si avrà la prova che l’intelligenza artificiale è
stata realizzata quando un sistema informatico riuscirà a ingannare l’interrogante, facendogli credere di essere una persona (quando l’interrogante, nel gioco dell’imitazione,
attribuirà l’identità umana con la stessa probabilità all’interlocutore umano e a quello
elettronico).286 Nessun sistema ha ancora superato il test di Turing, e anzi nessun siste-
274
6.1. L’INTELLIGENZA
Figura 6.2: Il test di Turing
ma si è avvicinato a questo risultato.287 Se ne può trarre la conclusione rassicurante che
l’intelligenza artificiale è ancora ben lontana dal raggiungere l’intelligenza umana, nel
campo della comunicazione non ristretta.288
Tuttavia, il test di Turing solleva un importante problema teorico, che ci possiamo
porre in astratto, indipendentemente dalla possibilità concreta di realizzare oggi, o nel
prossimo futuro, un sistema che superi il test. Ci possiamo cioè chiedere se un sistema
che, in ipotesi, riuscisse a superare il test sarebbe una vera intelligenza artificiale, o invece sarebbe solo un mero “idiota sapiente”, che si limita a fingere di essere intelligente,
che simula una mente senza possederla veramente. Infatti, il test di Turing è puramente
comportamentale: per superarlo è sufficiente che la macchina si comporti come un essere umano, non è necessario che esso abbia veramente una mente, dei pensieri. Vi è stato
pertanto chi ha affermato l’impossibilità teorica di realizzare sistemi informatici capaci
di attività mentale (di pensiero in senso proprio), quali che siano le prestazioni offer-
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
275
te dagli stessi (anche se tali prestazioni comportino il superamento del test di Turing).
Di conseguenza, l’intelligenza artificiale forte sarebbe impossibile in linea di principio,
indipendentemente da futuri sviluppi tecnologici.
In particolare questa tesi è stata sostenuta da John Searle. Per criticare le pretese
dell’intelligenza artificiale forte Searle ha sviluppato un celebre esperimento mentale,
il cosiddetto “argomento della stanza cinese”. Searle ci invita a immaginare che una
persona capace di parlare solo la lingua inglese (non il cinese) sia chiusa in una stanza
dotata di una fenditura verso l’esterno. La stanza contiene dei fogli di carta e un enorme
volume. Il volume è un manuale di istruzioni che specifica come, una volta ricevuto
un input consistente in una sequenza di caratteri cinesi, si debba produrre un output
consistente in un’altra sequenza degli stessi caratteri. Le regole collegano a ogni input
l’output appropriato (la risposta che giudicheremmo appropriata in una conversazione tra
persone che conoscono il cinese), ma sono formali, nel senso che fanno riferimento solo
alla forma della comunicazione, cioè alla sequenza con la quale i caratteri di input sono
presentati (per applicare le regole non bisogna conoscere il significato dei simboli). Ecco
come funziona la stanza cinese (come opera la persona al suo interno). Dalla fenditura
viene immesso un foglio di carta che riporta caratteri cinesi (incomprensibili a chi non
conosca questa lingua). Seguendo esattamente le istruzioni del manuale, la persona nella
stanza scrive su un foglio bianco la risposta (i caratteri cinesi) che le regole del manuale
collegano ai caratteri indicati nei fogli di input, e spinge il foglio attraverso la fenditura.
Le risposte che escono dalla camera cinese, in ipotesi, sono indistinguibili da quelle
che potrebbero essere fornite da una persona capace di parlare il cinese. Di conseguenza,
(tralasciando il problema dei tempi di risposta) la camera cinese riuscirebbe a superare
il test di Turing (l’interrogante non sarebbe in grado di stabilire se sta dialogando con
la stanza o con un cinese). Searle sostiene però che la persona all’interno della stanza
cinese si è limitata a manipolare simboli a lei incomprensibili: anche se quella persona
risponde come un parlante cinese, le è precluso l’accesso al significato dei simboli cinesi.
Ora, uscendo dalla metafora, la persona nella stanza cinese è il calcolatore, guidato da un
software (il manuale di istruzioni). Pertanto, Searle conclude che anche un calcolatore
capace di conversare come un essere umano non è capace di pensieri, non ha una mente,
si limita alla cieca manipolazione di simboli.
Numerosi studiosi di intelligenza artificiale hanno raccolto la sfida di Searle, e hanno contestato il suo argomento. Alcuni hanno obiettato che, anche se l’uomo all’interno
della stanza cinese non capisce il cinese, l’intero sistema consistente nella stanza, la persona, e il manuale di regole è in grado di capire il cinese, consistendo la comprensione
di una lingua nella capacità di rispondere a input in quella lingua producendo output
appropriati nella stessa. L’errore di Searle consisterebbe nell’astrarre da tale sistema una
sola componente (l’elemento che effettua le trasformazioni simboliche, corrispondente
alla persona nella stanza). Sarebbe come chiedersi se la funzione mentale umana consistente nell’effettuazione di operazioni di ragionamento sia sufficiente a comprendere una
276
6.2. BREVE STORIA DELL’INTELLIGENZA ARTIFICIALE
lingua, una volta separata dalla memoria, dalle conoscenze, dai sensi, ecc. Un’ulteriore
critica attiene al fatto che tanto la mente umana quanto il calcolatore elaborano informazioni con velocità ed efficienza enormemente superiori rispetto all’operatore della
stanza cinese. L’impressione che la stanza non capisca il cinese si basa su questa circostanza, non applicabile all’elaborazione informatica. Pertanto, non sarebbe giustificato
estendere al calcolatore le conclusioni concernenti la camera cinese.
Altri hanno osservato che la conclusione che la persona nella stanza (o la stanza nel
suo insieme) non comprenda il cinese è determinata dal fatto che la comprensione di
un linguaggio richiede la capacità di connettere le parole ai loro referenti reali, il che
presuppone l’esperienza degli oggetti di cui parla il linguaggio (o almeno di alcuni di
essi). Questo limite di un calcolatore isolato non si applica però ai sistemi automatici che
uniscano capacità percettive (e possibilmente motorie) a quelle attinenti all’elaborazione
e alla registrazione delle informazioni. Di conseguenza, i limiti della camera cinese non
sono limiti dell’intelligenza artificiale: essi possono essere superati estendendo il sistema
con dispositivi capaci di movimento e dotati di appropriati sensori.
Altri infine hanno osservato che l’intelligenza è un fenomeno emergente da comportamenti meccanici anche nel caso del cervello umano: anche l’intelligenza umana nasce
da processi non intelligenti, le operazioni “meccaniche” (i processi chimici e fisici) che
hanno luogo all’interno dei singoli neuroni del cervello umano e nei contatti (sinapsi)
tra gli stessi. Allo stesso modo le operazioni meccaniche che avvengono all’interno del
calcolatore programmato possono dare origine all’intelligenza.289
6.2
Breve storia dell’intelligenza artificiale
Da secoli l’uomo è affascinato e al tempo stesso impaurito dalla possibilità di realizzare
entità intelligenti artificiali. Nell’antica Grecia ricordiamo il mito di Pigmalione, che
scolpı̀ Galatea, una statua vivente (seppure grazie all’intervento divino), e il mito del
dio Efesto, capace di costruire esseri animati di bronzo, come Talos, il guardiano di
Creta. Passando dal mito all’ingegneria meccanica, possiamo menzionare nell’antichità
gli automi costruiti da Erone di Alessandria (vissuto nel primo secolo, e inventore, tra
l’altro, del motore a vapore), usati per animare le divinità nei templi. In epoche più
vicine possiamo ricordare, nel mito, il Golem di Praga, creato per difendere il ghetto da
attacchi antisemiti, che sfuggi però al controllo del suo creatore.
Il termine robot—oggi utilizzato per designare le entità intelligenti artificiali capaci
di azione e interazione, nel mondo fisico o in quello virtuale—trae origine dall’opera
teatrale R.U.R. (sigla che sta per “Rossumovi univerzálnı́ roboti”, cioè “i robot universali
di Rossum”), dello scrittore cecoslovacco Karel Capek [1890-1938], che diede questo
nome agli esseri artificiali cui è dedicata tale opera. I robot di Capek sono andoidi
costruiti per servire gli uomini, ma si ribelleranno ai loro padroni e ciò causerà la fine
dell’umanità.290
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
277
Il tema del rapporto tra intelligenza artificiale e intelligenza umana troverà sviluppo
in numerose opere di fantascienza. Mi limito a ricordare l’opera di due autori, Arthur C.
Clarke e Isaac Asimov. Clarke291 immaginò il calcolatore HAL (Heuristically programmed ALgorithmic computer), reso famoso dal film “2001 Odissea nello Spazio”, diretto
da Stanley Kubrick. HAL—capace non solo di ragionare, ma anche di comprendere il
linguaggio umano (non solo tramite il suono, ma anche “leggendo le labbra”), di avere
emozioni e di cogliere le emozioni altrui—acquista una psicologia umana, anzi troppo
umana: prima per impedire che si vengano a conoscere i suoi errori e poi per proteggere
se stesso, si rivolge contro gli astronauti al cui viaggio avrebbe dovuto sovrintendere.
Asimov analizza il problema del rapporto tra gli uomini e l’intelligenza artificiale (i
robot) in numerosi volumi e racconti, superando lo schema dell’artefatto che si ribella
al suo creatore. Nei racconti di Asimov i robot sono di regola esseri benevoli, il cui
funzionamento si ispira alle tre leggi della robotica:
1. Un robot non può nuocere a un essere umano o consentire, mediante la propria
omissione, che un essere umano subisca danno.
2. Un robot deve obbedire agli ordini impartitigli da esseri umani, eccetto che quando
questi ordini confliggano con la prima legge.
3. Un robot deve proteggere la propria esistenza fintantoché tale protezione non
confligga con la prima o la seconda legge.292
Tuttavia, nell’opera di Asimov, la benevolenza dei robot non esclude un aspetto problematico: la disponibilità di servitori robotici, con capacità superiori per molti aspetti
a quelle umane, può indurre chi se ne serve a diventare dipendente dai propri schiavi
meccanici, ad adagiarsi nella comodità, rinunciando all’iniziativa, rifiutando ogni rischio. Il tema della dipendenza dell’uomo dai propri servitori meccanici ripropone cosı̀
il tema della dipendenza del padrone dai propri schiavi, illustrato da Hegel nella sua
Fenomenologia dello spirito.293 . Delegheremo tanta parte della nostra vita ai nostri aiutanti elettronici da perdere la capacità di pensare e agire autonomamente? Interporremo
in tale misura i nostri schiavi elettronici tra noi e la soddisfazione dei nostri desideri (come direbbe Hegel) da divenire completamente passivi, ci trasformeremo in capricciose
e inutili “macchine desideranti”, avendo trasferito ai nostri schiavi elettronici tutte le attività produttive e comunicative necessarie per soddisfare le nostre voglie, cosı̀ come le
competenze e le conoscenze richieste a tal fine?
6.2.1
Gli entusiasmi dei pionieri e il paradigma dell’intelligenza
artificiale simbolica
La ricerca scientifica e tecnologica nel campo dell’intelligenza iniziò tra gli anni ’40 e gli
anni ’50. Già nel 1943 Walter Pitts and Warren Sturgis McCulloch (due collaboratori di
Norbert Wiener, l’inventore della cibernetica) mostrarono come reti di neuroni artificiali
278
6.2. BREVE STORIA DELL’INTELLIGENZA ARTIFICIALE
potessero elaborare informazioni, dando avvio al tentativo di riprodurre il funzionamento dei neuroni del cervello umano, benché essi non utilizzassero calcolatori digitali (i
neuroni erano realizzati mediante circuiti analogici).294
La nascita dell’intelligenza artificiale viene tuttavia solitamente ricondotta a una celebre conferenza tenutasi a Dartmouth (New Hampshire, USA), che riunı̀ per un mese
alcuni tra i principali pionieri della materia. Lo scopo esplicito della riunione era lo
studio dell’intelligenza automatica, partendo dall’ipotesi che “ogni aspetto dell’apprendimento e ogni altra caratteristica dell’intelligenza possa in principio essere descritto con
tale precisione che si possa costruire una macchina capace di simularlo.295
La tesi fondamentale che ispirava gli studiosi riuniti a Dartmouth era infatti espressa dalla famosa ipotesi del sistema simbolico fisico (physical system hypothesis), cioè
dall’ipotesi che l’intelligenza possa risultare dal funzionamento di un sistema che manipola strutture simboliche (per esempio, sequenze di parole o numeri) producendo altre
sequenze simboliche, secondo determinati processi. Ecco come Alan Newell e Simon
caratterizzano un tale sistema:
Un sistema di simboli fisici consiste di un insieme di entità, chiamate simboli, che
sono schemi fisici che possono presentarsi come componenti di un altro tipo di
entità, chiamata espressione (o struttura simbolica). Pertanto una struttura simbolica è composta di un numero di istanze (o occorrenze) di simboli correlati in
qualche modo fisico (ad esempio, un simbolo può essere adiacente a un altro simbolo). In ogni istante di tempo il sistema conterrà una collezione di queste strutture
simboliche. Oltre a queste strutture, il sistema contiene anche una collezione di
processi che operano sulle espressioni per produrre altre espressioni: processi di
creazione, modificazione, riproduzione e distruzione. Un sistema simbolico fisico
è una macchina che produce nel tempo una collezione di strutture simboliche in
evoluzione.296
Secondo gli stessi autori “un sistema simbolico fisico ha i mezzi necessari e sufficienti
per l’azione intelligente generale”.297 Dato che ogni sistema di simboli fisici può essere
realizzato mediante una macchina universale (come la macchina di Turing) e dato che
i moderni calcolatori sono macchine universali (Figura 2.1.3), l’ipotesi che un sistema
di simboli fisici sia capace di intelligenza, implica che un calcolatore potrebbe dar vita all’intelligenza (una volta che fosse dotato di un software adeguato e di sufficiente
memoria e capacità di calcolo). Come affermano Newell e Simon
L’ipotesi del sistema di simboli fisici implica una teoria computazionale dell’intelligenza [. . . ] Pertanto l’ipotesi del sistema simbolico implica che l’intelligenza
sarà realizzata da un calcolatore universale.298
Seguendo questa linea di pensiero non vi sono limiti assoluti o “filosofici” allo sviluppo
dell’intelligenza automatica, si tratta solo di sviluppare tecnologie hardware, e soprattutto software, adeguate. In entrambe le direzioni vi furono notevoli progressi. Circa
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
279
le tecnologie hardware, furono inizialmente sviluppati calcolatori specificamente dedicati all’intelligenza artificiale, le cosiddette “macchine per il Lisp” (Lisp machine), ma
la disponibilità di calcolatori “a scopo generale” (general purpose) sempre più potenti
ed economici consentı̀ di usare questi ultimi anche per le applicazioni di intelligenza
artificiale.299 Nel campo del software le ricerche si svilupparono in due direzioni complementari: tecniche per la rappresentazione della conoscenza in strutture simboliche,
e tecniche per l’elaborazione di tali conoscenze, cioè per il ragionamento automatico.
Ciò corrispondeva al paradigma dell’intelligenza artificiale “simbolica”, cioè all’assunto
che un sistema capace di risolvere problemi in modo intelligente (intelligent problem
solving) debba unire due aspetti: una rappresentazione simbolica (in un linguaggio appropriato) delle conoscenze rilevanti, e la capacità di trarre conclusioni fondate su tali
conoscenze. Questa idea è espressa con chiarezza da John McCarthy e Paul Hayes (anche quest’ultimo fu tra i fondatori dell’intelligenza artificiale), che danno la seguente
definizione di intelligenza.
Un’entità è intelligente se ha un modello adeguato del mondo (inclusi il mondo
intellettuale della matematica, la comprensione dei propri scopi e altri processi
mentali), se è capace di rispondere a un’ampia varietà di domande sulla base di quel
modello, se può trarre informazioni ulteriori dal mondo esterno quando necessario,
e può effettuare nel mondo esterno i compiti richiesti dai suoi scopi e consentiti
dalle sue capacità fisiche.300
La nozione di intelligenza, per gli stessi autori, comprende due parti: una parte
epistemologica e una parte euristica.301
La parte epistemologica è una rappresentazione del mondo in una forma tale che
la soluzione dei problemi derivi dai fatti espressi nella rappresentazione. La parte
euristica è il meccanismo che sulla base dell’informazione risolve il problema e
decide che cosa fare.302
Un’importante estensione del paradigma appena prospettato è il tentativo di affiancare
alle teorie che descrivono i diversi domini dell’azione intelligente, meta-teorie intese a
indicare come le prime teorie debbano essere usate, estese, e aggiornate. In questo modo,
funzioni come l’apprendimento dall’esperienza o l’effettuazione di inferenze analogiche
possono essere rese compatibili, almeno in una certa misura, con una concezione tendenzialmente statica della conoscenza (la conoscenza come rappresentazione del mondo
all’interno del sistema intelligente).
6.2.2
Sviluppo e crisi delle ricerche di intelligenza artificiale
Negli anni seguenti, il programma di ricerca dell’intelligenza artificiale (e in particolare,
il paradigma “simbolico” appena tratteggiato) diede origine a numerosi risultati. Da un
lato furono sviluppati numerosi sistemi “intelligenti”, cioè capaci di affrontare compiti
280
6.2. BREVE STORIA DELL’INTELLIGENZA ARTIFICIALE
apparentemente tali da richiedere intelligenza (il gioco degli scacchi, la derivazione di
teoremi matematici, la soluzione di problemi matematici o fisici, la traduzione automatica dall’una all’altra lingua, la visione meccanica, ecc.). Dall’altro lato furono realizzati
alcuni strumenti che facilitavano grandemente la realizzazione di sistemi “intelligenti”,
come in particolare il linguaggio Lisp.
Questi successi condussero a previsioni esageratamente ottimistiche. Studiosi molto
autorevoli si spinsero ad affermare che entro un prossimo futuro (uno o due decenni) sarebbero state disponibili macchine capaci di raggiungere l’intelligenza umana, di “svolgere ogni lavoro possa essere compiuto da un essere umano” (cosı̀ Simon, nel 1965) e
di “avere l’intelligenza generale di un essere umano medio” (cosı̀ Minsky nel 1970). Il
lento sviluppo delle applicazioni di intelligenza artificiale smentı̀ però queste previsioni: passare dai semplici esempi usati nelle applicazioni pionieristiche a sistemi utili per
affrontare problemi reali si rivelò molto difficile. In particolare l’intelligenza artificiale
non riuscı̀ ad affrontare in modo soddisfacente i compiti cognitivi (come la comprensione
del linguaggio, o l’identificazione di oggetti nello spazio) che l’uomo compie spontaneamente e apparentemente senza sforzo. Si tratta delle funzioni comprese nella dotazione
naturale della nostra specie, che vengono effettuati utilizzando le conoscenze attinenti al
“senso comune”, appartenenti a ogni persona normale (in parte innate, in parte acquisite
nel corso della normale socializzazione).
Negli anni seguenti l’accento passò pertanto al tentativo di risolvere problemi riguardanti invece ambiti specialistici, nei quali la soluzione potesse essere ottenuta derivandola da un’ampia base di conoscenze concernenti un particolare settore. Si trattava
quindi di realizzare sistemi esperti capaci di risolvere in modo intelligente (utilizzando
un’ampia base di conoscenze) problemi che richiedessero una particolare competenza
(expertise), come quella di cui è dotato un esperto umano. Si elaborarono conseguentemente tecniche per la rappresentazione della conoscenza in forme tali da renderla elaborabile automaticamente, e procedure per utilizzare ampie basi di conoscenza nella
soluzione di problemi. Tra tali tecniche ebbe importanza crescente l’uso di metodi per il
ragionamento automatico ispirati alla logica: se le procedure inferenziali di un sistema
esperto potevano essere ricondotte alla logica, intesa in senso ampio come l’insieme dei
metodi del ragionamento corretto, allora si poteva fare affidamento nel funzionamento
del sistema stesso. La logica computazionale (l’effettuazione automatica di inferenze
logicamente corrette) conobbe infatti un rapido sviluppo. In particolare, all’inizio degli
anni ’70 fu inventato il Prolog, un linguaggio logico semplice e intuitivo, basato su una
parte della logica predicativa, per il quale furono definite procedure di inferenza molto
efficienti.
Tra gli anni ’70 e ’80 furono sviluppati numerosi sistemi esperti, e alcuni di essi
conseguirono risultati significativi in diversi campi, come la diagnosi medica, l’analisi
delle strutture molecolari o la progettazione di sistemi informatici.303
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
281
In questi anni iniziarono anche i primi studi in materia di intelligenza artificiale e diritto e, come vedremo nel seguito, non mancarono i tentativi di realizzare sistemi esperti
di diritto.
Anche nell’ambito dei sistemi esperti ai primi entusiasmi fece seguito una profonda
delusione. Si dovette costatare che i sistemi realizzati non erano in grado di sostituire la
prestazione di un professionista esperto, ma semmai di integrarne la competenza. L’attività di un esperto non si limita infatti all’applicazione di conoscenze preesistenti, ma
richiede attività ulteriori, come l’esame del caso concreto, la ricerca delle informazioni
rilevanti, la considerazione delle analogie con casi precedenti, la formulazione e la valutazione di ipotesi, la percezione di coerenze e incoerenze in un insieme di informazioni
e dei modi di ripristinare la coerenza, capacità che oggi nessun sistema informatico può
offrire (benché non manchino teorie computazionali della coerenza e dell’evoluzione
della conoscenza).304 Pertanto, nello svolgimento di un compito complesso un sistema
esperto può integrarsi con le competenze umane, ma non le può, di regola, sostituire.
Per risultare veramente utile, un sistema esperto avrebbe dovuto essere superiore
sia ai sistemi che elaborano informazioni senza usare a tal fine una specifica competenza o conoscenza (limitandosi ad applicare precise procedure predefinite), sia ai sistemi
che forniscono informazioni all’esperto umano senza elaborare tali informazioni (come
i sistemi documentari o gli ipertesti). Rispetto ai sistemi non-esperti che applicano procedure predefinite (ad esempio, un sistema che calcola le imposte, usando un diverso
algoritmo per ogni imposta), un sistema esperto doveva offrire vantaggi nella capacità di
affrontare compiti non riducibili ad algoritmi specificabili in anticipo e inoltre nella facilità di sviluppo, controllo, e aggiornamento, mantenendo al tempo stesso una sufficiente
efficienza (rapidità di esecuzione). Rispetto ai sistemi che forniscono informazioni senza
elaborarle (ogni elaborazione restando affidata all’intelligenza umana), il sistema esperto doveva provare la sua superiorità nel collegare le informazioni e applicarle ai casi
concreti, garantendo al tempo stesso il controllo umano sui contenuti del sistema e sulle
modalità dell’elaborazione.
Inoltre emersero alcune difficoltà inerenti allo sviluppo e la manutenzione dei sistemi esperti. In particolare, si constatava che era difficile e costoso rappresentare la
conoscenza nella forma richiesta da un sistema esperto (assai più rigida e limitata rispetto al linguaggio umano) e mantenerla aggiornata, ma anche che non tutte le informazioni
potevano essere espresse in questo modo e che, una volta ridotte in tale forma, le informazioni non potevano essere impiegate con la flessibilità di cui è capace l’intelligenza
umana.
Se da un lato i sistemi esperti erano criticati a causa delle loro limitazioni, dall’altro
lato la prospettiva di un loro successo suscitava opposte inquietudini. Si temeva, cioè,
che l’uomo, nel consegnare l’uso delle proprie conoscenze a un sistema informatico (superiore all’uomo per memoria e rapidità di elaborazione) venisse a rinunciare al possesso
di tali conoscenze, delegando le proprie attività intellettuali allo strumento elettronico.
282
6.2. BREVE STORIA DELL’INTELLIGENZA ARTIFICIALE
È vero che lo sviluppo della nostra specie si basa anche sulla nostra capacità di trasferire
all’esterno, realizzando appositi artefatti, sia i contenuti della nostra mente (dai disegni sulle caverne all’uso della scrittura), sia i processi mediante i quali quei contenuti
sono elaborati (dal pallottoliere ai calcolatori elettronici).305 Possiamo cosı̀ delegare a
tali artefatti una parte delle nostre funzioni cognitive (delegare all’agenda il compito di
ricordare le scadenze, al pallottoliere il compito di effettuare calcoli, ecc.). Ogni delega, però, può rappresentare una perdita nella competenza del delegante, sia per quanto
riguarda direttamente il compito delegato, sia per quanto riguarda le ulteriori capacità
cognitive acquisibili mediante l’esecuzione di quel compito. Ricordiamo la celebre critica di Platone all’uso della scrittura. Il dio Theuth—racconta Platone nel Fedro, uno
dei suoi più celebri dialoghi—espose al faraone Talos i vantaggi della sua invenzione, la
scrittura:
Questa scienza, o re - disse Theuth - renderà gli Egiziani più sapienti e arricchirà la loro memoria perché questa scoperta è una medicina per la sapienza e
la memoria.306
Il faraone Talos però rispose:
O ingegnosissimo Theuth, una cosa è la potenza creatrice di arti nuove, altra cosa è giudicare qual grado di danno e di utilità esse posseggano per coloro che le
useranno. E cosı̀ ora tu, per benevolenza verso l’alfabeto di cui sei inventore, hai
esposto il contrario del suo vero effetto. Perché esso ingenererà oblio nelle anime
di chi lo imparerà: essi cesseranno di esercitarsi nella memoria perché fidandosi
dello scritto richiameranno le cose alla mente non più dall’interno di se stessi, ma
dal di fuori, attraverso segni estranei.307
Talos pecca senz’altro di eccessivo conservatorismo: la scrittura si è rivelata strumento
decisivo dello sviluppo individuale e sociale, passaggio fondamentale nella civiltà umana. Tuttavia l’idea che la delega delle nostre funzioni mentali a enti materiali possa
avere effetti pregiudizievoli per lo sviluppo umano merita considerazione, specialmente
con riferimento ai sistemi informatici intelligenti. Infatti, nel caso della scrittura i nostri
dubbi possono essere superati dalla considerazione che lo scritto non è in grado di applicarsi da solo: è necessario che la mente umana si riappropri del contenuto trasferito
nelle strutture simboliche (nella sequenza di caratteri alfabetici che costituisce il testo
scritto) affinché quel contenuto possa tradursi in azione.
Nel caso del sistema esperto invece la struttura simbolica (la sequenza di caratteri
che forma la base di conoscenza del sistema) diventa autonoma, potendo essere applicata
mediante processi automatici. Diventa quindi necessario, come osserveremo in seguito
stabilire opportune modalità per l’integrazione (la simbiosi, vedi Sezione 6.4.3), tra intelligenza umana e intelligenza automatica, cosicché, anche nell’ambito delle funzioni
in cui si utilizzino sistemi esperti, da un lato l’uomo continui a fornire le competenze
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
283
cognitive di cui la macchina è priva (competenze necessarie in molte applicazioni del diritto), e che dall’altro egli mantenga il controllo sulla conoscenza trasferita alla macchina
e sul processo della sua applicazione.
6.2.3
Dalla crisi ai primi successi
Nei primi anni ’90 vi fu quindi una profonda crisi delle ricerche di intelligenza artificiale,
il cosiddetto “inverno dell’intelligenza artificiale” (AI winter), un clima di generale sfiducia nei confronti delle prospettive di questa disciplina. Lo stesso termine “intelligenza
artificiale” cadde in discredito, e gli studiosi che continuavano a occuparsi dei temi dell’intelligenza automatica preferivano spesso qualificare la propria ricerca in altro modo
(logica o linguistica computazionale, database deduttivi, sistemi probabilistici, supporto
alle decisioni, ecc.). La crisi dell’intelligenza artificiale simbolica determinò un’intensa
attività di ricerca in direzioni diverse. Qui mi limito a ricordarne tre: la ripresa degli studi
sui modelli computazionali dell’attività neurale, la creazione di nuovi modelli computazionali simbolici ispirati alle discipline matematiche ed economiche, l’attenzione per le
dimensioni dell’azione e della comunicazione.
I modelli ispirati all’attività neurale mirano a riprodurre l’aspetto reattivo dell’intelligenza (comune a tutti gli animali evoluti), cioè la capacità di rispondere agli input forniti
dall’esperienza e di adattare tale risposta in modo appropriato (di apprendere), pur senza
il tramite del ragionamento e della rappresentazione esplicita della conoscenza. Le reti
neurali (e in generale i modelli connessionistici) hanno offerto una nuova tecnologia (e
una nuova prospettiva) per affrontare compiti del senso comune (come il riconoscimento
di immagini o di volti) per i quali mancano modelli teorici precisi, ma anche per compiti
specialistici attinenti al riconoscimento, alla luce di esperienze precedenti, di caratteristiche non definibili con precisione (come la rischiosità di un’operazione finanziaria, la
probabilità che un soggetto incorra in un sinistro, ecc.).
I modelli simbolici, d’altro canto, hanno potuto essere grandemente potenziati dall’uso di metodiche formali tratte non solo dalla logica matematica (cui l’intelligenza
artificiale si era ispirata fin dai propri inizi) ma anche dalle logiche filosofiche (logica
dell’azione, della possibilità, di obblighi e permessi) e da discipline quali il calcolo delle
probabilità, la teoria della decisione, la teoria dei giochi, le teorie dell’argomentazione.
È divenuto cosı̀ possibile utilizzare in misura crescente strumenti di intelligenza artificiale per il supporto alla decisione, anche in contesti caratterizzati da incertezza (come
nelle previsioni atmosferiche o finanziarie) o opinabilità (come nell’ambito giuridico).
L’attenzione per gli aspetti dinamici e relazionali (l’azione, l’interazione, la comunicazione) ha consentito di superare l’idea del sistema intelligente quale mero intelletto,
privo di iniziativa, che si limita a rispondere alle domande dell’utilizzatore sulla base
delle conoscenze registrate al suo interno. Le ricerche si sono indirizzate invece verso
la realizzazione di agenti intelligenti, capaci non solo di elaborare informazioni, ma an-
284
6.2. BREVE STORIA DELL’INTELLIGENZA ARTIFICIALE
che di ricercare le informazioni rilevanti, di percepirle esaminando l’ambiente e di agire
sulla base degli obiettivi a essi assegnati, possibilmente interagendo con altri agenti dello stesso tipo o con interlocutori umani. È stato cosı̀ enfatizzato l’aspetto “robotico”
dell’intelligenza artificiale, cioè la realizzazione di robot quali entità capaci di azione
autonoma, sia nello spazio fisico (come le sonde spaziali capaci di movimento autonomo o gli aerei senza pilota) sia nello spazio virtuale di Internet (come gli agenti software
utilizzabili nella ricerca di informazioni o per fare acquisti on-line).
Nei primi anni ’90 le ricerche di intelligenza artificiale hanno incontrato Internet, che
da un lato richiedeva applicazioni informatiche intelligenti, dall’altro offriva un’enorme
quantità di informazione in formato digitale alla quale applicare tecniche di intelligenza
artificiale. Le tecniche di intelligenza artificiale hanno trovato impiego in diversi strumenti per la rete: motori di ricerca, sistemi che forniscono raccomandazioni agli utenti,
sistemi per la costruzione di siti Web, agenti software per la ricerca di informazione e
l’effettuazione di transazioni commerciali, ecc.
Gli sviluppi appena indicati hanno determinato la fine dell’“inverno dell’intelligenza
artificiale”. Dalla fine degli anni ’90 la ricerca è ripresa con rinnovato vigore e non sono
mancati significativi risultati (anche operativi) in numerosi settori, tra i quali si possono
ricordare, senza pretese di completezza, i seguenti:
• l’estrazione di informazioni da grandi masse di dati (data mining), oggi ampia-
•
•
•
•
•
•
•
•
mente utilizzata per ricerche commerciali, per individuare comportamenti fraudolenti (ad esempio nell’uso di carte di credito) o anche per finalità attinenti alla
sicurezza (indagini anti-terrorismo);
la selezione di informazioni rilevanti o l’eliminazione di quelle irrilevanti con
tecniche intelligenti (utilizzate per esempio, nei filtri antispamming);
l’interpretazione degli esami medici e la consulenza medica;
la traduzione automatica, che oggi fornisce risultati molto utili, anche se limitati;
i giochi, per i quali sono stati realizzati sistemi automatici capaci di raggiungere
alti livelli di competenza e prodotti commerciali di notevole successo;308
la gestione e la logistica (ad esempio, la pianificazione di attività imprenditoriali
o di operazioni militari);
il riconoscimento di immagini e movimenti (ad esempio, nei sistemi per la
vigilanza automatica);
i robot fisici, utilizzati nell’esplorazione di regioni inospitali della terra (come
l’Antartide) o dello spazio (ad esempio, Marte), ma anche nelle attività industriali,
nelle pulizie domestiche, nel gioco (i robot pet, nuovo tipo di animali domestici);
gli agenti software, ai quali l’utilizzatore può delegare compiti da eseguire con
autonomia negli spazi virtuali (dalla ricerca di informazioni, all’effettuazione di
transazioni commerciali).
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
285
Non si deve dimenticare il lato oscuro dell’intelligenza artificiale: molte applicazioni
sono state costruite anche per scopi militari, come per i bombardieri senza pilota o le
“bombe intelligenti”. In questo ambito è necessario un controllo sociale e politico sulle
tecnologie per evitare sviluppi potenzialmente distruttivi.309
Tra i profili emergenti dell’intelligenza artificiale va ricordata l’intelligenza ambientale (ambient intelligence). Si tratta dell’inserimento nell’ambiente fisico di dispositivi
automatici dotati della capacità di elaborare informazioni e, anzi, intelligenza. Tali dispositivi possono assorbire informazioni sia dall’ambiente fisico sia dalla rete informatica, e di operare in entrambi gli ambiti. Essi sono destinati a inserirsi nell’ambiente in
modo ubiquo e invisibile, governando macchine di vario genere, e facendo sı̀ che l’ambiente stesso si adatti automaticamente alle esigenze dell’uomo. Possono comunicare tra
loro—sviluppando l’Internet delle cose, vedi Sezione 5.5.10)—ma anche di percepire i
mutamenti dell’ambiente e di reagire agli stessi. Si immagini una casa nella quale la
porta si apra automaticamente ogni qualvolta la telecamera riconosca uno degli abitanti,
la cucina si attivi per riscaldare la cena al momento opportuno, il frigorifero proceda
automaticamente a ordinare i prodotti mancanti, la combinazione ottimale di umidità e
temperatura sia mantenuta costante (tenendo conto, altresı̀ del costo del riscaldamento),
l’armadietto sanitario si occupi di indicarci le medicine da prendere, secondo il piano
stabilito dal medico, l’impianto stereo proponga brani musicali, tenendo conto dei nostri
gusti e addirittura del nostro stato d’animo, ecc. Si immagini altresı̀ che sia possibile
dialogare con la casa stessa e con i vari dispositivi che ne fanno parte (per esempio,
chiedendo al forno di attivarsi per cucinare l’arrosto e allo stereo di proporci un brano di
Brahms o dei Rolling Stones).310
L’Unione Europea ha fatto propria la prospettiva dell’intelligenza ambientale, dedicando a essa un ampio spazio nell’ambito dei propri progetti di ricerca. Si tratta di
una prospettiva che, accanto agli aspetti positivi, manifesta diversi profili problematici,
rispetto ai quali si rendono necessarie garanzie giuridiche, profili che vanno dalla tutela
dei dati personali, alle responsabilità per i danni causati dalle apparecchiature intelligenti, alla protezione dell’interessato rispetto alle possibilità di sfruttamento e manipolazione ottenibili influenzando il comportamento delle macchine intelligenti e tramite esse
il comportamento del loro utilizzatore (ad esempio, rispetto a scelte di consumo o di
acquisto), e cosı̀ via.
Lo sviluppo delle scienze fisiche e delle tecnologie per l’elaborazione della materia
ci ha consegnato un mondo materiale “disincantato”,311 nel quale ci rapportiamo agli oggetti assumendo che il loro comportamento sia esclusivamente e pienamente accessibile
secondo le leggi fisiche, obbedendo alle quali gli oggetti svolgono la funzione loro assegnata. Oggi lo sviluppo dell’intelligenza artificiale ambientale sembra ricreare un mondo
“incantato” nel quale ci accosteremo agli oggetti in modo analogo a quello con cui interagiamo con le persone, riproducendo quindi schemi del pensiero animistico, proprie del
mondo del mito e della fiaba. In un vicino futuro potremo capire il funzionamento de-
286
6.2. BREVE STORIA DELL’INTELLIGENZA ARTIFICIALE
gli oggetti più comuni (dalla cucina, al frigorifero, all’automobile) solo assumendo che
l’oggetto in questione persegua certi obiettivi (attinenti alle nostre esigenze, cosı̀ come
l’oggetto stesso riesce a coglierle) scegliendo i mezzi che ritiene più adatti al loro conseguimento. Interagiremo con gli oggetti intelligenti adottando uno stile comunicativo,
cioè interrogandoli sulle iniziative che stanno adottando, e indicando a essi i risultati da
realizzare o i modi per raggiungerli (cosı̀ come faremmo con un collaboratore domestico).312 Immaginiamo per esempio di rientrare in casa e di chiedere alla cucina che cosa
possa prepararci per cena (dopo aver interrogato il frigorifero sulle sue disponibilità),
che questa si informi sulle nostre preferenze, e conseguentemente suggerisca particolari
menu, ci indichi i tempi di cottura (o quelli necessari per approvvigionarsi di materie
prime non disponibili in casa), e cosı̀ via. Il mondo incantato dell’intelligenza ambientale può però diventare un mondo stregato, nel quale gli oggetti (o chi li governa) ci
manipolano, ci sfruttano, operano a nostro danno.
Il tema dell’intelligenza ambientale si incontra con un altro modello tecnologico,
anch’esso di notevole interesse per il giurista: gli agenti software, cioè i sistemi informatici in grado di agire con autonomia, senza il controllo diretto del loro utilizzatore.
Questa tecnologia trova impiego nelle aree più diverse dell’informatica: nello sviluppo
di sistemi informativi, nel coordinamento di applicazioni distribuite, nella realizzazione
di interfacce, nella gestione di attività complesse e di situazioni critiche (ad esempio, nel
governo del traffico marittimo o aeroportuale).
Per il giurista presentano particolare interesse gli agenti software che non esauriscono la propria attività nella sfera del loro utilizzatore (come avviene per quelli cui sia
affidata la gestione decentrata della logistica aziendale), ma entrano in contatto con altri
soggetti. Ciò accade soprattutto su Internet, dove operatori e utenti possono ricorrere ad
agenti software per cogliere e sfruttare l’enorme varietà di possibilità offerte dallo sconfinato, diversificato e dinamico ambiente virtuale del ciberspazio. Gli agenti software
possono essere usati in particolare nella raccolta di informazioni (ricerca di dati, di offerte concernenti beni e servizi, di possibili partner commerciali) e nell’attività contrattuale
(trattativa, formulazione di proposte, valutazione della loro convenienza, conclusione di
contratti). Essi possono utilizzare tecniche di intelligenza artificiale per accedere alle informazioni utili (ad esempio, le opportunità offerte dal mercato), accertare le circostanze
rilevanti per le loro azioni (per esempio, la convenienza comparativa delle diverse offerte
recuperate), e agire conseguentemente (effettuando l’acquisto più conveniente).
Un profilo giuridico particolarmente interessante è quello della qualificazione dell’attività realizzata dall’agente nell’interesse del suo utilizzatore, adempiendo con autonomia il mandato affidatogli dall’utilizzatore stesso. A mio parere, qualora l’utilizzatore
deleghi al suo aiutante elettronico lo svolgimento di un compito da realizzare con autonomia (compito che includa attività cognitive, come quelle necessarie per individuare la
controparte di un contratto e determinare il contenuto del contratto stesso), si dovrebbero
applicare per analogia le norme sulla rappresentanza. Conseguentemente, già in base al
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
287
diritto vigente, gli effetti giuridici ricadrebbero sull’utilizzatore, ma gli stati psicologici rilevanti (la volontà, la conoscenza, l’errore, ecc.) sarebbero quelli dell’agente (per
quanto riguarda gli elementi del contratto determinati dall’agente stesso).313
6.3
Il modello connessionistico: le reti neurali
Come abbiamo osservato sopra (Sezione 3.5.4), la ricerca sulle reti neurali è ispirata
all’idea che l’intelligenza possa ottenersi riproducendo l’hardware cerebrale (i neuroni)
piuttosto che riproducendo le funzioni più astratte svolte da quell’hardware (il ragionamento). Conseguentemente, tale ricerca assume che il comportamento intelligente risulti
innanzitutto dall’adattamento flessibile all’ambiente (di cui sono capaci tutti gli animali dotati di un sistema nervoso), piuttosto che dal pensiero consapevole.314 L’ipotesi,
quindi, è che possiamo apprendere non solo acquisendo consapevolmente contenuti formulati in un linguaggio (ed elaborati grazie al ragionamento), ma anche in modo del
tutto inconsapevole, mediante la modificazione delle connessioni tra i nostri neuroni: il
fatto che in certe condizioni si sia data la risposta “giusta” conduce a una modifica di tali
connessioni tale da far sı̀ che la stessa risposta sia data in futuro nelle stesse condizioni o
in condizioni analoghe; il fatto che in certe condizioni si sia data una risposta sbagliata
conduce a un modifica delle connessioni neuronali tale evitare la ripetizione dell’errore
in futuro.
6.3.1
La struttura delle reti neurali
La struttura informatica utilizzata per riprodurre questo tipo di apprendimento è la rete
neurale, una struttura software composta da unità chiamate neuroni, e da determinati
collegamenti tra le stesse unità.315 I neuroni artificiali riproducono informaticamente
la struttura dei neuroni presenti nel nostro cervello, come risulta dal confronto tra la
Figura 6.3 e la Figura 6.4, che rappresentano, rispettivamente un neurone biologico e un
neurone informatico. Ogni neurone riceve segnali dai neuroni a esso connessi, segnali
che viaggiano seguendo determinati collegamenti. Ai collegamenti sono assegnati pesi,
cioè coefficienti secondo i quali i segnali passanti attraverso i collegamenti stessi sono
amplificati o ridotti.
Il funzionamento di ogni neurone è stabilito da funzioni logico-matematiche. Il neurone, quando riceve determinati segnali, verifica se quei segnali abbiano raggiunto il
livello (la soglia) richiesta per la propria attivazione. Se il livello non è stato raggiunto,
il neurone rimane inerte; se invece il livello è stato raggiunto, il neurone si attiva, inviando a sua volta segnali ai neuroni con esso connessi. Per esempio, nell’immagine riportata
nella Figura 6.4 al neurone sono inviati stimoli di valore 2, 3, 2 e 3. I pesi applicati a tali
stimoli sono rispettivamente 2, 1, 3, e 1. Moltiplicando gli stimoli inviati al neurone per
i relativi pesi, si ottengono gli input forniti al neurone: 2 ⇤ 2 = 4; 3 ⇤ 1 = 3; 2 ⇤ 3 = 6;
288
6.3. IL MODELLO CONNESSIONISTICO: LE RETI NEURALI
assone da altro neurone
sinapsi
assone
dendrite
nucleo
Figura 6.3: Neurone naturale
Input provenienti
dall'esterno o
da altri neuroni
Output diretti
all'esterno o ad
altri neuroni
I1 = 2
P1 = 2
I2 = 3
I1 = 2
P2 = 1
P3 = 3
Soglia = 15
I2 = 2
I3 = 2
I3 = 2
P4 = 1
I4 = 3
Figura 6.4: Neurone artificiale
3 ⇤ 1 = 3. Il valore ottenuto sommando gli input (4 + 3 + 6 + 3), cioè 16, è al disopra
della soglia (15) del neurone, che conseguentemente si attiverà, inviando messaggi di
valore 2 ai neuroni a esso collegati.
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
289
Unità di output
Unità nascoste
Unità di Input
Figura 6.5: Rete neurale
Combinando i neuroni otteniamo una rete neurale. Come risulta dalla Figura 6.5,
alcuni neuroni della rete ricevono input dall’esterno (ad esempio da una base di dati,
da una telecamera che riceve immagini dall’ambiente, da una tavoletta sulla quale si
tracciano disegni o caratteri); alcuni neuroni, i cosiddetti neuroni nascosti, sono collegati
solo con altri neuroni; alcuni neuroni, infine, inviano il loro output all’esterno della rete.
La tecnica più comune per addestrare una rete neurale consiste nel proporre alla rete
una serie di esempi corretti, cioè un serie di coppie < input, output >, dove l’output
indica il risultato corretto per l’input corrispondente. Per esempio, se sogliamo addestrare una rete nel riconoscimento dei caratteri alfabetici ogni esempio consisterà di un
segno grafico unito al carattere corrispondente.
L’elaborazione degli esempi avviene nel modo seguente. Il sistema determina la propria risposta rispetto all’input indicato nell’esempio. Se la risposta differisce dall’output
nell’esempio, la rete si riorganizza, cambiando la propria configurazione (i collegamenti
o i pesi associati a essi) in modo da poter dare la risposta corretta (la stessa indicata
nell’esempio) di fronte alla riproposizione dello stesso input. Dopo un conveniente addestramento, la rete acquista l’abilità di dare risposte corrette non solo nei casi contenuti
nell’insieme degli esempi, ma anche in casi analoghi.
290
6.3. IL MODELLO CONNESSIONISTICO: LE RETI NEURALI
In ambito giuridico, le reti neurali sono solitamente addestrate mediante casi giudiziari. Assumendo che le risposte dei giudici siano corrette (o almeno coerenti tra di
loro), l’obiettivo è allenare la rete neurale in modo che essa possa riprodurre le risposte
date dai giudici nei precedenti, e rispondere analogamente nei casi simili.
6.3.2
Le reti neurali e il diritto
Tra le non molte applicazioni del modello della rete neurale in ambito giuridico,316 si
può ricordare il sistema Split-up, cui è stato affidato il compito di ripartire il patrimonio
tra gli ex coniugi in seguito a un divorzio.317 Gli autori del sistema furono indotti a
utilizzare la tecnica delle reti neurali in quanto, dall’analisi della legislazione e delle
sentenze, non avevano rinvenuto regole precise la cui applicazione logica ai fatti dei casi
potesse condurre alle soluzioni adottate dai giudici. In materie di questo tipo i giudici
sembrano infatti operare in base a un’“intuizione allenata” piuttosto che secondo regole
precise: si tratta di un’intuizione informata dalla conoscenza di casi precedenti e dalle
esperienze dello stesso decisore, che ha acquisito adeguate capacità di discriminazione
e valutazione pur senza esserne necessariamente e completamente consapevole.
Nella rete di Split-up, i neuroni di input rappresentano i fattori rilevanti nella decisione dei casi in questione, e i neuroni di output indicano le possibili divisioni del
patrimonio. Come risulta dalla Figura 6.6, i soli dati di input accolti dalla rete (quindi
i soli fattori rilevanti nel determinare la ripartizione) sono il contributo dei coniugi alla formazione del patrimonio e l’ammontare del patrimonio stesso (livelli inferiori del
patrimonio conducendo a ripartizioni maggiormente egualitarie). Secondo gli autori del
sistema, tale semplice rete, dopo essere stata “allenata” sottoponendole alcune centinaia
di casi precedenti, sarebbe divenuta capace di riprodurre le decisioni dei casi passati e
avrebbe acquistato la capacità di prevedere con sufficiente precisione le decisioni di casi
futuri.
L’uso delle reti neurali nell’applicazione del diritto è stato finora assai limitato.
Un’importante ragione di ciò sta nel fatto che le reti neurali, anche quando indicano soluzioni giuridiche plausibili, non offrono una giustificazione di tali soluzioni, nel senso
che non indicano quali premesse conducano al particolare risultato proposto dalla rete.
Ciò è dovuto al fatto che la conoscenza utilizzata da una rete neurale è implicita nella
struttura della rete (nelle connessioni neurali e nei pesi associati a esse), non è formulata
in proposizioni esplicite. Pertanto, la rete si comporta come un “oracolo” che indica una
soluzione giuridica senza motivarne l’adozione.
Questo fatto è suscettibile di essere differentemente valutato da diverse teorie del
diritto. Chi segua un orientamento irrazionalistico, vedrà nelle reti neurali (nel loro uso
per riprodurre e anticipare il comportamento del giurista) la possibilità di smascherare l’illusione logicistica secondo cui le decisioni giuridiche seguirebbero logicamente
dall’applicazione delle norme ai fatti del caso.
291
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
Husband needs much more
''
more
''
same
10%
''
less
20%
''
much less
30%
Husband contributed much more
35%
''
more
40%
''
same
45%
''
less
50%
''
much less
55%
Marriage is very wealthy
60%
''
wealthy
65%
''
confortable
70%
''
average
80%
asset poor
very few assets
90%
''
''
Figura 6.6: Rete neurale per la divisione del patrimonio tra coniugi
Chi invece segue un orientamento logicistico, e assume che ogni decisione giuridica
sia raggiunta (e debba esserlo) applicando regole preesistenti a fatti dati, riterrà aberrante
ogni applicazione delle reti neurali.
Chi infine, adotta una prospettiva intermedia, secondo la quale nella decisione umana
l’aspetto adattivo proprio delle rete neurali (l’intuizione della correttezza di un certo
risultato, alla luce delle esperienze precedenti) si unisce alla ricerca e all’applicazione di
premesse atte a fondare la decisione, riterrà il modello delle rete neurali suscettibile di
qualche applicazione, pur entro confini ristretti.
A mio parere, le reti neurali artificiali oggi disponibili hanno una capacità molto limitata nel ricevere e nell’elaborare le esperienze (esse sono assai semplici se comparate
alla complessità delle strutture neurali del cervello umano), e non sono in grado di collegare conoscenze adattive e premesse esplicite del ragionamento (come invece accade
quando riflettiamo sulle nostre reazioni intuitive e sviluppiamo modelli logici in grado di razionalizzarle). Questi limiti consigliano una grande cautela nell’impiego di reti
neurali, ma non ne escludono il possibile utilizzo per problemi circoscritti.318
Un interessante uso delle reti neurali (come più in generale, delle analisi statistiche,
cui le reti neurali possono in parte essere ricondotte) consiste peraltro nello smascherare
false giustificazioni, cioè giustificazioni che pongono a fondamento di decisioni giuri-
292
6.4. CONOSCENZA ESPLICITA E RAGIONAMENTO
diche fattori diversi da quelli che hanno realmente motivato tali decisioni. Se una rete
neurale capace di riprodurre un certo insieme di decisioni (ad esempio, condanne penali) non può essere costruita sulla base dei fattori indicati nelle motivazioni dei giudici
(fattispecie del reato, gravità, precedenti, ecc.), ma può essere invece costruita tenendo
conto di altri fattori (caratteristiche etniche, sesso, età, condizione economica, ecc.), cui
si connettono pregiudizi non apertamente dichiarabili, allora è probabile che la spiegazione delle decisioni giudiziarie possa ravvisarsi in quei pregiudizi piuttosto che nelle
ragioni espressamente addotte.319
6.4
Conoscenza esplicita e ragionamento
Nonostante l’interesse suscitato dalle ricerche sulle reti neurali, il modello prevalente
nell’intelligenza artificiale rimane quello dell’utilizzo esplicito della conoscenza, mediante metodi per il ragionamento automatico (secondo l’idea che abbiamo illustrato nella Sezione 3.5.3). A questo fine bisogna che il sistema informatico disponga di due componenti: una rappresentazione della conoscenza rilevante, e metodi per il ragionamento
automatico applicabili a tale rappresentazione.
Ricordiamo che il ragionamento consiste in generale nel passaggio da certe ragioni
(premesse, obiettivi, ecc.), a conclusioni giustificate da tali ragioni. Tale passaggio avviene in generale secondo modelli generali o schemi di ragionamento, che sono forniti
dalla logica (intesa in senso ampio). Il ragionamento che consiste nel passaggio da
certe premesse a certe conclusioni, secondo un determinato schema, può essere detto
inferenza. Per esempio, le premesse A e “SE A ALLORA B” giustificano l’inferenza
della conclusione B, quali che siano i particolari contenuti espressi dalle proposizioni
A e B: in ogni caso il fatto che un ragionatore comprenda tra le sue premesse A e “SE
A ALLORA B” giustifica l’inferenza della conclusione B (almeno quando non ci siano
indicazioni in contrario). La correttezza di un’inferenza, ovviamente, non garantisce la
verità/validità320 della sua conclusione. Per esempio, entrambi i seguenti ragionamenti
sono corretti, ma non sono vere/valide entrambe le conclusioni che ne discendono.
• Premesse
1.
SE
[x è il datore di lavoro di y]
ALLORA
[x può accedere alla
casella di posta aziendale usata da y];
2.
[Lucia è il datore di lavoro di Renzo]
• Conclusione
3.
[Lucia può accedere alla casella di posta aziendale usata da
Renzo]
• Premesse
1.
SE
[x è il datore di lavoro di y]
ALLORA
[x
NON
può accedere
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
293
alla casella di posta aziendale usata da y]
2.
[Lucia è il datore di lavoro di Renzo]
• Conclusione
3.
[Lucia
NON
può accedere alla casella di posta aziendale usata
da Renzo]
Le conclusioni di tali ragionamenti sono infatti incompatibili (o Lucia può accedere alla casella di posta, o non può farlo) e quindi non possono essere entrambe vere/valide.
Tuttavia l’inferenza di ciascuna conclusione è giustificata dalle corrispondenti premesse. Il problema è che non sono vere/valide le premesse di entrambe le decisioni: o è
vera/valida la premessa che il datore di lavoro può accedere alla posta del dipendente, o
è vera/valida la premessa che lo stesso non vi può accedere.
La verità/validità della conclusione tratta da un certo insieme di premesse mediante
un’inferenza, è, in generale, garantita solo dalla compresenza delle seguenti condizioni:
• la verità/validità delle premesse;
• la correttezza dell’inferenza;
• l’assenza di inferenze prevalenti contro l’impiego delle premesse o contro
l’esecuzione dell’inferenza
Le prime due condizioni sono sufficienti a garantire conclusioni tratte secondo il ragionamento deduttivo (che presuppone, che premesse e inferenze non ammettano eccezioni),
mentre la terza condizione si richiede qualora si ricorra al ragionamento defeasible (vedi
Sezione 6.4.6).
6.4.1
Ragionamento e applicazione di regole
Non è possibile illustrare in questa sede i metodi del ragionamento logico (o, meglio,
dei diversi ragionamenti autorizzati da diversi modelli logici), né il modo in cui quei
metodi possono essere applicati da sistemi informatici. Ai nostri fini è sufficiente illustrare il tipo di ragionamento più frequente in ambito giuridico, cioè l’applicazione di
regole. Per “regola”, nel contesto qui considerato, non si intende un enunciato deontico
(un enunciato che qualifichi come obbligatorio, vietato o permesso un certo comportamento, come per esempio “è vietato fumare”), ma piuttosto un enunciato condizionale,
che collega un antecedente e un conseguente consentendo di inferire il secondo dal primo. Il concetto di regola come condizionale (piuttosto che come obbligo o prescrizione)
corrisponde all’idea diffusa che le regole giuridiche—come quelle degli esempi appena
riportate—colleghino una fattispecie e una conseguenza giuridica: la fattispecie astratta
è l’antecedente della regola e la conseguenza giuridica astratta ne è il conseguente. L’antecedente può consistere di un solo elemento, o invece di una congiunzione di elementi.
294
6.4. CONOSCENZA ESPLICITA E RAGIONAMENTO
Quali esempi di regola, cosı̀ intesa, si considerino, gli enunciati seguenti: “se una persona causa colpevolmente un danno ingiusto, allora lo deve risarcire”, o “se una persona è
nata da un cittadino italiano, allora quella persona è cittadino italiano”.
Il ragionamento che sarà qui esaminato consiste semplicemente nella derivazione di
un’istanza specifica (concreta) del conseguente di una regola, data una corrispondente
istanza dell’antecedente della stessa. Ecco un semplice esempio:
• Premesse:
1.
SE
ALLORA
2.
[x ha intenzionalmente causato a y un danno ingiusto]
[x deve risarcire il danno a y]
[Lucia ha intenzionalmente causato a Renzo un danno ingiusto]
• Conclusione:
3.
[Lucia deve risarcire il danno a Renzo]321(m)
Si possono ricondurre al ragionamento mediante regole anche inferenze espresse in altro
modo. Consideriamo per esempio il sillogismo che combina una premessa universale e
una premessa individuale:
• Premesse:
1.
[Tutti gli A sono B]
2.
[↵ è un A]
• Conclusione:
3.
[↵ è un B]
che possiamo esemplificare come segue:
• Premesse:
1.
[Tutti gli uomini sono mortali]
2.
[Socrate è un uomo]
• Conclusione:
3.
[Socrate è mortale]
Allo stesso schema corrisponde il seguente esempio giuridico.
• Premesse:
1.
[Tutte le compravendite sono contratti]
2.
[L’atto tra Lucia e Renzo è una compravendita]
• Conclusione:
3.
[L’atto tra Lucia e Renzo è un contratto]
Questi sillogismi si possono ricondurre all’applicazione di regole riformulandone la premessa universale “Tutti gli A sono B” nel condizionale “P E R O G N I (x) S E
[x è un A] A L L O R A [x è un B]. Ne risulta il seguente schema di inferenza
(nella quale le formule con variabile sono da intendersi implicitamente quantificate, cioè
precedute da P E R O G N I )
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
295
• Premesse:
1.
SE
2.
[↵ è un A]
[x è un A]
ALLORA
[x è un B]
• Conclusione:
3.
[↵ è un B]
che possiamo esemplificare come segue:
• Premesse:
1.
SE
2.
[Socrate è un uomo]
[x è un uomo]
ALLORA
[x è mortale]
• Conclusione:
3.
[Socrate è mortale]
• Premesse:
1.
SE
[x è una compravendita]
2.
[L’atto tra Lucia e Renzo è una compravendita]
ALLORA
[x è un contratto]
• Conclusione:
3.
[L’atto tra Lucia e Renzo è un contratto]
Il modello delle regole può essere impiegato per rappresentare conoscenze di diverso tipo. Per esempio, il funzionamento di un sistema destinato alla diagnosi medica potrebbe
comprendere regole del tipo seguente:322
[x ha il morbillo] S E
[x ha la febbre] E
[la pelle di x è cosparsa di punti rossi]
[x ha l’influenza] S E
[x ha la febbre] E
[x N O N presenta sintomi specifici]
Dati particolari fatti concreti:
[Marco ha la febbre].
[la pelle di Marco è cosparsa di punti rossi].
il sistema può concludere, utilizzando le regole, che Marco ha il morbillo. Allo stesso
modo un sistema che si occupi della concessione di borse di studio potrebbe contenere
regole del tipo seguente
[x ha diritto alla borsa di
[x possiede i requisiti
[x possiede i requisiti
[x possiede i requisiti
studio] S E
soggettivi] E
di merito] E
di reddito].
296
6.4. CONOSCENZA ESPLICITA E RAGIONAMENTO
[x possiede i requisiti soggettivi] S E
[x è cittadino comunitario] E
[l’età di x è inferiore a 30 anni].
[x possiede i requisiti di merito] S E
[x ha sostenuto il numero di esami richiesto] E
[la media dei voti di x è superiore al 28].
[x è cittadino comunitario] S E
[x è cittadino dello stato y] E
[y appartiene all’Unione Europea].
Dati i fatti seguenti:
[l’età di Elena è inferiore a 30 anni].
[Elena ha sostenuto il numero di esami richiesto].
[la media di voti di Elena è superiore al 28].
[Elena è cittadino dello stato Romania].
[Romania appartiene all’Unione Europea].
l’applicazione delle regole sopra indicate condurrà alla conclusione che
[Elena ha diritto alla borsa di studio].
Infine, possiamo utilizzare regole per rappresentare conoscenze giuridiche. In questo
caso solitamente si usano regole per rappresentare la conoscenza normativa, e asserti incondizionati (fatti) per rappresentare le fattispecie concrete. Per esempio, date le regole
seguenti
[x è cittadino italiano] S E
[x è nato in Italia].
[x è cittadino italiano] S E
[x è figlio di un cittadino italiano].
[x è figlio di un cittadino italiano] S E
[y è genitore di x] E
[y è un cittadino italiano].
e dati i fatti seguenti
[Giovanni è genitore di Benedetta].
[Giovanni è nato in Italia].
un sistema informatico capace di applicare regole potrà concludere che
[Benedetta è cittadino italiano].
In particolare, il sistema potrà raggiungere tale conclusione compiendo il seguente ragionamento: Benedetta è cittadina italiana essendo nata da genitore italiano, ed è nata
da genitore italiano essendo suo genitore Giovanni, il quale è cittadino italiano essendo
nato in Italia.323
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
6.4.2
297
I sistemi basati su regole nel diritto
I sistemi basati su regole (rule-based system) costituiscono il tipo più semplice e diffuso
di sistema basato sulla conoscenza (knowledge-based system). Tali sistemi contengono
una base di conoscenza costituita da regole, e un motore di inferenza, che applica tali
regole ai dati di fatto attinenti a casi concreti. Le informazioni attinenti ai casi possono
essere fornite dall’utilizzatore umano del sistema o estratte da archivi informatici.
Il modello del sistema basato su regole ha trovato applicazione in numerosi ambiti:
la diagnosi dei guasti di apparecchiature informatiche, la concessione di crediti, la determinazione di polizze assicurative, il controllo di varie funzioni all’interno di strutture
organizzative pubbliche e private, ecc. In quest’ultimo caso, le regole depositate nel sistema vengono anche chiamate “regole d’affari” (business-rules), termine con il quale si
indicano in generale le regole che governano il funzionamento di un’organizzazione, regole che possono riflettere direttamente o indirettamente requisiti giuridici (ad esempio,
in un sistema che gestisce il commercio elettronico, la regola che prescrive di applicare
l’imposta sul valore aggiunto, al tasso corrispondente al tipo di bene venduto) o invece
determinazioni interne all’organizzazione in questione (ad esempio, la regola che applica lo sconto del 10% ai clienti che abbiamo già fatto acquisti in precedenza, e spendano
per il nuovo acquisto più di C100).
I primi studi sui sistemi basati su regole risalgono ormai agli anni ’60, quando furono realizzati i primi prototipi (come il già ricordato Mycin, utilizzato nelle diagnosi
mediche).
Anche in ambito giuridico si realizzarono alcuni sistemi prototipali già negli anni
’70, ma la ricerca che ha maggiormente influenzato il dibattito teorico e le soluzioni applicative fu realizzata presso l’Imperial College di Londra tra la fine degli anni ’70 e l’inizio degli anni ’80. Un gruppo di studiosi di formazione informatica—coordinato da Robert Kowalski e Marek Sergot, due tra i massimi esperti nella logica computazionale—
applicò le nuove tecniche della programmazione logica alla rappresentazione di norme
giuridiche e all’esecuzione di inferenze corrispondenti.324 La ricerca dell’Imperial College mostrò come le norme giuridiche potessero essere rappresentate in forma di regole,
e potessero essere applicate secondo modelli logici efficienti, intuitivi e rigorosi.325
Per illustrare lo stile di rappresentazione adottato nel prototipo in questione, si
consideri il seguente esempio:
[x acquista la cittadinanza britannica alla data y,
secondo la sezione 1.1] S E
[x è nato nel Regno Unito] E
[x è nato nella data y] E
[x ha un genitore che possiede i requisiti
di cui alla sezione sezione 1.1, alla data y].
298
6.4. CONOSCENZA ESPLICITA E RAGIONAMENTO
[x ha un genitore che possiede i requisiti di cui alla
sezione 1.1, alla data y] S E
[z è genitore di x] E
[z è cittadino britannico alla data y].
Negli anni successivi accanto a ricerche sperimentali volte a cogliere ulteriori aspetti del
ragionamento giuridico (come il ragionamento basato sui casi, l’argomentazione, ecc.)
non mancarono i tentativi di realizzare sistemi basati su regole che trovassero immediato
impiego nell’ambito delle attività giuridiche, uscendo dallo stadio prototipale.326 Per
esemplificare la forma nella quale le norme giuridiche si rappresentano nei sistemi basati
su regole riporto un breve esempio tratto da un’applicazione australiana (pensioni di
guerra).327 Come il lettore può osservare la regola è formulata in un linguaggio non
elegante (in particolare si evitano pronomi e si esplicita tutta la sintassi), ma tuttavia
comprensibile anche al lettore privo di conoscenze logiche o informatiche:
[il Cap 6 Parte 1 si applica al membro (delle
forze armate australiane)] se;
(a) entrambe;
[il membro è stato inviato per obbligo di
servizio in una località rilevante]; e
[il membro vive nella località rilevante]
oppure
(b) [il membro ha svolto il proprio servizio per
obbligo temporaneo in una località rilevante
per un periodo continuo di più di 21 giorni];
oppure
(c) [il membro è inviato per servizio su una nave
sul mare, la cui base si trova in una
località rilevante].
La semplicità di questo esempio non deve far pensare che un sistema basato su regole
giuridiche sia necessariamente semplice o comunque utile solo nei casi semplici (cosı̀
da dare all’utilizzatore un aiuto non diverso da quello che potrebbe essere fornito da un
manuale di istruzioni). L’importanza di tali sistemi deriva dalla possibilità di applicare
un numero elevato di regole (vi sono sistemi che ne contengono decine di migliaia),
tenendo conto dei collegamenti tra le stesse (come quando il conseguente di una regola
rappresenti la precondizione per l’applicazione di altre regole o indichi un’eccezione ad
altre regole). Essi possono cosı̀ supplire ai limiti della memoria, dell’attenzione, e della
capacità combinatoria dell’uomo.
6.4.3
Sistemi basati sulla conoscenza e sistemi esperti
Come osservavamo sopra, la caratteristica essenziale dei sistemi basati sulla conoscenza
consiste nel fatto che il loro funzionamento, cioè il modo in cui affrontano i problemi
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
299
loro affidati, si basa sull’utilizzo di una “base di conoscenza”. Tale base di conoscenza
consiste in un insieme di informazioni (conoscenze) specialistiche, attinenti all’ambito
(il dominio) particolare in cui tali sistemi debbono operare, e alle tecniche utilizzabili
per la soluzione dei problemi che possano emergere in quell’ambito.
I sistemi basati sulla conoscenza sono spesso identificati con i cosiddetti sistemi
esperti, cioè, i sistemi intesi a fornire funzionalità che richiedono una specifica competenza professionale (expertise). Un sistema basato sulla conoscenza è indubbiamente un
sistema esperto nel senso che esso svolge funzioni basate su conoscenze specialistiche,
che solo un esperto possiede. Ciò non significa però che esso sia un vero esperto, cioè
che possa svolgere da solo un’intera prestazione professionale, comprensiva di tutte le
funzioni che si affiderebbero all’esperto umano. Questo obiettivo non è realizzabile con
le tecnologie disponibili oggi o anche nel vicino futuro. Anche in un futuro più lontano
un esperto automatico rimarrà privo delle capacità cognitive legate alla condizione umana (come la capacità di immedesimarsi nella posizione dell’altro, di coglierne gli stati
psicologici, i ragionamenti, i bisogni, e quindi di apprezzare pienamente gli interessi e
i valori in gioco). L’idea di un esperto automatico pone non solo ostacoli tecnologici
ma anche problemi giuridici ed etici.328 Si considerino le ipotesi estreme di un automa
professionista nella medicina e nel diritto.
Un automa esperto nella medicina dovrebbe contenere informazioni attenenti all’anatomia umana, alla fisiologia alle diverse patologie, alle cure disponibili per ciascuna
di esse. Il sistema dovrebbe usare conoscenze anatomiche, fisiologiche e patologiche per
determinare la patologia da cui il paziente è affetto, e quindi, sulla base di conoscenze
attenenti ai metodi terapeutici, suggerire la terapia migliore per il particolare caso clinico. Inoltre il sistema non dovrebbe limitarsi all’elaborazione delle informazioni a esso
fornite in forma linguistica. Al contrario, dovrebbe essere dotato di capacità percettive tali da consentirgli di estrarre informazioni dall’ambiente (ad esempio, dalla visione
delle parti malate o delle radiografie) e di interagire con l’ambiente, utilizzando altresı̀
la comunicazione umana, al fine di ottenere informazioni utili mediante il dialogo (ad
esempio, interrogando il malato, o chiedendogli di sottoporsi agli esami del caso).
Allo stesso modo, un automa esperto nel diritto dovrebbe contenere informazioni
concernenti le norme giuridiche, le loro interpretazioni dottrinali, i precedenti giurisprudenziali, i valori e le finalità che caratterizzano l’ordinamento, i fenomeni sociali
disciplinati dal diritto. Il sistema inoltre dovrebbe possedere la capacità di ricavare informazioni dall’ispezione delle prove fisiche e di interagire con le parti e i terzi.Grazie
a queste informazioni, l’automa dovrebbe determinare le soluzione giuridiche di casi
concreti (come farebbe un giudice o un funzionario pubblico).
Non è questa la prospettiva nella quale possiamo sperare di ottenere risultati utili
nella realizzazione di sistemi informatici, almeno nel futuro a noi vicino. Si potranno invece affidare all’elaborazione automatica particolari fasi o momenti delle attività
giuridiche che si affiancano e integrano a quelli affidati all’uomo, cioè all’avvocato, al
300
6.4. CONOSCENZA ESPLICITA E RAGIONAMENTO
giudice, al funzionario amministrativo o allo stesso destinatario di un servizio pubblico. La prospettiva nella quale collocare l’interazione tra uomo e sistema informatico è
quella della simbiosi uomo-macchina, già concepita all’inizio degli anni ’60 da J. C. R.
Licklider (tra gli iniziatori delle ricerche che hanno portato alla realizzazione di Internet,
vedi Sezione 5.2.1), che caratterizzava nel modo seguente le prospettive dell’interazione
tra uomo e macchina:
La simbiosi tra uomo e calcolatore è uno sviluppo atteso nell’interazione cooperativa tra uomini e calcolatori elettronici. Essa implica uno stretto accoppiamento tra
le componenti umane e quelle elettroniche dell’associazione. Gli scopi principali
sono (1) far sı̀ che i calcolatori facilitino la formulazione dei problemi cosı̀ come
ora essi aiutano nella soluzione di problemi già formulati e (2) consentire agli uomini e ai calcolatori di cooperare nel prendere decisioni e nel controllare situazioni
complesse senza la dipendenza inflessibile da programmi predeterminati. Nell’associazione simbiotica prevista, gli uomini indicheranno gli scopi, formuleranno le
ipotesi, determineranno i criteri ed effettueranno le valutazioni. Le macchine calcolatrici faranno il lavoro di routine che deve essere compiuto per preparare la strada
per nuove idee e decisioni nel pensiero tecnico e scientifico. Le analisi preliminari
indicano che l’associazione simbiotica eseguirà operazioni intellettuali molto più
efficacemente di come possa eseguirle l’uomo da solo.329
Per capire possibilità presenti e prospettive future dell’informatica nelle attività giuridiche dobbiamo interrogarsi sull’integrazione simbiotica tra uomo e macchina, e individuare gli ambiti nei quali i sistemi informatici, e in particolare sistemi basati sulla
conoscenza, possano affiancarsi all’attività dell’uomo.
6.4.4
L’uso dei sistemi basati sulla conoscenza giuridica
I risultati operativi ottenuti in ambito giuridico mediante sistemi basati sulla conoscenza
furono inizialmente inferiori alle attese. I prototipi realizzati non condussero allo sviluppo di sistemi funzionanti, furono rifiutati fin dall’inizio dai funzionari destinati ad
applicarli, furono abbandonati dopo una breve sperimentazione, o non si ritenne di procedere al loro aggiornamento quando le loro basi di conoscenza diventarono obsolete in
seguito a modifiche normative.
Negli ultimi anni tuttavia, queste iniziali delusioni sono state seguite da alcuni importanti successi, in particolare nell’ambito della pubblica amministrazione. La ragione
fondamentale di tale cambiamento è da ritrovarsi innanzitutto nell’avvento di Internet,
che ha modificato completamente l’uso delle applicazioni informatiche e in particolare
dei sistemi basati sulla conoscenza. Internet rappresenta, infatti, un mondo aperto dove un sistema può essere utilizzato da un numero illimitato di utenti, e le funzioni di
un sistema possono essere integrate con quelle offerte da altri sistemi nell’ambito di architetture distribuite. Ciò significa che il sistema finalizzato a una particolare funzione
(per esempio, destinato a determinare il diritto a ricevere certe prestazioni) può essere
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
301
utilizzato (possibilmente con modalità diverse) sia da parte dei cittadini, sia da parte
dei funzionari pubblici competenti, nei diversi uffici che gestiscono la normativa corrispondente. Inoltre il sistema può essere integrato con altri sistemi informatici (come per
esempio, banche di dati, archivi di documenti e formulari, ecc.) in modo tale che le funzioni svolte da ciascuno di tali sistemi siano “orchestrate” per realizzare una funzionalità
complessiva. Si tratta del modello informatico dei servizi di rete (Web service, vedi Sezione 3.5.2): molteplici funzioni informatiche sono rese disponibili on-line e possono
essere integrate in un sistemi virtuali.
Le pubbliche amministrazioni e, più in generale, i soggetti che forniscono servizi
pubblici hanno iniziato a usare Internet per fornire informazioni ai cittadini. Normalmente si tratta di materiale di presentazione dell’ente e delle sue funzioni, cui si accompagna la possibilità di “scaricare” documenti di vario genere (testi normativi, manuali
di istruzioni, moduli e formulari). Talvolta l’utente è abilitato a estrarre dagli archivi
elettronici della pubblica amministrazione i dati che lo riguardano e a effettuare l’aggiornamento degli stessi. Tuttavia, Internet rimane un mero deposito di informazioni, la
cui elaborazione e utilizzazione sono affidate per intero allo sforzo del lettore umano.
I sistemi basati sulla conoscenza possono apportare un importante progresso nell’uso di Internet da parte della Pubblica Amministrazione: essi non si limitano a fornire
documenti, ma impiegano le regole associate ai documenti per agevolare lo svolgimento
delle relative attività amministrative. Tali sistemi sono particolarmente utili nei processi
decisionali “determinativi”, cioè a quelli volti a stabilire quali obblighi e diritti spettino
ai cittadini in base alla legge, e in particolare nei processi volti a stabilire se il cittadino
possegga i requisiti per accedere a un certo servizio pubblico e a quali condizioni possa
avervi accesso.330
I sistemi basati sulla conoscenza non sono quindi esperti automatici in grado di sostituirsi al funzionario pubblico, ma piuttosto strumenti che forniscono un aiuto intelligente
al richiedente del servizio o al funzionario che lo gestisce. Si tratta di un aiuto che può
integrarsi con funzionalità informatiche ulteriori (la ricerca di documenti, la fornitura
di moduli, la loro predisposizione automatica) e soprattutto con le attività dell’utente
e del funzionario stesso.331 L’esperienza delle pubbliche amministrazioni che più ampiamente hanno utilizzato sistemi basati sulla conoscenza (quella australiana, inglese e
olandese) indicano come questa tecnologia possa avere un impatto positivo non solo sull’applicazione amministrativa di norme giuridiche, ma anche sulla formulazione delle
norme stesse. Al fine di predisporre una base di conoscenza bisogna infatti tradurre i
testi giuridici in regole tanto precise da essere automaticamente applicabili. Emergono
cosı̀ le incoerenze e le lacune della normativa da applicare (e le possibilità di riformularne i contenuti con maggiore precisione e chiarezza), e da ciò si possono trarre utili
indicazioni per il legislatore, che può essere invitato a porre rimedio ai difetti delle sue
statuizioni.
302
6.4. CONOSCENZA ESPLICITA E RAGIONAMENTO
Non deve essere sottovalutato il rischio che l’uso di sistemi basati sulla conoscenza nella pubblica amministrazione conduca a un’applicazione rigida e iniqua del diritto,
sorda alle esigenze del caso concreto, a una forma estrema di legalismo che vincolerebbe
l’attuazione del diritto non solo al testo legislativo ma anche alla particolare interpretazione dello stesso che si è deciso di inserire nel sistema informatico. Queste critiche
possono però trovare risposta non tanto nel richiamarsi a superiori esigenze di certezza
ed efficienza (che renderebbero sopportabili rigidità e iniquità), ma piuttosto nel ribadire
che i sistemi basati sulla conoscenza non sminuiscono necessariamente né il ruolo del richiedente un servizio pubblico né quello del funzionario competente. Al contrario l’uso
di tali sistemi può accrescere le sfere di iniziativa e di autonomia informata del cittadino
e del pubblico funzionario incaricato di provvedere a un’attività regolata dal diritto. Ciò
può avvenire quando l’uso del sistema sia agevole e controllabile, esistano procedure
aperte ed efficaci per rivedere la base conoscenza quando essa conduca a conclusioni
inaccettabili, siano rispettati gli ambiti nei quali l’apprezzamento non predeterminato (o
predeterminato solo in parte) delle caratteristiche del caso concreto possa dare risultati
migliori dell’applicazione di regole predefinite. Nella prospettiva simbiotica sopra prospettata si tratta di progettare modalità di accesso e gestione che consentano di integrare
nel modo migliore attività umana ed elaborazione (e memoria) informatica, in modo che
la valorizzazione dell’iniziativa del cittadino e della competenza dell’amministrazione si
combini con i vantaggi che l’informatica può dare sotto i profili dell’informazione, dell’efficienza e della certezza. I sistemi basati sulla conoscenza giuridica possono essere
utilmente impiegati nei processi determinativi solo grazie all’integrazione delle seguenti
attività:
• l’attività dell’esperto informatico-giuridico che si occupa non solo dell’inseri-
mento, ma anche della correzione e revisione delle regole (nel caso di errori o
della necessità di tener conto di nuove informazioni), assicurando che la base di
conoscenza non contenga errori di diritto;
• l’attività del cittadino o del funzionario che inseriscono i dati sui casi concreti,
sulla base dell’esame delle circostanze di fatto e dell’interpretazione delle regole
da applicare;332
• l’attività del sistema, che si occupa della derivazione delle conseguenze deducibili
dalle regole in esso comprese e dei dati di fatto a esso forniti o cui abbia accesso.
6.4.5
I limiti dell’applicazione deduttiva di regole
I sistemi che applicano automaticamente, in modo puramente deduttivo, regole preesistenti nella loro base di conoscenza, trovano le maggiori applicazioni, come abbiamo
visto, nell’ambito della Pubblica Amministrazione. Essi non sono in grado di affiancare
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
303
il giurista nelle attività che formano la parte centrale del suo pensiero, che consiste nell’affrontare casi controversi, nell’identificare e valutare diversi argomenti, nel contribuire
alla formazione (o concretizzazione) del diritto.
Tali sistemi potrebbero svolgere per intero il ragionamento giuridico (e in particolare
il ragionamento giudiziario) solo se risultasse vera, presa alla lettera, la famosa frase di
Charles Montesquieu [1689-1755]:
I giudici della nazione non sono [. . . ] che la bocca che pronuncia le parole della
legge; esseri inanimati che non ne possono moderare né la forza né il rigore.333
Il pensiero giuridico si ridurrebbe allora al classico modello del cosiddetto sillogismo
giudiziale:
• le soluzioni giuridicamente corrette di ogni caso concreto sarebbero derivabili
da un insieme di premesse comprendente norme giuridiche generali (la legge) e
asserti fattuali specifici (i fatti del caso concreto), e
• tale derivazione consisterebbe in una deduzione (qualora le premesse normative e
fattuali fossero vere/valide saremmo assolutamente sicuri che anche le conclusioni
sarebbero vere/valide).334
Alla riduzione del ragionamento giuridico al modello sillogistico, come è noto, si oppongono però alcune fondamentali caratteristiche del diritto e, conseguentemente, alcuni
aspetti essenziali del ragionamento del giurista: le fonti del diritto spesso non forniscono
norme sufficienti a disciplinare tutti gli aspetti del caso (vi sono lacune), comprendono
norme che si contraddicono (vi sono antinomie) o il cui contenuto rimane indeterminato (vi sono ambiguità e vaghezze), includono casi particolari (precedenti), da cui si
possano trarre indicazioni solo mediante analogie o prospettando spiegazioni e generalizzazioni.335 Inoltre, in certi casi può essere necessario andare al di là dell’applicazione
di regole e precedenti, e considerare i valori individuali e sociali perseguiti dal diritto, e
i modi in cui massimizzarne la realizzazione, nel rispetto delle aspettative dei cittadini e
delle funzioni che competono alle diverse istituzioni giuridiche e politiche.336
Secondo alcuni, l’uso di sistemi basati su regole in abito giuridico presupporrebbe
l’accettazione del modello sillogistico del ragionamento giuridico, l’idea che il diritto si
riduca a un insieme di regole e che il ragionamento giuridico consista nell’applicazione
“meccanica” (deduttiva) di tali regole.337 Questo errore teorico determinerebbe l’inutilità pratica di tali sistemi: non rappresentando fedelmente il diritto e il ragionamento
giuridico, essi sarebbero inutili o anzi dannosi, conducendo necessariamente a risultati
scorretti o ingannevoli.
A mio parere è vero che i sistemi basati sull’applicazione deduttiva del diritto si
limitano a cogliere un aspetto limitato del ragionamento giuridico, ma ciò non postula un
errore teorico e non ne determina l’inutilità pratica. Infatti, le limitazioni di questi sistemi
non ne escludono l’utile impiego, nella piena consapevolezza di tali limitazioni. In un
304
6.4. CONOSCENZA ESPLICITA E RAGIONAMENTO
modello simbiotico di interazione uomo-macchina è possibile affidare alla macchina la
registrazione delle regole, la loro l’applicazione deduttiva e il prelievo dei dati fattuali già
disponibili in forma elettronica, e affidare invece all’uomo la formulazione delle regole,
il controllo sul funzionamento del sistema e l’inserimento e la qualificazione giuridica
di nuovi dati fattuali.338
6.4.6
Intelligenza artificiale e dialettica giuridica: il ragionamento
defeasible
Le ricerche degli ultimi anni hanno evidenziato come l’informatica giuridica possa andare al di là dei limitati risultati conseguibili nell’ambito del modello deduttivo, operando
in due direzioni complementari:
• la costruzione di precisi modelli dei ragionamenti giuridici non-deduttivi, la crea-
zione, cioè, di una nuova logica giuridica formale, più estesa dei tradizionali
modelli deduttivi;339
• lo sviluppo, sulla base di tali modelli, di software che possano agevolare la ricerca
e l’elaborazione di informazioni giuridiche.
Non è possibile presentare qui la vasta gamma delle ricerche innovative che, nel corso
degli ultimi decenni, hanno contribuito alla crescita degli studi di intelligenza artificiale
e diritto, ricerche che vertono su aspetti come l’analogia sulla base dei precedenti,340
lo sviluppo di teorie giuridiche basate su regole e casi, 341 la logica dei concetti normativi,342 la ricerca delle informazioni sulla base dei concetti, 343 la generazione di
documenti, 344 ecc.
Qui mi limiterò a illustrare brevemente una particolare direzione di ricerca, che ritengo particolarmente significativa, il tentativo di sviluppare nuovi modelli formali dell’argomentazione giuridica. L’idea fondamentale è che sia possibile e utile predisporre
strumenti logici e informatici capaci di affrontare la dialettica del ragionamento giuridico, superando i limiti del ragionamento sillogistico. Infatti, quando la soluzione a un
problema giuridico controverso è presentata quale risultato di una deduzione da regole
giuridiche date, la spiegazione risulta monca: non indica perché i testi sono stati interpretati in un certo modo, perché altri testi non sono stati presi in considerazione, quali
principi sono stati attuati e quali tralasciati, quali eccezioni si sono accolte o respinte,
quali obiettivi sono stati perseguiti e quali sono rimasti insoddisfatti. Chi intenda giustificare una decisione giudiziale o una soluzione dottrinale solo mediante un sillogismo,
è costretto a tacitare, a rimuovere (in quanto inesprimibile nel mezzo logico scelto),
proprio il nucleo del proprio processo raziocinativo-argomentativo, che rimane inarticolato, se non inconsapevole. Di conseguenza, la giustificazione stessa risulta monca e
insufficiente.345
A questo riguardo dobbiamo distinguere due diversi tipi di schema di ragionamento (e di corrispondenti inferenze): schemi conclusivi e schemi defeasible (vincibili).346
305
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
La differenza tra uno schema conclusivo e uno schema defeasibile è la seguente: se si
accettano le premesse di un’inferenza conclusiva se ne debbono necessariamente accettare anche le conclusioni; invece, è possibile respingere le conclusioni di un’inferenza
defeasible pur accettandone le premesse. Normalmente ricorriamo al ragionamento defeasible quando le nostre premesse sono generalizzazioni empiriche o norme suscettibili
di eccezione, come negli esempi seguenti.
• Premesse:
1.
SE
2.
[Tweety è un uccello];
[x è un uccello]
ALLORA
[x vola]
• Conclusione:
3.
[Tweety vola]
• Premesse:
SE
[x ha colpevolmente causato a y un danno ingiusto],
ALLORA
[x
deve risarcire il danno]
[Lucia ha colpevolmente causato a Renzo un danno ingiusto]
• Conclusione:
[Lucia deve risarcire il danno].
Possiamo continuare ad accogliere le premesse delle inferenze defeasible, anche quando informazioni ulteriori ci conducono ad abbandonarne le conclusioni. Per esempio,
se venissimo a sapere che [Tweety è un pinguino], non abbandoneremmo le
premesse già accolte (la convinzione che gli uccelli normalmente volano, e che Tweety
è un uccello), ma riterremmo di trovarci di fronte a un’eccezione a tale regola. Allo stesso modo, se venissimo a sapere che [Lucia ha agito per legittima
difesa], non abbandoneremmo l’idea che chi causa colpevolmente un danno ingiusto lo debba risarcire, ma riterremmo di trovarci di fronte a un’eccezione a tale regola
(l’esonero da responsabilità per legittima difesa).
Come abbiamo visto, un’inferenza defeasible è un argomento che si impone alla
nostra ragione, ma solo in modo provvisorio, cioè solo a condizione che non emergano eccezioni, contro-esempi, argomenti contrari di importanza preminente. Pertanto, il fatto che si accolgano le premesse dell’argomento che conduce a una certa conclusione può essere insufficiente a giustificare tale conclusione: un argomento dotato
di premesse valide perde la propria forza se viene sconfitto (defeated) da un controargomento. Per illustrare la dialettica di argomenti contrapposti dobbiamo considerare
brevemente la struttura degli argomenti e i modi in cui essi possono essere attaccati da
contro-argomenti.
La struttura fondamentale degli argomenti basati su regole è rappresenta in forma
generale nei grafi proposti dal Stephen Toulmin,347 nei quali si distinguono i dati di
partenza dell’argomento (data) e la regola generale (warrant), che consente di passare
306
6.4. CONOSCENZA ESPLICITA E RAGIONAMENTO
Rossi ha causato un
danno ingiusto a Verdi
Argomento A
Rossi ha l'obbligo
risarcire il danno a Verdi
Rossi ha agito con
colpa
Chi causa ad altri un danno
ingiusto con dolo o colpa, ha
l'obbligo di risarcire il danno
Argomento B
Rossi non è responsabile
(non ha l'obbligo di
risarcire il danno)
Rossi ha agito in stato
di incapacità
Chi è incapace non è
responsabile (non ha
l'obbligo di risarcire il danno)
Argomento C
La regola dell'esonero da
responsabilità in caso di
incapacità non si applica
a Rossi
Rossi è divenuto incapace
per sua colpa
La regola dell'esonero da
responsabilità in caso di incapacità
non si applica a chi sia divenuto
incapace per sua colpa
Figura 6.7: Dialettica di argomenti: responsabilità civile
dai dati alla conclusione che si vuole sostenere (claim). Per esempio, nell’argomento A
della Figura 6.7, i dati sono costituiti dal fatto che Rossi ha causato un danno ingiusto a
Verdi agendo con colpa, la conclusione è rappresentata dall’obbligo risarcitorio a carico
di Rossi, e il nesso tra fatti e conclusione è fornito dalla regola generale che ogni fatto
doloso o colposo che causi ad altri un danno ingiusto obbliga l’autore al risarcimento.
Possiamo distinguere due modi in cui un argomento defeasible ↵ può essere contrastato. Il primo è detto rebutting,348 termine che forse possiamo tradurre con “contraddire”, e consiste nell’opporre ad ↵ un contro-argomento che contraddice la conclusione
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
307
di ↵: la conclusione di nega, o comunque è incompatible con la conclusione di ↵.
Il secondo è detto undercutting,349 che forse possiamo tradurre con recidere, e consiste
nell’opporre ad ↵ un contro-argomento che nega la forza argomentativa di ↵: afferma che le premesse di A sono inidonee a fondarne la conclusione (in particolare, può
contestare l’applicabilità della regola su cui si fonda, in ↵, il passaggio da premesse a
conclusioni).
Per esempio, l’argomento A della Figura 6.7 è contraddetto (rebutted) dall’argomento B secondo il quale Rossi non è responsabile essendosi stato incapace di intendere e
di volere nel momento dell’incidente.350
L’argomento B della Figura 6.7 (Rossi non è responsabile, in forza della sua incapacità) viene reciso (undercut) dall’argomento C secondo il quale l’incapacità di Rossi non
è rilevante (non lo scusa) poiché Rossi provocò colpevolmente il suo stato di incapacità,
per esempio, assumendo bevande alcoliche. Il fatto che Rossi abbia bevuto troppo non
è un’autonoma ragione per la quale egli debba essere ritenuto responsabile (si è responsabili per aver causato ad altri un danno ingiusto, non per la propria ubriachezza). Si
tratta invece di una ragione per disapplicare la regola secondo la quale chi è incapace
non è responsabile o, detto in altro modo, per escludere la rilevanza dell’incapacità, per
impedire (recidere) il passaggio dall’incapacità alla non-colpevolezza.
L’accoglimento delle premesse (i dati e la regola) di un argomento defeasible non
è sufficiente a garantire l’accettabilità della sua conclusione. A tal fine dobbiamo altresı̀ considerare se esistano contro-argomenti che contraddicano o recidano il nostro
argomento. Solo se tutti i contro-argomenti possono essere superati alla luce di considerazioni ulteriori, la conclusione dell’argomento risulta giustificata. Da ciò discendono
due aspetti importanti dell’interazione dialettica tra argomenti contrapposti.
Il primo aspetto consiste nella possibilità di ristabilire (reinstate) un argomento, attaccando gli argomenti che potrebbero sconfiggerlo. Un argomento può essere difeso
non solo producendo argomenti ulteriori che vanno nella stessa direzione (che ne ribadiscono la conclusione) ma anche, e soprattutto cercando di demolire i contro-argomenti
che a esso si oppongono (in modo da recuperare l’argomento stesso). Per esempio, l’argomento A appena presentato (Rossi è responsabile avendo danneggiato colpevolmente
Verdi) può essere difeso contro l’attacco del contro-argomento B (Rossi non è responsabile essendosi trovato in stato di incapacità), attaccando B con il nuovo contro-controargomento C (l’incapacità di Rossi è irrilevante, essendosela procurata Rossi stesso,
ingerendo sostanze alcoliche). C nell’invalidare B, fa in modo che A riacquisti la propria forza (C ristabisce A).351 Nel diagramma della Figura 6.7 lo stato dialettico di un
argomento è indicato dal colore dello stesso: gli argomenti in (validi, alla luce dell’informazione riportata nel diagramma) sono in chiaro, gli argomenti out (invalidi, alla luce
dell’informazione disponibile) sono ombreggiati. Il diagramma evidenza come l’argomento A, che sarebbe stato out sulla base del contro-argomento B, torna in una volta
che B diventi out, essendo invalidato dal suo contro-argomento C.
308
6.4. CONOSCENZA ESPLICITA E RAGIONAMENTO
A.
La foto di Maria non può
essere pubblicata poiché ciò
viola la sua privacy
B.
La pubblicazione della foto
di Maria non viola la sua
privacy poiché Maria è
ritratta in un luogo pubblico
C.
La pubblicazione della foto
di Maria viola la sua privacy
anche se la ritrae in un
luogo pubblico, poiché Maria
è riconoscibile dalla foto
D.
La foto di Maria può essere
pubblicata poiché ciò
corrisponde all'altrui diritto
all'informazione
F.
Il divieto di pubblicare la foto
di Maria (quale violazione
della sua privacy) non si
applica perché Maria ha
consentito alla pubblicazione
della foto
E.
Il diritto alla privacy di Maria
prevale sull'altrui diritto
all'informazione poiché la
foto non attiene ad attività di
Maria aventi interesse
pubblico
Figura 6.8: Dialettica di argomenti: la privacy
Il secondo aspetto, invece, consiste nella possibilità di sostenere un argomento A,
contraddetto (rebutted) da un contro-argomento B, adducendo ulteriori argomenti che
indichino perché A debba prevalere su B. Per esempio, assumiamo che nella causa di
divorzio tra Rossi e Verdi, Rossi affermi (argomento A) il proprio diritto all’uso dell’abitazione della famiglia, essendo affidatario dei figli, e che Verdi (argomento B) opponga
il proprio diritto a possedere tale abitazione, in quanto proprietaria della stessa. A questo
punto, il contrasto tra i due argomenti può forse essere risolto affermando (argomento C)
la prevalenza dell’argomento di Rossi, poiché tale argomento corrisponde al preminente
interesse dei figli. L’esito del conflitto tra A e B è indeterminato quanto si considerino solo A e B. Esso acquista determinatezza alla luce della valutazione comparativa
motivata dall’ulteriore argomento C.352
Una dialettica argomentativa più complessa è illustrata nella Figura 6.8. Ripercorriamo brevemente questo esempio. S’immagini che la foto di una persona, chiamiamola
Maria, sia stata pubblicata in un giornale e che Maria chieda lumi al suo avvocato sui
possibili rimedi giuridici (l’esempio non intende essere giuridicamente accurato, ma si
limita a illustrare, nel modo più semplice, la logica qui proposta).
Il primo argomento considerato dal legale è il seguente:
A : La foto di Maria non può essere pubblicata, poiché ciò viola la sua privacy.
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
309
Da A, considerato isolatamente, possiamo trarre la conclusione che la foto di Maria
non poteva essere resa pubblica (la sua pubblicazione viola i diritti di Maria). Tuttavia,
l’avvocato deve considerare anche i possibili contro-argomenti, come B:
B : La pubblicazione della foto di Maria non viola la sua privacy, poiché la ritrae in
un luogo pubblico
Dinanzi ad argomenti in conflitto (come A e B nel nostro esempio) ci si trova in uno
stato di incertezza o perplessità: vi sono più argomenti in competizione ma, per quanto
è emerso finora, nessuno di essi prevale sugli altri, tutti tali argomenti sono difendibili,
ma nessuno è giustificato.
In generale, per determinare se un argomento giuridico sia giustificato, non basta
guardare a quell’argomento isolatamente. Al contrario bisogna collocare l’argomento
nel contesto di tutti gli argomenti rilevanti, cioè nel contesto argomentativo (argumentation framework) del caso. Come vedremo, al mutare del contesto argomentativo in cui un
argomento viene collocato può mutare lo status dell’argomento: argomenti che apparivano giustificati possono cessare di esserlo, mentre argomenti che apparivano sopraffatti
da argomenti in contrario, possono riacquistare forza.
Per esempio, se A fosse stato l’unico argomento rilevante nel caso di Maria, e nessuna obiezione (contro-argomento) si fosse potuta sollevare contro di esso, avremmo
dovuto accettare la sua conclusione. Invece nella cornice argomentativa che unisce A
e il controargomento B, A non è più giustificato (Maria non riesce a dimostrare che la
foto non poteva essere pubblicata).
Tuttavia l’avvocato di Maria, riflettendo ancora sulla causa, trova un argomento
contro B:
C : La foto di Maria viola la sua privacy, anche se la ritrae in un luogo pubblico,
poiché Maria è riconoscibile nella foto.
L’argomento C prevale contro B (essendo più specifico) e quindi priva B di rilevanza nel
caso in esame. Di conseguenza, nel contesto argomentativo costituito degli argomenti
A, B e C (dove A è attaccato da B, ma dove C attacca B e prevale su di esso) risulta
che A è giustificato (Maria dimostra che la sua foto non poteva essere pubblicata).
Vi è però un altro possibile argomento a favore della pubblicazione della foto: essa
realizza l’interesse del pubblico (assumiamo che Maria rivesta un ruolo pubblico).
D : La foto di Maria può essere pubblicata poiché ciò realizza l’interesse del pubblico
Il nuovo argomento D porta un nuovo attacco contro l’argomento A. Nel contesto argomentativo A, B, C, e D, risulta che A non è più giustificato (Maria non riesce a
dimostrare che la sua foto non poteva essere pubblicata). A questo punto, l’avvocato perplesso ricorre al meta-ragionamento. Egli sviluppa un nuovo argomento (E) che
adduce ragioni a favore della prevalenza di uno degli argomenti in conflitto:
310
6.4. CONOSCENZA ESPLICITA E RAGIONAMENTO
E : Il diritto alla privacy prevale sull’interesse del pubblico alla conoscenza, poiché la
foto non attiene ad attività di Maria aventi interesse pubblico.
Grazie all’aiuto fornitogli dal nuovo argomento E, A appare ora superiore a D, e quindi
capace di prevalere su di esso e di emergere dal conflitto come giustificato. In altre
parole, nel contesto argomentativo costituito dagli argomenti A, B, C, D, E (dove A e
D si attaccano reciprocamente, e E afferma che A è superiore a D), A risulta giustificato
(Maria dimostra che la sua foto non poteva essere pubblicata).
Il ragionamento dell’avvocato, purtroppo, non è ancora finito. Nel colloquio con la
cliente emerge che ella aveva consentito alla pubblicazione della propria foto. Abbiamo
cosı̀ un nuovo argomento:
F : Il divieto di pubblicare la foto di Maria (in quanto attinente alla sua privacy) non
si applica poiché Maria ha consentito alla pubblicazione della foto.
Nel contesto argomentativo rappresentato dagli argomenti A, B, C, D, E, e F , risulta
che A non è più giustificato (quindi Maria non riesce a dimostrare che la sua foto non
poteva essere pubblicata). L’argomentazione potrebbe continuare indefinitamente (per
esempio, si potrebbe sostenere che il consenso di Maria era stato revocato, cosa che
rende inapplicabile la regola del consenso), ma quanto detto finora può dare sufficiente
supporto alla tesi che il ragionamento giuridico consiste nella dialettica tra argomenti
e contro-argomenti, e che tale dialettica fa sı̀ che il ragionamento giuridico sia defeasible: le conclusioni che appaiono giustificate alla luce di certi argomenti possono essere
inficiate da argomenti ulteriori.353(m)
Questo pur sommario esempio dovrebbe essere sufficiente a illustrare l’idea fondamentale che caratterizza i tentativi di costruire modelli formali della dialettica giuridica.
Si tratta di affrontare situazioni nelle quali vi sono numerosi argomenti in gioco. Alcuni
stanno combattendo per la supremazia, altri danno sostegno ad alcuni dei combattenti
(per esempio, fornendo ragioni per le quali essi dovrebbero prevalere sui propri oppositori), altri negano l’applicabilità di altri argomenti, e cosı̀ via. Il compito di una logica
dialettica è quello di dirci non solo quali argomenti siano costruibili utilizzando premesse date, ma anche di determinare quali argomenti emergano vincitori (giustificati) dallo
scontro con i loro contro-argomenti, quali siano sconfitti, e quali siano difendibili (non
sconfitti, ma neppure vincitori).
Logiche degli argomenti, come quella appena presentata sono state usate per realizzare sistemi informatici che, anziché limitarsi a fornire una risposta univoca ai quesiti
loro proposti, elaborino giustificazioni per la soluzione di punti controversi, suggeriscano argomenti possibili, valutino lo stato degli argomenti alla luce dell’architettura argomentativa complessiva risultante dalle informazioni fornite al sistema (gli argomenti, i
contro-argomenti e i meta-argomenti costruibili con tali informazioni e le loro relazioni).354 La realizzazione di tali sistemi richiede nuovi linguaggi per la rappresentazione
della conoscenza, sufficientemente espressivi da cogliere le strutture fondamentali della
CAPITOLO 6. L’INTELLIGENZA ARTIFICIALE
311
conoscenza giuridica (le regole, i diritti, i casi, i principi, i valori, ecc.) e nuovi metodi
di inferenza, che riproducano i passi tipici del ragionamento giuridico (l’applicazione di
regole, il riferimento ai precedenti, il ragionamento teleologico, ecc.).355
Uno sviluppo ulteriore consiste nella realizzazione di sistemi tesi ad agevolare le
discussioni giuridiche (cooperative o conflittuali) indicando alle parti, in ogni momento
della loro interazione, quale sia lo stato di ogni argomento, e quali nuovi argomenti
possano essere rilevanti per l’oggetto della discussione. Inoltre tali sistemi mirano a
organizzare le informazioni fornite nel corso del dialogo in un’architettura di argomenti
e contro-argomenti (ragioni e contro-ragioni), dove ogni argomento sia collegato agli
argomenti che sostiene o attacca. Chi entra nella discussione può quindi accedere più
facilmente al punto del dibattito che lo interessa maggiormente, o rispetto al quale egli
voglia fornire un contributo. Tra le applicazioni, ricordo i sistemi intesi a promuovere
il dialogo democratico (la discussione di temi politici e amministrativi), o a facilitare
la soluzione di controversie mediante conciliazione. Questi sistemi si scontrano però
con la difficoltà di tradurre in strutture logiche uniformi (necessarie affinché il sistema
possa organizzare le argomentazioni fornite dalle parti), le molteplici e complesse forme
linguistiche in cui si svolge il dibattito giuridico.356