...

ppt

by user

on
Category: Documents
31

views

Report

Comments

Description

Transcript

ppt
1
Lez. 12
2
Il Paradigma Reattivo emerse nei tardi anni ‘80. Esso è importante
da studiare per almeno due motivi.
Primo, i sistemi robotici operanti in domini ristretti con compiti
limitati sono ancora oggi costruiti usando architetture reattive.
Secondo, il Paradigma Reattivo è la base per il Paradigma ReattivoDeliberativo Ibrido
3
Il Paradigma Reattivo scaturì dall'insoddisfazione del paradigma gerarchico e
dalle idee provenienti dall'etologia.
Anche se i vari sistemi reattivi possono o non possono aderire strettamente ai
principi dell'intelligenza biologica, generalmente imitano alcuni aspetti della
biologia.
L'insoddisfazione del Paradigma Gerarchico fu molto bene compendiata da
Rodney Brooks, che evidenziò la sua struttura orizzontale.
4
Invece, un esame della letteratura etologica suggerisce che
l'intelligenza è stratificata secondo una decomposizione verticale,
come mostrato qui
5
Secondo una decomposizione verticale, un agente
prevede in primo luogo behaviour di sopravvivenza
primitivi ed evolve poi verso strati nuovi di behaviour
che o riusano i behaviour più bassi e precedenti, oppure
interdicono altri behaviour, o creano in parallelo
behaviour più avanzati.
Gli elementi paralleli possono essere pensati a strati,
accatastati verticalmente. Ogni strato ha accesso a
sensori ed attuatori indipendentemente da qualunque
altro strato.
6
Se accade qualche cosa ad un behaviour avanzato, i
behaviour di livello più basso restano ancora operativi.
Questo ritorno ad un livello più basso imita il degrado di
funzioni autonome nel cervello.
Le funzioni nel cervello funzionano (come il respirare)
continuamente, indipendentemente da funzioni di ordine
più alto (come contare, riconoscere volti, progettare),
permettendo ad esempio ad una persona che ha un
danno al cervello, derivante ad esempio da un incidente
automobilistico, ancora di respirare, etc.
7
Molti lavori di Arkin, Brooks e Payton si sono
concentrati sulla definizione dei behaviour e sui
meccanismi per manipolare correttamente situazioni
quando più behaviour sono simultaneamente attivi.
Brooks propose un approccio noto ora come sussunzione
e costruì degli insetti robot con behaviour inseriti
direttamente nell’hardware.
8
Arkin e Payton usarono una metodologia di campi di
potenziale, favorendo realizzazioni software. Questi
approcci sono praticamente equivalenti. Il Paradigma
Reattivo incontrò inizialmente una forte resistenza da
parte dei clienti tradizionali di robotica, particolarmente
i militari e le agenzie per il controllo nucleare. Questi
utenti delle tecnologie robotiche erano preoccupati del
modo impreciso in cui behaviour distinti si combinavano
per formare un behaviour emergente e più ricco.
9
In
particolare,
i
behaviour
reattivi
non
sono
assoggettabili a dimostrazioni matematiche che mostrano
che essi sono sufficienti e corretti per un certo compito.
Alla fine, i tempi di esecuzione rapidi associati coi
behaviour riflessivi portarono alla loro accettazione da
parte degli utenti, proprio nel momento in cui i
ricercatori si erano spostati verso il paradigma ibrido per
introdurre anche elementi di intelligenza.
10
I behaviour possono operare concomitantemente e
sequenzialmente.
Di seguito le due architetture rappresentative,
sussunzione e campi di potenziale, sono confrontate e
contrapposte usando lo stesso task come esempio.
Vedremo in questa parte come una architettura
manipola behaviour concomitanti per produrre un
behaviour emergente.
11
Attributi del Paradigma Reattivo
L'attributo fondamentale del paradigma reattivo è che
tutte le azioni sono portate a termine attraverso
behaviour.
Come nei sistemi etologici, i behaviour sono un mapping
diretto degli input dei sensori con un pattern di azioni
motorie che sono usate poi per realizzare il compito.
Da una prospettiva matematica, i behaviour sono
semplicemente una funzione di trasferimento che
trasforma gli input sensoriali in comandi per gli
attuatori.
12
Per gli scopi di questo corso, un behaviour sarà trattato
come uno schema, e consisterà di almeno un schema
motore ed uno schema percettivo.
Lo schema percettivo contiene l'algoritmo per estrarre il
percetto e la sua forza (o valore), lo schema motore
contiene l'algoritmo per generare il pattern di azione per
un attuatore fisico.
Teniamo presente però che solo poche architetture di
robot reattivi descrivono i loro behaviour in termini di
schemi. Ma in pratica, le diverse realizzazioni con
behaviour
hanno
routine
motorie
e
percettive
riconoscibili, anche se raramente sono riportate come
schemi.
13
Il Paradigma Reattivo eliminò la componente di Pianificazione
della triade Percezione, Pianificazione, Azione, come mostrato in
Figura.
behaviour
behaviour
SENSE
behaviour
SENSE
behaviour
SENSE
behaviour
SENSE
behaviour
SENSE
SENSE
ACT
ACT
ACT
ACT
ACT
ACT
14
Le componenti di Percezione e Azione sono strettamente
accoppiate nei behaviour, e tutte le attività del robot
emergono come il risultato di questi behaviour che o
operano in sequenza o concomitantemente.
L’organizzazione S-A non specifica come i behaviour sono
coordinati e controllati.
La percezione nel Paradigma Reattivo è locale in ogni
behaviour, o behaviour-specifico.
15
Ogni behaviour ha il suo proprio sistema percettivo
dedicato. In molti casi, questo è implementato come un
sensore o schema percettivo per behaviour. Ma in altri
casi, più di un behaviour può prendere lo stesso output da
un sensore e può trattarlo differentemente (tramite gli
schemi percettivi dei singoli behaviour).
Un behaviour letteralmente non sa quello che un altro
behaviour sta facendo o sta percependo. La Fig. mostra
graficamente il meccanismo percettivo del Paradigma
Reattivo.
16
…....
17
Organizzazione S-A del Paradigma Reattivo in behaviour
multipli e concomitanti
Questo paradigma, come già detto, è fondamentalmente
opposto al modello di mondo globale usato nel
paradigma gerarchico.
Il percetto è immediatamente disponibile per lo schema
percettivo del behaviour che può fare poca o molta
elaborazione secondo le necessità per estrarre il percetto
prevalente.
Se è usata una affordance, computazionalmente poco
costosa, allora la parte percettiva del behaviour è quasi
istantanea e l’azione è molto rapida.
Come si è visto nel capitolo precedente relativo ai
fondamenti biologici del paradigma reattivo, i behaviour
18
favoriscono l'uso di affordances.
Brooks disse (rumorosamente) in una conferenza, "noi non
abbiamo bisogno di rappresentazioni puzzolenti" e scrisse un
lavoro dal titolo “Gli elefanti non giocano a scacchi” (1990).
Si dovrebbe notare che spesso la parte di schemi percettivi del
behaviour deve usare una rappresentazione behaviour-specifica o
una struttura dati per rivelatori specializzati capace di estrarre
affordances.
Per esempio, estrarre una regione rossa in un'immagine è nonbanale per un computer comparato con un animale che vede il
rosso.
Il punto è che mentre un programma di computer può dovere
avere strutture dati per simulare un semplice funzionamento
neurale, il behaviour non conta su alcuna rappresentazione
centrale fornita da tutti i sensori.
19
Nelle prime realizzazioni del paradigma reattivo, l'idea
di
"un sensore, un behaviour"
funzionò bene.
Per behaviour più avanzati, divenne utile fondere
l’output di sensori multipli all'interno di uno schema
percettivo per avere maggiore precisione o una migliore
misura della forza dello stimolo.
Questo tipo di fusione di sensori è permesso all'interno
del paradigma reattivo finché la fusione è locale al
behaviour.
20
Caratteristiche e connotazioni dei behaviour reattivi
Come visto precedentemente, un sistema robotico
reattivo decompone le funzionalità in behaviour che
accoppiano strettamente percezione ad azione senza
l'uso di interposizioni di rappresentazioni astratte
(globale).
Questa è una definizione ampia e vaga.
21
La connotazione primaria di un sistema robotico
reattivo è che risponde rapidamente.
L'accoppiamento stretto di percezioni ed azioni
permettono al robot di operare in tempo reale,
muovendosi alla velocità di 1-2 cm per secondo.
I behaviour possono essere implementati direttamente
in hardware come circuiti, o come algoritmi di
complessità computazionale bassa (0(n)).
22
Questo vuole dire che i behaviour reagiscono non solo
rapidamente rispetto al processo, ma sono
particolarmente veloci se comparati alle velocità di
esecuzione di Shakey e di altri robot legati al
paradigma gerarchico.
Una connotazione secondaria è che i sistemi robotici
reattivi non hanno nessuna memoria, limitandosi, i
behaviour reattivi, a quello che i biologi chiamerebbero
riflessi stimolo-risposta puri.
23
In pratica, molti behaviour esibiscono un pattern di
risposta di azione prefissata, laddove il behaviour
persiste per un periodo di tempo corto senza la
presenza diretta dello stimolo.
Il punto principale è che i behaviour sono controllati da
quello che sta accadendo nel mondo, duplicando così lo
spirito di meccanismi di releasing innati, piuttosto che
dal memorizzare e ricordare quello che il robot ha fatto
di recente.
24
Le cinque caratteristiche di quasi tutte le architetture che seguono il
Paradigma Reattivo sono:
1. I robot sono agenti situati che operano in una nicchia
ecologica. Come visto nella prima parte, agente situato vuole
dire che il robot è una parte integrante del mondo. Un robot ha
le sue proprie mete ed intenzioni. Quando un robot agisce,
cambia il mondo, e riceve una reazione immediata dal mondo
attraverso i sensori. Quello che il robot percepisce influenza le
sue mete e, il tentativo di soddisfarle, genera un nuovo ciclo di
azioni.
Attenzione che la situatedness è definita da un ciclo AzionePercezione alla Neisser.
Similmente, le mete del robot, il mondo nel quale opera e come
esso può percepire il mondo formano la nicchia ecologica del
robot.
Per enfatizzare questo, molti ricercatori di robotica dicono
25 che
loro stanno lavorando su robotica ecologica.
2. I behaviour servono come fondamenti di base per le
azioni del robot, ed il behaviour complessivo del robot è
quello che emerge.
I behaviour sono entità computazionali indipendenti, ed operano
concomitantemente. Il behaviour complessivo emerge di
conseguenza: non c'è nessun modulo "controllore" esplicito che
determina quello che sarà fatto, o funzioni che chiamano altre
funzioni.
Ci può essere un programma di controllo coordinato nello schema
di un behaviour, ma non c'è nessun controllore esterno di tutti i
behaviour per un dato compito.
Come con gli animali, l’"intelligenza" del robot è nell'occhio
dell'osservatore, piuttosto che in un specifico pezzo di codice.
Poiché il behaviour complessivo di un robot reattivo emerge dal
modo con cui i suoi behaviour individuali interagiscono, le
maggiori differenze tra le architetture reattive risiedono di solito
nello specifico meccanismo per le interazioni. Questi meccanismi
26
includono combinazione, soppressione, cancellazione.
3. Sono permessi solo behaviour-specifico locali.
L'uso di rappresentazioni della conoscenza astratte esplicite nel
trattare la percezione, anche se è behaviour-specifico, è evitato.
Qualunque percetto che richiede rappresentazione è espresso
mediante coordinate ego-centriche (robot-centriche).
Per esempio, si consideri l’evitare un ostacolo. Una
rappresentazione ego-centrica vuole dire che non è importante
che un ostacolo è nel mondo alle coordinate (x,y,z), ma solamente
dove è relativamente al robot.
I dati sensoriali, con l'eccezione del GPS, sono inerentemente egocentrici (e.g., un range finder ritorna una distanza dall'oggetto
più vicino al transducer), questo elimina l’elaborazione necessaria
per creare un modello del mondo, mentre estrae solo la posizione
degli ostacoli relativamente al robot.
27
4. Questi sistemi seguono i buoni principi della
progettazione software.
La modularità dei behaviour favorisce la decomposizione di un
task in behaviour componenti.
I behaviour sono esaminati indipendentemente, e possono essere
assemblati a partire da behaviour primitivi.
28
5. Modelli di behaviour ispirati ad animali sono spesso
citati come una base per questi sistemi o per un particolare
behaviour.
Diversamente dai primi giorni della robotica AI, dove c'era un
sforzo consapevole di non imitare l'intelligenza biologica ma di
ricorrere alla matematica e alla logica, nel paradigma reattivo è
accettabile usare gli animali come ispirazione per una collezione di
behaviour.
29
Lez. 13
30
I vantaggi di programmare con i behaviour
Costruire un sistema robotico secondo il Paradigma Reattivo è
spesso riportato come programmare con behaviour, poiché il
componente fondamentale di ogni realizzazione sono i behaviour.
Programmare con behaviour ha molti vantaggi, la maggior parte
dei quali sono coerenti coi buoni principi di ingegneria del
software.
I behaviour sono inerentemente modulari e facili da testare
isolati dal sistema (i.e., essi forniscono unità di test).
I behaviour forniscono anche possibili espansioni incrementali
delle capacità di un robot. Un robot diviene più intelligente
avendo più behaviour. La decomposizione comportamentale dà
luogo ad una realizzazione che opera in tempo reale ed è di solito
computazionalmente poco costosa.
Ciononostante vedremo che alcune volte la duplicazione di alcuni
sensori specializzati (come i flussi ottici) è lenta. Se i behaviour
sono realizzati in economia, allora la realizzazione reattiva31può
essere lenta.
Generalmente, la velocità di reazione di un robot reattivo è
equivalente ai tempi di stimolo-risposta negli animali.
I behaviour rappresentano dei buoni principi di ingegneria del
software utilizzando la decomposizione, la modularità e i test
incrementali.
Se il sistema robotico è programmato con il più alto grado di
indipendenza possibile (anche detto accoppiamento basso), il
progettista può mettere su biblioteche facili da capire, da
manutenere, e può riusare moduli che minimizzano i side effects.
Accoppiamento basso vuole dire che i moduli possono funzionare
indipendentemente l'uno dall'altro con minimi collegamenti o
interfacce, promuovendo così un facile riuso.
Coesione vuole dire che i dati e le operazioni contenute in un
modulo si riferiscono solo al goal di quel modulo.
32
Architetture rappresentative
Per implementare un Sistema Reattivo il progettista deve
identificare il set di behaviour necessario per il task. I
behaviour possono essere o nuovi o si possono usare behaviour
esistenti. L'azione complessiva del robot emerge da behaviour
multipli e concomitanti.
Quindi un'architettura reattiva deve offrire meccanismi per
1) gestire behaviour
2) determinare quello che accade quando behaviour multipli sono
attivi allo stesso tempo.
Un'altra caratteristica che distingue tra loro le architetture
reattive è come esse definiscono un behaviour.
33
Ci sono molte architetture che vanno bene con il Paradigma
Reattivo.
Le due più conosciute e meglio formalizzate sono la sussunzione e i
campi di potenziale.
La sussunzione fa riferimento a come i behaviour sono combinati.
Le metodologie a campi di potenziale costringono i behaviour ad
essere implementati come campi di potenziale, ed i behaviour
risultanti sono ottenuti dalla sommatoria dei rispettivi campi di
potenziale.
34
Un terzo stile di architettura reattiva che è popolare in Europa e in
Giappone è il rule encoding, dove il componente schema motore
del behaviour ed il meccanismo di combinazione sono
implementati secondo regole logiche. Le regole per combinare i
behaviour sono spesso ad hoc, e perciò non le tratteremo in questo
corso.
Altri metodi per combinare behaviour esistono, incluso metodi
fuzzy e il vincitore-prende-tutto, ma questi tendono ad essere
dettagli di realizzazione piuttosto che una vera e propria
architettura.
35
Si legga e commenti in una relazione l’articolo di Brooks:
Elephants dont’t play chess
distribuito a lezione.
La relazione è attesa tra una settimana.
36
Architettura a Sussunzione
L'architettura a sussunzione di Rodney Brooks è la più nota nei
sistemi puramente reattivi.
Parte della popolarità scaturisce dalla pubblicità che circonda i
molti robot naturalistici costruiti con la sussunzione. Come si può
vedere in Fig., questi robot davvero sembrano insetti dell’ordine
di grandezza di una scatola di scarpe, con sei gambe ed antenne.
In molte realizzazioni, i behaviour sono inseriti direttamente nel
hardware o su piccoli microprocessori, permettendo ai robot di
avere tutta la capacità di calcolo on-board (questo non era vero
per i microprocessori poco potenti di metà degli anni 1980).
Inoltre, i robot di Brooks furono i primi ad essere capaci di
camminare, evitando collisioni, salire su ostacoli senza le pause
del "muovi-pensa-muovi-pensa" di Shakey.
37
38
Il termine "behaviour" nell'architettura a sussunzione ha un
significato meno preciso che nelle altre architetture.
Un behaviour è una rete di moduli percezione-azione che portano
a termine un task. I moduli sono Augmented Finite State Machine
AFSM, che hanno registri, temporizzatori, e altri miglioramenti
per permettere loro di essere connessi con gli altri moduli.
Un AFSM è equivalente all'interfaccia tra gli schemi e la strategia
di controllo coordinato in un schema comportamentale. In termini
di teoria degli schemi, un behaviour di sussunzione è una raccolta
di uno o più schemi in un behaviour astratto.
39
Una Macchina a Stati Finiti (FSM) è un sistema computazionale
che cambia il suo stato in funzione dello stato corrente e
dell’input.
Essa può assumere un numero finito di stati differenti e passa
da uno stato all’altro secondo precise regole.
40
I behaviour sono attivati con una modalità tipo stimolorisposta, senza un programma esterno che li coordini e
controlli esplicitamente.
Ci sono quattro aspetti interessanti della sussunzione in termini
di attivazione e controllo :
1. I moduli sono raggruppati in strati di competenza.
Gli strati riflettono una gerarchia dell'intelligenza, o della
competenza. Strati più bassi incapsulano funzioni di
sopravvivenza di base come evitare collisioni, mentre livelli
più alti creano azioni dirette alla meta come ad esempio il
mapping di un ambiente.
Ognuno degli strati può essere visto come un behaviour
astratto per un particolare compito.
41
2. I moduli in un strato più alto possono avere la priorità, o
sussumere, l’output del behaviour nello strato adiacente più basso.
Gli strati comportamentali operano concomitantemente ed
indipendentemente, quindi si ha bisogno di disporre di un
meccanismo che si occupi dei conflitti potenziali.
La soluzione nella sussunzione è del tipo il vincitore-prenderetutto, dove il vincitore è sempre lo strato più alto.
42
3. L'uso di stati interni è evitato.
Per stato interno in questo caso si intende un qualunque tipo di
rappresentazione locale e persistente che rappresenta lo stato
del mondo, o un modello.
Poiché il robot è un agente situato, la maggior parte delle sue
informazioni dovrebbero venire direttamente dal mondo.
Se il robot dipende da una rappresentazione interna, quello che
esso crede può cominciare a divergere pericolosamente dalla
realtà.
Alcuni stati interni sono necessari per attivare behaviour come
essere spaventati o affamati, ma una buona progettazione li
minimizza.
43
4. Un task è portato a termine attivando lo strato opportuno che poi
attiva gli strati più bassi sotto di lui e così via.
In pratica, i sistemi a sussunzione non sono facilmente taskable,
ovvero, non possono ricevere l’ordine di fare un altro task senza
essere riprogrammati.
44
Ci sono quattro aspetti interessanti della sussunzione in termini
di attivazione e controllo :
1. I moduli sono raggruppati in strati di competenza.
2. I moduli in un strato più alto possono avere la priorità, o
sussumere, l’output del behaviour nello strato adiacente più
basso.
3. L'uso di stati interni è evitato quando possibile.
4. Un task è portato a termine attivando lo strato opportuno che
poi attiva gli strati più bassi sotto di lui e così via.
45
Esempi
Questi aspetti sono illustrati meglio da un esempio, preso e
modificato estensivamente dai lavori originali di Brooks al fine di
essere consistente con la terminologia della teoria degli schemi e
facilitare il paragone con la metodologia dei campi di potenziale.
Un robot capace di muoversi in avanti e non collidere con niente
potrebbe essere rappresentato con un solo strato, Livello 0.
In questo esempio, il robot ha sonar multipli (o altri sensori di
distanza), ognuno che punta in una direzione diversa, e due
attuatori, uno per andare avanti ed uno per girare.
46
Il modulo Sonar legge il
range dei sonar, fa ogni
possibile filtraggio del
rumore, e produce un
grafico polare.
Un grafico polare
rappresenta le letture di
distanze in coordinate
polari, (r, ), intorno al
robot.
Come mostrato in Fig.,
la trama polare può
essere sviluppata
linearmente.
47
Se la lettura del range del sonar rivolto in avanti è sotto una certa
soglia, il modulo COLLIDE annuncia una collisione e spedisce il
segnale di alt all'attuatore che gestisce il FORWARD. Se il robot si
sta muovendo in avanti, ora si ferma. Nel frattempo, il modulo di
FEELFORCE sta ricevendo lo stesso grafico polare. Esso tratta
ogni lettura del sonar come una forza repulsiva che può essere
rappresentata come un vettore.
48
FEELFORCE può essere pensato come un sommatore di vettori
formati da ognuna delle letture sonar. Questo dà luogo ad un
vettore nuovo. Il vettore repulsivo è passato poi al modulo di
TURN.
Il modulo di TURN fornisce la direzione per girare e la invia
all'attuatore di svolta. TURN passa il vettore anche al modulo
FORWARD che usa la grandezza del vettore per determinare la
grandezza del prossimo movimento in avanti (quanto lontano o
quanto veloce). Così il robot gira e va via per una piccola distanza
dall'ostacolo.
49
Il behaviour osservabile consiste nella verifica che il robot fa di
non trovarsi in un spazio occupato. Questo behaviour si ripete
finché un ostacolo non arriva vicino al robot. Se l'ostacolo è su un
lato del robot, il robot girerà di 180° nella direzione opposta e
andrà via.
Il robot può reagire ad un ostacolo se l'ostacolo (o robot) è
immobile o in lento movimento; la risposta è calcolata ad ogni
aggiornamento dei sensori.
50
Se parte dell'ostacolo, o un altro ostacolo, è messo davanti, il
robot si fermerà, poi applicherà i risultati di RUNAWAY. Cioè si
fermerà, girerà e comincerà a muoversi di nuovo in avanti. La
fermata impedisce al robot di urtare l'ostacolo mentre sta
girandosi.
Il livello 0 mostra come un set abbastanza complesso di azioni
può emergere da moduli molto semplici.
51
È utile rivedere l'architettura a sussunzione nei termini usati
finora in questo corso, come mostrato in Fig. Si noti come
questo somiglia alla decomposizione verticale del lucido 4:
i
dati sensoriali circolano attraverso i behaviour concorrenti
verso l'attuatore. I behaviour sono indipendenti.
Il modulo SONAR potrebbe essere considerato come
un'interfaccia globale verso i sensori, mentre i moduli TURN e
FORWARD sarebbero considerati come parte dell'attuatore
(un'interfaccia).
52
Per gli scopi di questo corso, un behaviour deve consistere di uno
schema percettivo e di uno schema motorio. Gli schemi percettivi
sono connessi ad un sensore, mentre gli schemi motori sono connessi
ad attuatori.
Per il Livello 0, gli schemi percettivi sarebbero contenuti nei moduli
FEELFORCE e COLLIDE.
Gli schemi motori sono i moduli RUNAWAY e COLLIDE.
COLLIDE combina sia il processo percettivo (estrae il vettore dal
sonar che guarda direttamente avanti) sia il pattern attuativo (dà
l'alt se c'è una lettura negativa).
I behaviour primitivi riflettono i due percorsi attraverso lo strato.
Uno potrebbe essere chiamato il behaviour di RUNAWAY e l'altro il
behaviour di COLLIDE. Insieme, i due behaviour creano un
behaviour per evitare ostacoli, o uno strato di competenza.
53
Si noti che i behaviour usano una percezione diretta, o affordances.
La presenza di una lettura di distanza indica che c’è un ostacolo; il
robot non sa di che tipo di ostacolo si tratti.
Supponiamo di costruire un robot che va in giro invece di stare
immobile, ma è sempre capace di evitare ostacoli. Sulla base dello
schema a sussunzione, può essere aggiunto un secondo strato di
competenza (Livello 1).
L1
L0
54
In questo caso, il Livello 1 consiste di un modulo WANDER che
elabora un andamento casuale ogni n secondi. L'andamento
casuale può essere pensato come un vettore. Esso ha bisogno di
passare la sua indicazione ai moduli TURN e FORWARD. Ma non
può essere passato direttamente al modulo TURN. Questo infatti
sacrificherebbe l’evitare gli ostacoli, perché TURN accetta
solamente un input. Una soluzione è di aggiungere un altro modulo
al Livello 1, AVOID che combina il vettore di FEELFORCE col
vettore di WANDER.
L1
L0
55
Aggiungendo un nuovo modulo AVOID si offre un'opportunità di
creare una risposta più sofisticata agli ostacoli. AVOID combina la
direzione della forza da evitare con la direzione desiderata. Questo
dà luogo alla direzione attuale che è rivolta più verso una direzione
corretta che verso la svolta che il robot avrebbe dovuto fare
facendo un avanzamento diretto. (Si noti anche che il modulo
AVOID è capace di "spiare" le componenti dello strato più basso).
L’output di una direzione di AVOID ha la stessa rappresentazione
dell’output di RUNAWAY così che TURN può accettare input da
entrambe le fonti.
56
Il problema ora è quello di stabilire quando accettare il vettore
di direzione e da quale strato.
La sussunzione rende questo semplice: l’output dal livello più
alto sussume l’output dal livello più basso.
La sussunzione è realizzata in uno dei due seguenti modi:
1. inibizione.
Nell’inibizione, l’output del modulo di sussunzione è
connesso all’output di un altro modulo. Se l’output del
modulo che sussume è "on" o ha un qualunque valore,
l’output del modulo sussunto è spento. L’inibizione agisce
come un rubinetto, cambiando da on a off l’output.
57
2. soppressione.
Nella soppressione, l’output del modulo che sussume è connesso
all’input di un altro modulo. Se l’output del modulo che sussume è
on, esso sostituisce l’input normale al modulo sussunto.
La soppressione agisce come uno switch, scambiando un input con
un altro.
In questo caso, il modulo AVOID sopprime (segnato nel
diagramma con una S) l’output da RUNAWAY.
RUNAWAY sta ancora
operando, ma il suo output
non va da nessuna parte.
Invece, l’output di AVOID
va a TURN.
58
L'uso di strati e sussunzione permette a nuovi strati di essere
costruiti sopra lo strato meno competente, senza cambiare gli
strati più bassi. Questa è buona ingegneria del software, poichè
facilita la modularità e semplifica il test. Essa aggiunge anche
un po' di robustezza nel senso che se qualche cosa dovesse
disabilitare il Livello 1, il Livello 0 è probabile che rimanga
intatto. Il robot sarebbe almeno capace di preservare il suo
meccanismo di autodifesa e quindi di fuggire quando si
avvicina agli ostacoli.
59
La Fig. mostra il Livello 1 rivisto come behaviour. Nota che
FEELFORCE è usato da RUNAWAY e AVOID.
FEELFORCE è la componente percettiva (nello schema) di ambo
i behaviour, con i moduli AVOID e RUNAWAY che sono il
componente motorio. Spesso accade che i behaviour sono
chiamati con il nome dell'azione osservabile. Questo vuole dire
che il behaviour (che consiste di percezione ed azione) e la
componente azione hanno lo stesso nome. La figura non mostra
che i behaviour AVOID e RUNAWAY hanno lo stesso schema
percettivo FEELFORCE. Come sarà visto nel prossimo capitolo,
le proprietà object-oriented dello schema theory facilitano il riuso
e la condivisione di componenti percettive e motorie.
60
Ora supponiamo di aggiungere un terzo strato per permettere al
robot di muoversi lungo un corridoio, come mostrato in Fig. (il
terzo strato nel lavoro originale di Brooks è "esplorare", perché lui
stava considerando un task di mappatura). Il modulo di LOOK
esamina il plot polare del sonar ed identifica un corridoio. (Si noti
che questo è un altro esempio di behaviour che condivide gli stessi
dati sensoriali ma li usa localmente per scopi diversi).
L2
L1
L0
61
Poiché identificare un corridoio è più costoso computazionalmente
che estrarre solo i dati di distanza, LOOK può richiedere più
tempo di elaborazione di quello richiesto dai behaviour a livelli più
bassi. LOOK passa il vettore che rappresenta la direzione in mezzo
al corridoio al modulo STAYINMIDDLE. STAYINMIDDLE
sussume il modulo WANDER e manda il suo output al modulo
AVOID che può eventualmente girare attorno agli ostacoli.
L2
L1
L0
62
Ma come fa il robot se il modulo di LOOK non ha calcolato una
direzione nuova? In questo caso il modulo INTEGRATE sta
osservando il moto attuale del robot dagli shaft encoders degli
attuatori. Questo dà una stima di quanto lontano dal centro il
robot abbia viaggiato dall'ultimo aggiornamento di LOOK.
STAYINMIDDLE può usare i dati raccolti per calcolare il vettore
per il nuovo corso.
Questo serve a colmare i
L2
vuoti negli adattamenti
dovuti a diverse velocità L1
di aggiornamento dei
diversi moduli. Si noti
che LOOK e
STAYINMIDDLE sono
alquanto sofisticati da unL0
punto di vista software.
63
INTEGRATE è un esempio di modulo che si preoccupa di un
eventuale stato interno pericoloso: esso opera sulla base di un
feedback dal mondo reale. Se per qualche ragione, il modulo di
LOOK non aggiorna mai, allora il robot potrebbe operare senza
alcuni dati sensoriali per sempre. O almeno finché non si rompe!
Perciò, sistemi con lo stile a sussunzione includono costanti di
tempo sulla soppressione e sull'inibizione.
Se la soppressione da STAYINMIDDLE funziona più a lungo di n
allora la soppressione cessa. Il robot comincia a vagare con una
buona speranza che qualunque sia il problema (come essere
entrato in un ambiente molto grande) che aveva condotto alla
perdita dei segnali si risolva.
64
Chiaramente, un altro problema è: come sa il robot che non ha
cominciato a percorrere il corridoio come avrebbe dovuto?
Risposta: non lo sa.
Il progetto presume che un corridoio sarà sempre presente nella
nicchia ecologica del robot.
Se non c’è, il robot non si comporta come previsto.
Questo è un esempio della connotazione i che sistemi reattivi sono
"senza memoria."
65
Sommario Sussunzione
• La sussunzione ha una debole definizione di behaviour come
accoppiamento stretto di percezione e azione. Anche se non è
un'architettura a schema-theory, essa può essere descritta in
questi termini.
Essa raggruppa moduli tipo schema in strati di competenza, o
behaviour astratti.
• Strati più alti possono sopprimere e inibire behaviour in strati
più bassi, ma behaviour in strati più bassi non sono mai riscritti
o sostituiti. Da un punto di vista della programmazione, questo
può sembrare strano. Comunque, così si imita l'evoluzione
biologica. Si ricordi che il behaviour descritto per le rane (Lez. 3)
era il risultato di due behaviour, uno che si muoveva sempre
verso gli oggetti in movimento e l'altro che sopprimeva questo
behaviour quando l'oggetto era grande.
66
• Il progetto di strati e componenti di behaviour per una
realizzazione della sussunzione, come con ogni altro progetto
comportamentale, è difficile; è più un'arte che una scienza.
Questo è vero per tutte le architetture reattive.
• Non vi è nulla che assomigli ad una pianificazione tipo STRIPS
nella sussunzione. Invece i behaviour sono attivati dalla presenza
dello stimolo nell'ambiente.
67
•La sussunzione risolve il Frame problem eliminando il bisogno di
modellare il mondo. Non ci deve preoccupare se il mondo aperto è
non-monotono e non ha un tipo di meccanismo di mantenimento di
verità, perché i behaviour non ricordano il passato. Ci può essere
della persistenza percettiva che conduce ad un tipo di behaviour
con un pattern di azione fisso (e.g. seguire un corridoio), ma non
c'è nessun meccanismo che evidenzi i cambi nell'ambiente. I
behaviour semplicemente rispondono a qualunque stimolo
dell'ambiente.
68
•La Percezione è diretta, usando le affordances. Il releaser per un
behaviour è quasi sempre il percetto per guidare lo schema motore.
•La percezione è ego-centrica e distribuita. Nell'esempio del
WANDER (strato 1), il plot polare del sonar è relativo al robot. Un
plot polare nuovo viene creato ad ogni aggiornamento dei sensori.
Il plot polare è anche disponibile per qualunque processo ne abbia
bisogno (memoria globale e condivisa), permettendo ai moduli
utente di essere distribuiti. L’output dallo schema percettivo può
essere condiviso con gli altri strati.
69
PROPOSTE DI PROGETTO
SIMULAZIONE
1. Operai – Dato un ambiente con ostacoli fissi di colore blu,
contenenente un certo numero di oggetti gialli. Progettare un
team di robot (da due a 5 a scelta) che individuano gli oggetti
gialli e li spingono (o trasportano insieme) in una prefissata
posizione di accumulo.
70
PROPOSTE DI PROGETTI
HARDWARE
1. Simulare il comportamento di tre robot. L’ambiente è
costituito da una tana, degli ostacoli e il cibo. Un robot va in
esplorazione, cerca il cibo, quando lo trova chiama gli altri
due robot. Quando questi arrivano nei pressi del primo
robot questi concede l’accesso al cibo ai due altri robot e
regola il loro ritorno alla tana.
71
Lez. 14
72
Metodologie a Campi di potenziale
Un altro stile di architettura reattiva è basato sui campi di
potenziale. Le architetture specifiche che usano il tipo a campi di
potenziale sono troppo numerose per essere descritte tutte, per cui
ci limiteremo ad una generalizzazione.
Lo stile a campo di potenziale dei behaviour fa uso sempre di
vettori per rappresentare i behaviour e della somma vettoriale per
combinare vettori di behaviour diversi per produrre un behaviour
emergente.
73
Visualizzazione dei campi di potenziale
Il primo dogma di un'architettura a campi potenziale è che
l'azione motoria di un behaviour deve essere rappresentata come
un campo di potenziale .
Un campo di potenziale è un array, o campo di vettori.
Un vettore è una struttura matematica che consiste di una
ampiezza ed una direzione.
Un vettore V può essere descritto anche come un coppia (m,d),
dove m sta per ampiezza e d per direzione.
Per convenzione l’ampiezza è un numero reale tra 0 e 1, ma in
generale può essere qualunque numero reale.
74
L'array rappresenta una regione di spazio.
In molte applicazioni robotiche lo spazio è bidimensionale,
rappresentando una prospettiva a volo di uccello del mondo come
fosse una mappa.
La mappa può essere divisa in quadrati, creando una griglia (x,y).
Ogni elemento dell'array rappresenta un quadrato dello spazio.
Oggetti percepibili nel mondo esercitano un campo di forza sullo
spazio circostante.
Il campo di forza è analogo ad un campo magnetico o
gravitazionale.
Il robot può essere pensato come una particella che entra nel
campo emesso da un oggetto o da un ambiente. Il vettore
rappresenta la forza, cioè la direzione di rotazione e l’ampiezza o
velocità da intraprendere in quella direzione.
I campi di potenziale sono continui e ad ogni punto nello spazio è
75
associato un vettore.
La Fig. mostra come un ostacolo produce un campo sul robot e lo fa fuggire. Se il
robot è vicino all'ostacolo, diciamo entro i 5 metri, esso è nel campo di potenziale,
allora si genera una forza che lo spinge ad allontanarsi dall'ostacolo.
Se il robot non è all'interno del raggio dell'ostacolo, esso resta là perché nessuna
forza è applicata su lui. Si noti che il campo rappresenta quello che dovrebbe
fare il robot (lo schema motorio) se il robot percepisse un ostacolo (lo schema
percettivo).
Il campo non dà conto di come il robot arriva vicino all'ostacolo; il robot sente la
stessa forza sia se si sta muovendo all'interno del raggio sia se sta fermo al suo
interno.
76
Un modo di pensare ai campi di potenziale è di immaginare un
campo di forza che agisce sul robot. Un altro modo è pensare a
loro come ad una superficie di energia potenziale in tre
dimensioni (la gravità spesso è rappresentata così) ed il robot
come una palla di marmo. In questo caso, il vettore indica la
direzione verso cui il robot rotolerebbe sulla superficie.
Dossi sulla superficie fanno sì che il robot rotoli via o giri
intorno (i vettori dovrebbero puntare lontano dalla "vetta" della
collina), e le valli fanno sì che il robot rotoli verso il basso
(vettori che puntano verso il fondo).
77
Ci sono cinque campi di potenziale di base, o primitivi che
possono essere combinati per costruire campi più complessi:
uniforme, perpendicolare, attrattivo, repulsivo, e tangenziale.
La Fig. a mostra un campo uniforme.
In un campo uniforme, il robot dovrebbe sentire la stessa forza
indipendentemente da dove si trova e quale orientamento abbia.
Esso dovrebbe sentire il bisogno di girare e allinearsi alla
direzione della punta della freccia e muoversi in quella direzione
ad una velocità proporzionale alla lunghezza della freccia. Un
campo uniforme si usa spesso per descrivere il behaviour "va in
direzione di ….”.
78
La Fig. b mostra un campo perpendicolare, dove il robot è orientato
perpendicolarmente all'oggetto o al muro o al confine. Il campo
mostrato è diretto fuori dal muro grigio, ma un campo
perpendicolare può essere puntato anche verso un oggetto.
79
In Fig. c si illustra un campo attrattivo. Il cerchio al centro del campo
rappresenta un oggetto che sta esercitando un'attrazione sul robot.
Dovunque il robot sia, il robot sentirà una forza dovuta all'oggetto. I
campi attrattivi sono utili per rappresentare un qualche tropismo,
dove l'agente è letteralmente attirato da luce, cibo o una meta.
L'opposto di un campo attrattivo è un campo repulsivo, mostrato in
Fig. d. I campi repulsivi sono associati comunemente agli ostacoli, o
cose che l'agente dovrebbe evitare. Più vicino il robot è all'oggetto,
più è forte la forza repulsiva che lo allontana di 180° via da lui.
80
L’ultimo campo primitivo è il campo tangenziale in Fig. e.
Il campo è una tangente attorno all'oggetto (si pensi ad un vettore
tangente come perpendicolare alle linee radiali che si estendono
verso l’esterno dell'oggetto).
I campi tangenziali possono essere orari o antiorari; la Fig. e mostra
una rotazione oraria. Essi sono utili per spingere un robot a girare
attorno ad un ostacolo, o un robot a investigare su qualche cosa.
81
Profili di ampiezze
Si osservi che nelle Fig. c,d,e la lunghezza delle frecce è diversa a
seconda della distanza dall'oggetto. Il modo in cui l’ampiezza dei
vettori cambia nel campo è stata chiamata profilo di ampiezza. (Il
termine “profilo di ampiezza” è usato qui perché il termine profilo di
velocità è usato dagli ingegneri di controlli automatici per descrivere
come i motori di un robot accelerano e rallentano per produrre un
particolare movimento senza dare scosse.)
82
Si consideri il campo repulsivo in Fig.
Matematicamente, il campo può essere rappresentato in coordinate
polari ed il centro del campo è l'origine (0, 0):
(4.1) Vdirection
= -Ф
Vmagnitude = c
In questo caso, l’ampiezza è un valore costante c; la lunghezza delle
frecce cioè rimane la stessa. Questo può essere visualizzato con un
plot della ampiezza mostrata in Fig. a.
a
83
Questo profilo dice che il robot fuggirà (la direzione verso cui
correrà è -Ф), sempre alla stessa velocità, non importa quanto
vicino sia all'oggetto, finché è nel raggio dell'ostacolo. Appena il
robot esce dal raggio d’azione dell'ostacolo, la velocità cade a 0,
fermando il robot.
Il campo è essenzialmente binario: il robot o sta fuggendo a
velocita' costante o si ferma.
In pratica c’è qualche problema con l’ampiezza costante. Si può
infatti produrre un moto a scatti lungo il perimetro del raggio
d’azione del campo. Questo si nota quando un robot andando in
una particolare direzione, incontra un ostacolo. Fugge, lasciando
quasi immediatamente il campo, poi torna indietro di nuovo sul
suo percorso originale, incontra il campo di nuovo, e così via.
84
I profili di ampiezza rendono anche possibile al progettista
rappresentare la riflessività (una risposta che dovrebbe essere
proporzionale alla forza dello stimolo) e creare risposte interessanti.
Si consideri il profilo in Fig. b. Esso può essere descritto dal
comportamento visto da un osservatore che guarda il robot :
se il robot è lontano dall'oggetto, esso andrà in giro e si muoverà
rapidamente, quando si dirige verso l’oggetto inizierà a rallentare
per evitare di colpirlo.
85
In matematica, questo andamento è detto linear drop off
(esaurimento lineare), perché la velocità alla quale l’ampiezza si
esaurisce può essere rappresentata da una linea retta. La formula di
una retta è y = mx + b dove x è la distanza e y èy l’ampiezza. b
m
 x ). Qualunque
influenza l'inizio della linea e m è l’inclinazione (
valore di m e b è accettabile. Se non è specificato, m = 1 o -1 (una
inclinazione di 45° in su o in giù) e b = 0 per le funzioni lineari.
Il profilo lineare in Fig. b soddisfa il behaviour desiderato dal
progettista di avere un robot che reagisca di più, quanto più è vicino.
86
Per catturare il bisogno di una reazione forte e più accentuata si
deve usare un altro profilo. Un tale profilo è una funzione detta a
esaurimento esponenziale in cui l’esaurimento è proporzionale al
quadrato della distanza: per ogni unità di distanza dall'oggetto
la forza sul robot diminuisce della metà.
87
Come si può vedere dagli esempi precedenti, quasi nessun
profilo di ampiezza è accettabile. La motivazione di usare profili
di ampiezza è quella di raffinare il behaviour.
È importante notare che il robot calcola solamente i vettori che
agiscono su di lui nella sua posizione corrente. Le figure, invece,
espongono il campo intero per tutte le possibili ubicazioni del
robot.
La domanda che sorge è: perché le figure mostrano un campo
intero su uno spazio?
Prima di tutto, questo aiuta a visualizzare quello che il robot farà
complessivamente, non solo ad un particolare istante di tempo.
Secondo, siccome i campi sono rappresentazioni continue, questa
è una semplificazione che conferma se il campo è corretto e rende
subito evidente ogni cambio improvviso.
88
Campi di potenziale e percezione
Negli esempi precedenti, la forza del campo di potenziale in ogni
dato punto era una funzione del profilo di ampiezza e della
distanza relativa tra il robot ed un oggetto.
La forza di un campo di potenziale può però essere una funzione
dello stimolo, indipendentemente dalla distanza. Come esempio si
richiama dalla lez. 3 il behaviour di cibo per il piccolo di rondine
artica dove il behaviour cibo è guidato dallo stimolo "rosso."
Questo può essere modellato da un campo attrattivo. Più grande e
rosso è un oggetto nel campo visivo del piccolo, più forte
l'attrazione, suggerendo un profilo di ampiezza che usa una
funzione esponenziale crescente.
Un altro importante punto che già è stato menzionato è che i
campi di potenziale sono ego-centrici perché la percezione di un
robot è ego-centrica.
89
Programmazione di un singolo campo di potenziale
I campi di potenziale sono facili da programmare, specialmente
quando sono ego-centrici rispetto al robot.
La visualizzazione di un intero campo può indurre a pensare che il
robot e gli oggetti sono in un sistema di coordinate fisso, assoluto,
ma in realtà non lo sono.
Il robot calcola l'effetto del campo di potenziale, di solito come
una linea retta, ad ogni aggiornamento senza memoria di dove era
prima o dove il robot si è mosso.
Vediamo alcuni esempi.
90
Un campo di potenziale primitivo è rappresentato usualmente da
una sola funzione. Il vettore che ha un impatto sul robot è
calcolato ad ogni aggiornamento. Si consideri il caso di un robot
con un solo sensore di distanza rivolto in avanti. Il progettista
decide che è adatto un campo repulsivo con una attenuazione
lineare. La formula è:
Vdirection
= -180°
Vmagnitude
=
 D  d 

per d  D

 D

0
per d >D 
dove D è il range massimo dell'effetto del campo, o la massima
distanza a cui il robot può scoprire l'ostacolo.
(D non è sempre la distanza di rilevamento. Può essere la distanza alla quale il
robot dovrebbe rispondere ad un stimolo. Per esempio, molti sonar possono scoprire
ostacoli lontani 60 cm, producendo una risposta quasi infinitesima nel behaviour
emergente ma richiedendo un alto runtime per la chiamata di funzione). In pratica,
un robotico metterebbe un D di 2 metri).
Si noti che la formula produce un risultato quando
0.0 <= Vmagnitude <= 1.0.
91
Questo è un frammento di codice C che cattura il campo repulsivo.
typedef struct {
double magnitude;
double direction;
} vector;
vector repulsive(double d, double D)
{vector outputVector;
if (d <=D)
{
outputVector.direction =180; // si gira!
outputVector.magnitude = (D-d)/D; // decadimento
lineare
}
else {
outputVector.direction=O.O
outputVector.magnitude=O.O
}
return outputVector;
}
92
A questo punto, è facile illustrare come un campo di potenziale può
essere usato da un behaviour, RUNAWAY, per il robot con un solo
sensore. Il behaviour RUNAWAY userà la funzione repulsive() come
schema motorio, ed una funzione readSonar() come schema
percettivo. L’output del behaviour è un vettore.
RUNAWAY è chiamato dal robot ad ogni ciclo di aggiornamento.
vector RUNAWAY()
{ vector Voutput;
double reading;
reading=readSonar(); // schema percettivo
Voutput =repulsive(reading, MAX_DISTANCE);// schema
return Voutput;
// motorio
}
// ****************** MAIN **************
while (robot==ON)
{
double Vrunaway;
Vrunaway=RUNAWAY(reading); // schema motorio
turn(Vrunaway.direction);
forward(Vrunaway.magnitude*MAX_VELOCITY);
93
}
Combinazione di behaviour e Campi
Come affermato precedentemente, il primo attributo di una vera
metodologia di campi di potenziale è che essa richiede che tutti i
behaviour siano implementati come campi di potenziale.
Il secondo attributo è che essa combini i behaviour non mediante
una sussunzione uno dell’altro, ma mediante una sommatoria di
vettori.
Un robot avrà generalmente forze agenti su lui provenienti da
behaviour multipli e concomitanti.
Vogliamo fornire due esempi di come behaviour multipli sorgono e
come sono implementati e sono combinati.
94
Un primo esempio è la semplice navigazione di un robot che sta
perseguendo una meta (specificata come "10.3 m in direzione
Θ") ed incontra un ostacolo. Lo schema motorio del behaviour di
move2goal è rappresentato con un campo di potenziale attrattivo
che usa gli shaft encoder del robot per dire se è giunto alla
posizione di meta. Il behaviour RUNAWAY è un campo repulsivo
ed usa un sensore di distanza per scoprire se qualche cosa è di
fronte a lui.
G
O
95
La Fig. mostra una vista a volo di uccello dell'area di azione, e
mostra una visualizzazione del campo di potenziale. Il behaviour
di move2goal in Fig. b esercita un campo attrattivo sull’intero
spazio; dovunque sia il robot, esso sarà attratto dalla meta. Il
behaviour RUNAWAY in Fig. a esercita un campo repulsivo in un
raggio attorno all'ostacolo (tecnicamente il campo repulsivo si
estende su tutto lo spazio come fa move2goal, ma la ampiezza della
repulsione è 0.0 oltre il raggio d’azione). Il campo combinato è
mostrato in Fig. 4.16 c.
G
R
O
96
Ora si consideri il behaviour emergente del robot immerso in
questo campo quando parte dall'angolo in basso a sinistra,
mostrato in Fig.
Al tempo t0, il robot sente il mondo. Può percepire solamente la
meta e non può percepire l'ostacolo, così l'unico vettore che sente
è attrattivo (RUNAWAY ritorna un vettore di ampiezza 0.0). Esso
si muove su una linea retta verso la meta. A t2, aggiorna i suoi
sensori ed ora percepisce la meta e l'ostacolo. Entrambi i
behaviour offrono un vettore; i vettori sono sommati ed il robot
ora si allontana. A t3, il robot si è mosso già oltre l'ostacolo e la
meta va ora esercitando la forza più forte. A t4, riprende la corsa e
raggiunge la meta.
O
G
t3
t4
t5
t2
t1
t0
97
L'esempio illustra anche altri punti sui metodi a campi di
potenziale: l'impatto della velocità di aggiornamento e i minimi
locali. Si noti che la distanza (lunghezza delle frecce) tra
aggiornamenti è diversa. Questo è dovuto ai cambi nella ampiezza
del vettore di output che controlla la velocità del robot. Se il robot
ha un vettore più "corto", viaggia più lentamente e, perciò, copre
meno distanza nello stesso ammontare di tempo. Può anche
superare il segno tra un aggiornamento e l’altro come visto tra t3
e t4 dove il robot va veloce senza girare e quindi deve tornare
indietro. Il cammino sarà più breve se l’aggiornamento è più
frequente.
98
Un altro aspetto della frequenza di aggiornamento è che il robot
può superare la meta, specialmente se sta usando shaft encoders
(la meta è a 10.3 metri da dove il robot è partito). Qualche volta i
progettisti usano campi attrattivi con una ampiezza che si attenua
man mano che il robot si avvicina, facendo rallentare il robot che
così può dire che è giunto alla meta. (I programmatori mettono di
solito una tolleranza sull'ubicazione della meta, per esempio
invece di 10.3m la meta è l0.3m0.5m.)
99
I campi di potenziale trattano il robot come se fosse una particella
che può cambiare istantaneamente velocità e direzione. Questo
non è vero per i robot reali. Robot di ricerca come Khepera
(mostrato in Fig.) possono girare in qualunque direzione, ma
devono fermarsi prima e c'è un ammontare misurabile di errore a
causa dell’attrito tra le ruote e la superficie. Molti robot hanno
Ackerman, o sterzi di automobile, e chiunque ha tentato di
parcheggiare un'automobile sa che una macchina può andare
solamente in certe direzioni.
100
Un terzo problema è che i campi possono anche dare somma 0. In
Fig., si disegni una linea tra la Meta e l'Ostacolo. Lungo questa
linea dietro all’ostacolo, i vettori hanno solamente una testa
(direzione della freccia) e nessun corpo (lunghezza della freccia).
Questo vuole dire che l’ampiezza è 0 e che il robot se raggiunge
quel posto, si fermerà e non si muoverà più. Questo stato è
chiamato un problema di minimo locale, perché il campo di
potenziale ha un minimo, o un avvallamento che intrappola il
robot. Soluzioni al problema di minimi locali saranno descritte alla
fine del capitolo.
101
Esempio che usa un behaviour per sensore
Per avere un altro esempio di come è potente questa idea di
sommatoria di vettori, è utile considerare come RUNAWAY per
evitare ostacoli è implementato comunemente su veri robot. La Fig.
mostra una configurazione dei sensori di distanza IR su un robot
Khepera.
102
Siccome i sensori sono montati permanentemente sulla
piattaforma, il loro angolo αi, relativo al fronte è conosciuto. Se un
sensore riceve una lettura di distanza, qualche cosa è di fronte a
quel sensore. Sotto un campo repulsivo per RUNAWAY, il vettore
di input sarà di 180° opposto a αi. Il sensore non è capace di dire
molto sull'ostacolo: solo che si trova diritto di fronte a lui ed è ad
esso perpendicolare.
Se questo sensore fosse l'unico sensore sul robot, il behaviour
RUNAWAY sarebbe molto stringente. Ma cosa accade se, come nel
caso di Khepera, il robot ha più sensori di distanza? Gli ostacoli
più grandi saranno scoperti da più sensori allo stesso tempo.
In genere si ha un behaviour RUNAWAY per ogni sensore.
Questa operazione è chiamata istanziazione multipla dello stesso
behaviour.
103
Nel frammento di codice a istanziazione multipla sottostante si nota
che tutto quello che deve essere fatto è di aggiungere un ciclo per
sondare ogni sensore.
In questo caso sfruttiamo le due proprietà della somma vettoriale:
associativa (a+b+c+d) può essere calcolata come ((a + b) + c) + d),
commutativa (non importa in che ordine i vettori sono sommati).
while(robot==ON) {
vector.mag=vector.dir=0.0; //inizializza a 0
for (i=0; i<=numberIR; i++ {
vectorCurrent=RUNAWAY(i); guarda un certo sensore
vectorOutput=VectorSum(tempVector,vectorCurrent);
}
turn(vector.dir);
forward(vector.mag*MAX_VELOCITY);
104
}
Come si vede in Fig., il robot è capace di uscire fuori da una
trappola tipo caverna, detta un box canyon, senza costruire un
modello del muro. Ogni istanza offre un vettore, alcuni dei quali
hanno una componente X o Y che lo porta fuori.
Da una prospettiva etologica, il programma è elegante perché è
equivalente alla instanziazione di behaviour negli animali.
Si ricordi, nel Ch. 3 il modello di rana computrix e la sua
controparte nella vita reale, il rospo, dove ogni occhio vede e
risponde indipendentemente dall'altro occhio al passaggio di una
mosca. In questo caso, il programma tratta il robot come se avesse
8 occhi indipendenti!
105
Da un punto di vista robotico, l'esempio illustra due punti
importanti.
Primo, l'accoppiamento diretto delle operazioni di sentire e di
agire.
Secondo, la programmazione con behaviour è consistente con le
buone pratiche di ingegneria del software. La funzione
RUNAWAY esibisce una coesione funzionale, dove la funzione fa
una sola cosa e bene ed ogni asserzione nella funzione ha
direttamente qualche cosa a che fare con lo scopo della funzione.
La coesione funzionale è desiderabile, perché questo vuole dire
che è improbabile che la funzione presenti side effects nel
programma principale o che sia dipendente da un'altra funzione.
L'organizzazione complessiva mostra l’accoppiamento dei dati,
dove ogni chiamata di funzione prende un semplice argomento.
L’accoppiamento dei dati è buono, perché ciò vuole dire che tutte
le funzioni sono indipendenti; per esempio, il programma
106 può
essere cambiato facilmente per tener conto di più sensori.
L'alternativa alla instanziazione multipla è fare in maniera che lo
schema percettivo di RUNAWAY processi tutte le 8 letture di
distanza. Un approccio è quello di sommare internamente tutti gli
8 vettori. (Si può facilmente vedere che il vettore risultante è lo
stesso) . Questo non è elegante dal punto di vista dell’ingegneria
del software perché il codice ora è specifico del robot (si dice che la
funzione ha una coesione procedurale), e può essere usato
solamente con un robot che ha otto sensori di distanza in quelle
ubicazioni.
Un altro approccio che produce un behaviour emergente diverso è
quello che prevede che lo schema percettivo ritorni la direzione e la
distanza delle sole letture di distanza più grandi. Questo rende il
107
behaviour più selettivo.
Lez. 15
108
I campi di potenziale comparati con la sussunzione
Come possiamo formare un behaviour emergente più complicato
dei semplici behaviour?
Alla stessa maniera dei campi di potenziale più complicati che sono
costruiti da campi primitivi: combinando instanziazioni multiple
di behaviour primitivi.
Questo può essere visto rivisitando il behaviour di esempio che
descriveva l'architettura di sussunzione.
Nel caso del Livello 0 nella sussunzione, se non ci sono ostacoli
all'interno del raggio d’azione, il robot non sente la forza repulsiva
ed è immobile. Se un ostacolo entra all'interno del raggio d’azione
ed è rivelato da più di un sonar, ognuna delle letture sonar crea un
109
vettore, puntando il robot nella direzione opposta.
Nell'esempio della sussunzione , si può immaginare, che questi
vettori vengano sommati nel modulo RUNAWAY come mostrato in
Fig. In un sistema a campi di potenziale, ciascuna lettura sonar
rilascia un’istanza del behaviour RUNAWAYpf ("pf" è usato per
rendere chiaro quale RUNAWAY è assegnato). Il behaviour di
RUNAWAYpf usa un campo di potenziale repulsivo. I vettori di
output sono quindi sommati, e il vettore risultante è usato per
guidare la svolta e l’avanzamento del motore.
110
While (robot==ON)
{
vector.magnitude=vector.direction=0;
For (i=0; i<=numberSonars; i++)
{
Reading=readSonar ();
// schema percettivo
currentVector=runaway(reading); // schema motorio
vector=vectorSum(vector, currentVector);
}
turn(vector.direction);
forward(vector.magnitude*MAX_velocità);
}
111
Il modulo COLLIDE nella sussunzione non coincide con un
behaviour nella metodologia a campi di potenziale.
Si ricordi che lo scopo di COLLIDE è fermare il robot se tocca
un ostacolo; e questo accade se il behaviour RUNAWAY fallisce.
Questa descrizione va bene per la definizione di behaviour, cioè:
ha un input sensorio (distanza dall’ostacolo = 0) ed un pattern
riconoscibile dell'attività motoria (si ferma).
Ma non produce un campo di potenziale, a meno che un campo
uniforme di vettori di ampiezza 0 non sia considerato lecito. Se
fosse trattato come un behaviour, il vettore a cui esso
contribuisce sarebbe sommato con gli altri vettori prodotti dagli
altri behaviour. Ma un vettore di ampiezza 0 è la funzione
identità per la somma dei vettori, così un vettore COLLISION
non avrebbe alcun impatto. Invece le collisioni sono spesso
trattate come situazioni di "panico", provocando una risposta di
112
emergenza fuori della struttura del campo di potenziale.
Alcune differenze più sottili tra campi di potenziale e sussunzione
appaiono quando è considerato il caso del Livello 1. La stessa
funzionalità può essere portata a termine aggiungendo un solo
blocco di behaviour WANDER, come mostrato in Fig.
113
Come prima, il behaviour genera una direzione nuova per
muoversi ogni n secondi. Questo potrebbe essere rappresentato
da un campo di potenziale uniforme dove il robot sente la stessa
attrazione ad andare in una certa direzione, incurante di dove si
trova, per n secondi. Comunque, combinando l’output di
WANDER con l’output dei vettori di RUNAWAYpf, il bisogno di
un nuovo behaviour AVOID è eliminato. Il vettore WANDER è
sommato al vettore repulsivo e di conseguenza, il robot si
allontana contemporaneamente dagli ostacoli e va verso la
direzione desiderata. Questo è mostrato in Fig.
114
Le differenze principali in questo esempio sono che i campi di
potenziale esplicitamente incapsulano percezione e azione in
behaviour primitivi, e non devono sussumere nessun behaviour
più basso. Come con la sussunzione, il robot diventa più
“intelligente” quando il behaviour WANDERpf viene aggiunto al
behaviour RUNAWAYpf.
Ora vediamo, per il Livello 2, come sarebbe implementato followcorridor in un sistema a campo di potenziale.
In questo caso si vede bene la differenza concettuale tra i due
approcci.
Il robot avrebbe due behaviour concorrenti: RUNAWAYpf e
follow-corridor. RUNAWAYpf rimarrebbe lo stesso di prima, ma
WANDER potrebbe essere scartato.
In termini di campi di potenziale, il task di seguire un corridoio
richiede due behaviour simili, mentre il task di vagare richiede
115
due behaviour diversi.
L2
L1
L0
FOLLOW-CORRIDOR
116
Il behaviour follow-corridor è interessante, perché richiede un
campo di potenziale più complesso.
Come mostrato in Fig., sarebbe desiderabile per il robot stare nel
mezzo del corridoio. Questo può essere fatto usando due campi di
potenziale: un campo uniforme perpendicolare al confine sinistro
e che punta al centro, ed un campo uniforme perpendicolare al
confine destro che punta al centro. Si noti che entrambi i campi
hanno un decremento lineare in ampiezza non appena il campo si
avvicina al centro del corridoio. In pratica questo abbassamento
impedisce al robot di oscillare al centro.
117
Si noti anche che i due campi uniformi non sono sufficienti perché
non permettono al robot di muoversi in avanti; il robot si
muoverebbe nel mezzo del corridoio e si fermerebbe là. Perciò si
aggiunge un terzo campo uniforme che è parallelo al corridoio.
Questi tre campi combinati producono un campo smussato che
spinge il robot nel mezzo del corridoio secondo una funzione di
prossimità al muro, mentre contemporaneamente il robot va
spostandosi in avanti. La figura sotto mostra i campi coinvolti. Si
ricordi, in questo esempio, che il robot non sta proiettando confini
passati o futuri del corridoio; la visualizzazione del campo lo fa
apparire così
118
Il behaviour di follow-corridor usa gli stessi dati dei sonar di
AVOID; perciò i muri produrranno un campo repulsivo che
generalmente spingerebbe il robot verso il mezzo del corridoio.
Perché non usare un solo campo parallelo uniforme per follow-
corridor?
Prima di tutto i behaviour sono indipendenti. Se c'è un behaviour
follow-corridor, esso deve essere capace di seguire i corridoi senza
dipendere da effetti collaterali dagli altri behaviour. Secondo, la
simmetria polare dei campi repulsivi può causare oscillazioni,
così c'è un vantaggio pratico ad avere un behaviour separato.
119
L'uso di conoscenza di behaviour-specifico del dominio (data al
momento
dell’instanziazione
come
un
parametro
di
inizializzazione opzionale) può migliorare ulteriormente il
behaviour complessivo del robot. Se il robot conosce l'ampiezza
del corridoio a priori, follow-corridor può sopprimere le istanze di
AVOID perché per gli ostacoli sa che quella è la forma del confine
del muro. Quindi eviterà solamente gli ostacoli che sono nel
corridoio. Se non ci sono ostacoli, follow-corridor produrrà una
traiettoria diritta. Se gli ostacoli sono prossimi ad un muro, il
follow-corridor tratterà il profilo dell'ostacolo come un muro e si
sposterà più vicino al centro.
120
Gli schema motori per un behaviour possono essere ordinati in
sequenza. Un esempio di questo è il behaviour di docking.
Docking (approccio) è quando un robot si deve muovere verso
una specifica ubicazione (la stazione di docking) con un certo
orientamento.
Questo è utile per i robot che maneggiano materiali in una
industria. Per prendere un pezzo di materiale da trasportare il
robot deve, nella sua posizione finale, essere abbastanza vicino al
lato giusto del nastro trasportatore e trovarsi rivolto verso di esso.
121
Poiché il docking richiede una specifica posizione ed
orientamento, non può essere fatto con un schema motorio
attrattivo. Con questo campo il robot andrebbe in linea retta
verso il nastro, anche se alle sue spalle; il robot si fermerebbe
dietro la posizione giusta con l’orientamento sbagliato. Invece, è
necessario un campo di attrazione selettivo. Qui il robot "sente"
solamente la forza attrattiva quando è all'interno di un certo
range angolare della stazione di docking, come mostrato in Fig.
122
Sfortunatamente l'attrazione selettiva non copre il caso di quando
il robot si avvicina dalla parte posteriore o di lato. Come si può
muovere un robot in un'area dove c’è un campo di attrazione
selettivo? Un modo per fare questo è avere un campo tangenziale
che permette al robot di orbitare attorno al dock finché non entra
nell'area di attrazione selettiva. La combinazione dei due schemi
motori produce un campo continuo che fa convergere il robot
nella posizione ed orientamento corretto, come mostrato in Fig..
123
124
Un aspetto interessante del behaviour di docking è quando il
robot sta operando in prossimità del dock.
Il dock rilascia un’istanza di AVOID che impedisce al robot di
andare vicino alla posizione desiderata.
In questo caso, i behaviour di docking devono attenuare
l’ampiezza (il guadagno) del vettore di output dell’AVOID
instanziato nell'area di dock.
Essenzialmente questo è come se inibisse in parte il behaviour di
AVOID in alcune regioni selezionate.
Avremo quindi che tra attrazione e repulsione il robot si ferma
dove l'attrazione selettiva del dock si bilancia con la repulsione.
I campi selettivi e tangenziali non sono sufficienti in pratica, a
causare delle limitazioni percettive. Se il robot non può vedere il
dock, non può istanziare i campi.
125
DOCKING
126
E’ probabile che un robot industriale sappia la direzione relativa
di un dock molto di più di quanto un'ape ricordi la direzione del
suo alveare. Perciò una forza attrattiva attira il robot vicino al
dock, e poi quando il robot vede il dock, comincia l’effetto di
incanalamento verso la posizione con l’orientamento corretto
anche in presenza di ostacoli, come si vede in Fig.
127
128
Almeno tre schemi percettivi sono necessari per il behaviour di
docking. Uno è necessario per estrarre la direzione relativa del
dock per l'attrazione regolare.
Un altro è uno schema percettivo capace di riconoscere il dock in
generale, anche dalla parte posteriore o dai lati, al fine di sostenere
il campo tangenziale.
Il terzo schema percettivo è necessario per il campo di attenzione
selettiva e deve essere capace di interagire con la parte anteriore
del dock e valutare la distanza e l’orientamento relativo del robot.
129
DOCKING
ATTRATTIVO
DOCKING
TANGENZIALE
DOCKING
SELETTIVO
∑
∑
130
Il behaviour di docking è definito quindi come costituito da tre
schemi percettivi e tre schemi motorii (potrebbero essere
raggruppati in 3 behaviour primitivi). Una rappresentazione in
termini di schema-theory indica che il behaviour ha alcuni
programmi di controllo per coordinare e controllare questi schemi.
131
Nel caso del behaviour di docking, una macchina a stati finiti è una
scelta ragionevole per coordinare la sequenza di schemi percettivi e
motorii.
Essa fornisce una maniera formale per rappresentare la sequenza,
ed anche ricorda al progettista di considerare transizioni di stato
fuori dell’ordinario.
Il robot per esempio potrebbe stare muovendosi verso il dock sotto
l’influenza dei campi tangenziali e dell’attenzione selettiva. Se una
persona gli passa davanti, essa occluderebbe la vista del dock e
quindi cesserebbe l’attrazione. Allora si riattiva lo schema motorio
di attrazione generale, e insieme allo schema percettivo associato
rivalutano la direzione del dock alla luce del nuovo ostacolo.
Il nuovo vettore permetterebbe al robot di evitare la persona
andando in una direzione favorevole al raggiungimento del dock e
tentare di raggiungerlo.
132
Il behaviour di docking illustra anche quale impatto hanno le
capacità sensoriali del robot sui parametri dello schema motorio.
Si noti che l’ampiezza angolare del campo di attenzione selettivo è
determinata dagli angoli ai quali il terzo schema percettivo
potrebbe identificare il dock.
Similmente il raggio del campo tangenziale e di attrazione selettiva
è determinato dalla distanza alla quale il robot può percepire il
dock.
133
Vantaggi e svantaggi
L’architettura a campo di potenziale ha molti vantaggi.
Il campo di potenziale è una rappresentazione continua che è facile
visualizzare su una grande regione dello spazio. Di conseguenza, è
più facile per il progettista visualizzare il behaviour complessivo
del robot.
È anche facile combinare campi, e, linguaggi come C++,
forniscono strumenti per la creazione di biblioteche
comportamentali.
I campi di potenziale possono essere parametrizzati: il loro range
di influenza può essere limitato e una funzione continua può
esprimere il cambio in ampiezza rispetto alla distanza (lineare,
esponenziale, ecc.).
Inoltre un campo bi-dimensionale di solito può essere esteso ad un
campo tri-dimensionale, e così behaviours sviluppati per 2D134vanno
bene anche per il 3D.
Costruire un sistema reattivo con campi di potenziale non è senza
svantaggi.
Il problema comunemente più citato con i campi di potenziale è
quello che campi multipli possono portare ad un vettore con
ampiezza 0; questo è chiamato il problema del minimo locale. Si
veda il caso del box canyon. Se il robot viene attirato in un punto
dietro il box canyon, il vettore attrattivo annullerebbe il vettore
repulsivo ed il robot rimarrebbe fermo perché tutte le forze si
annullerebbero. Il problema del box canyon è un esempio di
raggiungimento di un minimo locale.
In pratica, vi sono molte soluzioni eleganti per questo problema.
Una è quella di avere un schema motorio che produce vettori di
piccola ampiezza a partire da rumore casuale. Il rumore nello
schema motorio servirebbe a sbattere il robot fuori dai minimi
135
locali. Si vedano le reti neurali e il simulated annealing.
Un'altra soluzione è quella dei template di navigazione (Navigation
Templates), come quelle implementate da Mark Slack per JPL (Jet
Propulsion Lab – California Inst.of Tech.).
La motivazione è che il problema dei minimi locali spesso sorge a
causa di interazioni fra il behaviour di campo repulsivo di AVOID
e gli altri behaviour, come quello del campo attrattivo di muovereverso-una-meta. Il problema dei minimi scomparirebbe se il campo
di potenziale AVOID fosse in qualche modo più intelligente. In
NaTs, il behaviour AVOID riceve come input il vettore somma
degli altri behaviour. Questo vettore rappresenta la direzione verso
cui il robot andrebbe se non ci fossero ostacoli vicino. Per gli scopi
di questo corso, questo sarà chiamato vettore strategico.
Se il robot ha un vettore strategico, quel vettore dice che se c’è un
ostacolo esso deve essere superato sulla destra o sulla sinistra.136
Per esempio, se il robot sta attraversando un ponte (vedi Fig.),
vorrà passare alla sinistra degli ostacoli che stanno a destra per
stare nel mezzo. Nota che il vettore strategico definisce quello che
sta a sinistra e quello che sta a destra.
137
NaTs implementa questa semplice euristica nel campo di
potenziale per RUNAWAY, promuovendolo ad un vero AVOID. Il
campo di repulsione viene completato con un campo a orbita
tangenziale. La direzione dell'orbita (in senso orario o anti orario)
è determinato dalla posizione del robot cioè se è a destra o a
sinistra del vettore strategico.
L’output del behaviour AVOID può essere chiamato vettore tattico,
perché persegue la meta strategica del robot di fronte a sfide
immediate.
138
Una più recente soluzione al problema di minimi locali è stata
quella di esprimere i campi come funzioni armoniche. I campi di
potenziale implementati come funzioni armoniche sono garantiti
dal non avere un minimo locale pari a 0. Lo svantaggio di questa
tecnica è che è computazionalmente costosa, e deva essere
implementata su un chip VLSI per operare in tempo reale per
grandi aree.
139
Per riassumere i punti principali sulle architetture a campi di
potenziale:
• I behaviour sono definiti come formati da uno o più behaviour di
schemi motori e percettivi. Lo schema motorio per un behaviour
deve essere un campo di potenziale.
• Tutti i behaviour operano concomitantemente ed i vettori di
output sono sommati. I behaviour sono trattati alla pari e non sono
stratificati, anche se ci possono essere, come vedremo, behaviour
astratti che internamente ordinano in sequenza i behaviour. Il
programma di controllo coordinato non è specificato; il progettista
può usare la logica, oppure macchine a stati finiti, ogni qualvolta è
ritenuto opportuno. L’ordinare in sequenza è di solito controllato
da percezioni o affordances presenti nell'ambiente che sono viste
come releasers.
140
• Anche se tutti i behaviour sono trattati ugualmente, i behaviour
possono dare contributi diversi all'azione complessiva del robot. Un
behaviour può cambiare i guadagni rispetto a un altro behaviour,
riducendo o aumentando l’ampiezza del suo output. Questo vuole
dire che i behaviour possono inibire o eccitare gli altri behaviour,
anche se questo è usato in pratica raramente.
• La percezione di solito è gestita da percezioni dirette o
affordances.
• Una percezione può essere condivisa da diversi behaviour. Una
conoscenza a priori può essere data allo schema percettivo, per
simulare un sensore specializzato che è più sensibile ad eventi come
i confini di un corridoio.
141
La valutazione delle Architetture Reattive
Come visto dall'esempio di follow-corridor, le due architetture,
sussunzione e campi di potenziale, sono molto simili nella filosofia
e nei tipi di risultati che si ottengono. Essenzialmente, sono
equivalenti.
In termini di supporto alla modularità, entrambe decompongono,
le azioni e le percezioni necessarie per trasformare un task in un
behaviour, anche se c'è disaccordo sul livello di astrazione di un
behaviour.
La sussunzione sembra favorire una realizzazione hardware,
mentre i metodi dei campi di potenziale hanno interessanti
proprietà per un sistema orientato al software.
142
Un problema ancora aperto è se queste architetture mostrano una
buona trasportabilità verso altri domini. I sistemi reattivi sono
limitati a applicazioni che possono essere portate a termine con
behaviour riflessivi. Essi non possono essere trasferiti a domini
dove il robot ha bisogno di fare pianificazione, ragionando
sull'allocazione delle risorse, ecc. (questo ha portato al Paradigma
Ibrido).
143
In pratica, veramente pochi dei livelli dell’architettura a
sussunzione possono essere trasferiti a nuove applicazioni di
navigazione senza fare cambiamenti. Le diverse applicazioni
creano strati che hanno bisogno di sussumere differentemente gli
strati più bassi.
La metodologia dei campi potenziale fa un po' meglio nel senso
che il progettista può creare una libreria di behaviour e schemi tra
cui scegliere, senza un implicito ricorso ad uno strato più basso.
144
Nessuna architettura propone sistemi che potrebbero essere detti
veramente robusti.
La stratificazione della sussunzione impone un certo degrado se un
livello superiore è distrutto, ma non ha nessun meccanismo per
evidenziare che c’è stato un degrado.
Come negli animali, un robot reattivo farà cose consistenti con la
sua percezione del mondo, ma non sempre quelle giuste.
145
Fly UP