...

Slides - Agenda Catania

by user

on
Category: Documents
24

views

Report

Comments

Transcript

Slides - Agenda Catania
Consorzio COMETA - Progetto PI2S2
FESR
Workload Management
System (WMS)
Elisa Ingrà INFN – Catania, Italy
Grid Tutorial per i Laboratori Nazionali
del Sud, Catania, 25-26 Febbraio 2008
www.consorzio-cometa.it
Contenuti
Panoramica dell’architettura
 Componenti e servizi
 Ciclo di vita del job
Catania, Grid Turorial per i Laboratori Nazionali del Sud, 25-27/02/2008
2/11
Panoramida dell’Architettura
Output Sandbox
Replicas info
Input Sandbox
Network Server
(Resource Broker)
tus
SE
&C
Ei
LHC File
Catalogue
nfo
Output
Sandbox
Jo
ta
bs
Input
Sandbox
Job submit event
Authentication &
authirization
User
Interface
Publish
Logging &
Bookkeeping
Information
Index
Computing
Element
Storage
Element
Workload Management System
components
Catania, Grid Turorial per i Laboratori Nazionali del Sud, 25-27/02/2008
3/11
Componenti e Servizi
• User Interface (UI)
– E’ il terminale per accedere ai servizi della griglia
– Command Line Interface (CLI)
– Portali grid (come GENIUS), applicazioni grafiche
• WMProxy/WMS
– Punto di accesso al Workload Management System
– Smista i job sulle varie risorse
– Implementa algoritmi di schedulazione
• Logging and Bookkeeping (LB)
– Tiene traccia delle azioni dell’utente
– Tiene traccia delle variazioni di stato dei job
• Computing Element (CE)
– E’ la risorsa computazionale che esegue il job
– Presenta un’interfaccia indipendente dal sistema sottostante
Catania, Grid Turorial per i Laboratori Nazionali del Sud, 25-27/02/2008
4/11
Ciclo di vita di un Job (1/4)
Input Sandbox
JobId
Network Server
(Resource Broker)
User
Interface
Logging &
Bookkeeping
• L’utente scrive un documento
• Il Resource Broker riceve e
(il job) in Job Description
memorizza il documento JDL
Language (JDL).
e i file di input allegati.
• Alcuni input file (Input
• Genera un codice univoco
Sandbox) possono essere
rappresentante il job appena
allegati al file JDL.
sottomesso e lo restituisce
all’utente.
• L’utente sottomette il file JDL
utilizzando istruzioni da riga di
comando e attende per qualche
risposta.
Catania, Grid Turorial per i Laboratori Nazionali del Sud, 25-27/02/2008
5/11
Ciclo di vita di un Job (2/4)
• Il Resource Broker esegue un algoritmo
(matchmaking) per decidere su quale CE fare
“atterrare” il job.
•
Il job verrà trasferito (con tutta la Input
Sandbox) al CE per l’esecuzione.
Input
Sandbox
• Il Computing Element accetta il job e lo mette
in coda.
Network Server
(Resource Broker)
Logging &
Bookkeeping
• Il job è eseguito sul Local Resources
Management System (LRMS)
Computing
Element
Catania, Grid Turorial per i Laboratori Nazionali del Sud, 25-27/02/2008
6/11
Ciclo di vita di un Job (3/4)
•
•
Quando il job termina la sua esecuzione, l’output è
inviato al Resource Broker.
Network Server
(Resource Broker)
Logging &
Bookkeeping
•
Allo stesso tempo il Computing Element manda un
messaggio di notifica al Logging & Bookkeeping
•
Così facendo l’output del job risulta essere disponibile
per essere scaricato dal Resource Broker
Output
Sandbox
Il Resource Broker riceve I risultati e I file contenuti
nella directory Output Sandbox e li memorizza nella
directory locale.
Computing
Element
Catania, Grid Turorial per i Laboratori Nazionali del Sud, 25-27/02/2008
7/11
Ciclo di vita di un Job (4/4)
Job-output
Output SandBox
User
Interface
Network Server
(Resource Broker)
Terminated
Job-status ?
• L’utente interroga il L&B per verificare lo stato dei
suoi job e realizza che il job ha terminato la sua
esecuzione.
• L’utente scarica l’Ouput Sandbox direttamente dal
WMProxy
• Il WMProxy ripulisce il repository locale (purging)
Logging &
Bookkeeping
• Il job ha terminato la sua esecuzione (cleared)
Catania, Grid Turorial per i Laboratori Nazionali del Sud, 25-27/02/2008
8/11
Macchina a stati del Job
Submitted: Il job è stato creato sulla UI ma
non ancora sottomesso
Waiting: Il job è in fase di
processamento da parte del WMProxy
Ready: Il job è stato
processato ma non inviato al
CE destinazione
Scheduled: Il job è nel CE in
coda in attesa di essere
eseguito
Running: Il job sta girando
sul Computing Element
Done: Il job ha
terminato la sua
esecuzione
Aborted: Il job è
stato abortito dal
WMS
Cancelled: Il job è
stato annullato
dall’utente
Cleared: Il job ha
terminato e l’output è
stato scaricato
Catania, Grid Turorial per i Laboratori Nazionali del Sud, 25-27/02/2008
9/11
Domande
Catania, Grid Turorial per i Laboratori Nazionali del Sud, 25-27/02/2008
10/11
Fly UP