Comments
Description
Transcript
Metadata
Biblioteca Digitale Anno 2005 – 2006 GRUPPO METADATA Maestri Gianluca Dal Soglio Serena Conforti Laura Dazzi Enrico Vicini Matteo Cavicchia Daniele E-BOOK E FORMATI Un FORMATO DI FILE è la convenzione che viene usata per leggere, scrivere e interpretare i contenuti di un file. I vari formati di eBook possono essere suddivisi in TRE diverse categorie: 1) FORMATI TESTUALI Il tipo di formato più utilizzato per la realizzazione di eBook. 2) FORMATI DI IMMAGINI BMP, DjVu, JPG 3) FORMATI AUDIO DTB (Digital Talking Book) FORMATI Gli e-book vengono realizzati e pubblicati in diversi formati. Il mercato ha indirizzato le scelte dell'industria editoriale verso formati di e-book protetti, leggibili con software proprietario Proprietario: ogni formato, o più in generale ogni tecnologia, legata agli strumenti software e hardware di un singolo produttore I più diffusi formati proprietari per la realizzazione di e-book sono: lit di Microsoft, tk3 di Night Kitchen, pdb della Peanut Press e pdf di Adobe. FORMATI TESTUALI - FORMATI APPOSITAMENTE IDEATI PER GLI E-BOOK DesktopAuthor LIT Mobipocket OeB Palm Digital Media PDF - FORMATI NON APPOSITAMENTE IDEATI PER GLI E-BOOK ASCII CHM HTML Ms Word (.doc) PostScript RTF TeX METADATA • Metadata sono dati su altri dati o oggetti digitali. Sono usati per identificare e descrivere risorse digitali e non, localizzate in un sistema distribuito di rete. • Un esempio immediato di metadata è il catalogo di una biblioteca: gli elementi contenuti nella descrizione di un libro sono il titolo, l'autore, la localizzazione ed altre informazioni. Lo scopo del catalogo è quello di identificare il libro nella collezione e consentirne l'accesso. • Essi rivestono un ruolo fondamentale in qualsiasi biblioteca digitale in quanto, senza di essi, non si potrebbero eseguire operazioni di vitale importanza: dal recupero di documentazione significativa alla gestione amministrativa della medesima. TIPO DEFINIZIONE ESEMPI Amministrativo Metadata usato nella gestione e l’amministrazione delle risorse d’informazione Informazioni d’acquisto Diritti delle riproduzioni Richieste di documentazioni di accessi legali Informazioni di localizzazioni Criteri di selezioni per le digitalizzazioni Versioni di controllo e di differenziazione tra oggetti informativi simili Tracce audio create da sistemi di archiviazione Descrittivo Metadata usati per descrivere o identificare delle risorse informative Le registrazioni dei cataloghi Ricerca di risorse Indici specializzati Relazioni di iper connessioni tra le risorse Annotazioni degli utenti Metadata per sistemi di archiviazione generati da creatori di registrazioni Conservazione Metadata in relazione alla conservazione della gestione delle risorse informative Documentazione di azioni prese per conservare le versioni fisiche e digitali delle risorse. ES: il rinnovamento e lo spostamento dei dati Documentazioni delle condizioni fisiche delle risorse Tecnici Metadata relazionati al funzionamento di un sistema o al comportamento di un metadata Documentazione dell’hardware e del software Informazioni sulla digitalizzazione. Per esempio: il formato, i rapporti di compressione di grandezza Tracce dei sistemi dei tempi di risposta Dati d’autentificazione e di sicurezza. Ad esempio: chiavi criptate e password Utilizzo Metadata in relazione al livello e al tipo di uso delle risorse informative Esibizione dei dati Utilizzo e utilizzatori delle tracce Riutilizzo del contenuto e informazioni multiversione METADATA Lo sviluppo dei metadata bibliotecari è servito principalmente e innanzitutto a fornire un accesso fisico e intellettuale al contenuto. In breve, i metadata hanno la funzione di facilitare il raggiungimento dei seguenti obbiettivi: OBIETTIVI - SEARCHING, ovvero individuare l’esistenza di un documento; (Identificazione) - LOCATION, ovvero recuperare (Localizazzione) una particolare manifestazione del documento - SELECTION, (Selezione) ovvero analizzare, valutare e filtrare una serie di documenti; - SEMANTIC INTEROPERABILITY, ovvero permettere la ricerca in ambiti (Interoperabilità) disciplinari diversi; - AVAILABILITY, ovvero ottenere informazioni sulla effettiva disponibilità (Disponibilità) del documento; MODELLO OAI Il modello OAI può essere descritto a due livelli: MODELLO FUNZIONALE: ha due componenti 1) Data Provide 2) Service provider MODELLO TECNICO o "Harvesting di metadati": I service provider interrogano i data provider da cui prelevano i METADATI tramite il protocollo OAI-PMH, ("Protocol for Metadata Harvesting") e confezionano servizi di valore aggiunto, ponendosi più vicino all' utente finale perché ne facilitano la ricerca, l'individuazione e la localizzazione di oggetti digitali in rete. L’OAI SI BASA SU TRE LIVELLI 1. 2. 3. Dati: sono i “digit”, vengono chiamati anche documenti o oggetti digitali. Il modello del documento prevede che: Ogni documento deve avere dei metadata (Dublin Core) che lo descrivono perché essi devono essere catalogati. Ogni documento deve avere un codice univoco ed identificativo. Ogni documento deve essere strutturato secondo un determinato layout perché il documento è granulare (insieme di pezzi collegati) e questa sua caratteristica è espressa dallo standard XML. Metadata: quelli inseriti nei documenti vengono estratti dai motori di ricerca e possono essere utilizzati indipendentemente dai data provider. Su di essi si applica la diffusione della pubblicazione e pertanto c’è bisogno di un grande lavoro di standardizzazione. Interfaccia: ha a che fare con l’utente. DUBLIN CORE L’obiettivo del progetto Dublin Core è la definizione di uno standard che permetta la descrizione di ogni risorsa disponibile in Rete da parte degli autori stessi, in modo, 1) sia da garantire un livello minimo di autocatalogazione per ciascun documento 2) sia di costituire la premessa necessaria per realizzare eventuali indicizzazioni successive più sofisticate, con sistemi automatici o con catalogatori professionisti. DUBLIN CORE L'ultima versione del Dublin Core Metadata Element Set rilasciata dalla Dublin Core Metadata Initiative (DCMI) si è caratterizzata per: semplicità d'uso - può essere impiegata anche dai non specialisti della catalogazione interoperabilità semantica - i dati sono descritti per significato e valore flessibilità - integra e sviluppa la struttura dei dati con significati semantici diversi, è indipendente dall'applicazione software o hardware in uso e può descrivere oggetti differenti per tipologia e supporto. CONCLUSIONI UN’ESIGENZA LEGATA ALLO SVILUPPO DELLE COLLEZIONI DIGITALI E’ QUELLA DI OTTENERE UN ACCESSO INTEGRATO ALLE DIVERSE RISORSE DELLA BIBLIOTECA. LE BIBLIOTECHE DIGITALI FIN QUI REALIZZATE SONO COSTRUITE SULLA BASE DI COLLEZIONI, CHE NON HANNO ALCUN SIGNIFICATO FACILMENTE INTUIBILE PER GLI UTENTI, MENTRE LA LORO ORGANIZZAZIONE PARE BASARSI SU REGOLE CASUALI. SERVE DUNQUE, DAL PUNTO DI VISTA DELLE BIBLIOTECHE, UN SISTEMA DI GESTIONE DELLE RISORSE DIGITALI CHE FACILITI L’ACCESSO AI SERVIZI A ESSE COLLEGATE. RINGRAZIAMO PER LA CORTESE ATTENZIONE Gianluca Maestri Serena Dal soglio Laura Conforti Enrico Dazzi Matteo Vicini Daniele Cavicchia