Comments
Description
Transcript
View/Open
E-teadusraamatukogu ETERA E-terast tärkab mõte Andres Kollist 16.03.2016, Kääriku Digiteerimine – pildistamine ja tekstitöötlus • Pildistamise täpsus • Fookus, rastri tihedus - DPI, värvide pildistamise ja salvestamise täpsus • Tekstituvastus • Tarkvara, OCR, HQ OCR, vigade otsimine, kontroll - % ideaalist (5 – 50%), käsitöö maht, vilets ja ähmane trükk, erinevad tähestikud – Gooti kiri, Kirillitsa, ...., erinevad keeled... • Tarkvara Üleslaadimine ETERA-sse MediaInfo (Geneza) • Migreerimine säilituskeskkonda Töövoog DocWorks Pro (CCS) • Masin/käsitöö = 1/5 (1/4) objektide arv 20 234 lehekülgede arv 1 052 000 www.etera.ee • ETERA on TLÜ AR e-teadusraamatukogu, mis on ülemaailmselt kättesaadav elektrooniline keskkond • ETERAs on 2016 märtsi seisuga 20 234 objekti, millest 55,4% perioodika 12,1% raamatud 12,8% üliõpilastööd (sh doktori- ja magistritööd) 7,4% ajakirjad 5% jätkväljaanded vanad fotod ja postkaardid (897), graafika (49), aga ka Rahvusarhiivi ainueksemplaride digitaalsed koopiad (700), millest suure osa moodustavad Eesti retrospektiivsesse rahvusbibliograafiasse kuuluvad trükised Mida digiteerida? • Kogu Eesti asi, st alates Gutenbergist tänaseni – 50 milj lk. Kogu Norra asi ca 200 milj lk. • Meie prioriteet – Eesti teadus. • Baerist Einasto, Lotmani ja Aristeni • Mitte labor, kus teha põnevaid digiteerimisalaseid katseid • Vabrik, tootmisliin. Projektvõimsus 3 milj lk/a • võimaldab täistekstotsingut (kõik tekstid, sh gooti kirjas trükised) • Võimaldab (kui võimaldab) lugejat huvitavaid tekstikohti kopeerida (ka piltidega) ja jagada. • Igal leheküljel on oma ainulaadne identifikaator (link) Digiteerimise põhimõtted •Eelnevalt bibliografeeritud •Standardid ja head tavad •Arhiivkoopia eesmärk tagada info säilimine • Kasutuskoopia eesmärk laialdane kättesaadavus ja kasutatavus • Pigem vähem, aga paremini • Terviklikkus • Teadmine sellest, mis seal sees on Üldised nõuded • Kogu informatsioon, mis sisaldub digiteeritavas teavikus, peab sisalduma ka digitaalses koopias, see tähendab: peab olema võimalik lugeda kogu teksti; peab olema võimalik näha fotosid, illustratsioone, graafikuid jms; peab olema võimalik näha graafiliste elementide selgitusi (nt pildiallkirjad, graafikute legendid jms). • Kui digiteeritav teavik vajab restaureerimist, siis tuleb see teavik restaureerida enne digiteerimiskeskusesse suunamist Teavikute terviklikkus • Kõik digiteeritavad teavikud tuleb skaneerida tervikuna, mitte üksikute köidetena, osade või alajaotuste kaupa, sh ka tühjad leheküljed, kaaned. • Teaviku digiteerimisel tuleb säilitada tema esialgne struktuur. Kui digiteeritaval teavikul puuduvad osad leheküljed, tuleb puuduvate lehekülgede andmed ära märkida teavikut kirjeldavates metaandmetes. Värvisügavus • Värviliste fotode ja illustratsioonide, tekstiliste dokumentide, pooltoonides illustratsioonide, hallskaalal fotode ja illustratsioonide puhul 24 bit. Failivormingud • säilituskoopiana loodud pildid, tekstilised dokumendid ja illustratsioonid tuleb salvestada vormingus TIFF (ver 6.0). • tagatiskoopiana loodud pildid, tekstilised dokumendid ja illustratsioonid tuleb salvestada vormingus TIFF LZW. • kasutuskoopiana loodud pildid, tekstilised dokumendid ja illustratsioonid tuleb salvestada vormingus TIFF LZW ning dokumendid vormingus PDF (ver 1.7). Failinimed • Failide nimetamisel on aluseks elektronkataloog ESTER-is kasutusel olev unikaalne bibliokirje number. Failide tihendamine • Säilituskoopiaid ei tihendata. Kasutuskoopiad • Igast digiteeritavast teavikust peab moodustuma üks terviklik PDF-fail. • PDF-faili minimaalne lahutusvõime on 300 dpi-d. Kasutatav lahutusvõime • Teavikute skaneerimisel on standardseks lahutusvõimeks 400 dpi. • Skaneerimise lahutusvõimet võib muuta erandjuhtudel sõltuvalt teaviku formaadist, digiteerimise eesmärgist, digiteerimisel kasutatavast seadmest või digiteerimise käigus loodavast lõpp-produktist erandi kehtestamise üle Optiline tärgituvastus • Kõik tekstilised väljaanded, mis on ilmunud pärast 1800. aastat, tuleb tärktuvastada. • Tekstiliste väljaannete puhul, mis on ilmunud enne 1800. aastat, tuleb tärktuvastamise vajadust ning võimalust hinnata igal üksikjuhul eraldi. Pilditöötlus • Piltitöötluse meetodeid kasutatakse ainult tagatiskoopiate puhul. • Kõik lõigatud ja kärbitud leheküljed peavad võimaluse korral ühe teaviku ulatuses olema samades mõõtudes. • Vajadusel tuleb tagatiskoopial rakendada täiendavaid pilditöötluse meetodeid: teksti kalde likvideerimine; üleliigse tühja ruumi kaotamine; teksti või muu sisu liigutamine digitaalse pildi keskele. Kohustuslikud metaandmed • Tehnilised metaandmed skanner väljastab automaatselt) • Kirjeldavad metaandmed: Dublin Core standardi lihtsas vormingus; • Struktuurilised metaandmed Annavad edasi teaviku struktuuri Minimaalselt kujul, mis võimaldab eristada teaviku põhilisi osi (tiitelleht, sisukord, eessõna, põhitekst, järelsõna, jms); peatükkideks jagatud teaviku puhul peavad sisaldama infot ka kõigi peatükkide kohta, s.t võimaldama haarata põhiteksti liigendust. Pikaajaline digitaalne säilitamine • Pikaajalise säilitamise puhul on tegu informatsiooni säilitamisega ja tõendusmaterjali loomisega pikas perspektiivis, st peab olema kindlustatud kaitse tehnoloogiliste muudatuste eest ning tagatud uute meedia- ja andmevormingute käideldavus. • Kõik failivormingud tuleb säilitada pikaajaliselt. • Kõik tehnilised-, kirjeldavad- ja struktuurilised metaandmed tuleb säilitada pikaajaliselt. • Pikaajaline säilitamine põhineb LTO (Linear Tape-Open) linditehnoloogial ning koosneb ühekordselt kirjutatavatest LTO lintidest, lindirobotist, kettamassiividest, seda teenindavatest serveritest ning nendega seotud seadmetest. Tallinna Ülikooli Akadeemiline Raamatukogu Projekt nr. 1 – Eesti teadus ja akadeemikud ca 1,6 milj lk • Tsaariaegsed teaduslikud väljaanded enne 1918 • Tsaariaegsed kultuuriseltsid / kultuuriajakirjad kuni 1918 • Õpetatud Eesti Selts (1838-1950, alates 1938-1950 Eesti Teaduste Akadeemia juures) • Tartu Ülikool 1919-1944 • Akadeemiliste seltside / teadusasutuste toimetised kahe maailmasõja vahel • Muude seltside toimetised 1918-1940 • Kultuuriajakirjad 1918-1940 • Üliõpilasorganisatsioonide väljaanded • Eesti Teaduste Akadeemia jätkväljaanded (1945-1991) • Tartu Riikliku Ülikooli väljaanded 1944-1991 • Teised kõrgkoolid, teadusliku uurimise instituudid 1944-1991 • Kultuuriteaduste ajakirjad 1944-1991 Eesti Teaduste Akadeemia jätkväljaanded (1945–1991) kokku ca 500 000 lk • • • • • • • • • • • • • • ENSV Teaduste Akadeemia (ETA) Toimetised 1952–1955, 32 köidet (kd), ā 500-600 lk ETA uurimused ja ülevaated 1949. 1 kd ETA 1. vabariikliku teaduslookonverentsi materjale, 1979-1991, 7 kd (8-11 kd 1993-2007) ETA Toimetised. Ühiskonnateaduste seeria. 1956-1991 (4 korda aastas), 4 laudimeetrit (lm) Põllumajandusökonoomika küsimusi : [artiklite kogumik] / Eesti NSV Teaduste Akadeemia Majanduse Instituut. Tööstuse ja ehituse ökonoomika küsimusi / Eesti NSV Teaduste Akadeemia Majanduse Instituut. 1 (1959) - 4 (1963), Kogumistöö juhendaja rahvaluule alal. Nr. 1 / Eesti NSV Teaduste Akadeemia, Riiklik Kirjandusmuuseum. 1 kd ETA Sotsiaalse arengu planeerimine : kodumaise kirjanduse valiknimestik, 1981-1982, 1980-1985 ETA Majanduse instituut 1989-1998 (10 kd) ETA Emakeele Seltsi aastaraamat 1955-1988 (34 kd) ETA Keele ja Kirjanduse Instituudi uurimused 1956-1964, 10 kd ETA Emakeele Seltsi toimetised 1958-1989, 23 kd Keel ja Kirjandus, ETA ja Eesti Kirjanike Liidu ajakiri 1958-1991 (1 x kuus), ca 400 numbrit Kodumurre. ETA Emakeele Selts. 1960-1989, 21 kd Emakeele seltsi bibliograafia, 1962 1 vihik Kogumistöö juhendaja eesti keele alal. Nr. 1 / Akadeemiline Emakeele Selts ETA juures. 1949-1958 • • • • • • • • • • • • • • • • • Kodumurre. ETA Emakeele Selts. 1960-1989, 21 kd Emakeele seltsi bibliograafia, 1962 1 vihik Kogumistöö juhendaja eesti keele alal. Nr. 1 / Akadeemiline Emakeele Selts ETA juures. 1949-1958, 7 kd ETA bibliografia uralica 1962-1971, 10 kd, 1976-1989 4 kd ETA Tartu Astronoomia Observatooriumi publikatsioonid. 1924-1943 (6 vihikut), 1952-1990, 23 kd ETA Loodusuurijate Selts. 1951-1991. 92 vihikut ETA Füüsika Instituudi uurimused 1955-1990, 67 vihikut, ā 200 lk ETA Loodusuurijate Seltsi aastaraamat 1853-1860 (10 vihikut), 1899-1914 (12 vihikut), 1916, 1 vihik; 1915-1943 : 24 vihikut. 1955-1975 (16 vihikut), 1976-1980 (5 vihikut). 1980-1989 (4 vihikut). ETA Geoloogia Instituudi Uurimused. 1956-1963, 13 kd. ETA Loodusuurijate Selts. 1960-61 2 kd ETA Toimetised. Bioloogia. 1956-1991, 39 kd, kokku ca 160 vihikut ā 250 lk, kokku 35 000 lk. ETA Zooloogia ja Botaanika Instituut. Entomoloogiline kogumik. 1959, 1 vihik ETA Tallinna Botaanikaaia uurimused. 1962-2006, 6 kd ETA Eesti Looduseuurijate Selts. Ornitoloogiline kogumik. 1958-1985. 10 kd ETA Zooloogia ja Botaanika Instituut. Hüdrobioloogilised uurimused. 1958-1991. 18 kd ETA populaarteaduslik ajakiri Loodus. 1958-1966 (6 nr aastas), kokku 54 nr, 1967-1991, 1 x kuus. 300 nr ETA Loodusuurijate Selts. Floristilised märkmed. 1958-1973, 5 vihikut • • • • • • • • • • • • • • • • ETA Институт астрофизики и физики атмосферы. Uurimusi atmosfäärifüüsikast. 1959-1978, 21 kd ETA Eksperimentaalbioloogia Instituut. Tööd taimefüsioloogia ja -geneetika alal. 1960-1962, 2 kd ETA Eesti Looduseuurijate Selts. Geoloogilised Märkmed. 1961-1976, 3 vihikut ETA Eesti Looduseuurijate Selts. Faunistilisi märkmeid. 1959-1976. 5 vihikut ETA Looduskaitse Komisjon. Teadusliku uurimistöö organiseerimise küsimusi looduskaitse alal. 19591961, 2 vihikut ETA Zooloogia ja Botaanika Instituut. 1961-1991. 7 kd ETA Eksperimentaalse ja Kliinilise Meditsiini Instituut. Mikrobioloogilised uurimused. 1961, 1 kd ETA astrofüüsika. 1959-1991 (109 vihikut) ETA Eesti Looduseuurijate Selts. Täppisteaduste Sektsiooni toimetised. 1959-1975, 8 kd ETA toimetised. Keemia. Geoloogia. 1967-1991, 40 kd, 4 x kvartalis, 160 vihikut ā 200 lkETA Teaduse ajaloo lehekülgi Eestist. 1968-1989, 7 kd, 1992-2004, 8.-13. kd ETA. Zooloogia ja Botaanika Instituut. Eesti Looduseuurijate Selts. Karl Ernst von Baeri Muuseum. Folia Baeriana. 1975-1999, 7 kd ETA Füüsika Instituut. Eesti NSV füüsikakroonika. 1973-1976, 4 vihikut ETA toimetised. Geoloogia. 1978-1989, 12 kd, 4 x aastas, kokku ca 10 000 lk. ETA Füüsika Instituut. Füüsika kroonika. 1977-1987 (3 vihikut) ETA Loodusuurijate Selts. Eesti looduseuurijate päeva ettekanded. 1961-1988 (10 kd) ETA Eesti Loodusuurijate Selts Kasutamise õigusi Norras •Üle maailma •Norras •Kokkulepped autorite organisatsiooniga 1990–2000. (0,68 euro/lk. aastas) Edasi läbi rääkimine 2000–2010 •Raamatukogus •Saab tellida – mälupulgale, (üle võrgu) Akadeemilises Raamatukogus •Üle maailma, (täielikult avatud) 8 246 objekti Avalik ainult lugemiseks (saab lugeda, kuid ei saa alla laadida faile, Sirp, Keel ja Kirjandus, Õpetajate Leht, ..., fotod) 3 944 objekti •Piiratud (ainult sisevõrgus – Rävala ja Narva mnt raamatukogud, üle 1930 väljaandmise kuupäev või 70 aastat surmast) 3 035 objekti •Suletud (ekstra digitellimused ja kinniseks kuulutatud lõputööd) 76 objekti •USA vs EU •Teeme, käime kohut / ärme teeme, arutame asja Autoriõiguse seadus 2. TEOSE KASUTAMINE AUTORI NÕUSOLEKUTA JA TASU MAKSMISETA •§ 19. Teose vaba kasutamine teaduslikel, hariduslikel, informatsioonilistel ja õigusemõistmise eesmärkidel •Autori nõusolekuta ja autoritasu maksmiseta, kuid kasutatud teose autori nime, kui see on teosel näidatud, teose nimetuse ning avaldamisallika kohustusliku äranäitamisega on lubatud: •1) õiguspäraselt avaldatud teose tsiteerimine ja refereerimine motiveeritud mahus, järgides refereeritava või tsiteeritava teose kui terviku mõtte õige edasiandmise kohustust; •2) õiguspäraselt avaldatud teose kasutamine illustreeriva materjalina õppe- ja teaduslikel eesmärkidel motiveeritud mahus ja tingimusel, et selline kasutamine ei taotle ärilisi eesmärke; •3) õiguspäraselt avaldatud teose reprodutseerimine õppe- ja teaduslikel eesmärkidel motiveeritud mahus haridus- ja teadusasutustes, mille tegevus ei taotle ärilisi eesmärke; •§ 20. Teose vaba kasutamine avaliku arhiivi, muuseumi või raamatukogu poolt •(3) Autori nõusolekuta ja autoritasu maksmiseta on avalikul arhiivil, muuseumil või raamatukogul õigus oma kogusse kuuluvat teost kasutada motiveeritud mahus näituse ja kogu tutvustamise eesmärgil. •(4) Autori nõusolekuta ja selle eest tasu maksmiseta on avalikul arhiivil, muuseumil või raamatukogul õigus kogus olevat teost füüsilise isiku tellimusel: •1) eriseadmete kaudu kohapeal kättesaadavaks teha; •2) individuaalseks kohapeal kasutamiseks laenutada. •(5) Käesolevas paragrahvis nimetatud tegevus ei või toimuda ärilisel eesmärgil. • Autorikaitse all (AutÕS § 4 lg 3) olevaid digitaalkoopiaid ei tehta avalikult kättesaadavaks; • Digitaalkoopiaid avalikustatakse juhul, kui autori surmast on möödunud vähemalt 70 aastat (vastavalt AutÕS § 38 lg 1); www.e-varamu.ee indekseeritud objekte 909 626: ajalehed 83.000 lk, raamatud ja ajakirjad 709.000 lk, üliõpilastööd 131.000 lk. Esimene etapp 5 milj E-varamu portaali partnerid 1. Rahvusarhiiv 2. Eesti Kirjandusmuuseum (KIVIKE) 3. Eesti Rahvusraamatukogu (DIGAR) 4. Tallinna Tehnikaülikooli Raamatukogu 5. Tallinna Ülikooli Akadeemiline Raamatukogu (ETERA) 6. Tartu Ülikooli Raamatukogu (Dspace) 7. Kultuuriministeerium (Muis) 8. Haridusministeerium (ETIS) 9. Eesti Keeleressursside keskus 10.eElurikkus 11.ESTER 12.ISE (artiklite andmebaas) 13.EMS (märksõnastik) objektide arv 20 234 lehekülgede arv 1 052 000 www.etera.ee TÄNAN! • E-varamu portaal on erinevaid andmebaase integreeriv kaasaegsel otsimootoril põhinev värav laialipillutud andmete otsimiseks. Evaramu intelligentne, kontekstitundlik otsimootor ja kasutajasõbralik esitlussüsteem teeb temast hästiorganiseeritud abivahendi soovitavate andmete otsimiseks üle suurte andmemahtude. E-varamu portaal on skaleeritav ja nii saab temaga liita järjest kasvavaid andmemahtusid, võimaldades samas otsingut üle kõikide seostatud andmemahtude. ETERA ja E-varamu kasvades sisaldavad nad enestes võimalikult täielikku kogumit Eesti vaimuvarast. Rahvusliku vaimuvara kättesaadavaks tegemisel arvestatakse informatsiooni ja kultuuri tarbimise harjumuste kiire muutumisega. Lugejatele tehakse kõik kättesaadavaks kõigi kaasaegsete infotehnoloogiliste vahenditega, olgu selleks (tahvel)arvuti, nutitelefon või muu. ETERA ja E-varamu teenivad sedaviisi ka rahvust ühendavat, ühtse info- ja kultuuriruumi hoidmise lausa põhiseaduslikku ülesannet. Need peavad omal nutikal moel “tagama eesti rahvuse ja kultuuri säilimise läbi aegade”. •