...

View/Open

by user

on
Category: Documents
19

views

Report

Comments

Description

Transcript

View/Open
E-teadusraamatukogu ETERA
E-terast tärkab mõte
Andres Kollist
16.03.2016, Kääriku
Digiteerimine – pildistamine ja tekstitöötlus
• Pildistamise täpsus
• Fookus, rastri tihedus - DPI, värvide pildistamise ja salvestamise täpsus
• Tekstituvastus
• Tarkvara, OCR, HQ OCR, vigade otsimine, kontroll - % ideaalist (5 – 50%),
käsitöö maht, vilets ja ähmane trükk, erinevad tähestikud – Gooti kiri,
Kirillitsa, ...., erinevad keeled...
• Tarkvara Üleslaadimine ETERA-sse MediaInfo (Geneza)
• Migreerimine säilituskeskkonda Töövoog DocWorks Pro (CCS)
• Masin/käsitöö = 1/5 (1/4)
objektide arv 20 234
lehekülgede arv 1 052 000
www.etera.ee
• ETERA on TLÜ AR e-teadusraamatukogu, mis on
ülemaailmselt kättesaadav elektrooniline keskkond
• ETERAs on 2016 märtsi seisuga 20
234 objekti, millest
 55,4% perioodika
 12,1% raamatud
 12,8% üliõpilastööd (sh doktori- ja magistritööd)
 7,4% ajakirjad
 5% jätkväljaanded
 vanad fotod ja postkaardid (897), graafika (49), aga ka
Rahvusarhiivi ainueksemplaride digitaalsed koopiad (700),
millest suure osa moodustavad Eesti retrospektiivsesse
rahvusbibliograafiasse kuuluvad trükised
Mida digiteerida?
• Kogu Eesti asi, st alates Gutenbergist tänaseni – 50 milj lk.
Kogu Norra asi ca 200 milj lk.
• Meie prioriteet – Eesti teadus.
• Baerist Einasto, Lotmani ja Aristeni
• Mitte labor, kus teha põnevaid digiteerimisalaseid katseid
• Vabrik, tootmisliin. Projektvõimsus 3 milj lk/a
• võimaldab täistekstotsingut (kõik tekstid, sh gooti kirjas
trükised)
• Võimaldab (kui võimaldab) lugejat huvitavaid tekstikohti
kopeerida (ka piltidega) ja jagada.
• Igal leheküljel on oma ainulaadne identifikaator (link)
Digiteerimise põhimõtted
•Eelnevalt bibliografeeritud
•Standardid ja head tavad
•Arhiivkoopia eesmärk tagada info säilimine
• Kasutuskoopia eesmärk laialdane kättesaadavus ja
kasutatavus
• Pigem vähem, aga paremini
• Terviklikkus
• Teadmine sellest, mis seal sees on
Üldised nõuded
• Kogu informatsioon, mis sisaldub digiteeritavas
teavikus, peab sisalduma ka digitaalses koopias,
see tähendab:
peab olema võimalik lugeda kogu teksti;
peab olema võimalik näha fotosid, illustratsioone,
graafikuid jms;
peab olema võimalik näha graafiliste elementide
selgitusi (nt pildiallkirjad, graafikute legendid jms).
• Kui digiteeritav teavik vajab restaureerimist, siis
tuleb see teavik restaureerida enne
digiteerimiskeskusesse suunamist
Teavikute terviklikkus
• Kõik digiteeritavad teavikud tuleb skaneerida
tervikuna, mitte üksikute köidetena, osade või
alajaotuste kaupa, sh ka tühjad leheküljed, kaaned.
• Teaviku digiteerimisel tuleb säilitada tema esialgne
struktuur. Kui digiteeritaval teavikul puuduvad osad
leheküljed, tuleb puuduvate lehekülgede andmed ära
märkida teavikut kirjeldavates metaandmetes.
Värvisügavus
• Värviliste fotode ja illustratsioonide, tekstiliste
dokumentide, pooltoonides illustratsioonide,
hallskaalal fotode ja illustratsioonide puhul 24 bit.
Failivormingud
• säilituskoopiana loodud pildid, tekstilised dokumendid ja
illustratsioonid tuleb salvestada vormingus TIFF (ver 6.0).
• tagatiskoopiana loodud pildid, tekstilised dokumendid ja
illustratsioonid tuleb salvestada vormingus TIFF LZW.
• kasutuskoopiana loodud pildid, tekstilised dokumendid ja
illustratsioonid tuleb salvestada vormingus TIFF LZW ning
dokumendid vormingus PDF (ver 1.7).
Failinimed
• Failide nimetamisel on aluseks elektronkataloog
ESTER-is kasutusel olev unikaalne bibliokirje number.
Failide tihendamine
• Säilituskoopiaid ei tihendata.
Kasutuskoopiad
• Igast digiteeritavast teavikust peab moodustuma üks
terviklik PDF-fail.
• PDF-faili minimaalne lahutusvõime on 300 dpi-d.
Kasutatav lahutusvõime
• Teavikute skaneerimisel on standardseks
lahutusvõimeks 400 dpi.
• Skaneerimise lahutusvõimet võib muuta erandjuhtudel
sõltuvalt teaviku formaadist, digiteerimise eesmärgist,
digiteerimisel kasutatavast seadmest või digiteerimise
käigus loodavast lõpp-produktist erandi kehtestamise
üle
Optiline tärgituvastus
• Kõik tekstilised väljaanded, mis on ilmunud pärast
1800. aastat, tuleb tärktuvastada.
• Tekstiliste väljaannete puhul, mis on ilmunud enne
1800. aastat, tuleb tärktuvastamise vajadust ning
võimalust hinnata igal üksikjuhul eraldi.
Pilditöötlus
• Piltitöötluse meetodeid kasutatakse ainult
tagatiskoopiate puhul.
• Kõik lõigatud ja kärbitud leheküljed peavad võimaluse
korral ühe teaviku ulatuses olema samades mõõtudes.
• Vajadusel tuleb tagatiskoopial rakendada täiendavaid
pilditöötluse meetodeid:
 teksti kalde likvideerimine;
 üleliigse tühja ruumi kaotamine;
 teksti või muu sisu liigutamine digitaalse pildi keskele.
Kohustuslikud metaandmed
• Tehnilised metaandmed
 skanner väljastab automaatselt)
• Kirjeldavad metaandmed:
 Dublin Core standardi lihtsas vormingus;
• Struktuurilised metaandmed
 Annavad edasi teaviku struktuuri
 Minimaalselt kujul, mis võimaldab eristada teaviku põhilisi osi
(tiitelleht, sisukord, eessõna, põhitekst, järelsõna, jms);
 peatükkideks jagatud teaviku puhul peavad sisaldama infot ka
kõigi peatükkide kohta, s.t võimaldama haarata põhiteksti
liigendust.
Pikaajaline digitaalne säilitamine
• Pikaajalise säilitamise puhul on tegu informatsiooni säilitamisega
ja tõendusmaterjali loomisega pikas perspektiivis, st peab olema
kindlustatud kaitse tehnoloogiliste muudatuste eest ning tagatud
uute meedia- ja andmevormingute käideldavus.
• Kõik failivormingud tuleb säilitada pikaajaliselt.
• Kõik tehnilised-, kirjeldavad- ja struktuurilised metaandmed
tuleb säilitada pikaajaliselt.
• Pikaajaline säilitamine põhineb LTO (Linear Tape-Open)
linditehnoloogial ning koosneb ühekordselt kirjutatavatest LTO
lintidest, lindirobotist, kettamassiividest, seda teenindavatest
serveritest ning nendega seotud seadmetest.
Tallinna Ülikooli Akadeemiline Raamatukogu
Projekt nr. 1 – Eesti teadus ja akadeemikud ca 1,6 milj lk
• Tsaariaegsed teaduslikud väljaanded enne 1918
• Tsaariaegsed kultuuriseltsid / kultuuriajakirjad kuni 1918
• Õpetatud Eesti Selts (1838-1950, alates 1938-1950 Eesti Teaduste Akadeemia
juures)
• Tartu Ülikool 1919-1944
• Akadeemiliste seltside / teadusasutuste toimetised kahe maailmasõja vahel
• Muude seltside toimetised 1918-1940
• Kultuuriajakirjad 1918-1940
• Üliõpilasorganisatsioonide väljaanded
• Eesti Teaduste Akadeemia jätkväljaanded (1945-1991)
• Tartu Riikliku Ülikooli väljaanded 1944-1991
• Teised kõrgkoolid, teadusliku uurimise instituudid 1944-1991
• Kultuuriteaduste ajakirjad 1944-1991
Eesti Teaduste Akadeemia jätkväljaanded (1945–1991)
kokku ca 500 000 lk
•
•
•
•
•
•
•
•
•
•
•
•
•
•
ENSV Teaduste Akadeemia (ETA) Toimetised 1952–1955, 32 köidet (kd), ā 500-600 lk
ETA uurimused ja ülevaated 1949. 1 kd
ETA 1. vabariikliku teaduslookonverentsi materjale, 1979-1991, 7 kd (8-11 kd 1993-2007)
ETA Toimetised. Ühiskonnateaduste seeria. 1956-1991 (4 korda aastas), 4 laudimeetrit (lm)
Põllumajandusökonoomika küsimusi : [artiklite kogumik] / Eesti NSV Teaduste Akadeemia Majanduse
Instituut. Tööstuse ja ehituse ökonoomika küsimusi / Eesti NSV Teaduste Akadeemia Majanduse
Instituut. 1 (1959) - 4 (1963), Kogumistöö juhendaja rahvaluule alal. Nr. 1 / Eesti NSV Teaduste
Akadeemia, Riiklik Kirjandusmuuseum. 1 kd
ETA Sotsiaalse arengu planeerimine : kodumaise kirjanduse valiknimestik, 1981-1982, 1980-1985
ETA Majanduse instituut 1989-1998 (10 kd)
ETA Emakeele Seltsi aastaraamat 1955-1988 (34 kd)
ETA Keele ja Kirjanduse Instituudi uurimused 1956-1964, 10 kd
ETA Emakeele Seltsi toimetised 1958-1989, 23 kd
Keel ja Kirjandus, ETA ja Eesti Kirjanike Liidu ajakiri 1958-1991 (1 x kuus), ca 400 numbrit
Kodumurre. ETA Emakeele Selts. 1960-1989, 21 kd
Emakeele seltsi bibliograafia, 1962 1 vihik
Kogumistöö juhendaja eesti keele alal. Nr. 1 / Akadeemiline Emakeele Selts ETA juures. 1949-1958
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Kodumurre. ETA Emakeele Selts. 1960-1989, 21 kd
Emakeele seltsi bibliograafia, 1962 1 vihik
Kogumistöö juhendaja eesti keele alal. Nr. 1 / Akadeemiline Emakeele Selts ETA juures. 1949-1958, 7 kd
ETA bibliografia uralica 1962-1971, 10 kd, 1976-1989 4 kd
ETA Tartu Astronoomia Observatooriumi publikatsioonid. 1924-1943 (6 vihikut), 1952-1990, 23 kd
ETA Loodusuurijate Selts. 1951-1991. 92 vihikut
ETA Füüsika Instituudi uurimused 1955-1990, 67 vihikut, ā 200 lk
ETA Loodusuurijate Seltsi aastaraamat 1853-1860 (10 vihikut), 1899-1914 (12 vihikut), 1916, 1 vihik;
1915-1943 : 24 vihikut. 1955-1975 (16 vihikut), 1976-1980 (5 vihikut). 1980-1989 (4 vihikut).
ETA Geoloogia Instituudi Uurimused. 1956-1963, 13 kd.
ETA Loodusuurijate Selts. 1960-61 2 kd
ETA Toimetised. Bioloogia. 1956-1991, 39 kd, kokku ca 160 vihikut ā 250 lk, kokku 35 000 lk.
ETA Zooloogia ja Botaanika Instituut. Entomoloogiline kogumik. 1959, 1 vihik
ETA Tallinna Botaanikaaia uurimused. 1962-2006, 6 kd
ETA Eesti Looduseuurijate Selts. Ornitoloogiline kogumik. 1958-1985. 10 kd
ETA Zooloogia ja Botaanika Instituut. Hüdrobioloogilised uurimused. 1958-1991. 18 kd
ETA populaarteaduslik ajakiri Loodus. 1958-1966 (6 nr aastas), kokku 54 nr, 1967-1991, 1 x kuus. 300 nr
ETA Loodusuurijate Selts. Floristilised märkmed. 1958-1973, 5 vihikut
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
ETA Институт астрофизики и физики атмосферы. Uurimusi atmosfäärifüüsikast. 1959-1978, 21 kd
ETA Eksperimentaalbioloogia Instituut. Tööd taimefüsioloogia ja -geneetika alal. 1960-1962, 2 kd
ETA Eesti Looduseuurijate Selts. Geoloogilised Märkmed. 1961-1976, 3 vihikut
ETA Eesti Looduseuurijate Selts. Faunistilisi märkmeid. 1959-1976. 5 vihikut
ETA Looduskaitse Komisjon. Teadusliku uurimistöö organiseerimise küsimusi looduskaitse alal. 19591961, 2 vihikut
ETA Zooloogia ja Botaanika Instituut. 1961-1991. 7 kd
ETA Eksperimentaalse ja Kliinilise Meditsiini Instituut. Mikrobioloogilised uurimused. 1961, 1 kd
ETA astrofüüsika. 1959-1991 (109 vihikut)
ETA Eesti Looduseuurijate Selts. Täppisteaduste Sektsiooni toimetised. 1959-1975, 8 kd
ETA toimetised. Keemia. Geoloogia. 1967-1991, 40 kd, 4 x kvartalis, 160 vihikut ā 200 lkETA Teaduse
ajaloo lehekülgi Eestist. 1968-1989, 7 kd, 1992-2004, 8.-13. kd
ETA. Zooloogia ja Botaanika Instituut. Eesti Looduseuurijate Selts. Karl Ernst von Baeri Muuseum. Folia
Baeriana. 1975-1999, 7 kd
ETA Füüsika Instituut. Eesti NSV füüsikakroonika. 1973-1976, 4 vihikut
ETA toimetised. Geoloogia. 1978-1989, 12 kd, 4 x aastas, kokku ca 10 000 lk.
ETA Füüsika Instituut. Füüsika kroonika. 1977-1987 (3 vihikut)
ETA Loodusuurijate Selts. Eesti looduseuurijate päeva ettekanded. 1961-1988 (10 kd)
ETA Eesti Loodusuurijate Selts
Kasutamise õigusi
Norras
•Üle maailma
•Norras
•Kokkulepped autorite organisatsiooniga 1990–2000. (0,68 euro/lk. aastas) Edasi läbi
rääkimine 2000–2010
•Raamatukogus
•Saab tellida – mälupulgale, (üle võrgu)
Akadeemilises Raamatukogus
•Üle maailma, (täielikult avatud) 8 246 objekti Avalik ainult lugemiseks (saab lugeda, kuid
ei saa alla laadida faile, Sirp, Keel ja Kirjandus, Õpetajate Leht, ..., fotod) 3 944 objekti
•Piiratud (ainult sisevõrgus – Rävala ja Narva mnt raamatukogud, üle 1930 väljaandmise
kuupäev või 70 aastat surmast) 3 035 objekti
•Suletud (ekstra digitellimused ja kinniseks kuulutatud lõputööd) 76 objekti
•USA vs EU
•Teeme, käime kohut / ärme teeme, arutame asja
Autoriõiguse seadus
2. TEOSE KASUTAMINE AUTORI NÕUSOLEKUTA JA TASU MAKSMISETA
•§ 19. Teose vaba kasutamine teaduslikel, hariduslikel, informatsioonilistel ja
õigusemõistmise eesmärkidel
•Autori nõusolekuta ja autoritasu maksmiseta, kuid kasutatud teose autori nime, kui see on
teosel näidatud, teose nimetuse ning avaldamisallika kohustusliku äranäitamisega on
lubatud:
•1) õiguspäraselt avaldatud teose tsiteerimine ja refereerimine motiveeritud mahus,
järgides refereeritava või tsiteeritava teose kui terviku mõtte õige edasiandmise kohustust;
•2) õiguspäraselt avaldatud teose kasutamine illustreeriva materjalina õppe- ja teaduslikel
eesmärkidel motiveeritud mahus ja tingimusel, et selline kasutamine ei taotle ärilisi
eesmärke;
•3) õiguspäraselt avaldatud teose reprodutseerimine õppe- ja teaduslikel eesmärkidel
motiveeritud mahus haridus- ja teadusasutustes, mille tegevus ei taotle ärilisi eesmärke;
•§ 20. Teose vaba kasutamine avaliku arhiivi, muuseumi või raamatukogu poolt
•(3) Autori nõusolekuta ja autoritasu maksmiseta on avalikul arhiivil, muuseumil või
raamatukogul õigus oma kogusse kuuluvat teost kasutada motiveeritud mahus näituse ja
kogu tutvustamise eesmärgil.
•(4) Autori nõusolekuta ja selle eest tasu maksmiseta on avalikul arhiivil, muuseumil või
raamatukogul õigus kogus olevat teost füüsilise isiku tellimusel:
•1) eriseadmete kaudu kohapeal kättesaadavaks teha;
•2) individuaalseks kohapeal kasutamiseks laenutada.
•(5) Käesolevas paragrahvis nimetatud tegevus ei või toimuda ärilisel eesmärgil.
• Autorikaitse all (AutÕS § 4 lg 3) olevaid digitaalkoopiaid ei tehta avalikult
kättesaadavaks;
• Digitaalkoopiaid avalikustatakse juhul, kui autori surmast on möödunud vähemalt 70
aastat (vastavalt AutÕS § 38 lg 1);
www.e-varamu.ee
indekseeritud objekte 909 626: ajalehed 83.000 lk, raamatud ja ajakirjad 709.000 lk,
üliõpilastööd 131.000 lk. Esimene etapp 5 milj
E-varamu portaali partnerid
1. Rahvusarhiiv
2. Eesti Kirjandusmuuseum (KIVIKE)
3. Eesti Rahvusraamatukogu (DIGAR)
4. Tallinna Tehnikaülikooli Raamatukogu
5. Tallinna Ülikooli Akadeemiline Raamatukogu (ETERA)
6. Tartu Ülikooli Raamatukogu (Dspace)
7. Kultuuriministeerium (Muis)
8. Haridusministeerium (ETIS)
9. Eesti Keeleressursside keskus
10.eElurikkus
11.ESTER
12.ISE (artiklite andmebaas)
13.EMS (märksõnastik)
objektide arv 20 234
lehekülgede arv 1 052 000
www.etera.ee
TÄNAN!
• E-varamu portaal on erinevaid andmebaase integreeriv kaasaegsel
otsimootoril põhinev värav laialipillutud andmete otsimiseks. Evaramu intelligentne, kontekstitundlik otsimootor ja kasutajasõbralik
esitlussüsteem teeb temast hästiorganiseeritud abivahendi soovitavate
andmete otsimiseks üle suurte andmemahtude. E-varamu portaal on
skaleeritav ja nii saab temaga liita järjest kasvavaid andmemahtusid,
võimaldades samas otsingut üle kõikide seostatud andmemahtude.
ETERA ja E-varamu kasvades sisaldavad nad enestes võimalikult
täielikku kogumit Eesti vaimuvarast. Rahvusliku vaimuvara
kättesaadavaks tegemisel arvestatakse informatsiooni ja kultuuri
tarbimise harjumuste kiire muutumisega. Lugejatele tehakse kõik
kättesaadavaks kõigi kaasaegsete infotehnoloogiliste vahenditega, olgu selleks (tahvel)arvuti, nutitelefon või muu. ETERA ja E-varamu
teenivad sedaviisi ka rahvust ühendavat, ühtse info- ja kultuuriruumi
hoidmise lausa põhiseaduslikku ülesannet. Need peavad omal nutikal
moel “tagama eesti rahvuse ja kultuuri säilimise läbi aegade”.
•
Fly UP