1.10.10

SLOVENSKA KONFERENCA O TRAJNEM OHRANJANJU VIROV Ljubljana, 17.9.2010

SLOVENSKA KONFERENCA O TRAJNEM OHRANJANJU VIROV
Ljubljana, 17.9.2010

“Trajno ohranjanje digitalnih virov ali po angleško "digital preservation" je temeljna skrb vseh organizacij, ki upravljajo z vedno večjim številom digitalnih vsebin. Medtem, ko se v knjižnicah soočamo z vprašanjem trajnega ohranjanja digitalnih publikacij, skušajo arhivisti rešiti vprašanje vrednotenja, prevzemanja in dostopnosti digitalnega arhivskega gradiva, vključno z njegovo verodostojnostjo v digitalnem okolju. S temi in podobnimi nalogami se ukvarjajo tudi druge raziskovalne organizacije in zavodi, ki morajo zajemati in ohraniti za prihodnost različne digitalne podatke oziroma multimedijske vsebine. Ne glede na strokovno področje, naj gre za arhivistiko, knjižničarstvo ali druge informacijske vede, so nekatere rešitve zanimive za vse. /…/ “

V: http://www.dlib.si/todv/konferenca/okonferenci.aspx

Tokrat se je konferenca odvijala v prostorih Pošte Slovenije na Čopovi 11 v Ljubljani. Uvodni nagovor je vodila ga. Mateja Komel Snoj. Konferenca je potekala v okviru projekta dLib.siPlus in predstavlja prvo konferenco v Sloveniji, ki povezuje tako knjižničarje in arhiviste, kakor tudi informatike. Vprašanje je, kaj sploh prinašamo iz preteklosti. Gre za delo v nastajanju. NUK ima vlogo nacionalnega agregatorja e-vsebin. Pri iskanju rešitev so nujni interdisciplinarni pristopi. To srečanje je dobra informacija o stanju in o vprašanjih, ki se jih moramo še lotiti.
Misel ga. Barbare Koželj Podlogar (generalna direktorica Ministrstva za kulturo) je bila, da je digitalizacija veliko več kot zgolj orodje. Imamo veliko dokumentov, vendar moramo imeti tudi zavest. Tomas Tišler pa nam je v uvodnem delu razložil, da je projekt NUKa dLib+ največji v Sloveniji na področju kulture. EU pa ne dovoli, da bi objavili razpise neposredno vezane na digitalizacijo vsebin. Kot možno rešitev je predlagal vzpostavitev še nekega drugega sistema, digitalizacija kot taka pa je zgolj poleg le-tega.
Projekt dLib.siPlus se sicer konec septembra tega leta zaključuje.


PRVI SKLOP PREDAVANJ:

Dr. Alenka – Kavčič Čolić : Pregled stanja trajnega ohranjanja digitalnih virov v Sloveniji
(Prosojnice s predavanja najdete na: http://www.dlib.si/todv/konferenca/file/pdf/2010_1_Kavcic.pdf )

Predavanja dr. Kavčič-Čolićeve so potekala v 2 delih. Prvi del je navezoval na uvod v področje, drugi pa na projekt dLib.siPlus. Razprava o trajnem ohranjanju digitalnih virov se je prvič pojavila 10 let nazaj. Takrat se je morda več gledalo na kvantiteto, kot na kvaliteto. S strani UNESCA je bilo, da se ohrani pravo digitalno kulturno dediščino. Pri ohranjanju digitalnih virov v Sloveniji gre za različne pristope s skupnim ciljem. Npr. arhivistika primarno ohranja dokumentarno gradivo. Knjižničarstvo primarno ohranja publikacije. Pristop je tako različen predvsem zaradi različnega gradiva. Iz tega sledijo tudi različne zakonske podlage. Skupni cilj vseh treh področji (knjižničarstvo, arhivistika, informatika) pa je trajno ohranjanje digitalne kulturne vsebine in pri arhivistiki še trajno ohranjanje izvirnika. Sam proces ohranjanja temelji na treh stebrih: virih, tehnoloških rešitvah in strategiji.

Značilnosti trenutnega razvoja področja v svetu so:
Odprtokodne rešitve, vzpostavitev 1. generacije odprtokodnih repozitorijev za skladiščenje digitalnih virov, digitalna skladišča, arhivi publiciranih elektronskih revij, razvoj tehnologij,ohranjanje novih vsebin iz spleta 2.0 in 3.0. Knjižničarji, arhivisti in informatiki se po svetu združujejo, nastajajo novi strokovni profili in učni načrti (npr. digitalni skrbnik) tudi Evropska komisija veliko več sofinancira raziskave na tem področju.

Cilj projekta dLib.siPlus je pregled stanja področja v Sloveniji. Pri tem so prišli do zaključkov, da v Sloveniji obstaja zgolj omejeno število organizacij, ki se ukvarjajo s trajnim hranjenjem. V Sloveniji nimamo dovolj izkušenj iz prakse. Veliko je zelo  različnih rešitev. Za ocene uspešnosti potrebujemo časovno distanco. Ustvarja se vire slabše kvalitete. To vlogo imajo večinoma že opredeljeno po defaktu z zakonskimi akti.

Mag. Tadjna Hajtnik: Strategija razvija slovenskega javnega elektronskega arhiva »e-ARH.si«

Ga.mag. Tatjana Hajtnik nam je predstavila strategijo razvoja in načrta slovenskega javnega elektronskega arhiva e-ARH.si. Skupna strategija SJAS (Slovenska javna arhivska služba) v smeri postavitve skupnega elektronskega arhiva, povzeta v šetstih korakih je bila:

1.korak: študija izvedljivosti
2.korak: priprava podlag za izvedbo dela
3.korak: sodelovanje s Ministrstvom za kulturo
4.korak: predstavitev Ministrstvu za kulturo
5.korak: potrditev vlade RS ( potrdiltev bila 29. julij 2010)
6. korak: formaliziranje projekta in izvedba e-Arh.si

(Okvirni) izvedbeni načrt:
Vizija Arhiva Republike Slovenije je, da bi ;e-ARH.si postal vodilni nosilec tako v Sloveniji, kot širše. Za izvedbeni načrt so si zadali vzpostavitev nacionalnih standardov / priporočil. S tem bi okrepili vlogo arhivistov v okviru Slovenske e-družbe. Želijo omogočiti dostop vsem uporabnikom s kateregakoli mesta.

Strateški cilji: Vseh sedem njihovih stratešklih ciljev strmi k shranjevanju in varovanju arhivskega gradiva. Tako tistega, ki je že primarno digitalno, kot preostalega, ki ga je še potrebno digitalizirati.

Strokovna izhodišča: Vse delo, ki ga opravljajo deluje kot dolgoročna rešitev. Kot izhodišče jim služi Zakon o varstvu dokumentarnegain arhivskega gradiva in arhivih ( ZVDAGA ).Po njem morajo biti vsi arhivski podatki najmanj na treh geografsko ločenih lokacijah. Sodelujejo tudi z drugimi državnimi inštitucijami javne uprave s področja e-poslovanja:z Ministrstvom za javno upravo in z ustvarjalci arhivsega gradiva. Njihovo delo ima vpliv na regionalni razvoj.Bolj pomembno je, da je gradivo dostopno in avtentično, kot pa to kdaj je dostopno.

V predstavitvi poslovnega modela e-ARH.si smo izvedeli za dve možni rešitvi:
Po prvi bo gradivo prehajalo od ustvarjalcev direktno v arhiv. Druga možnost je izgradnja sistema e-gradiva. Tu gradivo iz različnih inštitucij prehaja v e-hrambo, kjer ga ustrezno obdelajo in opremijo z metapodatki, in šele nato preide v arhiv.
Po modelu OAIS so opravili tudi SWOT analizo Izvedli so jo v štirih sklopih: organizacijskem, raziskovalnem, razvojnem ter infrastrukturnem.

Projekt se bo po trenutnem planu zaključil do novembra 2013.

Dr. Janez Štebe in Irena Vipavc Brvar: Analiza stanja in prespektiva digitalne hrambe v Arhivu družboslovnih podatkov (ADP)

ADP hrani zbirko podatkov, zanimivih za družboslovne analize, s poudarkom na problemih, povezanih s slovensko družbo. Prednost imajo vsebinsko pomembnejše in metodološko dobro izdelane raziskave, ob tem še posebej podatki skozi čas in mednarodni primerjalni podatki, pri katerih je upoštevana Slovenija. /…/
( V: http://www.adp.fdv.uni-lj.si/ )

.ADP deluje že več kot 10 let, a še vedno nima načrta. Njihov načrt digitalne hrambe sestoji iz več različnih pristopov. Za njegovo izdelavo so naredili pilotsko študijo. Vodilni zgled pri tem so jim bili UK DA, ICP SR in sorodne organizacije. Njihov primarni namen je poleg hrambe tudi uporaba gradiva.

Poslanstvo ADP:
Običajni nameni uporabe so pisanje znanstvenih poročil za objavo, seminarskih nalog, uporaba podatkov kot dopolnilo pri predavanjih in praktičnih vajah s študenti - v posameznih primerih so na voljo prilagojeni moduli za poučevanje. Ponujajo tudi s podatki povezana gradiva, ki so uporabna pri zasnovi nove raziskave (npr. izvorni vprašalniki in zbirke indikatorjev) ali pri oblikovanju teoretičnih izhodišč za interpretacijo podatkov (npr. naslovi publikacij, narejenih z izhodiščem v posameznem podatkovnem viru). ( V: http://www.adp.fdv.uni-lj.si/ )

Ob izvedbi pilotske študije so prišli do ugotovitve, da je v zakonodajo s področja znanosti in statistike potrebno vključiti odgovornost glede zagotavljanja prostega dostopa do podatkov.
Pri svojem delovanju so oblikovali politiko sprejema gradiv v arhiv. Postopek sprejema pa izboljšali s pomočjo recenzije akademikov.

- Council of European Social Science Data Archives

Specifikacija metapodatkov za družbene vede



Uporabniki do gradiv lahko dostopajo preko lastnega spletnega kataloga ali pa se poslužujejo spletnih katalogov: Cessda, ICPSR, Statističnega urada RS, ESS in GESIS (Več o samih katalogih najdete na njihovi spletni strani.)

DRUGI SKLOP PREDAVANJ:

Dr. Miroslav Novak: Usklajena strokovna terminologija kot gradnik interoperabilnosti na področju kulturnih in drugih vsebin

V prispevku je bilo govora o interoperabilnosti in nekaj osnovnih arhivskih pojmih. Pojem interoperabilnost razumemo kot zmožnost informacijskih sistemov, da medsebojno izmenjujejo podatke, informacije in znanja. Pogoji pa so tehnološki standardi, organizacija procesov, semantika podatkov.

Pri uporabi arhivskih pojmov prihaja, do pomankljivosti pri njih uporabi na nivoju mednarodnih arhivskih rešitev, kakor tudi njihove uporabe v različnih nearhivskih področjih. Isti pojmi se uporabljajo za različne vsebine, različni pojmi za iste vsebine, na abstraktnem nivoju označujejo primerljive entitete ali pa ne. Končni cilj stremi k usklajevanju nepravilnosti, saj naj bi bile zajete kulturne vsebine v elektronskem okolju dolgoročno vzdržne in uporabne skozi čas in prostor.

Dr. Tomaž Erjavec, Dr. Matija Ogrin, Jan Jona Javoršek in Petra Vide Ogrin:
Od bibliografskega leksikona do znanstvenokritične izdaje: vprašanje trajnosti elektronskih besedil

V sodelovanju med IJS, ZRC ZASU in SAZU je v zadnjem desetletju nastala vrsta elektronskih znanstvenih izdaj in korpusov. Po kronologiji nastanka gre za naslednje zbirke:
  • eZISS: Elektronske znanstvenokritične izdaje slovenskega slovstva
  • NRSS: Neznani rokopisi slovenskega slovstva 17. in 18. stoletja
  • SBL 1925-1991: Slovenski bibliografski leksikon
  • eBZ: Elektronska besedilna zbirka 
Primer XML podatki po TEI v Slovenskem bibliografskem leksikonu:


Pri perspektivi trajnosti elektronskih besedil so nam avtorji predstavili dva ločena, a med seboj povezana vidika:
1. Problematika standardov kodiranja besedil, ki tekstom predstavljajo interoperabilnost in dolgoročno uporabnost.
2. Problematika shranjevanja besedil, ki mora biti izvedena tako, da so besedila shranjena varno in da je mogoče slediti morebitnim spremembam v njih.
Avtorske pravice: eZISS uporablja licenco Creative Commons, da imajo uporabniki enak dostop do izvornega XML.

Mario Pušič: Digitalni multimedijski arhivi (DMA) in dolgotrajna hramba podatkov

Digitalni Multimedijski Arhivi so lokalno ali nacionalno pomembni arhivski repozitoriji v katerih so v digitalni obliki shranjeni podatki o njihovih vsebinah. Dnevno se ukvarjajo z množico podatkov v obliki slik in ostale multimedije. Če imaš dobrega strokovnjaka/računalničarja, tudi prenos ogromnih baz iz ene v drugo ne sme delati problemov (kot so omenjale kolegice knjižničarke, da se dogaja pri COBISSu)
Avtorji priporočajo sledečo strukturo lokacij gradiva:

a) Primarna lokacija digitalnega arhiva na lokaciji uporabnika, v digitalni obliki na RAID poljih podpirtih z redundanco strežnikov in UPS-ov

b) Sekundarna lokacija digitalnega arhiva z enako zgradbo kot primarna lokacija (RAID polja itd.) le da se nahaja oddaljena vsaj 200 km od primarne lokacije. Preslikava podatkov v arhivu se dogaja v realnem času, vsako uro in ponoči.

c) Lokacija rezervnih kopij arhiva se nahaja na LTO trakovih na enaki lokaciji kot primarna lokacija ali dislocirani lokaciji v istem mestu kot primarna lokacija.

Nujen dokument vsakega digitalnega arhiva je Elaborat o vzpostavitvi in ureditvi arhiva. V njem je v celoti opisana vsa zgradba digitalnega arhiva, podatki o posameznih zbirkah ter podatki o formatih zapisov, ki se nahajajo v arhivu.


TRETJI SKLOP PREDAVANJ:

Martin Žvelc in Bojan Kosi: Mediateka- oddelek za digitaliziranje in trajno hranjenje vsebin

RTV Slovenija v svojih arhivih hrani velike količine zvokovnih in slikovnih gradiv, različnih dokumentov in notnih gradiv, ki so večinoma še v analogni obliki zapisa.
Sredi 80 let so začeli snemati na digitalne nosilce zvoka. Pri upravljanju z zvokovnimi vsebinami uporabljajo programsko opremo Mediarc nemškega podjetja NOA Audio Solutions.

Fond:
1951- 2010 : c. 150 000 ur gradiva na magnetofonskih trakovih
1945 – 1990 : 50 000 vinilnih plošč
1984 – 2010 : 50 000 CD / CDR nosilcev zvoka
Velja za vse tri centre: Ljubljana, Maribor in Koper
1990 – 2010 : 7000 DAT nosilcev zvoka
2000 – 2010 : 80 000 zvokovnih datotek v arhivih produkcijskih sistemov
Velja za vse tri centre: Ljubljana, Maribor in Koper

Projekt digitalizacije:
Leti 2006 in 2007 sta bili odločilni, saj niso vedeli ali bodo projekt razvijali doma ali v tujini. Ustanovitev Mediateke in začetek digitalizacije sta se pričeli leta 2008. Pri svojem delu skrbijo za čimbolj verni prepis materiala. Trenutno delajo 14 ur dnevno. Arhivski format zapisa je BMF, skenira se še v formatu MP3. RTVSLO uporablja za digitalizacijo programsko opremo NOA mediARC, ki ima tudi spletni vmesnik. Diskovna polja so velikosti do 130TB. RTVSLO arhiv ni na voljo javnosti, ker ni še dovolj popisan in obstaja še veliko pravnih vprašanj . V diskusiji, po predavanju, se je pojavilo še veliko vprašanj (izjemoma!) ampak je moderator na žalost na hitro prekinil razpravo, zaradi prekoračitve časovnega okvirja.


Tadej Vodopivec: Trajno ohranjanje računalniških programov

G. Vodopivec prihaja iz računalniškega podjetja ComTrade d.o.o., Ljubljana. Podjetje razvija programsko opremo po naročilu za končne stranke, za velika IT podjetja in tudi samostojno za trg. Med drugim so Arhivu RS pomagali vzpostaviti metodologijo za akreditirano previrjanje usklajenosti programske opreme v skladu z zakonom, ki ureja varstvo dokumentarnega in arhivskega gradiva v digitalni obliki.
Z vidika trajnega ohranjanja digitalnih virov sta pomembna dva vidika:
- izvorna »koda« - kaj je napisano ?
- prikaz - kaj vidimo ? (to želimo ohraniti)

Pri večprestavnostnih vsebinah je ohranjanje prvotne kode in prikaza zapleteno, saj jim dodajamo neko gibanje oz. dinamičnost, ki jo je težko ohraniti.


Različne vrste računalniških programov so :
  • aplikacijska programska oprema
  • sistemska programska oprema
  • vgradna programska oprema
  • makro-ji v dokumentih
  • relacijska podatkovna baza
  • t. i. Middleware

Kandidati za trajno hrambo, so vsi od zgoraj naštetih, ki delujejo po sistemu » look and feel« .
Motivov za trajno hrambo je več, npr.: poslovni razlogi, pravni razlogi, tehnična » kulturna dediščina« ....


Prispevek na konferenci odpira vprašanja kot so:
Kdo je zaintereseran za trajno hrambo, čemu sploh hramba računalniških programov, kdo naj jo zagotovi in za koga. Pri sami hrambi programa pa, kaj, kje in kako ohraniti ( izvorno kodo, zaslonske slike, dokumentacijo, družbeni kontekst programa ... ).


Branko Godec: Informacijske storitve za trajno ohranjanje digitalnih vsebin

Šlo je za sponzorsko predstavitev g. Godca Nadomestnega informacijskega centra (NIC) Pošte Slovenije. NIC je poseben,varen prostor za namestitev IT oprame. Zgrajen je kot varna celica, ki IT opremo varuje pred požarom, potresom, elektromagnetnim udarom, gasilnimi in drugimi tekočinami, korozivnimi plini ter ostalimi vplivi in posegi iz okolja. Posebni gasilni sistem zagotavlja protipožarno zaščito, ki ob sprožitvi ne poškuduje IT opreme in na njej hranjenih podatkov.

Pošta Slovenije nudi poleg shrambe IT opreme poslovnim uporabnikom, tudi t.i. storitev e-arhiv Pošte Slovenije. Ta zagotavlja varno hrambo dokumentarnega in arhivskega gradiva v digitalni obliki in je akreditirana pri Arhivu RS, zato za pravno veljavnost hranjenega gradiva jamči država.

Dr. Drago Kunej (SAZU) : Vpliv nekaterih ključnih dejavnikov okolja na življenjsko dobo fizičnih digitalnih nosilcev


g. Kunej je govoril o vplivu temperature, vlage in svetlobe na življenjsko dobo fizičnih digitalnih nosilcev, na primeru obtičnih digitalnih nosilcev (zvočni posnetki).
Danes je v veljavi koncept uveljavljanja vsebine in ne več nosilcev. Na SAZU so tako naredili test obstojnosti CD nosilcev na svetlobo. Pri tem so želeli ugotoviti prdvsem vpliv vsakdanjih razmer, ki so jim nosilci navadno izpostavljeni v raziskovalnih inštitucijah pri rednem delu z zvočnimi zbirkami. Rezultati so potrdili pomen skrbnega ravnanja, ustreznega skladiščenja in rednega testiranja nosilcev.


Digitalizacija sama po sebi torej  ne reši vseh težav zaščite in arhiviranja.


Aljoša Jerman Blažič: Dolgoročno zagotavljanje avtentičnosti in vzdrževanje celovitosti elektronsko hranjenega gradiva

G. Jerman Blažič je udeležencem predstavil 7 načel e-arhiviranja, ki so: načelo o dostopnosti, načelo o uporabnosti, načelo o izvirnosti, načelo o dolgoročnosti, načelo o verodostojnosti, načelo o celovitosti in avtentičnosti in načelo o vzdrževanju veljavnosti.
Govorili smo tudi o samem procesu e-arhiviranja, ki vključuje : zajem, vzdrževanje, ter izločanje oz. odbiranje.


V prispevku je bi predstavljen pristop, ki je trenutno predmet tehnološke standardizacije za dolgoročno zagotavljanje avtentičnosti in celovitosti elektronskega gradiva na osnovi sintakse evidenčnih podatkov. Le ta temelji na izvlečku dokumeta samega in kriptograpskih postopkih. Zagotavlja pa vključevanje varnostnih vsebin s strani tretjih oseb in obnovo varnostnih vsebin. Torej podpira obtimizacijo izvajanja procesa.


Dr. Mitja Dečman (Fakulteta za upravo, Univerza v Ljubljani) : Problematika dolgoločne hrambe spletnih strani

Svetovni splet je dandanes porazdeljena zbirka spletišč, ki so dostopna preko Interneta kjerkoli na spletu. Njegova vsebina se nenehno spreminja, nove informacije zamenjajo stare, kar povzroča izgubljanje velike količine podatkov in posledično izgubo znansteve, kulturne in druge dediščine. Spletna stran tako danes predstavlja neko aplikacija. Veliko je tudi t.i. skritega spleta. Interesi za hrambo iz vidika avtorja kot iz vidika uporabnika spleta so različni. Podatkovne zbirke so dandanes že nek povsem normalen standard. Različni brskalniki pa podpirajo različne standarde. Pri shranjevanju se je potrebno vprašati kaj bomo ohranili: vsebino, videz, dinamičnost, interaktivnost... Pred zajetjem moramo zato izbrati signifikantne značilnosti hrambe. Danes se največ hranjenja izvrši na področju žetev ( t.i. harvesting-a)


Končna ideja  pri hranjenju spletnih strani je tako določitev namena hrambe in signifikantnih lastnosti hranjenjih virov.

Dr. Alenka Kavčič Čolić in Janko Klasinc : Arhiviranje spletnih strani v Narodni in univerzitetni knjižnici


Nuk raziskuje metode zajemanja spleta že od l. 2001, vendar je lahko šele po letu 2006, s sprejetjem novega Zakona o obveznem izvodu publikacij, ki je vključeval tudi gradiva na spletu, lahko prevzel odgovornost za zbiranje in ohranjanje elektronskih publikacij na spletu v Sloveniji. Pri tem poznajo več različnih tehnik zajemanja spleta npr. ročni oz. polavtomatski, glede pokritosti in namena pa ekstenzivno, inetenzivno, kontinuirano in eksperimentalno.

Od 1.4.2007 sodelujejo z IIPC (International Internet Preservation Consortion). Delavne skupine za hranjenje spletnega gradiva v NUKu so : razvoj Heritrixa (web curator tool), razvoj orodji za iskanje in dostop in trajno ohranjanje spletnih arhivov. Heritrix je najboljše orodje in je open-source. NUK sodeluje tudi v številnih delovnih skupinah skupaj z IIPC spletni arhiv ima trenutno 535 spletišč 1,5 TB Od leta 2008 je bilo izvedenih 2.235 zajemov v skupnem času 5.831ur. Spletni arhiv ima do sedaj 535 spletišč (začeli konec leta 2008). Uspešnost zajema je 71 %. Dostop sam pa še ni javno urejen, tudi glede zakonskih predpisov.

Na koncu se je razvila živahna razprava o tem, kdo bo arhiviral katere spletne strani npr. občin.

Foto utrinke s konference si lahko pogledate tudi na: http://picasaweb.google.si/101509267163497312019/TrajnoDigitalno# Omeniti moramo še, da na konferenci ni bilo nobenega WI-FI dostopa. Toda Biblioteam se je znašel z  UMTS modemom in neomejenim prenosom podatkov. Konferenco smo v živo spremljali tudi preko Twitterja s ključno besedo #todv201.

Ker pa je danes 1.10. bi vas radi spomnili še na dan sledenja knjižnicam na Twitter-ju! Več na:

Ni komentarjev:

Objavite komentar