SlideShare une entreprise Scribd logo
1  sur  19
Télécharger pour lire hors ligne
Webarchiv
Český webový archiv, více
AISV143
16. března 2018
“český web”?
• bohemikální charakter zdroje (definice v collection policy)
• Území – zdroje publikované na území ČR
• Jazyk – všechny zdroje v češtině (bez ohledu na místo
vydání)
• Autorství – všechny zdroje českých autorů (bez ohledu na
místo vydání)
• Předmět/obsah – všechny zdroje, jejichž obsah se týká
České republiky nebo českého národa
(bez ohledu na místo vydání)
Historie Webarchivu
• 2000 - začátek (jako projekt NK ČR, MZK a MU ČR)
• 2001 - první archivované webové stránky
• 2005 - pravidelné sklízení obsahu
• 2007 - vstup do IIPC
Profil archivu
• stáří archivu: 3. 9. 2001
• ~ 250 TB
• frekvence sklízení: 1x - 1x|2x|6x|12x/year
• hloubka sklízení: 5000 - 15 000 objects
• přístupnost: in house/online access
• robot.txt nerespektujeme
• velké dilema pro webové archivy
• rozhodnutí má zásadní dopady na archiv
• “V současnosti standardně soubory robots.txt nezohledňujeme, jelikož
věříme, že historie webu by se měla uchovat v takové podobě, v jaké ho vidí
lidé a ne vyhledávače.”
Designated community
• koncový uživatelé, kteří by měli být schopni porozumět
konkrétní množině informací (OAIS)
• definice uživatelů určuje obsah i jeho formu
1. individuální uživatelé
2. institucionální uživatelé
3. výzkumníci a vědci
Zpřístupnění
• Wayback Machine (zobrazování)
• Vyhledávání:
• primárně WWW
• katalog Aleph
• Wayback Machine
• méně než 1 % zdrojů zpřístupněných online
• celý archiv dostupný pouze v Klementinu
• Bude to lepší v budoucnu? Ne.
• terminály v dalších knihovnách?
• metadata
● spravujeme sbírku webových stránek
● Celoplošná (dostupná z NK Klementinum)
● Tematická (volby, olympiáda, Karel IV., povodně…)
● Výběrová sklizeň (kurátorská práce)
Co dělá kurátor webového
archivu?
Jak se k nám jednotlivé zdroje dostanou?
● Samotní vydavatelé nebo uživatelé stránek - formulář na
webu/e-mail (Seeder)
● ISSN - online časopisy (České národní středisko ISSN)
● Kurátoři (konspekt -
http://aleph.nkp.cz/F/?func=file&file_name=konsp-nkc)
Výběrová sklizeň
Seeder
V jakém prostředí se pohybujeme?
3 kurátoři - konspekt (odpovědnost) - hodnocení
obsahové hledisko
● bohemikální (čj, území, autor, obsahově o ČR nebo Češích)
● volně přístupné
● nekomerční (výjimky - viz Škoda - význam pro ČR)
● unikátní informace
● aktuální a dlouhodobá informační hodnota
technické hledisko (viz Zdenko), web 2.0
● sociální sítě, externí doplňky a aplikace (viz Google maps), flash, vyhledávací pole, rozbalovací nabídky, javascript
● možnost kontroly přes archive.org a testovací sklizně
frekvence sklízení
Jak probíhá hodnocení zdrojů?
● před hodnocením - návrh přes ISSN nebo přes formulář
● Archivace zamítnuta - kritéria
● Návrh na přehodnocení - málo obsahu
● Technicky ověřit - možné technické problémy
● Archivace schválena
○ zkontaktovat úspěšně vydavatele (celkem 3 e-mailové oslovení)
○ návrh na CC nebo na smlouvu
○ podpis smlouvy nebo vystavení pod CC
Jak se komunikuje s vydavateli?
● Smlouva nebo CC
● Katalogizace
● Kontrola
● Web
● Wayback
● Aleph
Co potom Co uživatelé
rozšiřujeme povědomí o Webarchivu
● píšeme odborné i popularizační články
● chystáme obsah pro web/facebook - novinky/mrtvé weby/nové
smlouvy
● jezdíme po konferencích a píšeme příspěvky
● komunikujeme s úřady
Co děláme kromě kurátorství
● Účast na workshopu (23. března/9. nebo 11. dubna v Hostivaři)
● Individuální úkol
● Skupinový úkol
Ukončení předmětu
Individuální úkol
seminární práce
1 ze světových archivů: https://en.wikipedia.org/wiki/List_of_Web_archiving_initiatives
cca 1 - 2 stránky
termín odevzdání: 4. květen
monika.holoubkova@nkp.cz
tým A, B, C, D
Podkategorie Konspektu s méně než 5 zdroji: https://webarchiv.cz/cs/katalog-stranek
Najít 20 zdrojů (bohemikální charakter, neveřejné zdroje)
Quality assurance (technické hledisko)
Skupinový úkol
Mgr. Monika Holoubková
monika.holoubkova@nkp.cz
20. dubna (Marie Haškovcová)
- právnická problematika, Creative Commons, metadatový popis
4. května (Jaroslav Kvasnica)
- webové archivy pro badatele

Contenu connexe

Tendances

Elektronické publikování a vědecká komunikace
Elektronické publikování a vědecká komunikaceElektronické publikování a vědecká komunikace
Elektronické publikování a vědecká komunikacelindask
 
Prezentace - knihovny současnosti 2014
Prezentace - knihovny současnosti 2014Prezentace - knihovny současnosti 2014
Prezentace - knihovny současnosti 2014Barbora Buchtová
 
Uchování a trvalé zpřístupnění webových dokumentů
Uchování a trvalé zpřístupnění webových dokumentůUchování a trvalé zpřístupnění webových dokumentů
Uchování a trvalé zpřístupnění webových dokumentůtomas.sibek
 
Záležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikaceZáležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikacelindask
 
Digitalizace národního kulturního dědictví
Digitalizace národního kulturního dědictvíDigitalizace národního kulturního dědictví
Digitalizace národního kulturního dědictvíMichala Brožová
 
Adolf Knoll - Digitální knihovna Manuscriptorium
Adolf Knoll - Digitální knihovna ManuscriptoriumAdolf Knoll - Digitální knihovna Manuscriptorium
Adolf Knoll - Digitální knihovna ManuscriptoriumKISK FF MU
 
Virtualní národní fonotéka - jeden portál, dvě země, společné řešení.
Virtualní národní fonotéka - jeden portál, dvě země, společné řešení.Virtualní národní fonotéka - jeden portál, dvě země, společné řešení.
Virtualní národní fonotéka - jeden portál, dvě země, společné řešení.MoravskaZemskaKnihovna
 
Knihy znovu nalezené: příspěvek o interdisciplinárním přístupu ke knižnímu k...
Knihy znovu nalezené: příspěvek o interdisciplinárním přístupu ke  knižnímu k...Knihy znovu nalezené: příspěvek o interdisciplinárním přístupu ke  knižnímu k...
Knihy znovu nalezené: příspěvek o interdisciplinárním přístupu ke knižnímu k...Books Discovered Once Again
 
Virtuální depozitní knihovna – představení projektu a první výsledky
Virtuální depozitní knihovna – představení projektu a první výsledkyVirtuální depozitní knihovna – představení projektu a první výsledky
Virtuální depozitní knihovna – představení projektu a první výsledkyVirtualniDepozitniKnihovna
 
Terénními projekty k portálu pro zvukové dokumenty. zn. Spěchá.
Terénními projekty k portálu pro zvukové dokumenty. zn. Spěchá.Terénními projekty k portálu pro zvukové dokumenty. zn. Spěchá.
Terénními projekty k portálu pro zvukové dokumenty. zn. Spěchá.MoravskaZemskaKnihovna
 
Aplikace pro průzkum fyzického stavu novodobých knihovních fondů
Aplikace pro průzkum fyzického stavu novodobých knihovních fondůAplikace pro průzkum fyzického stavu novodobých knihovních fondů
Aplikace pro průzkum fyzického stavu novodobých knihovních fondůVirtualniDepozitniKnihovna
 
Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR)
 Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR)  Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR)
Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR) Národní technická knihovna (NTK)
 

Tendances (20)

Blok expertu
Blok expertuBlok expertu
Blok expertu
 
Elektronické publikování a vědecká komunikace
Elektronické publikování a vědecká komunikaceElektronické publikování a vědecká komunikace
Elektronické publikování a vědecká komunikace
 
Kurz webové archivace 2017/3
Kurz webové archivace 2017/3Kurz webové archivace 2017/3
Kurz webové archivace 2017/3
 
Informační zdroje pro anglistiku
Informační zdroje pro anglistikuInformační zdroje pro anglistiku
Informační zdroje pro anglistiku
 
Český webový archiv
Český webový archivČeský webový archiv
Český webový archiv
 
Prezentace - knihovny současnosti 2014
Prezentace - knihovny současnosti 2014Prezentace - knihovny současnosti 2014
Prezentace - knihovny současnosti 2014
 
Uchování a trvalé zpřístupnění webových dokumentů
Uchování a trvalé zpřístupnění webových dokumentůUchování a trvalé zpřístupnění webových dokumentů
Uchování a trvalé zpřístupnění webových dokumentů
 
Slezska digitalni knihovna
Slezska digitalni knihovnaSlezska digitalni knihovna
Slezska digitalni knihovna
 
Seminar KK II.
Seminar KK II.Seminar KK II.
Seminar KK II.
 
Záležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikaceZáležitosti elektronického publikování a současné metody vědecké komunikace
Záležitosti elektronického publikování a současné metody vědecké komunikace
 
Digitalizace národního kulturního dědictví
Digitalizace národního kulturního dědictvíDigitalizace národního kulturního dědictví
Digitalizace národního kulturního dědictví
 
Adolf Knoll - Digitální knihovna Manuscriptorium
Adolf Knoll - Digitální knihovna ManuscriptoriumAdolf Knoll - Digitální knihovna Manuscriptorium
Adolf Knoll - Digitální knihovna Manuscriptorium
 
Virtualní národní fonotéka - jeden portál, dvě země, společné řešení.
Virtualní národní fonotéka - jeden portál, dvě země, společné řešení.Virtualní národní fonotéka - jeden portál, dvě země, společné řešení.
Virtualní národní fonotéka - jeden portál, dvě země, společné řešení.
 
Knihy znovu nalezené: příspěvek o interdisciplinárním přístupu ke knižnímu k...
Knihy znovu nalezené: příspěvek o interdisciplinárním přístupu ke  knižnímu k...Knihy znovu nalezené: příspěvek o interdisciplinárním přístupu ke  knižnímu k...
Knihy znovu nalezené: příspěvek o interdisciplinárním přístupu ke knižnímu k...
 
Informační zdroje pro germanistiku
Informační zdroje pro germanistiku Informační zdroje pro germanistiku
Informační zdroje pro germanistiku
 
Virtuální depozitní knihovna – představení projektu a první výsledky
Virtuální depozitní knihovna – představení projektu a první výsledkyVirtuální depozitní knihovna – představení projektu a první výsledky
Virtuální depozitní knihovna – představení projektu a první výsledky
 
Terénními projekty k portálu pro zvukové dokumenty. zn. Spěchá.
Terénními projekty k portálu pro zvukové dokumenty. zn. Spěchá.Terénními projekty k portálu pro zvukové dokumenty. zn. Spěchá.
Terénními projekty k portálu pro zvukové dokumenty. zn. Spěchá.
 
Aplikace pro průzkum fyzického stavu novodobých knihovních fondů
Aplikace pro průzkum fyzického stavu novodobých knihovních fondůAplikace pro průzkum fyzického stavu novodobých knihovních fondů
Aplikace pro průzkum fyzického stavu novodobých knihovních fondů
 
Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR)
 Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR)  Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR)
Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR)
 
Budování virtuální depozitní knihovny
Budování virtuální depozitní knihovnyBudování virtuální depozitní knihovny
Budování virtuální depozitní knihovny
 

Similaire à Kurz webové archivace 2018/2

Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz v Bloku expertů KISK 2017 Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz v Bloku expertů KISK 2017 Knihovny.cz
 
Filip Šír: Virtuální národní fonotéka
Filip Šír: Virtuální národní fonotéka Filip Šír: Virtuální národní fonotéka
Filip Šír: Virtuální národní fonotéka ÚISK FF UK
 
Petr Žabička - Specializované portály a regionální souborné katalogy
Petr Žabička - Specializované portály a regionální souborné katalogyPetr Žabička - Specializované portály a regionální souborné katalogy
Petr Žabička - Specializované portály a regionální souborné katalogyMoravskaZemskaKnihovna
 
Jiří Nechvátal: Projekt Obálky knih
Jiří Nechvátal: Projekt Obálky knihJiří Nechvátal: Projekt Obálky knih
Jiří Nechvátal: Projekt Obálky knihÚISK FF UK
 
Informační zdroje pro obor klasická studia
Informační zdroje pro obor klasická studia Informační zdroje pro obor klasická studia
Informační zdroje pro obor klasická studia Ústřední knihovna FF MU
 
Jiří Nechvátal: Projekt Obálkyknih.cz
Jiří Nechvátal: Projekt Obálkyknih.czJiří Nechvátal: Projekt Obálkyknih.cz
Jiří Nechvátal: Projekt Obálkyknih.czÚISK FF UK
 
Knihovny.cz - centrální portál českých knihoven
Knihovny.cz - centrální portál českých knihovenKnihovny.cz - centrální portál českých knihoven
Knihovny.cz - centrální portál českých knihovenKnihovny.cz
 
Projekt Europeana Newspapers - online brána k evropským historickým novinám
Projekt Europeana Newspapers - online brána k evropským historickým novinámProjekt Europeana Newspapers - online brána k evropským historickým novinám
Projekt Europeana Newspapers - online brána k evropským historickým novinámEuropeana Newspapers
 
KP-SYS: Portaro / Tomáš Krejzek, Jan Pachol
KP-SYS: Portaro / Tomáš Krejzek, Jan PacholKP-SYS: Portaro / Tomáš Krejzek, Jan Pachol
KP-SYS: Portaro / Tomáš Krejzek, Jan PacholInfodays
 
Průvodce databázemi pro studenty oboru Dějiny starověku
Průvodce databázemi pro studenty oboru Dějiny starověkuPrůvodce databázemi pro studenty oboru Dějiny starověku
Průvodce databázemi pro studenty oboru Dějiny starověkuÚstřední knihovna FF MU
 
Knihovna 2.0
Knihovna 2.0Knihovna 2.0
Knihovna 2.0JanKanka
 
Přednáška o vyhledávání informací, informačních zdrojích, citacích...
Přednáška o vyhledávání informací, informačních zdrojích, citacích...Přednáška o vyhledávání informací, informačních zdrojích, citacích...
Přednáška o vyhledávání informací, informačních zdrojích, citacích...Drahomíra Dvořáková
 
Průvodce databázemi pro studenty oboru Mediteránní studia
Průvodce databázemi pro studenty oboru Mediteránní studiaPrůvodce databázemi pro studenty oboru Mediteránní studia
Průvodce databázemi pro studenty oboru Mediteránní studiaÚstřední knihovna FF MU
 
Elektronické informační zdroje pro studenty KISKu
Elektronické informační zdroje pro studenty KISKuElektronické informační zdroje pro studenty KISKu
Elektronické informační zdroje pro studenty KISKuÚstřední knihovna FF MU
 

Similaire à Kurz webové archivace 2018/2 (20)

Kurz webové Archivare I.
Kurz webové Archivare I.Kurz webové Archivare I.
Kurz webové Archivare I.
 
Kurz webové archivace 2018/1
Kurz webové archivace 2018/1Kurz webové archivace 2018/1
Kurz webové archivace 2018/1
 
Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz v Bloku expertů KISK 2017 Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz v Bloku expertů KISK 2017
 
Knihovny.cz v Bloku expertů 2017
Knihovny.cz v Bloku expertů 2017Knihovny.cz v Bloku expertů 2017
Knihovny.cz v Bloku expertů 2017
 
Filip Šír: Virtuální národní fonotéka
Filip Šír: Virtuální národní fonotéka Filip Šír: Virtuální národní fonotéka
Filip Šír: Virtuální národní fonotéka
 
Petr Žabička - Specializované portály a regionální souborné katalogy
Petr Žabička - Specializované portály a regionální souborné katalogyPetr Žabička - Specializované portály a regionální souborné katalogy
Petr Žabička - Specializované portály a regionální souborné katalogy
 
Jiří Nechvátal: Projekt Obálky knih
Jiří Nechvátal: Projekt Obálky knihJiří Nechvátal: Projekt Obálky knih
Jiří Nechvátal: Projekt Obálky knih
 
Informační zdroje pro obor klasická studia
Informační zdroje pro obor klasická studia Informační zdroje pro obor klasická studia
Informační zdroje pro obor klasická studia
 
Jiří Nechvátal: Projekt Obálkyknih.cz
Jiří Nechvátal: Projekt Obálkyknih.czJiří Nechvátal: Projekt Obálkyknih.cz
Jiří Nechvátal: Projekt Obálkyknih.cz
 
Knihovny.cz - centrální portál českých knihoven
Knihovny.cz - centrální portál českých knihovenKnihovny.cz - centrální portál českých knihoven
Knihovny.cz - centrální portál českých knihoven
 
M. Lhoták
M. LhotákM. Lhoták
M. Lhoták
 
Tematické kolekce jako měřítko kvality webových archivů
Tematické kolekce jako měřítko kvality webových archivůTematické kolekce jako měřítko kvality webových archivů
Tematické kolekce jako měřítko kvality webových archivů
 
Projekt Europeana Newspapers - online brána k evropským historickým novinám
Projekt Europeana Newspapers - online brána k evropským historickým novinámProjekt Europeana Newspapers - online brána k evropským historickým novinám
Projekt Europeana Newspapers - online brána k evropským historickým novinám
 
KP-SYS: Portaro / Tomáš Krejzek, Jan Pachol
KP-SYS: Portaro / Tomáš Krejzek, Jan PacholKP-SYS: Portaro / Tomáš Krejzek, Jan Pachol
KP-SYS: Portaro / Tomáš Krejzek, Jan Pachol
 
Průvodce databázemi pro studenty oboru Dějiny starověku
Průvodce databázemi pro studenty oboru Dějiny starověkuPrůvodce databázemi pro studenty oboru Dějiny starověku
Průvodce databázemi pro studenty oboru Dějiny starověku
 
Knihovna 2.0
Knihovna 2.0Knihovna 2.0
Knihovna 2.0
 
Přednáška o vyhledávání informací, informačních zdrojích, citacích...
Přednáška o vyhledávání informací, informačních zdrojích, citacích...Přednáška o vyhledávání informací, informačních zdrojích, citacích...
Přednáška o vyhledávání informací, informačních zdrojích, citacích...
 
Průvodce databázemi pro studenty oboru Mediteránní studia
Průvodce databázemi pro studenty oboru Mediteránní studiaPrůvodce databázemi pro studenty oboru Mediteránní studia
Průvodce databázemi pro studenty oboru Mediteránní studia
 
Elektronické informační zdroje pro studenty KISKu
Elektronické informační zdroje pro studenty KISKuElektronické informační zdroje pro studenty KISKu
Elektronické informační zdroje pro studenty KISKu
 
Centrální portál knihoven
Centrální portál knihovenCentrální portál knihoven
Centrální portál knihoven
 

Plus de Webarchive of National Library of the Czech Republic

Plus de Webarchive of National Library of the Czech Republic (19)

Inzerat - datovy analytik / datova analyticka
Inzerat - datovy analytik / datova analyticka Inzerat - datovy analytik / datova analyticka
Inzerat - datovy analytik / datova analyticka
 
Inzerát datovy analytik_wa
Inzerát datovy analytik_waInzerát datovy analytik_wa
Inzerát datovy analytik_wa
 
Sys admin wa_rvv
Sys admin wa_rvvSys admin wa_rvv
Sys admin wa_rvv
 
Volné pracovní místo - kurátor/ka webového archivu
Volné pracovní místo - kurátor/ka webového archivuVolné pracovní místo - kurátor/ka webového archivu
Volné pracovní místo - kurátor/ka webového archivu
 
Webarchiv - Curatorial approaches, topic collections and cooperation with the...
Webarchiv - Curatorial approaches, topic collections and cooperation with the...Webarchiv - Curatorial approaches, topic collections and cooperation with the...
Webarchiv - Curatorial approaches, topic collections and cooperation with the...
 
Volné místo - analytik českého webového archivu
Volné místo - analytik českého webového archivuVolné místo - analytik českého webového archivu
Volné místo - analytik českého webového archivu
 
Webarchiv aneb až po lokty v mrtvolách
Webarchiv aneb až po lokty v mrtvoláchWebarchiv aneb až po lokty v mrtvolách
Webarchiv aneb až po lokty v mrtvolách
 
Datovy analytik
Datovy analytikDatovy analytik
Datovy analytik
 
Webarchiv CZ 2017
Webarchiv CZ 2017Webarchiv CZ 2017
Webarchiv CZ 2017
 
Kurz webové archivace 2017/2
Kurz webové archivace 2017/2Kurz webové archivace 2017/2
Kurz webové archivace 2017/2
 
WARC 1.1 je skoro tady - co přinese nová verze?
WARC 1.1 je skoro tady - co přinese nová verze?WARC 1.1 je skoro tady - co přinese nová verze?
WARC 1.1 je skoro tady - co přinese nová verze?
 
WARC 1.1 je skoro tady - co přinese nová verze
WARC 1.1 je skoro tady - co přinese nová verzeWARC 1.1 je skoro tady - co přinese nová verze
WARC 1.1 je skoro tady - co přinese nová verze
 
Mezi snem a realitou. Otevřená data českého webového archivu.
Mezi snem a realitou. Otevřená data českého webového archivu.Mezi snem a realitou. Otevřená data českého webového archivu.
Mezi snem a realitou. Otevřená data českého webového archivu.
 
Kurz webové archivace III.
Kurz webové archivace III.Kurz webové archivace III.
Kurz webové archivace III.
 
Kurz webové archivace II.
Kurz webové archivace II.Kurz webové archivace II.
Kurz webové archivace II.
 
Webarchiv jako digitální knihovna II.
Webarchiv jako digitální knihovna II.Webarchiv jako digitální knihovna II.
Webarchiv jako digitální knihovna II.
 
Prezentace obsahu webového archivu
Prezentace obsahu webového archivuPrezentace obsahu webového archivu
Prezentace obsahu webového archivu
 
Infrastruktura památníku českého webu a zkušenosti s Heritrixem
Infrastruktura památníku českého webu a zkušenosti s HeritrixemInfrastruktura památníku českého webu a zkušenosti s Heritrixem
Infrastruktura památníku českého webu a zkušenosti s Heritrixem
 
Veřejné služby pro Dark archives
Veřejné služby pro Dark archivesVeřejné služby pro Dark archives
Veřejné služby pro Dark archives
 

Kurz webové archivace 2018/2

  • 1. Webarchiv Český webový archiv, více AISV143 16. března 2018
  • 2. “český web”? • bohemikální charakter zdroje (definice v collection policy) • Území – zdroje publikované na území ČR • Jazyk – všechny zdroje v češtině (bez ohledu na místo vydání) • Autorství – všechny zdroje českých autorů (bez ohledu na místo vydání) • Předmět/obsah – všechny zdroje, jejichž obsah se týká České republiky nebo českého národa (bez ohledu na místo vydání)
  • 3. Historie Webarchivu • 2000 - začátek (jako projekt NK ČR, MZK a MU ČR) • 2001 - první archivované webové stránky • 2005 - pravidelné sklízení obsahu • 2007 - vstup do IIPC
  • 4. Profil archivu • stáří archivu: 3. 9. 2001 • ~ 250 TB • frekvence sklízení: 1x - 1x|2x|6x|12x/year • hloubka sklízení: 5000 - 15 000 objects • přístupnost: in house/online access
  • 5. • robot.txt nerespektujeme • velké dilema pro webové archivy • rozhodnutí má zásadní dopady na archiv • “V současnosti standardně soubory robots.txt nezohledňujeme, jelikož věříme, že historie webu by se měla uchovat v takové podobě, v jaké ho vidí lidé a ne vyhledávače.”
  • 6. Designated community • koncový uživatelé, kteří by měli být schopni porozumět konkrétní množině informací (OAIS) • definice uživatelů určuje obsah i jeho formu 1. individuální uživatelé 2. institucionální uživatelé 3. výzkumníci a vědci
  • 7. Zpřístupnění • Wayback Machine (zobrazování) • Vyhledávání: • primárně WWW • katalog Aleph • Wayback Machine
  • 8. • méně než 1 % zdrojů zpřístupněných online • celý archiv dostupný pouze v Klementinu • Bude to lepší v budoucnu? Ne. • terminály v dalších knihovnách? • metadata
  • 9. ● spravujeme sbírku webových stránek ● Celoplošná (dostupná z NK Klementinum) ● Tematická (volby, olympiáda, Karel IV., povodně…) ● Výběrová sklizeň (kurátorská práce) Co dělá kurátor webového archivu?
  • 10. Jak se k nám jednotlivé zdroje dostanou? ● Samotní vydavatelé nebo uživatelé stránek - formulář na webu/e-mail (Seeder) ● ISSN - online časopisy (České národní středisko ISSN) ● Kurátoři (konspekt - http://aleph.nkp.cz/F/?func=file&file_name=konsp-nkc) Výběrová sklizeň
  • 11. Seeder V jakém prostředí se pohybujeme?
  • 12. 3 kurátoři - konspekt (odpovědnost) - hodnocení obsahové hledisko ● bohemikální (čj, území, autor, obsahově o ČR nebo Češích) ● volně přístupné ● nekomerční (výjimky - viz Škoda - význam pro ČR) ● unikátní informace ● aktuální a dlouhodobá informační hodnota technické hledisko (viz Zdenko), web 2.0 ● sociální sítě, externí doplňky a aplikace (viz Google maps), flash, vyhledávací pole, rozbalovací nabídky, javascript ● možnost kontroly přes archive.org a testovací sklizně frekvence sklízení Jak probíhá hodnocení zdrojů?
  • 13. ● před hodnocením - návrh přes ISSN nebo přes formulář ● Archivace zamítnuta - kritéria ● Návrh na přehodnocení - málo obsahu ● Technicky ověřit - možné technické problémy ● Archivace schválena ○ zkontaktovat úspěšně vydavatele (celkem 3 e-mailové oslovení) ○ návrh na CC nebo na smlouvu ○ podpis smlouvy nebo vystavení pod CC Jak se komunikuje s vydavateli?
  • 14. ● Smlouva nebo CC ● Katalogizace ● Kontrola ● Web ● Wayback ● Aleph Co potom Co uživatelé
  • 15. rozšiřujeme povědomí o Webarchivu ● píšeme odborné i popularizační články ● chystáme obsah pro web/facebook - novinky/mrtvé weby/nové smlouvy ● jezdíme po konferencích a píšeme příspěvky ● komunikujeme s úřady Co děláme kromě kurátorství
  • 16. ● Účast na workshopu (23. března/9. nebo 11. dubna v Hostivaři) ● Individuální úkol ● Skupinový úkol Ukončení předmětu
  • 17. Individuální úkol seminární práce 1 ze světových archivů: https://en.wikipedia.org/wiki/List_of_Web_archiving_initiatives cca 1 - 2 stránky termín odevzdání: 4. květen monika.holoubkova@nkp.cz
  • 18. tým A, B, C, D Podkategorie Konspektu s méně než 5 zdroji: https://webarchiv.cz/cs/katalog-stranek Najít 20 zdrojů (bohemikální charakter, neveřejné zdroje) Quality assurance (technické hledisko) Skupinový úkol
  • 19. Mgr. Monika Holoubková monika.holoubkova@nkp.cz 20. dubna (Marie Haškovcová) - právnická problematika, Creative Commons, metadatový popis 4. května (Jaroslav Kvasnica) - webové archivy pro badatele