Kurz webové Archivare I.

•

0 j'aime•133 vues

Webarchive of National Library of the Czech Republic

1. prezentace z Kurzu webové archivace na UISK. Obecně o webové archivaci a o českém webovém archivu

Technologie

Webová archivace
Web archiving is the process of collecting portions of the
World Wide Web to ensure the information is preserved in
an archive for future researchers, historians, and the public.

Web scale archiving
• webové archivy se snaží archivovat tak velkou část
internetu, že není možné kontrolovat akvizici, ochranu,
zpřístupnění ani kontrolu kvality jednotlivých webových
stránek pouze lidskými silami.

Limity webové archivace
• legislativa + budget
• deep web (?)
• web 2.0 (streaming, passwords, databases)
• dlouhodobá ochrana

Technické překážky
• Flash, Ajax, JavaScript …
• technických překážek je mnoho, řešení?
• univerzální řešení neexistuje

Kdo jsou webové archivy
• Internet Archive
• Národní knihovny
• Univerzity, neziskové organizace

Memento
• agregátor webových archivů
• https://www.youtube.com/watch?v=WtZHKeFwjzk

Dark archives
• veřejně nepřístupné archivy
• většinou pouze v místě samé, někdy ani to ne
• autorský zákon, knihovní licence

Historie Webarchivu
• 2000 - začátek (jako projekt NK ČR, MZK a MU ČR)
• 2001 - první archivované webové stránky
• 2005 - pravidelné sklízení obsahu
• 2007 - vstup do IIPC

Proﬁl archivu
• stáří archivu: 3. 9. 2001
• ~ 200 TB
• frekvence sklízení: 1x - 1x|2x|6x|12x/year
• hloubka sklízení: 5000 - 15 000 objects
• přístupnost: in house/online access

• robot.txt nerespektujeme
• velké dilema pro webové archivy
• rozhodnutí má zásadní dopady na archiv
• “V současnosti standardně soubory robots.txt nezohledňujeme,
jelikož věříme, že historie webu by se měla uchovat v takové podobě,
v jaké ho vidí lidé a ne vyhledávače.”

Designated community
• koncový uživatelé, kteří by měli být schopni porozumět
konkrétní množině informací (OAIS)
• deﬁnice uživatelů určuje obsah i jeho formu
1. individuální uživatelé
2. institucionální uživatelé
3. výzkumníci a vědci

Zpřístupnění
• Wayback Machine (zobrazování)
• Vyhledávání:
• primárně WWW
• katalog Aleph
• Wayback Machine

Role kurátora
• komunikace s vydavateli
• “plnění” konspektu
• správa webových zdrojů vč. hodnocení
• katalogizace
• quality assurance

Kurátorství ve světě
• Technicky vyřešeno
• Důraz na kolekce
• IIPC collaborative collections
• Sociální sítě

Jak to děláme my?
• Tematické sklizně
• Plníme konspekt
• Chystáme kolekce a zapojení dalších institucí

w
w w
w w w
Děkuji za pozornost!
Jaroslav Kvasnica
jaroslav.kvasnica@nkp.cz

Contenu connexe

Similaire à Kurz webové Archivare I.

Kurz webové archivace 2018/2Webarchive of National Library of the Czech Republic

Knihovna 2.0 + Google DocsJanKanka

KP-SYS: Portaro / Tomáš Krejzek, Jan PacholInfodays

Knihovna 2.0JanKanka

Komu se nelení, tomu se zelení - Open Access GreenhornsTereza Simandlová

Knihovny.cz v Bloku expertů KISK 2017 Knihovny.cz

Knihovny.cz v Bloku expertů 2017Centrální portál knihoven

Informační zdroje pro obor klasická studia Ústřední knihovna FF MU

Online katalogy a weby knihovenJanKanka

Průvodce databázemi pro studenty Ústavu klasických studiíÚstřední knihovna FF MU

Knihovny.cz - centrální portál českých knihovenKnihovny.cz

Uchování a trvalé zpřístupnění webových dokumentůtomas.sibek

Library 2.0 / Knihovna 2.0JanKanka

Do knihovny skrze webovy prohlizeMilan Janíček

Elektronické informační zdroje pro studium humanitních oborůÚstřední knihovna FF MU

EIZ v práci doktorandůÚstřední knihovna FF MU

Open source v e learninguMichal Černý

Odborné informace onlie Ústřední knihovna FF MU

Elektronické informační zdroje na VUT a vědecké publikování - FSIUstredni knihovna VUT

Průvodce databázemi pro studenty oboru Mediteránní studiaÚstřední knihovna FF MU

Similaire à Kurz webové Archivare I. (20)

Kurz webové archivace 2018/2

Knihovna 2.0 + Google Docs

KP-SYS: Portaro / Tomáš Krejzek, Jan Pachol

Knihovna 2.0

Komu se nelení, tomu se zelení - Open Access Greenhorns

Knihovny.cz v Bloku expertů KISK 2017

Knihovny.cz v Bloku expertů 2017

Informační zdroje pro obor klasická studia

Online katalogy a weby knihoven

Průvodce databázemi pro studenty Ústavu klasických studií

Knihovny.cz - centrální portál českých knihoven

Uchování a trvalé zpřístupnění webových dokumentů

Library 2.0 / Knihovna 2.0

Do knihovny skrze webovy prohlize

Elektronické informační zdroje pro studium humanitních oborů

EIZ v práci doktorandů

Open source v e learningu

Odborné informace onlie

Elektronické informační zdroje na VUT a vědecké publikování - FSI

Průvodce databázemi pro studenty oboru Mediteránní studia

Plus de Webarchive of National Library of the Czech Republic

Inzerat - datovy analytik / datova analyticka Webarchive of National Library of the Czech Republic

Inzerát datovy analytik_waWebarchive of National Library of the Czech Republic

Sys admin wa_rvvWebarchive of National Library of the Czech Republic

Volné pracovní místo - kurátor/ka webového archivuWebarchive of National Library of the Czech Republic

Webarchiv - Curatorial approaches, topic collections and cooperation with the...Webarchive of National Library of the Czech Republic

Volné místo - analytik českého webového archivuWebarchive of National Library of the Czech Republic

Webarchiv aneb až po lokty v mrtvoláchWebarchive of National Library of the Czech Republic

Datovy analytikWebarchive of National Library of the Czech Republic

Webarchiv CZ 2017Webarchive of National Library of the Czech Republic

Kurz webové archivace 2017/4Webarchive of National Library of the Czech Republic

Kurz webové archivace 2017/3Webarchive of National Library of the Czech Republic

Kurz webové archivace 2017/2Webarchive of National Library of the Czech Republic

WARC 1.1 je skoro tady - co přinese nová verze?Webarchive of National Library of the Czech Republic

WARC 1.1 je skoro tady - co přinese nová verzeWebarchive of National Library of the Czech Republic

Mezi snem a realitou. Otevřená data českého webového archivu.Webarchive of National Library of the Czech Republic

Kurz webové archivace III.Webarchive of National Library of the Czech Republic

Kurz webové archivace II.Webarchive of National Library of the Czech Republic

Webarchiv jako digitální knihovna II.Webarchive of National Library of the Czech Republic

Prezentace obsahu webového archivuWebarchive of National Library of the Czech Republic

Infrastruktura památníku českého webu a zkušenosti s HeritrixemWebarchive of National Library of the Czech Republic

Plus de Webarchive of National Library of the Czech Republic (20)

Inzerat - datovy analytik / datova analyticka

Inzerát datovy analytik_wa

Sys admin wa_rvv

Volné pracovní místo - kurátor/ka webového archivu

Webarchiv - Curatorial approaches, topic collections and cooperation with the...

Volné místo - analytik českého webového archivu

Webarchiv aneb až po lokty v mrtvolách

Datovy analytik

Webarchiv CZ 2017

Kurz webové archivace 2017/4

Kurz webové archivace 2017/3

Kurz webové archivace 2017/2

WARC 1.1 je skoro tady - co přinese nová verze?

WARC 1.1 je skoro tady - co přinese nová verze

Mezi snem a realitou. Otevřená data českého webového archivu.

Kurz webové archivace III.

Kurz webové archivace II.

Webarchiv jako digitální knihovna II.

Prezentace obsahu webového archivu

Infrastruktura památníku českého webu a zkušenosti s Heritrixem

Kurz webové Archivare I.

1. Webarchiv Kurz webové archivace, AIS142

2. Webová archivace Web archiving is the process of collecting portions of the World Wide Web to ensure the information is preserved in an archive for future researchers, historians, and the public.

3. Proč archivovat web?

4. Web scale archiving • webové archivy se snaží archivovat tak velkou část internetu, že není možné kontrolovat akvizici, ochranu, zpřístupnění ani kontrolu kvality jednotlivých webových stránek pouze lidskými silami.

5. Limity webové archivace • legislativa + budget • deep web (?) • web 2.0 (streaming, passwords, databases) • dlouhodobá ochrana

6. Technické překážky • Flash, Ajax, JavaScript … • technických překážek je mnoho, řešení? • univerzální řešení neexistuje

7. Kdo jsou webové archivy • Internet Archive • Národní knihovny • Univerzity, neziskové organizace

8. Memento • agregátor webových archivů • https://www.youtube.com/watch?v=WtZHKeFwjzk

9. Dark archives • veřejně nepřístupné archivy • většinou pouze v místě samé, někdy ani to ne • autorský zákon, knihovní licence

10. Webarchiv Český webový archiv, více

11. Historie Webarchivu • 2000 - začátek (jako projekt NK ČR, MZK a MU ČR) • 2001 - první archivované webové stránky • 2005 - pravidelné sklízení obsahu • 2007 - vstup do IIPC

12. Proﬁl archivu • stáří archivu: 3. 9. 2001 • ~ 200 TB • frekvence sklízení: 1x - 1x|2x|6x|12x/year • hloubka sklízení: 5000 - 15 000 objects • přístupnost: in house/online access

13. Rozložení domén

14. Tempo růstu

15.

16. • robot.txt nerespektujeme • velké dilema pro webové archivy • rozhodnutí má zásadní dopady na archiv • “V současnosti standardně soubory robots.txt nezohledňujeme, jelikož věříme, že historie webu by se měla uchovat v takové podobě, v jaké ho vidí lidé a ne vyhledávače.”

17. Designated community • koncový uživatelé, kteří by měli být schopni porozumět konkrétní množině informací (OAIS) • deﬁnice uživatelů určuje obsah i jeho formu 1. individuální uživatelé 2. institucionální uživatelé 3. výzkumníci a vědci

18. Zpřístupnění • Wayback Machine (zobrazování) • Vyhledávání: • primárně WWW • katalog Aleph • Wayback Machine

19. Role kurátora • komunikace s vydavateli • “plnění” konspektu • správa webových zdrojů vč. hodnocení • katalogizace • quality assurance

20. Kurátorství ve světě • Technicky vyřešeno • Důraz na kolekce • IIPC collaborative collections • Sociální sítě

21.

22.

23. Jak to děláme my? • Tematické sklizně • Plníme konspekt • Chystáme kolekce a zapojení dalších institucí

24. w w w w w w Děkuji za pozornost! Jaroslav Kvasnica jaroslav.kvasnica@nkp.cz

Kurz webové Archivare I.

Recommandé

Recommandé

Contenu connexe

Similaire à Kurz webové Archivare I.

Similaire à Kurz webové Archivare I. (20)

Plus de Webarchive of National Library of the Czech Republic

Plus de Webarchive of National Library of the Czech Republic (20)

Kurz webové Archivare I.