2. Co je to informační věda?
• předmětem studia informační vědy je informace ve
smyslu svého obsahu
• vylučuje formu informace, kterou se zabývá informatika
• zabývá se obsahovými strukturami informací,
• tyto struktury lze vyjádřit v konceptuálních modelech,
• lze je zachytit v syntaktické reprezentaci,
• zprostředkovat v informačních systémech.
3. Historie informační vědy: počátky
Dva samostatné proudy, směry, které ovlivnily informační vědu
• Humanitní, filozofický a sociální
• vycházel ze zkušeností knihoven a archivů
• ve 2. polovině 19. století, kdy začalo vznikat specializované
knihovnické povolání a tím i potřeby profesních knihovnických
organizací
• první knihovnická škola na světě byla otevřena v roce 1887 na
Kolumbijské univerzitě v New Yorku
• Matematicko-technický a kybernetický proud
• hlavní vliv měla kybernetika, která se zrodila na konci 40. let 20. století
• zakladateli jsou Vannevar Bush a Claude Shannon
• kybernetika je obor, který studuje chování a řízení složitých
organizovaných systémů,
• z kybernetiky se později odděluje „computer science" neboli věda o
počítačích, informatika
4. Zaměření informační vědy
Informační věda v rámci studia na UISK:
Studia
nových
médií
Knihovní
věda
(LIS)
Knižní
kultura
(Knihověda)
Informační věda
v INFORMAČNÍ
SPOLEČNOSTI
Informační věda
v INFORMAČNÍCH
INSTITUCÍCH
Informační věda
v PAMĚŤOVÝCH
INSTITUCÍCH
5. Co je to informace?
Původ slova - „informatio“ .. dávat obrys, nebo tvar.
Definice:
• Informace je zpráva nesená médiem, které může být hmotné
nebo energetické povahy.
• ISO: Any kind of knowledge about things, facts, concepts, etc.
of a universe of discourse that is exchangable among users.
• N. Wiener definuje informaci jako "obsah toho, co se vymění s
vnějším světem, když se mu přizpůsobujeme a působíme na
něj svým přizpůsobováním„
6. Tři přístupy k pojmu informace
M. Buckland vychází ze vztahů mezi znalostmi, objekty a
procesy a rozlišuje 3 pohledy:
Informace jako znalost
je objektem informace jako procesu. Jde o entitu, nikoliv
proces. Znalosti, názory, víra .. nelze se jich přímo dotknout.
Informace jako dokument
hmatatelná entita, dokument. Jde o fixovanou informaci,
informaci v určité materiální reprezentaci.
Informace jako proces
někdo někoho informuje, sděluje mu zprávu. Závisí na
kontextu.
7. Čtyři aspekty informace (Buckland)
Znalost
Sdělení Zpracování dat
DokumentVĚC
PROCES
NEHMOTNÁ HMOTNÁ
8. Hierarchie DATA– INFORMACE– ZNALOST
Tradiční pohled na vztah mezi těmito pojmy
INFORMACE jsou DATA plus význam
ZNALOST znamená INFORMACE plus kontext
(článek Saab, J., Information as Ontologization)
9. Sémantika a syntaxe informace
• Každá informace obsahuje dvě zásadně odlišné složky:
• Sémantický obsah (myšlenkový obsah, význam, smysl)
• prostá informace, poznatek, pochopený poznatek, znalost
• Syntaktickou formu (je to způsob, jak je sémantický obsah vyjádřen v
jazyce)
• syntaktická forma informace je obecně řetězec znaků, který tvoří dobře
vytvořený výraz použitého jazyka (podle daných gramatických pravidel)
• holá data, zkontrolovaná a ověřená data, „vyčištěná“ a uspořádaná data
• Vztah mezi sémantickým obsahem informace a syntaktickou formou
informace je základní funkcí jazyka.
• V této syntaktické formě jazyk slouží k zachycení a komunikování
sémantického obsahu informace.
11. Claude Elwood Shannon
(1916 - 2001)
matematik a inženýr, jeden ze zakladatelů teorie informace
uvědomil si, že stavy relé odpovídají pravdivostním hodnotám
v Booleově algebře, použil ji pro návrh relé sítí
ukázal, že libovolnou formuli Booleovy algebry lze implementovat ve formě
kombinačního (tranzistorového) obvodu
za války v Bellových laboratořích pracoval na vývoji přístrojů protiletecké palby
v r. 48 napsal „A mathematical theory of communication“
je třeba abstrahovat od významu informace, informace odstraňuje neurčitost
poprvé použil termín bit – binary digit
v 45 letech zanechal aktivní vědecké činnosti
12. Shannonovo chápání informace
odesílatel - kódování - kanál (médium) - kódování - příjemce
odhlíží od předchozích znalostí příjemce, od sémantického obsahu
informace
máme-li dvě možnosti a víme, že platí jedna z nich .. 1 bit
paradox – je třeba odhlédnout od smyslu zpráv, pak zbude forma, kterou
lze popsat jako posloupnost dovolených stavů
čím větší překvapení ve zprávě, tím větší je hodnota informace
13. Shanonova definice informace
Požadavky na míru informace dané zprávy:
• méně pravděpodobná zpráva nese více informace
• množství informace je vždy kladné
Zavedeme tyto termíny:
• abeceda ... množina všech symbolů
• zpráva ... jakákoliv posloupnost symbolů
Pak počet možných zpráv .. N délky .. n
nad abecedou s celkovým počtem symbolů ..s je
A: {0,1} tedy s=2
n = 1 N=2, I=1 ... přenos informace o velikosti 1 bitu
n = 2 N=4, I=2 ... přenos informace o velikosti 2 bity
n = 8 N=256, I=8 ... přenos informace o velikosti 8 bitů = 1 byte
(všechny zprávy mají stejnou pravděpodobnost)
n
sN NI 2log [ bit ]
15. Dva hlavní důvody informačního zahlcení
1. obrovský nárůst objemu dokumentů
a informací, které jsou dostupné –
tento objem narůstá exponenciálně
2. dostupností těchto informací –
kyberprostor se obrovským tempem
rozšiřuje, síť se zahušťuje a připojuje
další uživatele
15
Současný vývoj je nejvíce ovlivňován dvěma faktory:
16. Moorův zákon jako předpoklad
informační exploze
Potvrdily se předpoklady Moorova zákona z roku 1965 :
• složitost součástek (výkon) se každý rok zdvojnásobí při zachování
stejné ceny
• dnes říkáme: cca každých 18 měsíců se výpočetní výkon a
kapacita disků zdvojnásobí
• odhaduje se, že zůstane v platnosti i následujících 20 let
• za posledních cca 40 let tedy vzrostl výpočetní výkon přibližně 100
milionkrát
Bez této podmínky by informační exploze evidentně
nemohla probíhat, neměla potřebné technické předpoklady.
16
17. Rozpor
• Máme přístup k obrovskému množství informací ze
široké škály odvětví a oborů, je jen na nás, jak tohoto
potenciálu využijeme.
• Schopnost člověka "vstřebávat" informace je značně
omezena našimi intelektuálními schopnostmi a zvětšuje
se buď vůbec, nebo jen velmi pomalu.
17
18. Vyhledávání informací
Jsou dva možné přístupy, které umožní vytváření metadat, a tím
i zpracování a vyhledávání informací:
1. Ruční přístup – knihovnické kategorizace, thesaury, selekční jazyky.
2. Strojové zpracování – přístup hrubou výpočetní silou, vytváření
metadat bez zásahu člověka (rychlost, možnost zpracování velkých
datových objemů, paralelizace vyhledávacích procesů),
• účinný způsob jak zpracovat celou množinu informací v kyberprostoru.
18
23. Úvod
„Lidé nejenže používají informace, které je snadné najít;
oni dokonce používají informace, o kterých ví, že jsou málo
kvalitní a méně hodnověrné – pokud nevyžaduje přílišnou
námahu je najít – spíše než by použili informace, o kterých
ví, že jsou kvalitnější a hodnověrnější, ale je těžší je najít.“
(Bates, 2003)
„Nenuťte uživatele přemýšlet!“
(Krug, 2003)
23
24. Web scale discovery - cíle
• Výsledky jsou zobrazeny v jedné výsledkové
množině s jednotnou relevancí.
• Každý dotaz musí být prováděn ve všech
zdrojích knihovny (tištěné, elektronické,
digitalizované…).
• Zobrazení plného textu na jedno kliknutí.
• Integrace objednávání a čtenářského konta.
24
Marshall Breeding
26. Typické zdroje pro „discovery“
• licencované databáze
• knihovní fond
• volně dostupné dokumenty
a data (open access)
• digitální knihovny
• institucionální repozitáře
26
27. Plnění centrálního indexu
• Smlouvy s poskytovateli a agregátory různého typu
(typicky na 3 roky).
• Rozsah získávaných metadat:
• základní metadata
+ věcný popis
+ abstrakt
+ plný text
27
28. Hlavní dodavatelé pro ČR
Hlavní dodavatelé, kteří mají u nás zastoupení:
• PRIMO Central
• EBSCO Discovery Service
• Summon
• Zde si můžete prohlédnout
přehledný seznam ostatních důležitých discovery
systémů.
28
29. Doporučená literatura
• BAWDEN, D. a ROBINSON, L. Introduction to Information Science.
Vydání 1. London : Facet Publishing, 2012. 350 s. ISBN 978-1-85604-
810-1.
• NAUMANN, Friedrich. Dějiny informatiky : Od abaku k internetu.
Vydání 1. Praha : Academia, 2009. 422 s. ISBN 978-80-200-1730-7.
• PILECKÁ,Věra. Souvislosti a aspekty vztahu informační a kognitivní
vědy (studie). Člověk : časopis pro humanitní a společenské vědy
[online]. Vydáno dne 15.12.2007 [cit. 2008-09-19]. Dostupný z WWW:
http://clovek.ff.cuni.cz/view.php?cisloclanku=2008121602.
• STODOLA, Jiří. Předmět informační vědy a informační
vzdělávání. ProInflow [online].10.02.2011 [cit. 20.02.2012]. Dostupný
z WWW: <http://pro.inflow.cz/predmet-informacni-vedy-informacni-
vzdelavani>. ISSN 1804–2406.
30. Otázky, komentáře ?
Děkuji Vám za pozornost.
30
Martin Souček
martin.soucek@ff.cuni.cz
Ústav informačních studií a knihovnictví,
FF UK v Praze.