SlideShare une entreprise Scribd logo
1  sur  164
INFORMACIJSKA TEHNIKA
Teorija informacije
Predavač: prof.dr.sc. Franjo Jović
Kontakt: franjo.jovic@etfos.hr
tel: 031-224-615, utorak/srijeda11-12h
Satnica i izvođenje nastave
Predavanja: 30-45 h Auditorne vježbe: 8-12 h Laboratorijske vježbe: 8-12h -
Sadržaj predavanja
Pojam informacije. Filozofske osnove. Matematičko izražavanje.
Entropija. Entropija kontinuiranog izvora informacije. Pojavni i
obilježni oblici informacije. Bayesovi i Gittovi stavci. Kapacitet
informacijskog kanala. Shannonov teorem. Železnikarove teze.
Informacija na izvoru, njeno otkrivanje i kodiranje. Obrazac i
opažaj. Markovljev izvor. Kvaliteta izvora. Govorna informacija.
Mrežni agent kao informacijski izvor. Šum i kodiranje na kanalu.
Međuinformacija. Podaci i informacija. Signal i umnožak BT.
Analiza glavnih komponenti informacije. Carnapova entropija.
Klasifikacijski postupci. Statistička i entropijska klasifikacija.
Klastering. Postklasifikacijska analiza. Vrednovanje
semantičkog sadržaja. Mrežni informacijski multiagenti posrednici, osnovica .
Sadržaj vježbi
Kodiranje na informacijskom kanalu. Vlastiti
sadržaj informacije. Proračun entropije.
Proračun semantičkog sadržaja.
Proračun uvjetne entropije. Kodiranje
Markovljevih izvora. Filtriranje podataka.
Klasifikacijska analiza. Klasteriranje složenih
događaja. Projekt mrežnog agenta.
Proračun rizičnosti složenih događaja
Znanje, informacija i osnovna
pitanja filozofije
Uvodno izlaganje
Franjo Jović
Osijek 05.10.2006.
Što je filozofija
Filozofija razmatra cjelinu bitka u
odnosu na čovjeka i istinu koju
obuhvaća dublje od svake znanstvene
spoznaje
Nastupa kod osvještavanja ljudi
Smisao čiste filozofije bez znanosti se
pojavljuje tamo gdje se:
a) stvarnost sagledava u svom podrijetlu
b) stvarnost obrađuje poput unutrašnjeg
razgovora
Što je filozofija/2
c) otvara širina spoznatljivog
d) odvija ljudska komunikacija u
traženju istine
e) razum strpljivo održava budnim pred
onim najstranijim i pred osobnim
ograničenjima
Filozofija nas koncentrira time što nas
održava ljudima u našem sudjelovanju
u stvarnosti.
Podrijetlo filozofije
Pobuda filozofiranja leži u čuđenju,
sumnji, svijesti o izgubljenosti,
primicanju graničnih stanja: smrti,
slučaja, krivice, neoslonjivosti na svijet
Platon i Aristotel su izučavali u
začuđenosti samu bit bitka, Descartes
je u beskonačnosti nepoznatog tražio
ono nužno poznato; stoici su u patnji
sadašnjosti tražili smirenje duše.
Podrijetlo filozofije/2
Pritisak polazi od sigurnog tla do dubine
bitka do počovjekovljenja; ide do
komunikacije čovjek - čovjek.
Priopćenja koja pritom nastaju su
neodvojiva od sagledavanja istine: u
unutrašnjem postojanju, osvjetljavanju
ljubavi, približavanju savršenstvu
Spoznatljivo
Osnovno pitanje filozofije je: Što jest? Što je bitak,
osnovica svega što postoji, živog i neživog, vidljivog i
nevidljivog? Ono iz čega sve proizlazi?
Tales: Sve je voda! ..vatra, materija, duh, duhovno
živuća materija (hilozoizam)
No jesmo li voda koja misli? … To dovodi do
suprotnosti subjekt - objekt. Nema objekta bez
subjekta i obrnuto. Stvarnost je dakle spoznatljivo
koje se u toj suprotnosti pojavljuje. Spoznatljivo ne
postaje predmetom ali dolazi u pojavnost u dualnosti
ja-predmet. U tom promišljanju postoji i drugi rascijep:
predmet u odnosu na druge predmete.
Spoznatljivo/2
Kao razlika prema drugome proizilazi da je bitak
suprotstavljen ništavilu. Predmet ne može biti sve,
dakle ni cjelina bitka. Ni sam bitak. Svako
osmišljavanje nečega je izvlačenje toga iz
spoznatljivog. Dakle to stoji suprotstavljeno ne samo
meni već i drugim predmetima. Spoznatljivo je stoga
ono što se u promišljanju uvijek navještava.
Zamisao je u odnos na predmet neprirodna pojava u
uobičajenom razumijevanju odnosa. Mi želimo s
njezinom pomoći utjecati na vlastitu svjesnost bitka.
Zamisao sama po sebi je prazna, bespredmetna. No
svojim oblikom otvara beskonačne mogućnosti
pojave postojanja i postaje s obzirom na njega
transparentna.
Spoznatljivo/3
Mi promišljamo predmetno, slikovno. Moramo odatle
misleći predmetno postići usmjerenje na
bespredmetno spoznatljivog.
Egzistencijalno smo vezani na Boga /
transcendentalno a to sve putem znakova, simbola.
Božje postojanje je za nas stvarnost putem našeg
postojanja, dok inače postoji u drugim dimenzijama
potpuno različitim od našeg predmetnog svijeta.
Tako se spoznatljivo sastoji od naše svjesnosti po
kojoj smo svi jednaki, od životne stvarnosti po kojoj
smo međusobno odvojeni pojedinci i od egzistencije
u kojoj smo po svojoj snalažljivosti.
Spoznatljivo
Mistici transcendiraju dualnost objekt - subjekt,
poništavaju subjekt i odlaze u transcendentalno, no
ne mogu ga iskazati jer nije predmetljivo, nije izrecivo
Spoznatljivo je dakle:
–
–
–

bitak po sebi
transcendentalost (Bog)
svijet
Transcendentalno
Prorok Jeremija promišlja živog Boga. Grčki filozofi domišljaju
Boga kao pravilo. Oba razmišljanja svode se na to da Bog jest i
da postoji kao obdržavač i stvoritelj svijeta. Današnji filozofi
zaobilaze to pitanje, kao ono: što ne možemo znati radije
prešućujemo. Bog nije pristupačan promišljanjem već
vjerovanjem. Njegovo se postojanje ne može dokazati
matematikom ili empirijskim znanostima. No ni dokazani Bog ne
bi bio Bog već predmet.
Odakle vjera? Iz ljudske slobode. U svojoj slobodi nisam po sebi
samom već sam sebi u njemu darovan; ne mogu svoju slobodu
iznuditi. U svojoj najvećoj slobodi sam slobodan i od sebe i
svoje vezanosti za svijet. Dakle najdublje sam vezan za
transcendentalno. Bog je po meni odlučnost u kojoj postojim.
On je sadašnjost postojanja a ne sadržaj znanja. U njemu je
izvjesnost životne prakse /1,Karl Jaspers/.
Bezuvjetni zahtjev
BZ postoji u ljubavi, borbi, u visoko postavljenim
ciljevima. Obilježje BZ jest da mu je život u cjelini
osnova no ne posljednja. Za ostvarenje BZ je
svejedno odnosi li se na ideju, ljubav ili vjernost. Nije
podložan volatilnosti života. U krajnjoj granici
prekoračuje život i dovodi do gubitka bitka, do
neizbježne smrti. Uvjetni zahtjev se po svaku cijenu
obraća životu.
Sokrat, Thomas Morus, Bruno, umrli su za svoju
istinu
BZ ima svoj korijen u nama samima, s time da me provlači kroz
nešto što nisam samo ja po sebi. To nije ono što se želi nego
ono zbog čega se želi. To je stav vjere, težina jedne duše.
Bezuvjetni zahtjev/2
Razabiremo li mi svoje osnove i ciljeve svojih postupaka
ostajemo u uvjetovanom. Tek život iz nepredmetnog osnova je
života u BZ. BZ je duboko ukorijenjen u ono čime smo ispunjeni.
Opredmećeni BZ je fanatizam i tiranija
Komunikacija zaljubljenih u ljubavnoj bitci - možda i ona može
biti lažna
BZ je vanvremensko. Ono je konstruktivna dobrota.
Zlo nastupa u tri oblika
– kao moralni čin odluke tipa želja / zadaća
– kao etični čin kada odluke BZ stoji u ovisnosti uvjetovanog (čistoća
motiva)
– kao metafizički čin biti motiva: ljubav (od koje se živi) / mržnja
(izvlačenje iz transcendentalnog)
Ostala pitanja filozofije
Što je čovjek
– sloboda, djelovanje, transcendentalnost

Što je svijet
– svijet i prolaznost
– svijet i ono vječno u njemu

Povijest čovječanstva, filozofije, religije
– je li ipak nečastivi pomagač Bogu

Filozofska neovisnost
– Filozof je neovisan od materijalne zapetljanosti, plemena,
asket, nije prestrašen, neovisan o religiji, politici, uređenju
države, smrti
– filozofiranje je škola neovisnosti a ne posjedovanje
neovisnosti.
1.Pojam i matematičko
izražavanje informacije

“Mislim da smo trenutno u predkopernikanskom razdoblju spoznaje i
primjene informacije” Marijan Miković, 2004., osobno priopćenje
Informacija i propast EPR pokusa
Na temelju članka Einsteina, Rosena i Podolskog (1935) “Can
quantum-mechanical description of physical reality be
considered complete?” izradio je John Bell prijedlog provjere
istodobne pojave informacije na udaljenim mjestima npr u
pokusu s polariziranim zrakama svjetlosti. Ovo su spomenuta tri
autora naveli kao nešto nemoguće. Pokus su 1982. godine
izveli Aspect, Roger i Dalibard i pokazali da se informacija
pojavljuje istodobno na udaljenim mjestima, dakle neovisno o
brzini svjetlosti. Ovime je informacija pokazala da posjeduje
svojstvo (barem) četvrte prostorne dimenzije jer se može
iskazati istodobno na bilokojem mjestu treće dimenzije prostora.
Naprosto dolazeći iz njegovog “ne prostora”.
Istodobno i materija(energija) je pokazala da je nedjeljivo
“vezana” uz informaciju! Obje činjenice bile su “previše” za
dotadašnje poimanje stvarnosti.
Informacija i propast EPR pokusa/2
Neovisnost o prostornoj dimenziji 3D prostora čini i striktno čuvanje
informacije te dostup do informacije vrlo osjetljivim ako ne i nemogućim
zahvatom u užem smislu te riječi. Naravno ukoliko je informacija
upakirana u materijalnom aspektu prostora.
Mi smo propašću EPR pokusa dovedeni na “golu ledinu” gdje je samo
pitanje vremena i sredstava kada će apsolutno nedostupna materijalno
pakirana informacija biti stvar prošlosti. Ograničenje će biti naša
spoznajna sposobnost, dakako.

Drugo je pitanje ne posjedujemo li već takva saznanja u
podsvijesti? No informacija u podsvjesti je isto tako i
“nedostupna informacija”. Osim ako nismo vješti u npr
tumačenju snova...
Opažaj - obrazac - informacija
Poučavanje o informaciji je stoga poučavanje o mišljenju.
Poučavanje o mišljenju ne smije biti poučavanje o klasičnoj logici, jer je
logika nešto konkretno i opipljivo, nešto čisto i formalno gotovo poput
matematike. Logika je osim toga samo sukladna mitu u paru logos –
mithos /2, de Saussure Ferdinand/.
U svojoj osnovnoj prirodi logika je alat opažanja, ona ukazuje na ono
implicitno, na proturječno.
Porota se na sudu bavi istraživanjem iskustva zločina. Činjenice
povećavaju opažaj. Logika čini implicitno eksplicitnim.
Eksplicitne činjenice povezuju se u obrazac. U poučavanju obično se
informacija izvlači iz gotovih obrazaca i “suho” predstavlja. Tada naša
pažnja ide brzo prema informaciji.
U stvarnom životu doći do informacije je mučan postupak. Skup. O
tome ćemo ovdje raspravljati. O gruboj tehnici dobivanja obrazaca.
Iz podataka, signala, znakova, zvukova - podsvješću se ne kanimo
baviti. Niti snovima.
Obrazac - oblik - ideja
Obrazac bi mogao biti nešto što se ponavlja, nekakav red,
odnos, nešto što mi opažamo i uspoređujemo s nečim nama
ranije poznatim
Definicija, deBono /3/: Kada se dogodi pokret iz sadašnjeg
stanja u neko sljedeće stanje s vjerojatnošću iznad očekivanog
tada se stvara obrazac:
– ova definicija uključuje aktora obrasca
– moguću ideju o akciji koju on izvodi, te
– moguću posljedicu te akcije
Obrasci mogu biti simultani, sinkronijski ili slijedni, dijakronijski.
Njihovo pojavljivanje u jeziku poput nečega što je “postavljeno
van volje pohranitelja” nešto što više izražava svojstvo duha
nego prirodu stvari /2/. No izgleda da je materijal koji generira
obrazac u prednosti pred Gestaltom, oblikom, da je pojava u
prednosti pred formom.
Obrazac - oblik - ideja /2
De Saussure je izveo dihotomiju jezika (langue) i govora
(parole) iz prvobitnog zajedništva u jezičkoj djelatnosti
(language). Dakle postoji pojedinčev i skupni (povijesni) vid
jezika /2/.
Jezik i kodovi u komunikaciji nisu mogući bez sustava stvaranja
obrazaca. Riječi su kodovi. One pokreću akcije u memoriji
slušatelja. One djeluju kao okidači obrazaca. Riječima se naš
razum vodi od stanja do stanja (preko nespoznatljivih
međustanja).
Po nekim obrascima. Do ideja. Ali i obrnuto: od ideja (iz
nadprostora??).
Prikazuju se dva modela obrasca informacije: model stolnjaka i
model želatine. Zašto su to informacijski modeli?
Model stolnjaka
Mjesto A pokazuje otisak neke
pravilne mrlje
Mjesto B pokazuje otisak
nepravilnog oblika

A

C

Mjesto C pokazuje još veći
nepravilni otisak
Jesu li podaci o prošlim
događajima zapisani?
Jesu li ti podaci lako izmjenjivi?

B

Jesu li podaci međusobno
povezani? Prostorom,
vremenom?
Model želatine

a

b

Dotok tople tekućine otapa sve
više i više želatinu.
Otopljena tekućina u području a
i b se širi.
Kada se područja a i b spoje
sve što padne bit će samo
zajednički doprinos.
Sve što padne izvana neće biti
doprinos.
Koji najvažniji informatički
proces je tu u igri?
Selekcija!
Ideje i informacija
Obrada informacije (gdje je ta informacija koja se izgubila u
podacima) - ili zašto je Napoleon izgubio bitku kod Trafalgara
( pa zbog sporijeg punjenja topova!)
Informacijsko prokletstvo na kineski način- Dabogda živjeli u
zanimljivim vremenima! Ili, ako se bavite tuđom
informacijom/idejom tada se ne bavite vlastitom.
Slika - sve je započelo izgleda jednostavnim crtežima - iako,
prije slika bile su piramide (i samo suglasnici) jedne davne
civilizacije.
Ideje i informacija /2
Riječ ( u početku su riječi bile svete: izgovaranjem riječi
nastajala je pojava) - zato su i Egipćani vjerojatno zazirali od
skraćenicama prikazanih riječi npr. koloid = ko(tač)+lo(tos)
+id(em), no Midianiti se nisu bojali i … nastali su suglasnici, a u
Grčkoj i samoglasnici.
Pismo današnje dobi nastalo je u Feniciji i Grčkoj, no za brojeve
su se pobrinuli Babilonci i - Arapi; pred 5000 godina su Kinezi
davali doktorate iz matematike

...= B ;A

=

Slijede pravila, strojevi, tehnologija, inteligencija, ideje, ljudski
element - tu leži informacija!
Osnovna svojstva informacije
Spontanost, nepredvidljivost, slojevitost, kružnost, povratnost
Informira i biva informirana, protuinformacija - pitanje, prostor
ukotvljenosti, opkoljenosti, proširenje informacije, prag
Nastaje i nestaje, briše se, prekriva, ponavlja,
Serijska, paralelna, paralelna pa serijska
Apsolut, osobnost, bolno spoznajna, svjesna, podsvjesna
Informacija je komunikacija i njen nedostatak,
Vanjska - unutrašnja, povjerljiva, javna, nedostupna,
nespoznatljiva, jednostavna, tajanstvena, simbolična,
prosvjetljenje, razum, moć
Informacija je riječ koja bijaše na početku, izraz više sile,
unutrašnji glas...
Osnovna svojstva
informacije/2
Informacija je činjenica, detalj, laž, promidžba, instinkt, intuicija
Informacija je u pozivu, djelovanju, volji
Informacija je univerzalna, ćudljiva, (ne)dohvatljiva
Provjerava se informacijom, pitamo se što je to, bojimo se moći
informacije, krijemo je
Pojavljuje se na začudnim mjestima i skrivenim putovima, u
postupku koji je entitet i proces istodobno, događanje i
prestanak događanja,
Informacija je nadzor, vođenje i povratna veza; šum i smetnja
su informacija,
Nevidljiva je i sveprisutna, ona je sve to rečeno i puno više
Nastaje voljom i razumom.
To je fundamentalna veličina, ni energija niti materija
Nastanak i spremanje
informacije
Pojam informacije osnova je za mnoge znanosti i tehničke
discipline: kibernetiku, automatiku, biologiju, povijest, teologiju,
ekonomiju, proizvodne tehnologije, filozofiju
Osnovni Shannonov teorem koji pojam informacije uspješno
veže uz vjerojatnost pojave pojedinih znakova, riječi komentira
Karl Steinbach: “To je kao kada biste smatrali kilogram zlata i
kilogram pijeska jednako vrijednim”
Norbert Wiener piše: “Informacija je informacija ni materija niti
energija”
Gittov 1. stav: Fundamentalnu veličinu informaciju ne možemo
pripisati materiji.
Ovime se “čisti” materijalni procesi isključuju kao izvori
informacije.
Nastanak i spremanje
informacije/2
Stav 2: Informacija nastaje samo putem volje (nakane)

I  vd2
Inf.

Volja

No informacija iz nekog izvora je to bolja što je veća inteligencija
i znanje tog izvora, dakle informacija = inteligencija (d) * znanje
(d) * volja (v) = v*d2
Nastanak i spremanje
informacije/3
Povezivanje volje informacije i inteligencije / znanja odražava
pojavu na izvoru informacije. Osnova priopćenja informacije je
volja pojedinca. Veća volja daje veći učin. Konstanta
proporcionalnosti ovisi o umnošku inteligencije i znanja autora
informacije. Ovo je intuitivni model, dakako.
Informacija služi svrsi vođenja sustava u kojem je stvorena,
radom ne slučajem. Dakle informacija je nešto blisko politici, ali i
tehnici, medicini, pravu.
Stav 3. Pri svim tehničkim i uopće umjetnim sustavima
informacija tvori njenu nematerijalnu osnovicu.
Informacije se može pohranjivati na materijalnu osnovicu,
štoviše, idealno je upravo ono pohranjivanje gdje se modificira
određena (prostorna) dimenzija materijalnog medija drugom
dimenzijom informacijskog svijeta (vremenom)
Razine, oblici i vrste informacije
Pet je različitih vidova informacije: statistika, sintaksa,
semantika, pragmatika i apobetika. Primjer govorne informacije:
abeceda
rječnik
jezik
informacija

a, b, c

Ivo

kôd

Ivo gleda

gramatika

:Ivo gleda

smisao

akcija?
Razine, oblici i vrste informacije/2
Statistički vid određuje kvantitetu, količinu informacijskih
znakova, predanu ili primljenu, brzinu protoka znakova,
znakovnih grupa, riječi.
Gramatička točnost i jasnoća informacije pri tome nije bitna, jer
se svaka pogreška u prijenosu jednako tretira.
Informacija se obrađuje posredno preko vjerojatnosti
pojavljivanja informacijskih znakova.
Statistički vid osnovica je mjerenja informacije. Kako se to može
obaviti? Pa preko statističke mjere: relativne frekvencije
pojavljivanja informacijskih znakova.
Razine, oblici i vrste informacije/3
Iza oblikovanja znakova, slova, grafema, fonema u riječi,
simbola, stoji sintaksa (syntaxis - poredak, order, Anordnung).
Pravila se odnose na znakove pisanih jezika, kodne signale,
slikovne znakove, notno pismo, računalne kodove, genetičke
kodove, plesne znakove pčela, mirisne znakove kukaca,
znakovlje gluhonijemih. Pravila se uče ili nasljeđuju.
U sintaksu spadaju pravila pisanja, izbor simbola i njihovih
kombinacija, pravila biranja riječi, tvorbe rečenice, načini na koje
se rečenica mijenja. Gramatika. Na razini koda se odražava i
odlučuje o tome ima li predloženi sustav kreativnu ili samo
reproduktivnu značajku.
Kreativni kodovi imaju u pravilu sintetička, integrativna,
asocijativna a reproduktivni analitička, disocijativna svojstva.
Razine oblici i vrste informacije/4
Semantika (semantikos - obilježavajući, sema = znak) je
smisao, sadržaj, poruka, iskaz, značenje niza znakova, riječi
neke poruke.
Stav 4: samo je ono informacija što sadrži (barem) semantiku,
značenje.
Ovo znači da odašiljatelj (i primatelj) informacije posjeduju
određeni duhovni koncept, kojim je moguće prihvatiti značenje
informacije.
Tek se postojanjem jezika informacija može pohranjivati na
materijalnim nositeljima. Informacija je nepromjenjiva bez obzira
na vrstu prijenosnog medija ili sustava zapisa. Ova
invarijantnost uzrokovana je njezinom nematerijalnom prirodom.
Razine, oblici i vrste informacije /5
Razlikujemo:
prirodne jezike (preko 5000 jezika)
umjetne jezike (esperanto, gluhonijemi, zastavice, prometna
pravila),
umjetne formalne jezike (programski, matematički, logički,
kemijski, notni),
posebne jezike tehnike, znakovni jezik nacrta,
posebne jezike žive prirode (dupini, glavonošci, pauci, ..)
Razine, oblici i vrste informacije/6
Kodiranje značenja u prirodnim i umjetnim jezicima postiže se
pojedinim ili složenim djelovanjem sljedećih sredstava:
–
–
–
–
–
–

oblikovanjem
stilistikom
fonetikom
intonacijom
gestikom
semantičkim sredstvima: homonimima, homofonima, metaforama,
metonimijama, ironijom, anomalijom,…

Pri tome su predajnik i prijemnik ili inteligentno biće
ili inteligencijom stvoreni umjetni sustavi.
Razine, oblici i vrste informacije/7

Pragmatika (pragmatike - vještina ispravnog rukovanja)
Svaki prijenos informacije ima za cilj ili nakanu izazvati na
prijemnoj strani odgovarajući učin, događaj. Da bi to postigla
predajna strana se služi: molbom, pitanjem, kukanjem,
poučavanjem, opominjanjem, pritiskom, naredbom, a sve u cilju
rukovanja predajnom stranom.
Informacija se stoga može nazvati i strukturom koja na
predajnoj strani izaziva određeni učin. Ona je manipulativna.
Možemo razlikovati
– kruto postupanje,

kao kod programiranja strojeva, izgradnje stanice, funkcija disanja,
instinktivno rukovanje
dresura životinja
Razine, oblici i vrste informacije/8
Pragmatika - fleksibilno i kreativno rukovanje
informacijom
–
–
–
–

uvježbano rukovanje ljudima, oblici učtivosti, kretnje obrtnika
jednostavno djelovanje ljudi
intuitivno nastupanje ljudi
inteligentno ponašanje ljudi slobodne volje

Sva navedena ponašanja rezultat su upravo
primljene informacije, dakle
komuniciranja, ali i onog naučenog,
iskustvenog.
Razine, oblici i vrste informacije/9
Apobetika (apobeinon - događaj, uspjeh, rezultat)
razmatra svrhovitost, cilj odašiljanja informacije.
Primjeri su kod životinja osiguranje životnog prostora,
kod ljudi su potreba komunikacije i dogovora o
zajedničkom cilju, životu.
Uvijek se u slučaju naglašavanja ili potiskivanja cilja
treba biti oprezan, jer se radi o najvišem vidu
prijenosa informacije, pa i šteta za primatelja može
biti najveća.
Razine, oblici i vrste informacije/10
Dakle izvoru informacije treba posvetiti dužnu pozornost! Kod
informacije nekog izvora specifičan je!
Izbjegavanje dohvata informacije je opasno, jer smo bez
informacije neupućeni.
Dohvaćanje informacije je opasno, jer nas dobivanje informacije
kada je nismo spremni primiti može “satrti” - stoga u pravilu
vrijedi:

Kada je čovjek spreman da je primi - informacija
dolazi. Skrivanje od informacije je također opasno!
No suprotstavljeni koncepti se utjelovljuju i sukobljavaju opet u živom
dijalogu! U dijalogu autora (duha) i junaka (duše). Život je konflikt.
Konflikt je prirodan.
Kvalitete izvora informacije
Kvaliteta izvora Kval. semantike i Kvaliteta
pragmatike
događaja
Zamisao rješenja, Cilj
Inteligencija

Genijalnost

funkcije
Optimalnost,
strategija
Vrijeme provedbe

Stanje znanja

Tehnologija

Funkcija

Domišljatost

Programiranje

Scenarij

Bogatstvo ideja

Minijaturizacija

Nakana
Smisao
Razine, oblici i vrste informacije/11
Vrste informacije:
Proizvodna, pogonska, komunikacijska
Podrijetlo informacije:
– kopirana informacija (CD, DNK, fotokopija, reprodukcija
slike), u pravilu se svakim kopiranjem nešto gubi; zašto?
– reproduktivna informacija (interpretacija teksta, glazbe, dijela
softvera), u pravilu se svakom reprodukcijom nešto dobiva;
zašto?
– kreativna informacija: voljom, sposobnošću i talentom
pojedinca nastaje nova vrijednost poput jezika, teksta, koda,
sustava, glazbe, slike, patenta, postupka, saznanja.
Razine, oblici i vrste informacije/12
Poseban oblik informacije je hologram. Izgleda da je DNK jedan
vid holograma. Osnovno svojstvo holograma je zapisivanje
informacije u nižoj dimenziji prostora. Tako se 1D hologram
može rabiti za zapis 2D podatka, 2D za zapis 3D itd. Drugo je
svojstvo integrativnost: iako se dio holograma može izgubiti
sadržaj ostaje. Treće svojstvo je linearnost: hologram čuva
spremljeno vjerno reproducirajući osnovni oblik.
Može se očekivati veća uporaba ovog vida pohrane i aktiviranja
informacije. Aktiviranjem holograma događa se i mogućnost
promjene sadržaja (relaksacije) u smislu smanjenja
hologramskog “šuma”. Na taj način se, uz ostalo brane i naše
stanice od smetnji izazvanih izgaranjem ATP-a, toksikacijom ili
napadom virusa.
Razine, oblici i vrste informacije/13
Primjer relaksacije holograma:
nerelaksirani hologram s greškom

relaksacija

relaksirani oporavljeni hologram
Kvaliteta i korisnost
informacije
Informacija može biti upotrebljiva ili neupotrebljiva
što ovisi o okolnostima.
No bez obzira na to ona može biti po svojoj mjeri samo
kvalitativnog a nikako kvantitativnog značenja.
Po svojoj semantičkoj vrijednosti i korisnosti razlikujemo
pet stupnjeva vrednovanja:
izuzetno važnu, važnu, korisnu, beskorisnu i štetnu informaciju.
Ova procjena je često stvar pojedinca, iako postoje posve jasni
etički obrasci koji su podloga procjeni. Postoji savjest.
Kvaliteta i korisnost informacije/2

Izuzetno važna informacija: visoki sadržaj apobetike
Važna informacija: značajna za postizanje cilja
Korisna informacija: općeg značenja, u smislu
kontakta, izobrazbe, zabave, dnevnih događaja
Beskorisna informacija: općeniti podaci, banalnosti,
besmislene novosti, gubitak vremena
Štetna informacija: inf. s negativnim posljedicama ,
vodi k zabludama, štetnim događajima, defektima a
postiže se svjesnim ili u zabludi datim iskazima,
lažima, podmetanjima, šarlatanstvom, ljutnjom,
sektašenjem, ideologizacijom, šundom.
Važnost i korisnost informacije
Korisnost je objektivna
komponenta informacije
– vrijedi za većinu ljudi
– nije upotrebljiva ako ne
postoji ili nije ostvariva
– često neotkrivene
činjenice
– neobjavljena inf.
– zaboravljena inf.
– beskorisnost je vezana i
za nemogućnost
djelovanja

Važnost je pojedinčeva
komponenta informacije
– važnost za pojedinca nije
isto što i za neku drugu
osobu
– općenita važnost inf. je
samo relativno važna
pojedincu
– velika većina inf. je
pojedincu irelevantna
– velika je važnost
pojedincu svaka njemu
štetna informacija
Vrednovanje semantičkog sadržaja informacije
Veličine koje obuhvaćaju semantičku kvalitetu informacije u cilju
njene možebitne kvantifikacije ili barem relativne usporedbe su
semantička kvaliteta q
relevantnost r
novost (aktualnost) a
dostupnost z
postojanje e
To su semantičke veličine osobnog značaja informacije,
korisničke
Kreću se dogovorno u rasponu od 0 do 1 osim q koji se prema
ranije navedenom kreće u rasponu q = (1,-1)
Vrednovanje semantičkog sadržaja informacije semantička kvaliteta
Mjera semantičke kvalitete obuhvaća težinu značenja. Posebno
se odnosi na tzv proizvodnu upotrebljivost informacije, poput
učinkovitosti primijenjenog algoritma u računalu, smanjenjenju
memorijskog prostora i vremena obrade, prenosivost programa,
pouzdanost programa, primijenjenom programskom jeziku i sl.
Koliko pojedini elementi ovog vida informacije utječu na samu
kvalitetu informacije ovisi i o subjektivnim procjenama, ali i o
objektivno zatečenom stanju.
Informacija bez kvalitete, prazna informacija ima q = 0,
najkvalitetnija informacija ima q = 1, a najštetnija informacija ima
q = -1
Semantička relevantnost i važnost
Kod informacije posebno se naglašava osobni interes koji
donesena informacija daje korisniku, njegovom ostvarenju cilja,
osobnom cilju
Ono što osobi A može biti izuzetno važno, dakle rA = 1, može
osobi B biti potpuno nevažno, dakle može imati rB = 0
Stoga je procjena iznosa parametra relevantnosti od strane
neinformiranih promatrača za nepoznate osobe težak zadatak.
Tako je npr prognoza vremena za zapadnu Australiju
prosječnom hrvatskom gledatelju televizije potpuno irelevantna.
Naprotiv, ako netko odavde putuje rođacima u zapadnu
Australiju rado će pogledati na TV prognozu vremena i uopće se
upoznati s tamošnjim vremenskim prilikama.
Za tehnološke procese je relevantnost nebitna, jer nemaju
osobni značaj - ili ne bi trebali biti tako projektirani.
Aktualnost
U mnogim je područjima života potrebno relevantnu i važnu
informaciju dostaviti pravodobno.
Podatak o zastarjeloj informaciji, “lanjskom snijegu”, ima iznos
a=0
Visokoaktualna informacija ima a = 1.
Za tehnološke procese je aktualnost nedvojbena i trajno
konstantna veličina s a = 1, pa se niti ne procjenjuje posebno.
Opadanje iznosa aktualnosti zavisi o vremenskim konstantama pojava
na koje se odnose - već i mali prekid govora ili glazbe je štetan
Tako su geološki podaci iako izuzetno stari još uvijek aktualni
Istraživanjem nekih starih događaja se parametar aktualnosti mijenja
Osobito kada se pravilnosti pojavljivanja mogu protegnuti na današnje
događaje - dakle nešto davno može postati vrlo aktualno.
Dostupnost
Ni najvažnija informacija ako nije dostupna nema vrijednosti,
dakle za nju je z = 0.
Informacija koja je potpuno dostupna ima iznos z = 1.
Baze podataka, biblioteke, informacijski centri, računarske
mreže, internet povećavaju dostupnost informaciji.
Nedostupnost se povećava zaštitnim kodom, klauzuriranosti
informacije u pravu, medicini, filozofiji te namjerne
klauzuriranosti kod nedostupnih, tajnih ili štićenih podataka
poput industrijske svojine ili poslovnih tajni. Nedostupnost može
biti i mjera manipulacije.
Industrijski podaci moraju biti dostupni operatorima, tehnolozima
ili voditeljima smjeni, iako selektivno. Smatra se da je
dostupnost u proizvodnim procesima jednaka jedinici.
Postojanje
Postojanje informacije je pitanje da li informacija uopće postoji
na svojem izvoru (ili materijalnoj kopiji).
Potpuna upitnost postojanja izražava se iznosom parametra e =
0.
Potpuna poznatost, osvjedočenost postojanja izražava se
iznosom parametra e = 1.
Tako je pitanje postojanje terapije raka želudca između 0 i 1, a
isto to kod raka jetre jednako je ništici.
Procesni i tehnološki podaci smatraju se da redovito postoje,
iako često preko posrednog mjerenja.
U teoriji sustava smatra se da neki podaci postoje iako nisu
izmjerivi. Do takvih se podataka ne može dostupiti.
U principu možemo reći da svi podaci na neki način postoje
(Bayes).
Mjera semantičkog sadržaja primjer

Postojanje

Dostupnost

Aktualnost

Relevantnost

PROCES
INTERNET
VISOKA ŠKOLA
Kvaliteta

1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
Mjera informatičkog sadržaja
Pretvorbom tabličnog u pentagramski oblik dobiva se za
površinu izraz
A = F sin720 (ra+az+ze+eq+qr) / 2
(1)
Nadopuna 1: faktor potpunosti F koji je jednak ništici kada su q,
ili r ili a ili z ili e jednaki ništici a inače je F jednak jedinici. Dakle,
ne smatra se informatičkim sadržajem kada ne postoji neki od
parametara.
Nadopuna 2: na iznos parametra q koji može biti između -1 i 1
Normalizacija na iznos semantičke mjere jednake maksimalno
100 ili -100 dobiva se relacijom
S = 20 ( ra +az +ze + e|q| + |q|r) F sign q
(2)
Izrazite mjeru informatičkog sadržaja iz prethodnog primjera!
2. Entropija kontinuiranog
izvora informacije
Zalihost
Zalihost ili redundancija jest postojanje nekog detalja, koda,
poruke, signala kanala ili sustava više nego što je najnužnije
potrebno za predstavljanje ili prijenos tražene informacije.
Prijenosom redundantnog signala na primjer, dolazi do
neučinkovite uporabe kanala, jer ne prenosi informaciju na
svojoj najvećoj brzini
Prikažemo li npr. signal DA i signal NE sljedećom shemom
–
–
–
–
–
–

DA : ++--NE : +-+-+
dobivamo dosta zališnu shemu jer bi zadovoljilo i
DA : +
NE : Dakle imali bismo pet puta brži prijenos ili manji prostor skladištenja
podatka
Prednost zalihosti
U slučaju smetnji ili šuma postoji bolja mogućnost
ispravne interpretacije

t

*Kontrolirana ekspanzija informacije daje potpuniji
opis
procesa na izvoru informacije
Zalihost u tehničkoj praksi
Zalihost ponavljanjem u vremenu
– ponavljanje poruke u vremenu u slučaju otkrivanja pogreške
– periodičkim slanjem poruke
Zalihost ponavljanjem u prostoru
– slanjem poruke u više kanala
– bilježenjem podatka na više mjesta
Zalihost ponavljanjem u frekvenciji
– slanjem poruka na više frekvencijskih područja
Zalihost u funkciji
- ponavljanjem uređaja, ili kritičnih dijelova uređaja
- ponavljanjem softvera ili više načina uporabe softvera
Uzorkovanje redundantnog signala
Dobivaju se manje redundantni podaci
Uzorkovanje frekvencijom višom od Nyquistove
Primjer:
–
–
–
–

a) originalni podaci(V): 2,56 2,05 2,98 8,01 4,87
b) zaokružene vrijednosti(V): 3, 2, 3, 8, 5
c) kodirani iznosi: --++, --+-, --++, +---, -+-+
d) niz impulsa u prijenosu / zapisu : --++--+---+++----+-+

Navedite razliku broj bitova nizova a) i d) !
Diskretni informacijski izvor
Izvor koji proizvodi konačan broj poruka naziva se diskretnim
izvorom informacije
Poruka može biti za početak znak poput slova, ili riječ kao
smislena kombinacija znakova
Kontinuirani izvor poput temperaturnog detektora ili mikrofona
proizvodi neizmjerno različiti skup znakova. No većina od tih
znakova beznačajna je za korisnika voditelja procesa ili
slušatelja glazbe
Pretpostavimo za početak da su uzastopne poruke diskretnog
informacijskog izvora međusobno neovisni događaji
Iznos informacije za svaki znak- poruku jednaka je
– I = log (aposteriorna vjerojatnost/ apriorna vjerojatnost) (3)
– vjerojatnosti se odnose na pojavljivanje datog znaka - poruke
Ukupna informacija diskretnog izvora
Kada nema šuma brojnik je u izrazu (3) jednak jedinici tj sigurno
smo primili poslani znak, pa ostaje samo apriorna vjerojatnost
pojave nekog znaka
Stoga možemo izraziti ukupnu informaciju koju očekujemo od
niza duljine n od k različitih znakova s poznatim apriornim
vjerojatnostima pojave i-tog znaka P(i) kao
Ukupna informacija = - n Σ P(i) log P(i)
(4)
gdje suma ide po svim k različitih znakova
Prosječna informacija po znaku jednaka je entropiji tj
H = -Σ P(i)log P(i) 1 < i < k
(5)
Entropija diskretnog izvora uvijek je manja od navedenog izraza.
Zašto?
Entropija složenog događaja
Vjerojatnost pojave dvaju uzastopnih znakova i j
H(ij) = - ΣΣ P(ij) log P(ij) 1<i,j<n
(6)
Opći iznos entropije nekog znaka kada je poznat njegov
prethodnik jednak je
H(j/i)= - ΣΣ P(ij) log P(j/i)
(7).
Vrijedi također
H(ij) = H(i) + H(j/i)  H(i) + H(j)
(8)
Gornji se izrazi odnose i na izvore koji emitiraju znakove
potpuno nezavisno.
Razmotrimo slučaj gdje dva izvora označeni s i j istodobno
proizvode znakove: izvor i proizvodi znakove A,B,C a izvor j
proizvodi D,E,F, G
– data je tablica vjerojatnost P(i) te uvjetne vjerojatnosti P(j/i)
Tablica uvjetnih vjerojatnosti složenog događaja

A

C

1/2

P(i)

B
1/3

1/6

P(j/i)

D

1/4

3/10

1/6

P(j/i)

E

1/4

1/5

½

P(j/i)

F

1/4

1/5

1/6

P(j/i)

G

1/4

3/10

1/6
Tablica vjerojatnosti složenog događaja
-

A

B

C

D

1/8

1/10

1/36

E

1/8

1/15

1/12

F

1/8

1/15

1/36

G

1/8

1/10

1/36
Entropija složenog događaja
Iz (6) slijedi H(ij) = 3,416 bit/znak
Iz (5) slijedi H(i) = 1,461 bit /znak
Iz (7) i prethodnih tablica slijedi
H(j/i) = 1,956 bit/znak
Dakle vidimo da vrijedi relacija (8).
Ako bismo računali entropiju izvora j (ovo nije jednostavno jer
nemamo nigdje eksplicite dato pa računamo preko uvjetnih
vjerojatnosti P(D) = P(A)*P(D/A) + P(B) * P(D/B)+ …,) dobili
bismo
H(j) = 1,977 bit /znak što bi dalo maksimum entropije
H(ij)max = 3,458 bit/znak
Pitanje: Jesu li to jako povezani izvori? Koliko?
Entropija diskretiziranog kontinuiranog
izvora
Neka su vjerojatnosti diskretiziranog izvora informacije date
tablicom
i= 0
1
2
j=0 9/11
1/8
0
j=1 2/11
3/4
2/9
j=2 0
1/8
7/8
Vjerojatnosti p(0)=11/36, p(1)=4/9 , p(2)=1/4 računaju se iz
površina ispod funkcije gustoće vjerojatnosti.
Odatle je H(i) = 1,542 bit/impuls
Računanje P(ij) = P(i)*P(j/i) daje P(00)=1/4, P(01)=1/18,
P(02)=0, P(10) = 1/18, P(11) = 1/3, P(12)=1/18, P(20)=0,
P(21)=1/18 P(22)=7/36. Odatle je H(j/i)=0,890 bit/znak, te je
razlika 0,652 bit/znaku zbog međuznačnog utjecaja.
Entropija kontinuiranog izvora

Kontinuirani izvor ima kontinuiranu funkciju gustoće vjerojatnosti
p(v)
Ako uzmemo po analogiji s diskretnim izvodom diferencijal
vjerojatnosti dv dobivamo za entropiju izraz
- Σ p(vj) dv log (p(vj) dv) =
=lim dv-0 -( Σ p(vj)(log p(vj)) dv + lim dv-0 -Σ p(vj) (logdv)dv =
= - Ϊ p(v)log p(v) dv - lim dv-0 Σ p(vj)(log dv) dv (9)
Kako dv0 drugi izraz teži u beskonačno jer log dv teži u minus
beskonačno. Ako izostavimo ovaj član ono što možemo
izračunati prvim članom je samo relativni iznos entropije.
Računanje entropije za svaki konkretni slučaj mora uzeti u obzir
i drugi član u izrazu (9). Npr ako pojačamo signal faktorom dva
onda i dv biva dva puta veći pa je log1/dv= log2 + log 1/2dv
odnosno za jedan bit manji!
Rasprava o entropiji kontinuiranog signala
Signali su ograničeni frekvencijskim pojasom. Kada se njihova
funkcija distribucije postavi kao uniformna onda se postiže
maksimum entropije signala.
Kada signal ima maksimum entropije onda je maksimalan
prijenos bitova po znaku!
Druga je stvar kako se ponaša omjer signal/šum.
Tu trebna očito težiti manjim pojačanjima šuma kada je signal
manji. Inače se dobiva manji omjer signal /šum.
Za signale Gaussovskog tipa ograničene snagom N je
H = c * log N
(10)
Teleonomska entropija
Ciljna ili teleonomska entropija razmatra entropiju pojedinačnih
objekata u nekoj ciljnoj strukturi. Npr. raspored stolaca u
učionici. Mjera podjele prostora u tom slučaju određuje
prostorne segmente tzv Voronojeve dijagrame koje “zauzima”
pojedini predmet. Odnos veličina tih prostora i njihova razdioba
prema traženoj ciljnoj raspodjeli određuju trenutno stanje ciljne
entropije. Teleonomsku entropiju je prvi izrazio filozof Rudolf
Carnap (1956). Ona obuhvaća izračun prostora stanja
informacije prema prostoru željenog stanja informacije.
3. Informacija i informacijska
mreža
Proces, mreža i obrada podataka
Obrada podataka i proizvodni proces / usluga povezuju različite
vrste komunikacija.
U procesu se spontanim odvijanjem procesnih događaja
povećava entropija. Svrhovitom obradom tih podataka i
djelovanjem na proces postiže se ponovno smanjenje entropije
u sustavu. To su povoljni, korisni informatički procesi. Postoje i
nepovoljni procesi kod kojih se na pojavu smanjenja entropije
djeluje suprotno tome, izaziva nered i šteta.
Opća shema:
–

proces

mreža

obrada podataka
Entropija u sustavu s obradom i komunikacijom
Entropija se u sustavima održava na razini prirodne entropije tj
raste bez djelovanja u suprotnom smjeru
Entropija u sustavu s obradom podataka, informacijskom vezom
te efektorima u procesu se općenito smanjuje i održava na
razini ravnoteže procesne degradacije i informacijske akcije
U prijelaznim režimima kada se tek uspostavlja informacijska
obrada sustav teži iz stanja veće u stanje manje entropije.
Sustav s obradom informacije i efektorima u procesu kada
djeluje pod štetnim utjecajima povećava svoju entropiju do
razine djelovanja tih sila
Sustavi su redovito u ravnoteži prirodne entropije, sila za
smanjenje i sila za povećanje entropije.
Informacija i entropija u sustavu
Slučaj 1. Korisna informacija je veća od entropije - ukupna
entropija u sutavu pada
Slučaj 2. Korisna informacija je jednaka entropiji u sustavu entropija sustava je u ravnoteži
Slučaj 3. Korisna informacija je manja od entropije u sustavu entropija sustava raste
Korisna informacija uključuje lanac: izvor informacije - prijenos i
obrada podataka - odluka i djelovanje u povratu na proces /
izvor
Informacijski kanal je usmjerena veličina s najmanje jednim
izvorom i najmanje jednim odredištem; sadržava izvor, koder
informacije, koder kanala, prijenosni sustav, dekoder kanala,
dekoder informacije i odredište - prijamnik.
Informacijski kanal
Informacijski kanal ima semantičku bazu koja je zajednička za
izvor i korisnika, odredište
Pragmatika i apobetika se pri tome mogu značajno razlikovati
U tehničkom i informacijskom smislu razlikujemo kanale sa ili
bez memorije, dakle kod kojih se prijenos informacije u nekom
trenutku ne uvjetuje prethodnim prijenosom (znakom)
Isto tako lučimo stacionarne i nestacionarne kanale, dakle
kanale kojima se svojstva mijenjaju odnosno ne mijenjaju s
vremenom
Fizička i tehnička podrška informacijskom kanalu je vrlo različite
prirode poput telefonske veze, telegrafa, satelitskih, radijskih
komunikacija, do, po vlasničkom principu i izgradnji, različitih
namjenskih ili vlasničkih mreža
Osnovni parametri informacijskog kanala
Kanali se razlikuju po kašnjanju u prijenosu, propusnoj moći,
cijeni, pouzdanosti, kvaliteti usluge.
Komunikacijska mreža čini barem 40% ukupne cijene nekog
tehnološkog projekta - ako se gradi iznutra
Kašnjenje u sustavu zbog obrade dato je srednjim vremenom
Tw
– Tw = Tx - u
(11)
– gdje su Tx srednje vrijeme odziva kanala / sustava a u je vrijeme
obrade u čvorovima sustava
4. Bayesov teorem i Bayesov stavak
Ako postoji događaj A, P(A)>0, pokušajmo odrediti kolika je
vjerojatnost da neki drugi događaj B poprimi svojstvo događaja
A.
Dakle P(B/A) = P (AB) / P(A)
(12)

–B
AB

A
Složeni događaj
Ako je B neki događaj koji se prostire preko više područja A
onda vrijedi P(BA1)+P(BA2)+… +P(BAn) = P(B)
(13)
Odnosno
P(B)= P(B/A1)P(A1)+P(B/A2)P(A2)+…+P(B/An)P(An) (14).
Obrnuto da događaj A poprimi vrijednost događaja B je
P(A/B)=P(AB)/P(B)
(15).
Kako je P(AB) = P(BA) to vrijedi
P(A/B)=P(B/A) P(A) / P(B)
(16)
Poopćenje za Ai ti događaj daje
P(Ai/B)=P(B/Ai)P(Ai) / ( P(B/A1+…+P(B/An)P(An))
(17)
što se zove Bayesov teorem koji povezuje apriornu i
aposteriornu vjerojatnost tj vjerojatnosti prije i nakon pojave
događaja Ai.
Bayesov teorem - primjer
Izvor informacije šalje s jednakom vjerojatnosti p=0,5 jedan od
dva znaka 0 ili 1. Znamo s vjerojatnosti 0,001 da je moguće
bilokoji od ova dva znaka krivo interpretirati. Dobili smo 1. Koliko
je sigurno jedinica i poslana?
P(A1/B)= 0,999 0,5 /(0,999 0,5 + 0,001 0,5) = 0,499/0,5 = 0,999
Dakle zbog jednake vjerojatnosti odašiljanja aposteriorna
vjerojatnost jednaka je apriornoj. Što bi bilo da je p0=0,2?
Bayesov stavak : Makako malo vjerojatan događaj ipak ima
određenu iako vrlo vrlo malu vjerojatnost pojave.
5.Binarni simetrični kanal
Kanal: bez memorije, dio je informacijskog sustava i stacionaran
je.
Na ulazu je skupina znakova A (a1,a2,a3,…aq) a na izlazu
skupina znakova B (b1,b2,b3,…,bs). Ulazna abeceda je veća
zbog mogućnosti ispravljanja greški redundancijom u kodu.
Kanal opisuje skup uvjetnih vjerojatnosti P(bj/ai) =Pij tj
vjerojatnosti da neki ulazni znak ai bude interpretiran kao izlazni
znak bj.
Dakle imamo shemu:
p(a1)P11+p(a2)P21+ …+ p(aq)Pq1= p(b1)
….
p(a1)P1s+p(a2)P2s+…+ p(aq)Pqs=p(bs)
Ako kanal nema smetnji onda je za svaki i jedan Pij=1 a svi
ostali jednaki su ništici. Tada je p(bj)=p(ai).
Binarni simetrični kanal sa šumom/2
Rabimo sada Bayesovu formulu tj
P(ai/bj)=P(bj/ai)p(ai) / Σ P(bj/ai)p(ai)=P(bj/ai)p(ai)/p(bj)
(16)
Svaki ulazni znak izaziva pojavu nekog izlaznog znaka.
Problem je što mi ulaz ne poznajemo!
Binarni simetrični kanal: p(a1=0)=p, p(a2=1)=1-p
a1=0, a2 =1
P00=P11=P
b1=0, b2=1
P10=P01=Q

Što je Q? Kako ga možemo mjeriti?
Binarni simetrični kanal/3
Uz uvjet da znamo koji je znak primljen treba odrediti
vjerojatnost odašiljanja različitih znakova tj
P(a=0,b=0)= Pp/ (Pp+Q(1-p))
P(a=1,b=0)=Q(1-p) / (Pp+Q(1-p))
P(a=0,b=1)=Qp/(Qp+P(1-p))
P(a=1,b=1)=P(1-p)/(Qp+P(1-p))
(17)
Za P=0,9 Q=0,1 p(0)=19/20 p(1)=1/20 dobivamo iz (17)
P(a=0,b=0)=171/172, P(a=1,b=0)=1/172, P(a=0,b=1)=19/28 te
P(a=1,b=1)=9/28.
Proizlazi da se, za navedeni primjer, bez obzira na to koji je
znak poslan mora pretpostaviti da je poslana ništica! Isto je tako
veći utjecaj izbora znakova na kanalu od šuma na kanalu.
Entropije diskretnog kanala sa šumom
Zamisao entropije može se primijeniti na ulazni i izlazni niz znakova,
H(A)= Σp(ai)logp(ai), H(B)=Σp(bj)logp(bj)
(18)
Za uvjetne entropije H(A/B) iz
H(A/bj)= Σ P(ai/bj) logP(ai/bj)
H(A/B)= Σ p(bj) H(A/bj)=ΣΣ P(ai,bj)logP(ai/bj)
H(A,B)=ΣΣ P(ai,bj) log P(ai,bj) … slikom

H(A)

H(A/B) I(A,B) H(B) H(B/A)

H(A,B)
Entropije diskretnog kanala sa
šumom/5
Vrijedi:
H(A/B)≤ H(A), H(B/A)≤H(B)
H(A,B)=H(A)+H(B/A)=H(B)+H(A/B)
H(A)+H(B) = H(A,B) za nezavisne A i B
Transinformacija I(A,B)= H(A)+H(B) - H(A,B)
(19).
I(A,B)=H(B)- W
W=ΣB P(b/a) log(1/ P(b/a))=Plog(1/P)+Qlog(1/Q)=H(P) (19a)
I(A,B)=H(B)-H(P), uz p(b=0)=pP+(1-p)Q=x te p(b=1)=1-x slijedi
I(A,B)=H(x)-H(P)
Kapacitet C=maxAI(A,B)=1-H(P)
(19b),
jer je max(H(x)) jednako 1 za x=1/2
6. Markovljev izvor, kodiranje na izvoru,
procesni izvori
Izvori podataka često traže prilagodbu zbog svojeg optimalnog
kodiranja. To se naziva kodiranje na izvoru.
Uobičajena pretpostavka da su vjerojatnosti pojavljivanja
znakova međusobno neovisne je dosta gruba i netočna.
Uključuje zapravo gubitak memorije između pojava pojedinih
znakova
Uključenje memorije svojstvo je izvora Markovljevog tipa. Dakle
vjerojatnost emitiranje nekog znaka ovisi o prethodnim
znakovima, tj
P(ai u intervalu t/ aj u intervalu t+1) = P(an u intervalu t-n,…,
ai u intervalu t/ aj u intervalu t+1)
(20).
Markovljev proces je određen kada se zna početna raspodjela
vjerojatnosti pojave znakova pj i matrica prijelaza izmedju
svakog od znakova. Element matrice pij označava vjerojatnost
da se iza znaka ai šalje znak aj.
Markovljev izvor /2

Da bi izvor podataka Markovljevog tipa bio stacionaran mora biti
ispunjeno
pj = Σ pi *pij j=1,2,…a
(21),
odnosno u matričnom obliku
ΠT pij = pij
(22),
gdje je T oznaka za transponiranu matricu.
Markovljev izvor je izvor prvog reda kada ima memoriju prvog
reda.
Možete li procijeniti kolikog je reda cijena automobila kao
Markovljev izvor? Što moramo uzeti u obzir? A kojeg je reda
automobilska nezgoda?
Markovljev izvor podataka može biti ergodičan ili neergodičan.
Ergodičan je kada se izvor iz svakog stanja može u konačnom
vremenu vratiti u svako stanje.
Neergodičan Markovljev izvor
Na slici je prikazan neergodičan Markovljev izvor:

d

b
a

Izvor se nikada ne vraća u
početno stanje a!

c
e
Kodiranje podataka Markovljeva
izvora

Pretpostavimo da prijelazna matrica Markovljeva izvora ima
izgled:
a
b
c
–
–
–
–

–
–
–
–
–

a
1/3
1/3
1/3
b
1/4
1/2
1/4
c
1/4
1/4
1/2
Višestrukim množenjem matrice samom sa sobom što je ispunjeno
za homogenu nedjeljivu matricu dobivaju se tzv ravnotežne
vjerojatnosti pojavljivanja znakova a,b,c kao pa=3/11, pb = 4/11 pc
= 4/11.
Kodiranjem matrice prijelaza Huffmanovim kodom za a=1, b=00 i
c=01 slijedi: La = 1*1/3 + 2*1/3 +2*1/3 = 1,667 bita,
Lb= 2*1/4+1*1/2+2*1/4= 1,5 bita i Lc= 1,5 bita
U ravnoteži dobivamo prosječnu duljinu koda
Lm=3/11La+4/11Lb+4/11Lc= 17/11 bita
Kodiranjem prema frekvencijama pojavljivanja dobivamo
L=2*3/11+2*4/11+1*4/11=18/11> Lm !
Procesni izvori podataka
Vrsta
entropije

Primjer
varijable

Skup
znakova

Brzina
snimanja

Razdioba
podatka

Entropija

Tok
podataka

Vremenska

Temperatur
ni pretv.
mA
Tlak u
cijevi
0-1 bar
Onečišćenj
e tla, 0-10
ppm
Vrem.
Raspored
rada kem.
reaktora

Svakih
0,1mA

10 znak/s

Jednolika

763
bit/znak

76,3
bit/znak

Svaki 0,1
bar

1 znak/m

Drugi
korijen

3,25
bit/znak

3,25 bit/m

Svaki ppm

1 znak/km2 Eksponenci 1,5 bit/znak 1,5 bit
jalna
/km2

Uk / isk

1 znak/dan

Prostorna
2D
prostorna
Entropija
uporabe

Puk=0,7
Pisk=0,3

O,899
bit/znak

0,899
bit/dan
Optimiranje procesnih izvora podataka
Osnovno je što više reducirati nepotrebne obrade podataka. U
tu svrhu najjednostavnije je izostaviti redundantne podatke.
Smanjuje se razlučivanje osjetila ili povećava vremenski i
prostorni korak snimanja. Ograničenje za brzo promjenjive
procese je zahtjev Nyquistova teorema uzorkovanja ( uzimanje
najmanje dva uzorka od najbrže promjene - kako se to nosi sa
šumom?)
Drugi je način ne uzimati u prvoj fronti one podatke za koje
postoje izravna stohastička zamjena, sličnost. Ovo se naziva
ortogonalizacija izvora podataka.
Poseban je problem vjerodostojnost podatka pojedinog izvora.
To se rješava poznavanjem povezanosti ponašanja tog izvora s
ostalim izvorima podataka u procesu. Stoga je određena
redundantnost snimanja nužna.
7. Shannonov teorem za binarni
simetrični kanal
Sheme odlučivanja
Na prijamnoj strani odlučujemo, nakon dobivanja znaka bj, koji
je znak ai poslan. Ovo ovisi o p(bj/ai) te o vjerojatnosti p(ai). Na
primjer
–

b1

b2

b3

a1
0,5
0,3
0,2
a2
0,2
0,3
0,5
a3
0,3
0,3
0,4
Ovdje postoje tri pravila odlučivanja

Pravilo 1: o(b1)=a1 o(b2)=a1 o(b3)=a2
Pravilo 2: o(b1)=a1 o(b2)=a2 o(b3)=a2
Pravilo 3: o(b1)=a1 o(b2)=a3 o(b3)=a2
Argumenti postoje u prilog svake pojedine odluke. Promatra se jedan
znak u vremenskom nizu, a ne cijeli nizovi znakova.
Sheme odlučivanja /2
U općem slučaju postoji qs shema odlučivanja, q je broj ulaznih
a s broj izlaznih znakova. Stoga se uvodi pojam pravila najveće
vjerojatnosti odnosno uzimaju se najvjerojatniji znakovi. Ako to
primijenimo dobivamo za gornji slučaj i b1 : o(b1)=a1.
Ako je dobiven b2 možemo uzeti jednu od odluka
o(b2)= a1, o(b2)=a2 ili o(b2)=a3.
Kada na prijamniku dobijemo b3 onda istim načinom
odlučujemo za o(b3)=a3.
Općenito je vjerojatnot pogreške odlučivanja pri dobivanju
znaka bj jednaka
P(E/bj)= 1- P (o(bj)/bj)
(23)
Prosječna pogreška odlučivanja
Općenito je vjerojatnost pogreške pri prijamu znaka bj jednaka
P(E/bj) = 1 - P( o(bj)/ bj)
(24).
Prosječna pogreška jednaka je uz p(a)=1/q
Pe=Σ P(E/bj) p(bj)= 1 - 1/q * Σ P(bj/a ispr)
(25),
gdje je P(bj/ a ispr) vjerojatnost da je znak aispr bio uzrok
dobivanja bj na prijamniku. Tada iz našeg primjera imamo
Pe = 1 - 1/3 * (0,5 + 0,3 + 0,5) = 1 - 1/3 * 1,3 = 0,56667.
Vidimo da je iznos prosječne pogreške znatan. Tim prije se vidi
potreba uvođenja kodova koji povećanjem zalihosti smanjuju
očekivanu pogrešku kod prijama.
Pogreška na binarnom simetričnom
kanalu

Binarni simetrični kanal može prenositi informaciju sa
smanjenom pogreškom ako se uvede zalihost. Pretpostavimo
dakle da prenosimo 0 kodom (000) a 1 kodom (111). Tada su
preostale kombinacije kodova neiskorištene. Pretpostavimo da
je vjerojatnoast točnog prijenosa P a netočnog Q, Q<0,5. Za
Q=P=0,5 imamo samo šum na kanalu i kapacitet C=0.
Sada je vjerojatnost prijenosa bez greške jednaka P3, jedne
pogreške je 3P2Q (ispravljivo!), dvije pogreške je 3PQ2 te tri
pogreške Q3. Odatle je
–
–
–
–

Pe ≈ Q2 (Q + 3P).
Za P=0,99 dobivamo
Pe ≈ 3*10 -4
vidimo da je minimalni Hammingov razmak detektor s najvećom
razlučivošću.
Shannonov teorem
Teorem : Neka je dan binarni simetrični diskretni kanal bez
memorije kapaciteta C>0. Tada postoji blok kod (n,k) i shema
odlučivanja g tako da vrijedi da se prosječna pogreška može
načinit po volji malena izborom dovoljno velikog n koji je po volji
blizu granice kapaciteta kanala.
Dokaz:
Za kanal kojim prenosimo jedan od M jednako vjerojatnih znakova, tj
p=1/M, informacija po prenešenom znaku ai je
I(ai)= ln (1/p)=ln M
(26).
No, znamo da je kapacitet bin.sim.kan. jednaka (19c) C=1-H(P)=1-H(Q)
po binarnom znaku, pa će za n znakova biti na granici kapaciteta tj
I(ai)= n(C-ε1), gdje je epsilon neki mali pozitivni broj. Odatle je
M= 2 exp n(C-ε1)= 2exp nC / 2 exp nε1 (27)
(27).
Povećanjem n uzimamo mali dio znakova koji prolaze kanalom blizu
njegovog kapaciteta. Jesu li ti znakovi dovoljno različiti?
Shannonov teorem /2
Slaganje n-bitnog Hammingova koda za prijenos informacije
daje vjerojatnost greške po prenešenom bitu od Q=1-P, a
očekujemo nQ pogrešaka. Dakle nalazimo se negdje oko sfere
radiusa nQ oko znaka ai:

nQ

nε2

bj

ai

Radius r je broj, ε2 je malen tako da u zbroju s Q ne prelazi 1/2
Shannonov teorem /3
Kod prijama se slika invertira:

nQ

bj

ai

nε2

Sada tražimo formulu za pogrešku zbog nemogućnosti ispravnog
dekodiranja primljene poruke.
Shannonov teorem /4
Slučaji

Ispravan ai u
S(r)

Drugi ai u
sferi S(r)

Greška

1

da

da

da

2

da

ne

ne

3

ne

da

da

4

ne

ne

da
Shannonov teorem /5
Vjerojatnost pogreške prijama je
PE=P{ai ∉S(r)}+P{ai ∈S(r)}P{najmanje neki drugi kod je u S(r)}
(28)
Prvi član uključuje slučajeve 3 i 4, drugi član uključuje slučaj 1.
Budući da je P{ai∈S(r)}≤1, a drugi član u (28) možemo pisati
kao
ΣA-ai P{a∈S(r)} onda dobivamo:
PE ≤ δ + ΣA-ai P{a∈S(r)}

(29),

gdje δ=δ(ε2,n) možemo načiniti po volji malenim ako n dovoljno
povećamo, tako da sfera radijusa r= n(Q+ε2) pokriva sve
razmake osim za po volji mali broj slučajeva.
Dakle prvi član odgovoran je za grešku za određeni poslani
znak, a drugi član odgovara za brzinu prijenosa jer sadržava
sve ostale M-1 članove, osim koda za ispravni znak.
Shannonov teorem /6
Slučajni kod bira M n-bitnih riječi kao poruke. Sada je očekivana
pogreška
Pe ≤ δ + (Μ−1)Po a ∈ S(r) ≤ δ + MPo{a∈S(r)} aai
(30).
Za jednoliku vjerojatnost raspršenja svih kodova, osim ai, svuda
po prostoru koda, vjerojatnost nalaženja u sferi S(r) jednaka je
omjeru volumena sfere i ukupnog volumena, 2 exp n, dakle
Po= N(r) / 2 exp n
(31),
N(r) je broj kodnih točaka u sferi S(r). Taj je broj za binarni
simetrični kanal jednak
N(r)=1 + C(n,1) + C(n,2) + …+ C(n,r) = Σ C(n,k), k=0,…,r
(32).
Iz poznatih r=(Q+ε2)n, Q+ε2<1/2, te Q+ε2 =λ dobivamo
N(r)≤2 exp (n H(λ)), odnosno Po≤2exp(-n(1-H(λ))
(33).
Shannonov teorem /7
Dakle, Pe ≤ δ + Μ 2exp (-n(1-H(λ)))
(34).
Eksponent u (34) (1-H(λ))= C - (H(Q+ε2) - H(Q))
Zbog konveksnosti se entropijska funkcija može u bilo kojoj
točki ograničiti s tangentom na krivulju u toj točki tj
H(Q+ε2) ≤ H(Q)+ ε2 dH/dQ, gdje zbog 0<Q<1/2 vrijedi
dH/dQ = log (1-Q)/Q > 0. Odatle je
1-H(λ) ≥ C - ε2 log (1-Q)/Q = C - ε3.
Odatle je Pe ≤ δ + Μ2exp (-n(C-ε3)), odnosno
Pe ≤ δ + 2 exp(n(C-ε1)) 2 exp(-n(C-ε3))=δ+2exp(-n(ε1-ε3))
(35).
Dakle uz izbor ε2 takvog da je ε1-ε3>0 prosječna pogreška Pe
može biti po volji malena uz n dovoljno velik.
Shannonov teorem /8
Vidimo da postoje teorijski pogodni kodovi za optimalan prijenos
na kanalu sa šumom, sa zanemarivom pogreškom.Nadalje:
kodovi mogu biti prilično dugi. Duge poruke zahtijevaju dugo
prikupljanje podataka prije slanja, tj ništa se neće slati prije nego
se dovoljno ne prikupi (čekanje!).
Nadalje: kod nekog izvora ne znamo u kojoj je fazi kodiranja.
Nadalje: knjiga kodova je jako velika, njezin je opis velik.
Nadalje: nitko ne zna koji je od tih dugačkih kodova koja se
moraju mučno ispravljati zapravo onaj najbolji. O tome u
Shannona nema ni riječi! Očito je da za otkrivanje prave
informacije treba jako puno vremena i čekanja: čak i uz naoko
relativno povoljan kapacitet kanala.
U ekspanziji koda se možda krije i neka druga zakonitost?
Lema(F.J): ako vam neka informacija izgleda nejasna, a ne možete
povećati brzinu kanala, onda vam preostaje strpljenje. Danas se svi
bave povećanjem brzina kanala. Sama informacija pritom nije važna!
8. Železnikarove teze
1. Informacija je kružna spontana pojava informacije.
– Kad izgovaramo rečenicu: “Iva pije vodu” gdje je tu kružnost, kamo
spontanost?

2. Informacija posjeduje sposobnost samokontrole.
- je li samokontrola osnovno svojstvo izvora informacije?
- možemo li samokontrolu izvesti bez kružnosti?

3. Informacija unutar informacije iskazuje se kao protuinformacija pitanje
- može li se samokontrola izvesti bez pitanja?
4. Uključenje informacije znači njeno ubacivanje, ugnježdenje,
smještavanje u neko tijelo koje je razumije.
- informacija bestjelesnog / neenergetskog je nepristupačna, ulazom u
tjelesno - energetsko ona se postvaruje / manifestira
- da bi tijelo razumjelo informaciju ono mora kao prvo razumjeti okoliš - no
okoliš nije informacija - okoliš je zamagljenje informacije!
Železnikarove teze /2
5. Informacijski paralelizam je informacija po sebi
– paralelizam je inherentan informaciji
– informacija je i paralelna i trenutna
6. Informacijska slijednost je spontana kružnost informacijske prirode
– serijska priroda informacije teži svom izvoru, odatle i njezina kružnost
7. Ukupna fenomenologija živog i neživog je fenomenologija informacijskog
oblika i informacijskog procesa
– informacijski oblik i proces su dijalektička cjelina
8. Informacijski oblik je statička a informacijski proces dinamička informacijska
slika fenomena
– fenomeni se pojavljuju u statičkom (forma) i dinamičkom (sadržaj) obliku; u
ovom potonjem su neopisivi - dok se ne oblikuju u statičkom
– u računala je forma primarna veličina - ono je bez informatičkog sadržaja
9. Estimacija i interpretacija signala
Trenutna frekvencija signala
Pojam trenutne frekvencije vezan je za npr harmonijsko gibanje
tijela, ili općenito vibraciju, tj broj titraja u jedinici vremena.
Signal s(t), kada ga promatramo kao zbroj harmoničkih
vibracija, možemo predočiti vlastitim spektrom pomoću
Fourierove transformacije tj
S(f) = ∫ s(t) e -j2πft dt,
-∞< t < ∞
(36).
Slično tome se signal može sintetizirati iz svojeg spektra kao
s(t) = ∫ S(f) e j2πft df,
-∞< f < ∞
(37).
Postupci su opravdani za signale sa stalnim spektrima u
vremenu!
No u praksi nastupaju slučajevi s vremenski promjenjivim
spektrima.
Estimacija i interpretacija signala /2
Poopćenje pojma frekvencije na nestacionarne
signale
Van der Pol je 1947. razmatrao pojam trenutne frekvencije na
signalu:
s(t) = a cos (2πft + Θ)
(38)
a je amplituda, f je frekvencija a Θ je fazna konstanta, odnosno
argument kosinus funkcije je faza Φ(t) = 2 πft + Θ . Dakle
definirao je amplitudnu modulaciju kao
a(t) = a0(1+µg(t))
(39).
Faznu modulaciju je definirao kao
Θ = Θ(1 + µg(t))
(40),
a faza je argument kosinus funkcije u (38) postaje
Φ(t) = 2πft + Θ(t)
(41).
Estimacija i interpretacija signala /3
Frekvencijska modulacija se ne može izraziti poput (39) jer ne
dobivamo (41) već je potrebno rabiti izraz
s(t) = a cos [∫ 2πfi(t) dt + Θ]
(42),
gdje je argument kosinus funkcije faza. Dakle imamo definiciju
trenutne frekvencije fi kao
fi(t) = 1/2π * d(φ)/dt
(43).
Gabor je predložio nalaženje trenutne frekvencije iz FT stvarnog
signala pa modifikacijom spektra tako da se potisnu negativne a
dvostruko pojačaju pozitivne frekvencije spektra signala, dakle
z(t) = s(t) + jH(s(t))
(44),
z(t) je Gaborov složeni signal, s(t) je stvarni signal a H je
Hilbertova transformacija koja se definira kao:
H(s(t)) = p.v. ∫ s(t-τ) / πτ dτ -∞<τ<∞ (45).
P.v. je Cauchy-jeva principijelna vrijednost integrala (45).
Estimacija i interpretacija signala /4
Opravdanje za svoj postupak Gabor je vidio kod izračunavanja
centralnih momenata frekvencije signala, jer bi se svi
neparni momenti spektara bili jednaki nuli, a to ne bi išlo u
stvarnosti. Gaborov složeni signal naziva se analitički signal.
Ville je izrazio trenutnu frekvenciju signala s(t)= a(t) cos φ(t) kao
fi(t) = 1/2π d/dt(arg(z))
(46),
gdje je z(t) analitički signal dat u (44). Ville veli nadalje da, ako je t.f.
vremenski varira onda (intuitivno) i postoji neki trenutni spektar koji mu
se pridružuje, gdje su srednje vrijednosti frekvencija u tom spektru te t.f.
Uporabom Gaborovih prosječnih mjera dokazao je tu vezu prosječnih
frekvencija i vremenskih prosjeka, odnosno
∫f*Z(f)2 df / ∫z(f)2 df = ∫fi*z(t)2dt / ∫z(t)2 dt
(47),
a granice integrala su preko područja -∞<f<∞, -∞<t<∞.
Estimacija i interpretacija signala/5
Odatle su Ville i Wigner definirali raspodjelu signala po vremenu i
frekvenciji (42cit), označenu kao W(t,f), koja svojim prvim momentom
određuje trenutnu frekvenciju složenog signala. Ostali autori, poput
Rihaczeka i Ackroyda ukazali su na točke u vremensko-frekvencijskoj
ravnini gdje se koncentrira energija!
Osnovni problem je u tome što mi jednu jedinstvenu pojavu u vremenu
naime s(t) želimo prikazati dvjema funkcijama vremena, poput para
ovojnica-faza ili realni-imaginarni dio. Ovo koji puta ide bez pogreške
kao u slučaju kad razmatramo vrijedi li
a(t)cosφ(t) + jH(a(t)cosφ(t)) = a(t)e jφ(t)
(48).
Rješenje (48) , prema Bedrosianu, je valjano ako spektar A(f) = F{a(t)}
leži potpuno u području f< f0 a spektar F{cosφ(t)} postoji potpuno
izvan tog područja. Dakle amplituda a(t) i faza φ(t) mogu se smatrati
neovisnima samo ako spektar a(t) i cosφ(t) imaju odvojena
frekvencijska područja.
Estimacija i interpretacija signala /6
Trenutna frekvencija i grupno kašnjenje (GK)
Složeni signal z(t) =a(t) exp(jθ(f)) ima složeni spektar oblika
Z(f) = A(f) exp(jθ(f))
(49),
gdje su a(t) i A(f) pozitivno definitne funkcije.
Veličina zanimljiva za opis signala je grupno kašnjenje:
τg(f) = -1/2 π * d/df θ(f)
(50).
Grupno kašnjenje može se predstaviti kao da je promjena vremena
propagacije funkcija frekvencije impulsa koji putuje kroz linearni filter s
impulsnim odzivom h(t) = s(t). Jasno je da fazni spektar θ(f) i GK ovise i
o fazi i amplitudi vremenskog signala. Isto tako faza signala φ(t) i TF
također ovise i o faznom i amplitudnom spektru.
Za signal s(t), ako je vrijednost t= τg jedinstvena, smatramo da opisuje
položaj signala u vremenskoj domeni. Ako je τg funkcija f tada opisuje
lokalizaciju različitih komponenti spektra u vremenskoj domeni.
Estimacija i interpretacija signala/7
Utjecaj umnoška BT na TF I GK
Vrijeme trajanja T i širina pojasa B su značajke signala
koje opisuju “epohu” pojave signala i njegova spektra.
Smanjnjem trajanja signala u vremenu dolazimo do nestanka
signala u šumu. No signal se katkada, iako manji od šuma može
smatrati signalom u smislu njegove detekcije. To se naravno
odnosi na ponavljajuće pojave. Djelatno trajanje signala je po
dogovoru
Ts2= ∫t2s(t)2 dt / ∫s(t)2 dt
(51)
a djelatna širina pojasa
Bs2 = ∫f2S(f)2 df / ∫ S(f)2 df

(52).

Odnos između B i T možemo lako razmotriti ako signal s(t)
usporimo ili ubrzamo. Razvučeni signal sr = s(rt), gdje je r faktor
razvlačenja. Tada je pripadni spektar
Sr(f) = 1/r S(f/r) , r>0
(53).
Estimacija i interpretacija signala /8
Dakle rastezanje signala dovodi do sažimanja spektra. Odatle je
odnos B i T vezan, odnosno umnožak BT= const za svaki
signal. Dapače iz (51) i (52) slijedi da je minimalni BT= 1/4 π za
gaussovski oblik signala. Signale s konačnim trajanjem
spektrom i energijom ako imaju BT>10 smatraju se
“asimptotskim signalima ”. Landau i Pollak su pronašli da
signali s BT>5 imaju 99% energije u području definiranom
unutar B i T. Dakako signali s malim BT u informatičkom smislu
nisu dovoljno “bogati”. Njihove estimacije su slabe.
Neke korisne definicije i svojstva asimptotskih signala s(t):
Neki asimptotski signal s(t) je monokomponentan ako
njegova trenutna frekvencija fi(t) točno predstavlja modulacijski
zakon signala, jednoznačna je i postoji njen invers fi-1(t)
Neki je asimptotski signal s(t) višekomponentan ako postoji
konačan broj N monokomponentnih signala sj(t) takvih da u
zbroju daju s(t). Samo jedna od njenih komponenata mora biti
asimptotska. Dekompozicija je ovisna o primjeni!
Estimacija i interpretacija signala/9
Monokomponentni signal

Višekomponentni signali
t

t
f
t

f

f
Estimacija i interpretacija signala /10
Svojstva asimptotskih signala
1. Energijska razdioba asimptotskog signala s(t) usredotočena
je u konačnom vremensko-frekvencijskom području oko TF, a
stupanj koncentracije je ovisan o umnošku BT.
2. Za jednokomponentni asimptotski signal s velikim BT i
monotonim zakonom promjene može se pokazati da se fi(t)
približava prema τg-1, tj ove su dvije funkcije međusobno
inverzne. Tada fi(t) opisuje zakonitost frekvencijske modulacije
signala s(t), a τg(f) predstavlja vremensko kašnjenje signala.
3. Za jednokomponentni asimptotski signal s malim BT ne vrijedi
jednakost fi(t) = τg-1. Ne postoji niti fizikalno značenje koje se
može pripisati ponašanju u t-f ravnini, iako je matematički dobro
definirano.
Dakle traži se monotonost ponašanja TF i veliki iznos BT-a.
Monotonost osigurava jednu prasliku u području T, a veliki iznos BT
osigurava da se svaki element u T preslikava na jednu sliku u B, dakle
da postoji dominantnost jedne frekvencije npr. f0.
10. Pretraživanje podataka
Pretraživanje podataka (data mining) je analitička tehnika
kojom se grade modeli za obilježavanje podatka u cilju
nalaženja informacije. Procjena uspješnosti skupe marketinške
kampanje, otkrivanje bitnih uzroka kvarenja energetskih
transformatora ili postizanje veće odzivnosti na potrebe kupca
telefonske usluge - važan je motiv za opsežnu, skupu i često
dugotrajnu analizu velike količine podataka. Tehnike kojima se
služimo možemo grubo grupirati na:
- pomoć pri boljem razumijevanju podataka
- ugradnja značajki u podatke za njihovu kasniju analizu
- omogućavanje mjerenja uspješnosti ugrađenih značajki
Opisuje se niz postupaka od predobrade sirovih podataka do
korisnih postupaka njihovih odvajanja i obilježavanja. Naglasak
je na razumijevanju podataka već prije početka postupka
obrade.
Važnost podat(a)ka
Iznosi podataka penju se brzo na milijarde jedinica. Ako želimo
obilježiti živi svijet na nekom području tada za 2000 vrsta, u
2000 različitih lokaliteta te sa 2000 bajtova po lokalitetu imamo
8GBy podataka. Ipak zaključci koje možemo izvesti iz sintaksnih
okvira računarskih podataka i semantička interpretacija njezinih
vrijednosti je ograničena. Sve ovisi jako o kvaliteti podataka s
kojima raspolažemo. Tehnike rijetko kada imaju sposobnost
uporabe znanja iz date domene a zasigurno nemaju pristup
obilju infromacije koja je na raspolaganju analitičaru. Stoga
analitičar mora osigurati da se donose najbolji mogući podaci
koji daju i najviše moguće iznose informacije.
Kvaliteta podataka odnosi se na njihovu potpunost,
odvojivost i razumljivost za analitičara.
Potpunost ovisi o tome ne posjeduje li zapis sve podatke.
Nedostatak podataka obezvređuje osobine sustava. Postoje
neki načini da se nadiđe i takav slučaj.
Važnost podat(a)ka /2
Odvojivost podataka odnosi se na lakoću kojom se mogu
obilježavati klase podataka u datom skupu. Obilježavanje mora
moći ići u smislu postizanja cilja obrade. Tako se obilježavanje
podataka puta ne smije izbjeći kod analize problema trgovačkog
putnika i sl. Često je to kombinacija obilježja koja igra ulogu u
nalaženju informacije. No analitičar koji ne razumije područje
rada teško će otkrivati svojstva obilježavanja!
Razumljivost podataka može se kretati od poznavanja vrste
podataka atributa (obilježnika) do razumijevnja stohastičkih
modela koji se koriste i pravog sadržaja informacije. Semantičko
razumijevanje značenja atributa bila bi poželjna osobina, no
malo sustava za pretraživanje podataka posjeduje svojstvo
uporabe domenskog znanja.
Važnost podat(a)ka /3
Vrste podataka
U biti postoje dvije vrste podataka: brojčani (kvantitativni) i
simbolički (kvalitativni).
Brojčani podaci (cjelobrojnici ili realni brojevi) donose svojstvo
razlikovanja značajnosti dvaju podataka iz razlike njihovih
brojčanih iznosa.
Simbolički podaci ( brojke ili znakovi) donose svojstvo da im je
za istu jedinicu različito značenje. Dakle za neko svojstvo
obrade mora postojati neka skala obilježavanja simbola koja
je primjerena datom cilju obrade. Često je već postizanje skale
obilježavanja veliki doprinos pretraživanu podatka. Skale
obilježja dakle moraju izrađivati eksperti iz područja problema
koji se rješava datom obradom pretraživanja.
Zadatak: poredajte po skali obilježja vaše informatičke uređaje:
računalo, telefon (mobilni?), TV prijamnik, kućno zvonce. Ovisi li
to i o okolnosti uporabe?
Važnost podat(a)ka /4
Predočavanje podataka
Kada skup podataka prelazi tri atributa ili 1000 jedinki teško ga
je predstaviti s dovoljnom jasnoćom. Porast broja i složenosti
podataka u računalima taj je problem samo povećao. Jako je
teško stvarne podatke “vidjeti” kao nakupine, grozdove.
Svakako da je dobro predočavanje podataka uvjet za njihovo
bolje razumijevanje.Uz sve isto podatke ćemo najbolje
predočavati tako da istaknemo one atribute, dimnezije gdje se
najviše razlikuju. Isto tako možemo one dimenzije gdje se ne
razlikuju naprosto zanemariti u predočavanju. Tako možemo
prikaz smanjiti na onaj broj dimenzija 2,3 koji je najprimjereniji
za predočavanje čovjeku. Nadalje, dovoljno je izabrati do stotinu
oglednih podataka za prikaz od više od tisuću njih, da bi se
dobio uvid u osnovna svojstva skupa podataka.
Tehnika predobrade
Predobrada podataka je važan korak u njihovom boljem prikazu
korisniku, otkrivanju skrivenih svojstava i svođenju na oblik u
kojem se mogu uspoređivati podaci iz različitih izvora.
Postupci predobrade svode se na filtraciju, skaliranje,
normalizaciju te regresiju dimenzije. No, bez obzira koji se
postupak uvodi podaci nakon predobrade nisu više jednaki onim
sirovim podacima.
Budući da se radi o tome da ne znamo informacijski model na
izvoru, niti mu možemo pristupiti, ne možemo doći do čistog
informacijskog signala, a ne znamo ni model šuma niti mu
možemo pristupiti a znamo samo mjerni signal, to je problem
pristupu informaciji daleko teži nego izgleda.
Naravno da predobradom samo smanjujemo neke od
nepoznatih veličina, nikako sve.
Tehnika predobrade /2
Opća shema predobrade
Nedostupni model
šuma
Nedostupni šum
Model=?

Nedostupni
inf. izvor

Model=?

*

Filter

Nedostupni
inf. signal

Mjerenje, podatak

Predobrađeni
podatak
Tehnika predobrade /3
Filtriranje se može izraziti iz osnovne formule (Graupe, 176)
yk = x k + nk
(54),
gdje je yk mjerenje, sirovi podatak, xk je signal a nk je aditivno
dodani šum, k je k-ti vremenski interval. Filter daje procjenu,
estimaciju xke signala xk samo na osnovici yk. Pri tome optimalni
linearni filter zahtijeva poznavanje parametara modela
signala i šuma. Linearni Wienerov filter u smislu minimuma
kvadratnih odstupanja estimacije daje linearnu estimaciju xke
informacijskog signala s obzirom na mjerenja tj
xke = Σαi* yk-i sumiranje od 0<i<M
(55),
gdje su αi parametri filtera koji se izračunavaju prema
minimumu kvadrata odstupanja od estimacije, a M je dubina
utjecaja na estimaciju. Kada doprinos estimaciji s porastom M
padne ispod nekog iznosa onda se daljnje računanje po dubini
više ne uzima u obzir.
Možemo li za niz podataka 4,6,3,7 izračunati α0 i α1?
Tehnika predobrade /4
Norm iranje i skaliranje podataka
Skaliranje je promjena mjerila podataka u smislu povećanja
njihove razdvojivosti. Nakon skaliranja potrebno je često
podatke podvrgnuti zajedničkom normiranju. Teorijski
promatrano klasifikatori se mogu podučiti kako primijeniti
odgovarajuće linearno ili nelinearno skaliranje podataka na
svojim ulazima, što je vrlo složen postupak.
Uobičajeni postupci preobrade je pretvorba podataka u podatke
sa srednjom vrijednosti jednakoj ništici te normiranje varijance
ulaznih atributa.
Uzmimo da posjedujemo dva niza podataka: m1 = 3, 4, 6, 4 te
m2 = 11,14, 15, 12. Postavimo ih linearnom pretvorbom u
skalu1 - 10 Normiramo tako pretvorene podatke u nizove sa
srednjom vrijednosti ništa. Pokušajmo ih pretvoriti u podatke s
istom varijancom. Što opažamo? Kuda su nestale izvorne
veličine? Možemo li ih obnoviti?
Tehnika predobrade /5

Regresija
Regresija je zajednički naziv za raznorodnu grupu postupaka
kojima se smanjuje broj opisnih atributa promatranog skupa
podataka.
Uobičajeno je odrediti kolika je međusobna statistička ovisnost
parametara, pa onda izostaviti one parametre koji su već
dovoljno dobro predstavljeni drugim veličinama. Takvi
međusobno neovisni parametri nazivaju se glavni parametri ili
glavne analitičke komponente, GAK. Daljnja se obrada onda
odvija na puno manjem broju GAK-a što pojednostavljuje prikaz
i smanjuje broj pretraga. No, ostaje osnovni problem - kojom
metodom to postići! Odnosno kakav model regresije rabiti.
Linearna regresija tako svodi opis neke mjerne pojave y kao
linearne kombinacije GAK-a x1 , x2 ... Sljedećom shemom:
Y = a1 X1 + a2 X2 + a3 X3 + o
(56),
gdje je o oznaka za ostatak aproksimacije pojave. X1, X2 i X3
su tada GAK-e.
Primjer regresije podataka
Y

X1

X2

X3

X4

5

1

4

-3

2

8

0.2

6

-2

3

12

2

7

-1

2

15

0,6

10

1

1

-6

2

-3

2

0,6
Tehnika predobrade /6
Koeficijent korelacije niza y i x računa se prema izrazu
r = 1/n *Σ (xi- xsr)(yi - ysr) / ( 1/n *Σ (xi- xsr)2 )1/2) *
( 1/n *Σ (yi - ysr)2) 1/2)
(57),
gdje je n broj parova događaja, xi i yi su podaci i-tog događaja xsr i ysr
su srednje vrijednosti svakog niza.
Koeficijent korelacije rangiranih nizova y i x računa se prema izrazu
rq = 1- 6 Σ δ2/ n2 (n-1)
(58),
gdje je δ2 kvadrat razlike rangova dvaju nizova. Izraz (58) vrijedi za
nizove sa svim različitim rangovima u pojedinom nizu.
Što možemo dobiti ispitujući podatke iz Primjera ovim relacijama?
Možemo li možda postaviti regresijski izraz?
Kako se ponašaju nizovi na rang korelaciju?
Tehnika klasifikacije
Klasifikacija je postupak podjele ulaznih podataka prema krajnjem
ishodu događaja. Moguća je postupcima samoorganizacije podatka dakle postupcima umjetne inteligencije poput umjetnih neuronskih
(živčevnih) mreža, genetičkih algoritama, ili polukvalitativnih postupaka
(Quacol algebra)- ili induktivnim postupcima - stablom ili pravilom
odlučivanja, te statističke - CART metoda, statistička klasifikacija ili
entropijska klasifikacija.
Obradit ćemo samo neke od navedenih postupaka. Zajednička osobina
svim metodama je unošenje jakih elemenata kvalitativnog u postupku
donošenja odluke, pa ćemo na sklopu diskriminatora objasniti postupak
pretvorbe kvantitativne u kvalitativnu veličinu.
Drugi vrlo značajan element je pojačanje. Bilo da se radi o skaliranju ili
normalizaciji, podaci su, kada uđu u postupak ili uređaj za klasifikaciju,
izloženi značajnim pretvorbama.
Takve pretvorbe vrlo je teško do kraja razumjeti, obrazložiti i
interpretirati. Osobito kada se radi o samoorganiziranim postupcima.
Sklop za diskriminaciju
Sklop kojem se ulaz mijenja od -5V do 5V i koji ima prag
okidanja smješten na 0V prikazan je shemom:
Uul
Uiz

Uul

t

Uiz

Uiz
Uul

Sklop pretvara ulazni niz koji je u rasponu +/- 5V u izlazni niz koji ima
samo dva stanja + ili - . Na ovaj način na izlazu ne znamo koliko točno
iznosi ulazni niz, ali znamo da li je veći ili manji od ništice.Dakle podatak
je iz kvantitativnog prešao u kvalitativno područje: veće / manje.
Sklop za zbrajanje i skaliranje
Sklop za zrajanje s postupkom skaliranja dat je na shemi:
X - ulaz, Y - izlaz, W - težinski udio, S - zbrajalo
Koliki je Y ako su X1=5, X2=7, W1=1, W2=10? Tko dominira?
Kako možemo ovu shemu izvesti elektronički,
elektromehanički?

X1

W1
S

X2

Y=X1W1+X2W2

W2

Kako možemo na elektroničkom sklopu promijeniti W, X?
Samoorganizacija
Promotrimo sklop na slici (strjelice označavaju podešavanja
ulaznih struja u sumatore npr promjenom otpora):
Za svaku ulaznu pobudu može se podešavanjem dobiti
odgovarajući izlazni odziv. Ovo podešavanje naziva se
samoorganizacija.
X1

s

D

s

D

s

D

s

D

X2

X3

s

D

s

D

s

Y
Klasifikacija podataka /5
Klasifikacija samoorganizacijom
Svaka samoorganizacija sastoji se od strukture, mogućnosti
njene promjene i kriterija prilagodbe.
Opisujemo tri takve klasifikacije: neuralnom mrežom, genetičkim
algoritmom i Quacol algoritmom(Medusa).
Neuralnoj mreži se ne mijenje struktura, promjena je na razini
težinskih udjela a kriterij prilagodbe je minimum odstupanja
izlaza za dati skup ulaza. Ta se samoorganizacija izvodi u etapi
učenja. U etapi klasifikacije se dati obrazac propušta kroz mrežu
i opaža njen učin - tj kamo uzorak pripada po svojim atributima.
Genetički algoritam polazi od skupa različitih struktura, ispituje
prikladnost rješanja, uzima one najbolje, kombinira ih u nove
strukture tako da u kombinaciji slučajnim izborom promijeni
strukturu npr svakom stotom rješenju, pa dobivene strukture
opet ispituje na prilagođenost….
Klasifikacija podataka /6
Quacol (algebra kvalitativne korelacije) rangira ulazne podatke,
normira i rangira njihove algebarske kombinacije čime generira
različite algebarske strukture, pa one koje su kvalitativno
najsličnije ciljnoj funkciji bira za nove algebarske strukture.
Što je zajedničko svim samoorganiziranim postupcima?
Pretvorba kvantitativno u kvalitativno odvija se u više uzastopnih
koraka (cikličnost informacije!):
– kod neuronske mreže se na diskriminatoru izvodi pretvorba
kvantitativno - kvalitativno a na ulazu u sumator obrnuto.
– Kod genetičkog algoritma su rekombinacija i mutacija kvalitativni
koraci, a određivanje rezultata i biranje potomaka je kvalitativne
prirode
– kod Quacol algebre je rangiranje kvalitativni postupak, a
određivanje rezultata i biranje najpovoljnijih algebarskih struktura je
kvantitativan postupak.
Klasifikacija podataka /7

Induktivne metode
Dvije su induktivne metode: stablo indukcije i indukcijsko pravilo
Kod indukcijskog stabla računa se grananje na stablu u grupi
podataka po principu podjele u dvije grupe. Podaci se ispituju
prema nekoj vrijednosti atributa npr X1≥3 u ovisnosti o ishodu
npr Y=7. Ispituju se svi podaci. Ide se sve prema finijoj podjeli
podataka sve dok se ne dosegnu kriteriji zaustavljanja. Često se
računa informacijska dobit, kao kod ID3 postupka, pa kada je
više nema onda se klasifikacija zaustavlja.
Indukcijsko pravilo rabi mali skup prostornih i logičkih
konstrukata, poput “NA”, “I”, “U DOTICAJU”, “ILI” koji tvore
početni skup pravila zasnovan na nekom početnom kriteriju. Tim
se pravilima klasificiraju podaci - uzorci I mjeri učinak
klasifikacije. Nova se pravila dobivaju poopćenjima,
specijalizacijama i opet ispituju…Poznat je sustav AQ-11 za
klasifikaciju bolesti soje.
Klasifikacija podataka /8
Statistička klasifikacija podataka
Statistička parametarska klasifikacija: Podaci se dijele linijom u 2D

prostoru (ravninom u 3D), tako da ona prolazi područjem gdje je u oba
podijeljena skupa minimum kvadrata razlike od njegovog centra a maksimum
razlike između podataka različitih grupa. Ako je potrebno jedan se od
parametara skalira da bi se dobili traženi maksimumi, odnosno minimumi. Vodi
se računa o tipu funkcije razdiobe vjerojatnosti

Neparametarska statistička klasifikacija: izvodi se na sličan način kao

parametarska, ali ne vodi računa o tipu raspodjele, već računa centre okupljanja
(K-najbliži susjed) tako da postižu minimume razmaka untar grupe i maksimum
između članova različitih grupa.

CART(Classification And Regression Tree) metoda: dijeli skup

podataka prema sve homogenijem sastavu do ispunjenja određenog kriterija.
Svaka dioba ovisi samo o jdnoj vrijednosti jednog atributa i binarnog je tipa.Kada
su parametri opisni onda se podjela izvodi po njima a kada su numerički
određuju se regresijska pravila.
Klasifikacija podataka /9
Entropijska klasifikacija
Metoda se zasniva na grupiranju podataka prema parametru
koji posjeduje maksimum informacije, odnosno minimum
entropije.
Računaju se udio entropije uvjetne vjerojatnosti p(cj/ai) da ishod
bude cj ako je ulazni parametar a ima iznos ai, tj
H*(cj/ai) = - Σ p(cj/ai) log p(cj/ai), za sve ai od 1 do n (59),
gdje je n ukupan broj kombinacija ishoda cj i klasa atributa A.
Taj se udio množi težinskim udjelom svakog iznosa ai ukupnom
parametru A tj
H(A) = Σ p(ai) H*(cj/ai)
1<ai<k
(60),
k je broj klasa atributa A.
Odabiranjem najinformativnijeg atributa otvara se stablo
klasifikacije za ostale atribute.
Klasifikacija podataka /10
Kriteriji odrezivanja na stablu odlučivanja
Dva su kriterija odrezivanja: kada broj slučajeva padne ispod nekog
iznosa koji je značajan za donošenje odluke ili kada padne do iznosa
kada se događa da u neku klasu više ne dospijeva nijedan slučaj.
Nedogađanje slučaja izaziva umjetni pad entropije i “ruši” metodu, jer
pad entropije tada ne predstavlja smanjenje nereda već nedostatak
pojave!
Ako imamo c slučaja u datoj klasi a g ishoda ( npr. porast snage, pad
snage motora) te jednoliku raspodjelu gustoće vjerojatnosti ishoda tada
je vjerojatnost dobivanja jedne ništice unutar nekog od ishoda jednaka
P( jedan ishod =0) = ((g-1)/g)c
( 61).
Za slučaj c=15, g=4 vjerojatnost u (61) jednaka je 0,01336.
Računamo li pad entropije za slučaj g=4, c=15 npr iz obrasca
H(5,5,4,1)=0,54956 na H(5,5,5,0)=0,47712 on iznosi H=0,07244 ili
15,8%, što je zamjetno.
Klasifikacija podataka /11
Ako kao razumnu granicu za odrezivanje stabla uzmemo klase
s 2% ili manje slučajeva od ukupnog broja, tada npr za se sve
klase s manje od 740*0,02 ≈15 slučajeva dalje ne klasificiramo.
Ovo može biti drugi kriterij - potpuno pragmatički.
Analiza klasifikacijskih postupaka
Nema “najbolje “ klasifikacijske tehnike. Prema svakom slučaju
se mora posebno postupiti, prilagoditi. Ipak klasificiranje po
maksimumu sličnosti i potpuno odvajanje klasa kakvo je u
entropijskoj klasifikaciji daje joj prednost. No za veliki broj
parametara i ova klasifikacija gubi uvjerljivost.
Izračunajte koliko klasa ima u skupini podataka obilježenih s 10
parametara ako svaki ima dvije veličine!(1024 klasa)
Koja najvrjednije informatičko svojstvo krije u sebi postupak
klasifikacije? (selekcija)
Postklasifikacijska analiza
Klasifikacija je samo jedan dio posla. Drugi je odgovarajući
prikaz rezultata klasifikacije i njegovo opravdanje.
Analiza dobrote klasifikatora
1. Analiza postupka učenja
1.1 Uzima se samo jedan dio podataka i klasificira. Kada se klasifikator
“uvježba” onda se njime klasificira pokusna skupina podataka (od 9:1 do 1:1).
Pretrenirani klasifikator nema svojstvo generalizacije.
1.2 Uzima se n skupina uzoraka za učenje i testiranje. Računa se križna
validacija s nasumce izabranim parovima uzoraka. Ispituje se statistička
značajnost razlike postignutih rezultata.
1.3 Stvaraju se nove skupine uzoraka iz starih odgovarajućim zamjenama nešto slično slučaju 1.2. Tada se izvodi validacija postignutog i računaju
odstupanja. Ova metoda ima nedostatak u pojavi predrasudnih ocjena.

2. Ubacivanje funkcije troška
Procjenjuje se cijena neispravne klasifikacije - ovo je dosta teško
vrednovati.
Postklasifikacijska analiza /2
3. Analiza statističke značajnosti rezultata klasifikacije
Matrica smušenosti

Massy-jeva
matrica

A klas.

Bklas.

Apredv.

N11

N12

Bpredv.

N21

N22
Postklasifikacijska analiza /3
N11 - broj primjera klase A ispravno klasificiranih
N12 - broj primjeraka klase B neispravno klasificiranih
N21 - broj primjeraka klase A neispravno klasificiranih
N22 - broj primjeraka klase B ispravno klasificiranih
vrijedi N = N11+N12+N21+N22
Hi-kvadrat test se rabi za testiranje statističke značajnosti
rezultata klasifikacije. Zasniva se na razlici između opaženih (O)
i očekivanih (E) frekvencija pojava:
χ2 = Σ (O-E)2 / E za svih N slučajeva. (62).
Za veliki χ2 odbacuje s tzv nulta hipoteza da je razlika slučajna,
pa je i klasifikacija statistički značajna.
11. Govorna informacija - mrežni agenti
Govorna informacija razmatrat će se sa stajališta:
– 1. Postignuća automatskog prepoznavanja govora od strane
strojeva
– 2. Mogućnost automatskog čitanja pisanog teksta
– 3. Mogućnost prikupljanja podataka u otvorenom sustavu - mrežnim
agentima
– 4. Načini izgradnje konverzacijskog mrežnog agenta
– Slični postupci mogu se primijeniti i na području automatskog
prepoznavanja slike, automatskog crtanja, prikupljanja slikovnog
materijala i izrade umjetnog agenta za prikupljanje slikovnih
obrazaca, njihovu analizu i prepoznavanje.
– Sva navedena svojstva strojeva svode se na pitanje kako natjerati stroj da
prepozna govor, tekst ili slikovni obrazac, te kako ga isprogramirati da
sintetizira komunikaciju sve iz određene baze podataka - znanja prema
određenom obrascu.
– Dakle kako stroj naučiti značenju, semantici! Stroj dakako ne može naučiti
semantiku, ali se može dobro isprogramirati za tu funkciju.
Agent - komunikacijski posrednik
Nedruštveni agent (Poole)
Agent je nešto što djeluje u svijetu, poput osobe, robota, crva,
vjetra, gravitacije, svjetiljke. Ciljni agenti djeluju prema
preferencijama, vole neka stanja više od drugih, dok (naoko)
besciljne agente zovemo “prirodom”. Uloga nekog agenta je
stvar modelskih pretpostavki. Pas može u jednom scenariju biti
ciljni, a u drugom prirodni agent.
Agenti mogu imati osjetila, memoriju, aktore; oni zaključuju i
djeluju u vremenu. Agent osjetilima ne mora odražavati pravu
sliku svijeta u kojem djeluje. Agent može kontrolirati jedino svoju
akciju, poruku u datom okolišu. Agent prevodi ulazni signal u
izlaz u svakom trenutku vremena. To je ponašanje kauzalno jer
ulazno-izlazni odziv može ovisiti samo o datom i prijašnjim
ulazima i datom i prijašnjim izlazima. Nema govora o
predviđanju ili inkurziji (sadašnje ponašanje ne ovisi o budućim
stanjima). Ovakvo predstavljanje modelira svijet, agente i ciljeve
njihovog ponašanja na neki projektirani (sub)optimalni način.
Konverzacijski agent
Konverzacijski agent (Allen, /6/) može potpuno sudjelovati u
razmjeni informacije
Kakav je to stroj? Zašto bi trebao komunicirati? Zašto bi trebao
razumijevati ono što mu je preneseno?
Možda zato što je jednostavno programiran za nešto takvo.
Agent koji razgovara s bazom podataka naprosto
1. Prepoznaje i interpretira ulazno pitanje u logički oblik koji
predstavlja upit za bazu podataka
2. Izvodi upit u bazi podataka i generira izlaz zasnovan na
dobivenom odgovoru
Ovo nije inteligentan agent, a ne može prepoznati ništa osim
onoga što stoji u bazi podataka. Nema nezavisnosti u njeovom
ponašanju, što bi dovelo do primisli da je agent inteligentan.
Nešto više inteligencije dobili bismo predstavljanjem na način
koji više odražava stvari koje motiviraju ljudsko ponašanje.
Društveni agent
Društveni agent (Castelfranchi) ne živi sam u svijetu njegove
se osobine tvore na socijalnoj interakciji, koja nije reducirana na

komunikaciju već je komunikacija zbog potrebe društvenosti, djeluju u
zajedničkom svijetu, sučeljavaju se, utječu međusobno i ovise jedan o
drugome. Ta je akcija zasnovana na ispoljavanju moći,
uni(bi)lateralnom pokušaju utjecaja na drugog tako da mu mijenja
pamćenje, memoriju i nakanu. Društvena akcija nije nužno i
kooperativna akcija. Agenti i njihove akcije vođeni su ciljnom funkcijom.
Često ponašanja agenta nisu praćena nekom internom (mentalnom)
predstavom učina tog istog ponašanja. Cilj je interna predstava stanja
svijeta koji je kandidat za: upravljačku i vodeću akciju s pomoću
ponavljanja ispitivanja učina akcije ili suprotne predstavljanju,
određivanje akcije pretraživanja i izabiranja, te kvalifikacije uspjeha ili
neuspjeha. Cilj razlikuje društvenu od nedruštvene akcije. Akcija je
moguća I na podspoznajnoj razini npr u umjetnim samoorganiziranim
strukturama,ANN. Ovdje se razmatraju samo ciljno usmjerene akcije
interno zasnovane na spoznajno vođenim agentima čije se akcije
interno reguliraju ciljevima zasnovanim na uvjerenjima.
Međudjelovanje agenata i ciljeva
Prilagodba

Uvođenje

Negativno
djelovanje

Modifikacija plana u
cilju izbjegavanja
prepreke

Navođenje drugog da
napusti svoj prijeteći
cilj

Pozitivno
djelovanje

Prilagodba plana
ubacivanjem
iskorištenja akcije
drugog

Navođenje drugog da
slijedi cilj koji je nama
nužan
Stupnjevi interakcije društvenih agenata
Prvi stupanj: smetnja i ovisnost (vidjeti tablicu ranije datu)
Drugi stupanj: slaba društvena akcija - uvjerenje u mišljenje drugog - tj
traži se mogućnost predstavljanje mišljenja drugog agenta.
Kooerdinacija je tada moguća na reaktivni način tj da se uoči porble ili
na proaktivni način tj da se anticipiraju mogući ishodi akcije drugog
Treći stupanj: delegiranje akcije drugog, gdje prvi agent treba ili želi
akciju drugog agenta i uključuje je u svoj plan. Prvi agent ima
povjerenje u drugog.
Četvrti stupanj: jaka društena akcija - stvaranje ciljeva o akcijama i
ciljevima drugog agenta.
Peti stupanj: društveno prekrajanje cilja - agent dolazi do stupnja
prihvaćanja novog cilja ili razloga za prihvaćanje ciljeva drugog agenta,
dakle društveni agent je sposoban prihvatiti ciljeve izvana od drugih
agenata drugih frupa poput zahtjeva, potreba, naredbi, normi.
Razine kolaboracije: x prihvaća točno ono što mu je delegirao y, x
prelazi tu razinu, no cilj y-a se ne mijenja, x zadovoljava rezultete
traženog plana/akcije ali ih pritom mijenja (kritično!), x shvaća da je
pretjerao i mijenja akciju ...
Struktura komunikacije agenata
Osnovna struktura komunikacije int. agenata sastoji se u potrebi
definiranja dosega konteksta. Razgovor agenata možemo promatrati
kao linearni segment sve dok se na počne pozivati na kontekst iskazan
jednom ranije. U tom smislu možemo razlikovati događajni i
komunikacijski od informatičkog dijela razgovora. Intuitivno je jasno
kada se neki dio razgovora može izdvojiti. No ne postoji konsenzus o
tome što je to segment razgovora. Osnovno je uvidjeti da: postoji
tehnika analize rečenica unutar segmenta i postoji suodnos segmenata
razgovora. Iz praktičnih razloga segment razgovora se sastoji od iskaza
koji očitavaju lokalnu neproturječnost. Segement bi trebao imati
sljedeća svojstva:
– upotrebljivost neke tehnike za vremensko referiranje za postupak s kratkim
izrazima (elipse)
– čvrsto vrijeme i mjesto obilježava iskaze ili je napredovanje vremena i
mjesta jednostavno
– čvrsto određeni skup govornika i slušatelja sudjeluje u razgovoru
– čvrsti skup pozadinskih pretpostavki je relevantan
Opis događaja, informatički odnos,
komunikacijski cilj
Analizira se linearni niz događaja koji čini segment -u segmentu
ne smije doći do promjene situacije - npr promjene broja
konverzanata, skok u vremenu.
Strukture segmenata mogu biti linearne, uklopljene. Ključne
riječi odrđuju promjenu strukture događaja.
Konverzanti se određuju svojim informatičkim (semantičkim) i
komunikacijskim (volja, moć, apobetika, pragmatika) vidom.
Informatički odnos uključuje pretpostavke o ponašanju okoliša.
Komunikacijski cilj se u osnovici sastoji od prepoznavanja cilja
sugovornika.
Što je nužno za izgradnju konverzacijskog
agenta
Ljudi djeluju zato što imaju ciljeve, zbog svjesnosti situacije u
kojoj se nalaze, a imaju pozitivne i negativne osjećaje prema
datoj situaciji.
Recimo da želite prijeći prometnu cestu na neoznačenom
prijelazu. Tada morate:
–
–
–
–
–
–
–

promotriti cestu - opažaj
imati predstavu o tome što se događa - uvjerenje
moći stvoriti pozitivne / negativne osjećaje prema datoj situaciji želja / potreba
biti u stanju izvoditi zaključke - planiranje / zaključivanje
biti u stanju stvaranje odluke djelovanja - odlučnost
biti u stanju održati namjeraveni tijek akcije - nakana
moći djelovati i time promijeniti stanje - djelovanje

Dakle, morate posjedovati četiri procesne (opažaj, planiranje, odlučnost
i djelovanje) te tri spoznajne ( uvjerenje, želje i nakane) osobine.
Što je nužno za izgradnju konverzacijskog
agenta/2
Dijagram: uvjerenje - želje - nakane

Planiranje
Opažaj
Uvjerenja
Odlučnost
Želje

Nakane

Djelovanj
e
Razgovor
Razgovor kao linearni niz iskaza
Pojam segmenta razgovora i ključnih fraza koji ukazuju na
strukturu segmentacije
Utjecaj strukture segmenta na interpretaciju pojedinih izraza
posebno pridjeva
Utjecaj međudjelovanja segmenta i zaključivanja za
razumijevanje sadržaja razgovora
Utjecaj vremenski ovisnih pojava i uzročno - posljedičnih pojava
na segmentiranje razgovora
Konačni model razumijevanja razgovora
Primjer
Komunikacija kao djelovanje među
agentima
Govor (slika, riječ, simbol, signal) nužno uključuje više agenata. Cilj govora je
djelovanje jedne osobe na spoznajno stanje druge.
Situacije:
– Agent A signalizira znak X - Agent B to prepozna i koristi
– Agent A signalizira znak X - ali iz drugog razloga - B prepozna i griješi
– Agent A signalizira znak X - Agent B misli da je to neki drugi razlog i ne
reagira
– Dakle komunikacija se događa kada jedan agent namjerava komunicirati a
drugi prepozna tu njegovu nakanu. Druga strana komunikacije je
dogovoreni skup konvencija s unaprijed dogovorenim značenjem.
– Postoji dakle važna razlika između fizičkog čina i komunikacijskog čina.
– Austin je (1962) ustvrdio da postoje:
čin lokucije (recimo: izgovaranje riječi)
čin ilokucije ( čin izričaja značenja)
čin perlokucije (stvarni učin, rezultat izgovorenog)
Predstavljanje spoznajnih stanja
Podaci su ono što postoji u bazama podataka. Ako međutim
skupljamo znanje onda možemo oblikovati bazu znanja. Znanje
se predstavlja u obliku općepoznatog znanja i znanja
svojstvenog nekoj datoj situaciji. Opće znanje služi za
razlučivanje značenja u dvosmislenim iskazima i situacijama.
Specifično znanje služi za opis date situacije te za razlučivanje
značenja riječi, signala u konkretnoj situaciji.
Sustav za predstavljanje znanja sastoji se od baze znanja i
pravila zaključivanja. Pravila zaključivanja izvode iz baze znanja
nove iskaze, zaključke. Mnogi zaključci su sadržani u bazi
znanja, ili se izvode iz baze znanja, tzv implikacijama.
Tehnike zaključivanja su deduktivne ili nededuktivne.
Deduktivno zaključivanje je logički opravdano. Nededuktivno
zaključivanje može biti: učenje općeg iz posebnog (induktivno
zaključivanje) ili zaključivanje na odziv iz pobude (abduktivno
zaključivanje).
Tehnika zaključivanja
Zaključivanje tipa A ⊃B (glasi: ako A onda B) je deduktivno.
Abduktivno je zaključivanje na A ako znamo da postoji B.
Težinsko zaključivanje dozvoljava iznimke. Označava se s
A ⇒B i glasi: ako vrijedi A⇒B a ¬B ne možemo dokazati tada
zaključujemo da je B istinito. Tako rečenicu “Ptice lete” možemo
predstaviti kao
∀ x PTICA(x)⇒LETI(x)
(63).
Ovakvo zaključivanje naziva se nemonotono.
Postoji nemonotono zaključivanje drugog tipa zasnovanog na
zamisli zatvorenog svijeta. Tada se za sve što ne možemo
dokazati da je ispravno uzima da je neispravno (jezik Prolog).
Za zaključivanje se rabi predikatska logika prvog reda (s
proširenjima), tzv modalna logika, tako da se sheme
predstavljanja znanja poput semantičke mreže ili okvira mogu
relativno jednostavno obraditi.
Predstavljanje znanja
Obradimo djelovanje tipa “KUPNJA” sljedećim okvirom:

Klasa akcije: KUPNJA(k)
Uloge: Kupac, Prodavač, Predmet, Novac
Ograničenja: Čovjek(Kupac), AgentProdaje(Prodavač), JestPredmet(Predmet)
Vrijednost(Novac), Cijena(Predmet)
Preduvjeti: POSJEDUJE(Kupac, Novac), POSJEDUJE(Prodavač, Predmet)
Učini: ¬POSJEDUJE(Kupac,Novac),¬POSJEDUJE(Prodavač,Predmet)
POSJEDUJE(Kupac,Predmet), POSJEDUJE(Prodavač,Novac)
Opis: DAJE(Kupac,Prodavač,Novac), DAJE(Prodavač, Kupac, Predmet)
Koherentno znanje
Znanje o djelovanju uzročnosti i svakodnevnosti bitno je za
razumijevanje informacijskog konteksta i jednoznačno
djelovanje. Ovo je znanja osnovica za stvaranje očekivanja i
usporedbe mogućih interpretacija ulazne pobude. Značajna je tu
kontrola generiranja očekivanja. Koriste se postupci poput:
referentnih znanja, očekivanja, razumijevanja stereotipičnih
situacija, hijerarhijskih planova i zaključivanje tipa pobude-učina.
Inteligentan agent ponaša se u krugovima postupaka:
– 1. Promatra tekuću situaciju, uključivo i nadzor nad uspjehom
neposredno poduzete akcije
– 2. Odabire cilj, skup ciljeva, na koje se usredotočuje
– 3. Započinje razvijati plan kako postići te ciljeve
– 4. Izvodi akcije u planu kada ih smatra primjerenim
Prostori uvjerenja
Razmjena informacije je ograničena ako agent posjeduje samo
jednu bazu znanja - svoju! Tada ne može npr predstaviti
informaciju o uvjerenju drugog agenta. Nadalje, nema nikakve
svijesti o sebi jer ne može razlikovati između onog što on vjeruje
i onog što vidi u svijetu oko sebe. Dakle, nema osnovice ni za
uporabu opažaja.
Najjednostavnije rješenje jest podjela baze znanja na dva
područja uvjerenja. Takav prostor je naprosto skup iskaza i sam
po sebi je baza znanja. Svaka se može koristiti za
predstavljanje nekog agentovog uvjerenja. Za razgovor dviju
strana tada trebamo dva prostora: jedan za predstavljanje
znanja jednog a drugi za predstavljanje znanja drugog agenta
Ovo nije realističan model znanja jednog agenta, jer mu daje izravan uvid
u znanje drugog agenta. Bolje je sve postaviti relativno na stranu agenta
čije ponašanje modeliramo. Uvodimo predikat: UVJ(erenje).
Predstavljanje agentovog uvjerenja
UVJ(Ivo1,Pas(Fido1))
UVJ(Ivo1, ∀x:Pas(x),
Laje(x))
UVJ(Ivo1,UVJ(Ana1,
Pas(Fido1))
UVJ(Ivo1,UVJ(Ana1,∀x:
Pas (x). Laje(x)))
UVJ(Ivo1, UVJ(Ana1,
∀x: Pas(x), Laje(x) ⊃
Oštar(x))

Iskazi u modalnoj logici

Prostor 1: Ivino uvjerenje
Pas(Fido1)
∀x: Pas(x), Laje(x)
UVJ(Ana, Prostor 2)

Prostor 2: Ivino uvjerenje o Aninom uvjerenju
Pas(Fido1)
∀x: Pas(x), Laje(x)
∀x: Pas(x), Laje(x) ⊃ Oštar(x)

Iskazi u prostorima uvjerenja
121 teorija informacije_07-08
121 teorija informacije_07-08
121 teorija informacije_07-08

Contenu connexe

Similaire à 121 teorija informacije_07-08 (10)

Parapsy 01 11 12
Parapsy 01 11 12Parapsy 01 11 12
Parapsy 01 11 12
 
Fink eugen uvod u filozofiju
Fink eugen uvod u filozofijuFink eugen uvod u filozofiju
Fink eugen uvod u filozofiju
 
30133344 eugen-fink-uvod-u-filozofiju
30133344 eugen-fink-uvod-u-filozofiju30133344 eugen-fink-uvod-u-filozofiju
30133344 eugen-fink-uvod-u-filozofiju
 
HOLOGRAFSKI UNIVERZUM Michael Talbot
HOLOGRAFSKI UNIVERZUM  Michael Talbot HOLOGRAFSKI UNIVERZUM  Michael Talbot
HOLOGRAFSKI UNIVERZUM Michael Talbot
 
Evo 11 10 11
Evo 11 10 11Evo 11 10 11
Evo 11 10 11
 
Sinteza
Sinteza Sinteza
Sinteza
 
Kontrola uma
Kontrola umaKontrola uma
Kontrola uma
 
Gerd Gigerenzer -Snaga intuicije
Gerd Gigerenzer -Snaga intuicijeGerd Gigerenzer -Snaga intuicije
Gerd Gigerenzer -Snaga intuicije
 
Phd_obrana_zfk
Phd_obrana_zfkPhd_obrana_zfk
Phd_obrana_zfk
 
umjetna inteligencija.pptxiuhiuhiuhuihihuih
umjetna inteligencija.pptxiuhiuhiuhuihihuihumjetna inteligencija.pptxiuhiuhiuhuihihuih
umjetna inteligencija.pptxiuhiuhiuhuihihuih
 

121 teorija informacije_07-08

  • 1. INFORMACIJSKA TEHNIKA Teorija informacije Predavač: prof.dr.sc. Franjo Jović Kontakt: franjo.jovic@etfos.hr tel: 031-224-615, utorak/srijeda11-12h
  • 2. Satnica i izvođenje nastave Predavanja: 30-45 h Auditorne vježbe: 8-12 h Laboratorijske vježbe: 8-12h -
  • 3. Sadržaj predavanja Pojam informacije. Filozofske osnove. Matematičko izražavanje. Entropija. Entropija kontinuiranog izvora informacije. Pojavni i obilježni oblici informacije. Bayesovi i Gittovi stavci. Kapacitet informacijskog kanala. Shannonov teorem. Železnikarove teze. Informacija na izvoru, njeno otkrivanje i kodiranje. Obrazac i opažaj. Markovljev izvor. Kvaliteta izvora. Govorna informacija. Mrežni agent kao informacijski izvor. Šum i kodiranje na kanalu. Međuinformacija. Podaci i informacija. Signal i umnožak BT. Analiza glavnih komponenti informacije. Carnapova entropija. Klasifikacijski postupci. Statistička i entropijska klasifikacija. Klastering. Postklasifikacijska analiza. Vrednovanje semantičkog sadržaja. Mrežni informacijski multiagenti posrednici, osnovica .
  • 4. Sadržaj vježbi Kodiranje na informacijskom kanalu. Vlastiti sadržaj informacije. Proračun entropije. Proračun semantičkog sadržaja. Proračun uvjetne entropije. Kodiranje Markovljevih izvora. Filtriranje podataka. Klasifikacijska analiza. Klasteriranje složenih događaja. Projekt mrežnog agenta. Proračun rizičnosti složenih događaja
  • 5. Znanje, informacija i osnovna pitanja filozofije Uvodno izlaganje Franjo Jović Osijek 05.10.2006.
  • 6. Što je filozofija Filozofija razmatra cjelinu bitka u odnosu na čovjeka i istinu koju obuhvaća dublje od svake znanstvene spoznaje Nastupa kod osvještavanja ljudi Smisao čiste filozofije bez znanosti se pojavljuje tamo gdje se: a) stvarnost sagledava u svom podrijetlu b) stvarnost obrađuje poput unutrašnjeg razgovora
  • 7. Što je filozofija/2 c) otvara širina spoznatljivog d) odvija ljudska komunikacija u traženju istine e) razum strpljivo održava budnim pred onim najstranijim i pred osobnim ograničenjima Filozofija nas koncentrira time što nas održava ljudima u našem sudjelovanju u stvarnosti.
  • 8. Podrijetlo filozofije Pobuda filozofiranja leži u čuđenju, sumnji, svijesti o izgubljenosti, primicanju graničnih stanja: smrti, slučaja, krivice, neoslonjivosti na svijet Platon i Aristotel su izučavali u začuđenosti samu bit bitka, Descartes je u beskonačnosti nepoznatog tražio ono nužno poznato; stoici su u patnji sadašnjosti tražili smirenje duše.
  • 9. Podrijetlo filozofije/2 Pritisak polazi od sigurnog tla do dubine bitka do počovjekovljenja; ide do komunikacije čovjek - čovjek. Priopćenja koja pritom nastaju su neodvojiva od sagledavanja istine: u unutrašnjem postojanju, osvjetljavanju ljubavi, približavanju savršenstvu
  • 10. Spoznatljivo Osnovno pitanje filozofije je: Što jest? Što je bitak, osnovica svega što postoji, živog i neživog, vidljivog i nevidljivog? Ono iz čega sve proizlazi? Tales: Sve je voda! ..vatra, materija, duh, duhovno živuća materija (hilozoizam) No jesmo li voda koja misli? … To dovodi do suprotnosti subjekt - objekt. Nema objekta bez subjekta i obrnuto. Stvarnost je dakle spoznatljivo koje se u toj suprotnosti pojavljuje. Spoznatljivo ne postaje predmetom ali dolazi u pojavnost u dualnosti ja-predmet. U tom promišljanju postoji i drugi rascijep: predmet u odnosu na druge predmete.
  • 11. Spoznatljivo/2 Kao razlika prema drugome proizilazi da je bitak suprotstavljen ništavilu. Predmet ne može biti sve, dakle ni cjelina bitka. Ni sam bitak. Svako osmišljavanje nečega je izvlačenje toga iz spoznatljivog. Dakle to stoji suprotstavljeno ne samo meni već i drugim predmetima. Spoznatljivo je stoga ono što se u promišljanju uvijek navještava. Zamisao je u odnos na predmet neprirodna pojava u uobičajenom razumijevanju odnosa. Mi želimo s njezinom pomoći utjecati na vlastitu svjesnost bitka. Zamisao sama po sebi je prazna, bespredmetna. No svojim oblikom otvara beskonačne mogućnosti pojave postojanja i postaje s obzirom na njega transparentna.
  • 12. Spoznatljivo/3 Mi promišljamo predmetno, slikovno. Moramo odatle misleći predmetno postići usmjerenje na bespredmetno spoznatljivog. Egzistencijalno smo vezani na Boga / transcendentalno a to sve putem znakova, simbola. Božje postojanje je za nas stvarnost putem našeg postojanja, dok inače postoji u drugim dimenzijama potpuno različitim od našeg predmetnog svijeta. Tako se spoznatljivo sastoji od naše svjesnosti po kojoj smo svi jednaki, od životne stvarnosti po kojoj smo međusobno odvojeni pojedinci i od egzistencije u kojoj smo po svojoj snalažljivosti.
  • 13. Spoznatljivo Mistici transcendiraju dualnost objekt - subjekt, poništavaju subjekt i odlaze u transcendentalno, no ne mogu ga iskazati jer nije predmetljivo, nije izrecivo Spoznatljivo je dakle: – – – bitak po sebi transcendentalost (Bog) svijet
  • 14. Transcendentalno Prorok Jeremija promišlja živog Boga. Grčki filozofi domišljaju Boga kao pravilo. Oba razmišljanja svode se na to da Bog jest i da postoji kao obdržavač i stvoritelj svijeta. Današnji filozofi zaobilaze to pitanje, kao ono: što ne možemo znati radije prešućujemo. Bog nije pristupačan promišljanjem već vjerovanjem. Njegovo se postojanje ne može dokazati matematikom ili empirijskim znanostima. No ni dokazani Bog ne bi bio Bog već predmet. Odakle vjera? Iz ljudske slobode. U svojoj slobodi nisam po sebi samom već sam sebi u njemu darovan; ne mogu svoju slobodu iznuditi. U svojoj najvećoj slobodi sam slobodan i od sebe i svoje vezanosti za svijet. Dakle najdublje sam vezan za transcendentalno. Bog je po meni odlučnost u kojoj postojim. On je sadašnjost postojanja a ne sadržaj znanja. U njemu je izvjesnost životne prakse /1,Karl Jaspers/.
  • 15. Bezuvjetni zahtjev BZ postoji u ljubavi, borbi, u visoko postavljenim ciljevima. Obilježje BZ jest da mu je život u cjelini osnova no ne posljednja. Za ostvarenje BZ je svejedno odnosi li se na ideju, ljubav ili vjernost. Nije podložan volatilnosti života. U krajnjoj granici prekoračuje život i dovodi do gubitka bitka, do neizbježne smrti. Uvjetni zahtjev se po svaku cijenu obraća životu. Sokrat, Thomas Morus, Bruno, umrli su za svoju istinu BZ ima svoj korijen u nama samima, s time da me provlači kroz nešto što nisam samo ja po sebi. To nije ono što se želi nego ono zbog čega se želi. To je stav vjere, težina jedne duše.
  • 16. Bezuvjetni zahtjev/2 Razabiremo li mi svoje osnove i ciljeve svojih postupaka ostajemo u uvjetovanom. Tek život iz nepredmetnog osnova je života u BZ. BZ je duboko ukorijenjen u ono čime smo ispunjeni. Opredmećeni BZ je fanatizam i tiranija Komunikacija zaljubljenih u ljubavnoj bitci - možda i ona može biti lažna BZ je vanvremensko. Ono je konstruktivna dobrota. Zlo nastupa u tri oblika – kao moralni čin odluke tipa želja / zadaća – kao etični čin kada odluke BZ stoji u ovisnosti uvjetovanog (čistoća motiva) – kao metafizički čin biti motiva: ljubav (od koje se živi) / mržnja (izvlačenje iz transcendentalnog)
  • 17. Ostala pitanja filozofije Što je čovjek – sloboda, djelovanje, transcendentalnost Što je svijet – svijet i prolaznost – svijet i ono vječno u njemu Povijest čovječanstva, filozofije, religije – je li ipak nečastivi pomagač Bogu Filozofska neovisnost – Filozof je neovisan od materijalne zapetljanosti, plemena, asket, nije prestrašen, neovisan o religiji, politici, uređenju države, smrti – filozofiranje je škola neovisnosti a ne posjedovanje neovisnosti.
  • 18. 1.Pojam i matematičko izražavanje informacije “Mislim da smo trenutno u predkopernikanskom razdoblju spoznaje i primjene informacije” Marijan Miković, 2004., osobno priopćenje
  • 19. Informacija i propast EPR pokusa Na temelju članka Einsteina, Rosena i Podolskog (1935) “Can quantum-mechanical description of physical reality be considered complete?” izradio je John Bell prijedlog provjere istodobne pojave informacije na udaljenim mjestima npr u pokusu s polariziranim zrakama svjetlosti. Ovo su spomenuta tri autora naveli kao nešto nemoguće. Pokus su 1982. godine izveli Aspect, Roger i Dalibard i pokazali da se informacija pojavljuje istodobno na udaljenim mjestima, dakle neovisno o brzini svjetlosti. Ovime je informacija pokazala da posjeduje svojstvo (barem) četvrte prostorne dimenzije jer se može iskazati istodobno na bilokojem mjestu treće dimenzije prostora. Naprosto dolazeći iz njegovog “ne prostora”. Istodobno i materija(energija) je pokazala da je nedjeljivo “vezana” uz informaciju! Obje činjenice bile su “previše” za dotadašnje poimanje stvarnosti.
  • 20. Informacija i propast EPR pokusa/2 Neovisnost o prostornoj dimenziji 3D prostora čini i striktno čuvanje informacije te dostup do informacije vrlo osjetljivim ako ne i nemogućim zahvatom u užem smislu te riječi. Naravno ukoliko je informacija upakirana u materijalnom aspektu prostora. Mi smo propašću EPR pokusa dovedeni na “golu ledinu” gdje je samo pitanje vremena i sredstava kada će apsolutno nedostupna materijalno pakirana informacija biti stvar prošlosti. Ograničenje će biti naša spoznajna sposobnost, dakako. Drugo je pitanje ne posjedujemo li već takva saznanja u podsvijesti? No informacija u podsvjesti je isto tako i “nedostupna informacija”. Osim ako nismo vješti u npr tumačenju snova...
  • 21. Opažaj - obrazac - informacija Poučavanje o informaciji je stoga poučavanje o mišljenju. Poučavanje o mišljenju ne smije biti poučavanje o klasičnoj logici, jer je logika nešto konkretno i opipljivo, nešto čisto i formalno gotovo poput matematike. Logika je osim toga samo sukladna mitu u paru logos – mithos /2, de Saussure Ferdinand/. U svojoj osnovnoj prirodi logika je alat opažanja, ona ukazuje na ono implicitno, na proturječno. Porota se na sudu bavi istraživanjem iskustva zločina. Činjenice povećavaju opažaj. Logika čini implicitno eksplicitnim. Eksplicitne činjenice povezuju se u obrazac. U poučavanju obično se informacija izvlači iz gotovih obrazaca i “suho” predstavlja. Tada naša pažnja ide brzo prema informaciji. U stvarnom životu doći do informacije je mučan postupak. Skup. O tome ćemo ovdje raspravljati. O gruboj tehnici dobivanja obrazaca. Iz podataka, signala, znakova, zvukova - podsvješću se ne kanimo baviti. Niti snovima.
  • 22. Obrazac - oblik - ideja Obrazac bi mogao biti nešto što se ponavlja, nekakav red, odnos, nešto što mi opažamo i uspoređujemo s nečim nama ranije poznatim Definicija, deBono /3/: Kada se dogodi pokret iz sadašnjeg stanja u neko sljedeće stanje s vjerojatnošću iznad očekivanog tada se stvara obrazac: – ova definicija uključuje aktora obrasca – moguću ideju o akciji koju on izvodi, te – moguću posljedicu te akcije Obrasci mogu biti simultani, sinkronijski ili slijedni, dijakronijski. Njihovo pojavljivanje u jeziku poput nečega što je “postavljeno van volje pohranitelja” nešto što više izražava svojstvo duha nego prirodu stvari /2/. No izgleda da je materijal koji generira obrazac u prednosti pred Gestaltom, oblikom, da je pojava u prednosti pred formom.
  • 23. Obrazac - oblik - ideja /2 De Saussure je izveo dihotomiju jezika (langue) i govora (parole) iz prvobitnog zajedništva u jezičkoj djelatnosti (language). Dakle postoji pojedinčev i skupni (povijesni) vid jezika /2/. Jezik i kodovi u komunikaciji nisu mogući bez sustava stvaranja obrazaca. Riječi su kodovi. One pokreću akcije u memoriji slušatelja. One djeluju kao okidači obrazaca. Riječima se naš razum vodi od stanja do stanja (preko nespoznatljivih međustanja). Po nekim obrascima. Do ideja. Ali i obrnuto: od ideja (iz nadprostora??). Prikazuju se dva modela obrasca informacije: model stolnjaka i model želatine. Zašto su to informacijski modeli?
  • 24. Model stolnjaka Mjesto A pokazuje otisak neke pravilne mrlje Mjesto B pokazuje otisak nepravilnog oblika A C Mjesto C pokazuje još veći nepravilni otisak Jesu li podaci o prošlim događajima zapisani? Jesu li ti podaci lako izmjenjivi? B Jesu li podaci međusobno povezani? Prostorom, vremenom?
  • 25. Model želatine a b Dotok tople tekućine otapa sve više i više želatinu. Otopljena tekućina u području a i b se širi. Kada se područja a i b spoje sve što padne bit će samo zajednički doprinos. Sve što padne izvana neće biti doprinos. Koji najvažniji informatički proces je tu u igri? Selekcija!
  • 26. Ideje i informacija Obrada informacije (gdje je ta informacija koja se izgubila u podacima) - ili zašto je Napoleon izgubio bitku kod Trafalgara ( pa zbog sporijeg punjenja topova!) Informacijsko prokletstvo na kineski način- Dabogda živjeli u zanimljivim vremenima! Ili, ako se bavite tuđom informacijom/idejom tada se ne bavite vlastitom. Slika - sve je započelo izgleda jednostavnim crtežima - iako, prije slika bile su piramide (i samo suglasnici) jedne davne civilizacije.
  • 27. Ideje i informacija /2 Riječ ( u početku su riječi bile svete: izgovaranjem riječi nastajala je pojava) - zato su i Egipćani vjerojatno zazirali od skraćenicama prikazanih riječi npr. koloid = ko(tač)+lo(tos) +id(em), no Midianiti se nisu bojali i … nastali su suglasnici, a u Grčkoj i samoglasnici. Pismo današnje dobi nastalo je u Feniciji i Grčkoj, no za brojeve su se pobrinuli Babilonci i - Arapi; pred 5000 godina su Kinezi davali doktorate iz matematike ...= B ;A = Slijede pravila, strojevi, tehnologija, inteligencija, ideje, ljudski element - tu leži informacija!
  • 28. Osnovna svojstva informacije Spontanost, nepredvidljivost, slojevitost, kružnost, povratnost Informira i biva informirana, protuinformacija - pitanje, prostor ukotvljenosti, opkoljenosti, proširenje informacije, prag Nastaje i nestaje, briše se, prekriva, ponavlja, Serijska, paralelna, paralelna pa serijska Apsolut, osobnost, bolno spoznajna, svjesna, podsvjesna Informacija je komunikacija i njen nedostatak, Vanjska - unutrašnja, povjerljiva, javna, nedostupna, nespoznatljiva, jednostavna, tajanstvena, simbolična, prosvjetljenje, razum, moć Informacija je riječ koja bijaše na početku, izraz više sile, unutrašnji glas...
  • 29. Osnovna svojstva informacije/2 Informacija je činjenica, detalj, laž, promidžba, instinkt, intuicija Informacija je u pozivu, djelovanju, volji Informacija je univerzalna, ćudljiva, (ne)dohvatljiva Provjerava se informacijom, pitamo se što je to, bojimo se moći informacije, krijemo je Pojavljuje se na začudnim mjestima i skrivenim putovima, u postupku koji je entitet i proces istodobno, događanje i prestanak događanja, Informacija je nadzor, vođenje i povratna veza; šum i smetnja su informacija, Nevidljiva je i sveprisutna, ona je sve to rečeno i puno više Nastaje voljom i razumom. To je fundamentalna veličina, ni energija niti materija
  • 30. Nastanak i spremanje informacije Pojam informacije osnova je za mnoge znanosti i tehničke discipline: kibernetiku, automatiku, biologiju, povijest, teologiju, ekonomiju, proizvodne tehnologije, filozofiju Osnovni Shannonov teorem koji pojam informacije uspješno veže uz vjerojatnost pojave pojedinih znakova, riječi komentira Karl Steinbach: “To je kao kada biste smatrali kilogram zlata i kilogram pijeska jednako vrijednim” Norbert Wiener piše: “Informacija je informacija ni materija niti energija” Gittov 1. stav: Fundamentalnu veličinu informaciju ne možemo pripisati materiji. Ovime se “čisti” materijalni procesi isključuju kao izvori informacije.
  • 31. Nastanak i spremanje informacije/2 Stav 2: Informacija nastaje samo putem volje (nakane) I  vd2 Inf. Volja No informacija iz nekog izvora je to bolja što je veća inteligencija i znanje tog izvora, dakle informacija = inteligencija (d) * znanje (d) * volja (v) = v*d2
  • 32. Nastanak i spremanje informacije/3 Povezivanje volje informacije i inteligencije / znanja odražava pojavu na izvoru informacije. Osnova priopćenja informacije je volja pojedinca. Veća volja daje veći učin. Konstanta proporcionalnosti ovisi o umnošku inteligencije i znanja autora informacije. Ovo je intuitivni model, dakako. Informacija služi svrsi vođenja sustava u kojem je stvorena, radom ne slučajem. Dakle informacija je nešto blisko politici, ali i tehnici, medicini, pravu. Stav 3. Pri svim tehničkim i uopće umjetnim sustavima informacija tvori njenu nematerijalnu osnovicu. Informacije se može pohranjivati na materijalnu osnovicu, štoviše, idealno je upravo ono pohranjivanje gdje se modificira određena (prostorna) dimenzija materijalnog medija drugom dimenzijom informacijskog svijeta (vremenom)
  • 33. Razine, oblici i vrste informacije Pet je različitih vidova informacije: statistika, sintaksa, semantika, pragmatika i apobetika. Primjer govorne informacije: abeceda rječnik jezik informacija a, b, c Ivo kôd Ivo gleda gramatika :Ivo gleda smisao akcija?
  • 34. Razine, oblici i vrste informacije/2 Statistički vid određuje kvantitetu, količinu informacijskih znakova, predanu ili primljenu, brzinu protoka znakova, znakovnih grupa, riječi. Gramatička točnost i jasnoća informacije pri tome nije bitna, jer se svaka pogreška u prijenosu jednako tretira. Informacija se obrađuje posredno preko vjerojatnosti pojavljivanja informacijskih znakova. Statistički vid osnovica je mjerenja informacije. Kako se to može obaviti? Pa preko statističke mjere: relativne frekvencije pojavljivanja informacijskih znakova.
  • 35. Razine, oblici i vrste informacije/3 Iza oblikovanja znakova, slova, grafema, fonema u riječi, simbola, stoji sintaksa (syntaxis - poredak, order, Anordnung). Pravila se odnose na znakove pisanih jezika, kodne signale, slikovne znakove, notno pismo, računalne kodove, genetičke kodove, plesne znakove pčela, mirisne znakove kukaca, znakovlje gluhonijemih. Pravila se uče ili nasljeđuju. U sintaksu spadaju pravila pisanja, izbor simbola i njihovih kombinacija, pravila biranja riječi, tvorbe rečenice, načini na koje se rečenica mijenja. Gramatika. Na razini koda se odražava i odlučuje o tome ima li predloženi sustav kreativnu ili samo reproduktivnu značajku. Kreativni kodovi imaju u pravilu sintetička, integrativna, asocijativna a reproduktivni analitička, disocijativna svojstva.
  • 36. Razine oblici i vrste informacije/4 Semantika (semantikos - obilježavajući, sema = znak) je smisao, sadržaj, poruka, iskaz, značenje niza znakova, riječi neke poruke. Stav 4: samo je ono informacija što sadrži (barem) semantiku, značenje. Ovo znači da odašiljatelj (i primatelj) informacije posjeduju određeni duhovni koncept, kojim je moguće prihvatiti značenje informacije. Tek se postojanjem jezika informacija može pohranjivati na materijalnim nositeljima. Informacija je nepromjenjiva bez obzira na vrstu prijenosnog medija ili sustava zapisa. Ova invarijantnost uzrokovana je njezinom nematerijalnom prirodom.
  • 37. Razine, oblici i vrste informacije /5 Razlikujemo: prirodne jezike (preko 5000 jezika) umjetne jezike (esperanto, gluhonijemi, zastavice, prometna pravila), umjetne formalne jezike (programski, matematički, logički, kemijski, notni), posebne jezike tehnike, znakovni jezik nacrta, posebne jezike žive prirode (dupini, glavonošci, pauci, ..)
  • 38. Razine, oblici i vrste informacije/6 Kodiranje značenja u prirodnim i umjetnim jezicima postiže se pojedinim ili složenim djelovanjem sljedećih sredstava: – – – – – – oblikovanjem stilistikom fonetikom intonacijom gestikom semantičkim sredstvima: homonimima, homofonima, metaforama, metonimijama, ironijom, anomalijom,… Pri tome su predajnik i prijemnik ili inteligentno biće ili inteligencijom stvoreni umjetni sustavi.
  • 39. Razine, oblici i vrste informacije/7 Pragmatika (pragmatike - vještina ispravnog rukovanja) Svaki prijenos informacije ima za cilj ili nakanu izazvati na prijemnoj strani odgovarajući učin, događaj. Da bi to postigla predajna strana se služi: molbom, pitanjem, kukanjem, poučavanjem, opominjanjem, pritiskom, naredbom, a sve u cilju rukovanja predajnom stranom. Informacija se stoga može nazvati i strukturom koja na predajnoj strani izaziva određeni učin. Ona je manipulativna. Možemo razlikovati – kruto postupanje, kao kod programiranja strojeva, izgradnje stanice, funkcija disanja, instinktivno rukovanje dresura životinja
  • 40. Razine, oblici i vrste informacije/8 Pragmatika - fleksibilno i kreativno rukovanje informacijom – – – – uvježbano rukovanje ljudima, oblici učtivosti, kretnje obrtnika jednostavno djelovanje ljudi intuitivno nastupanje ljudi inteligentno ponašanje ljudi slobodne volje Sva navedena ponašanja rezultat su upravo primljene informacije, dakle komuniciranja, ali i onog naučenog, iskustvenog.
  • 41. Razine, oblici i vrste informacije/9 Apobetika (apobeinon - događaj, uspjeh, rezultat) razmatra svrhovitost, cilj odašiljanja informacije. Primjeri su kod životinja osiguranje životnog prostora, kod ljudi su potreba komunikacije i dogovora o zajedničkom cilju, životu. Uvijek se u slučaju naglašavanja ili potiskivanja cilja treba biti oprezan, jer se radi o najvišem vidu prijenosa informacije, pa i šteta za primatelja može biti najveća.
  • 42. Razine, oblici i vrste informacije/10 Dakle izvoru informacije treba posvetiti dužnu pozornost! Kod informacije nekog izvora specifičan je! Izbjegavanje dohvata informacije je opasno, jer smo bez informacije neupućeni. Dohvaćanje informacije je opasno, jer nas dobivanje informacije kada je nismo spremni primiti može “satrti” - stoga u pravilu vrijedi: Kada je čovjek spreman da je primi - informacija dolazi. Skrivanje od informacije je također opasno! No suprotstavljeni koncepti se utjelovljuju i sukobljavaju opet u živom dijalogu! U dijalogu autora (duha) i junaka (duše). Život je konflikt. Konflikt je prirodan.
  • 43. Kvalitete izvora informacije Kvaliteta izvora Kval. semantike i Kvaliteta pragmatike događaja Zamisao rješenja, Cilj Inteligencija Genijalnost funkcije Optimalnost, strategija Vrijeme provedbe Stanje znanja Tehnologija Funkcija Domišljatost Programiranje Scenarij Bogatstvo ideja Minijaturizacija Nakana Smisao
  • 44. Razine, oblici i vrste informacije/11 Vrste informacije: Proizvodna, pogonska, komunikacijska Podrijetlo informacije: – kopirana informacija (CD, DNK, fotokopija, reprodukcija slike), u pravilu se svakim kopiranjem nešto gubi; zašto? – reproduktivna informacija (interpretacija teksta, glazbe, dijela softvera), u pravilu se svakom reprodukcijom nešto dobiva; zašto? – kreativna informacija: voljom, sposobnošću i talentom pojedinca nastaje nova vrijednost poput jezika, teksta, koda, sustava, glazbe, slike, patenta, postupka, saznanja.
  • 45. Razine, oblici i vrste informacije/12 Poseban oblik informacije je hologram. Izgleda da je DNK jedan vid holograma. Osnovno svojstvo holograma je zapisivanje informacije u nižoj dimenziji prostora. Tako se 1D hologram može rabiti za zapis 2D podatka, 2D za zapis 3D itd. Drugo je svojstvo integrativnost: iako se dio holograma može izgubiti sadržaj ostaje. Treće svojstvo je linearnost: hologram čuva spremljeno vjerno reproducirajući osnovni oblik. Može se očekivati veća uporaba ovog vida pohrane i aktiviranja informacije. Aktiviranjem holograma događa se i mogućnost promjene sadržaja (relaksacije) u smislu smanjenja hologramskog “šuma”. Na taj način se, uz ostalo brane i naše stanice od smetnji izazvanih izgaranjem ATP-a, toksikacijom ili napadom virusa.
  • 46. Razine, oblici i vrste informacije/13 Primjer relaksacije holograma: nerelaksirani hologram s greškom relaksacija relaksirani oporavljeni hologram
  • 47. Kvaliteta i korisnost informacije Informacija može biti upotrebljiva ili neupotrebljiva što ovisi o okolnostima. No bez obzira na to ona može biti po svojoj mjeri samo kvalitativnog a nikako kvantitativnog značenja. Po svojoj semantičkoj vrijednosti i korisnosti razlikujemo pet stupnjeva vrednovanja: izuzetno važnu, važnu, korisnu, beskorisnu i štetnu informaciju. Ova procjena je često stvar pojedinca, iako postoje posve jasni etički obrasci koji su podloga procjeni. Postoji savjest.
  • 48. Kvaliteta i korisnost informacije/2 Izuzetno važna informacija: visoki sadržaj apobetike Važna informacija: značajna za postizanje cilja Korisna informacija: općeg značenja, u smislu kontakta, izobrazbe, zabave, dnevnih događaja Beskorisna informacija: općeniti podaci, banalnosti, besmislene novosti, gubitak vremena Štetna informacija: inf. s negativnim posljedicama , vodi k zabludama, štetnim događajima, defektima a postiže se svjesnim ili u zabludi datim iskazima, lažima, podmetanjima, šarlatanstvom, ljutnjom, sektašenjem, ideologizacijom, šundom.
  • 49. Važnost i korisnost informacije Korisnost je objektivna komponenta informacije – vrijedi za većinu ljudi – nije upotrebljiva ako ne postoji ili nije ostvariva – često neotkrivene činjenice – neobjavljena inf. – zaboravljena inf. – beskorisnost je vezana i za nemogućnost djelovanja Važnost je pojedinčeva komponenta informacije – važnost za pojedinca nije isto što i za neku drugu osobu – općenita važnost inf. je samo relativno važna pojedincu – velika većina inf. je pojedincu irelevantna – velika je važnost pojedincu svaka njemu štetna informacija
  • 50. Vrednovanje semantičkog sadržaja informacije Veličine koje obuhvaćaju semantičku kvalitetu informacije u cilju njene možebitne kvantifikacije ili barem relativne usporedbe su semantička kvaliteta q relevantnost r novost (aktualnost) a dostupnost z postojanje e To su semantičke veličine osobnog značaja informacije, korisničke Kreću se dogovorno u rasponu od 0 do 1 osim q koji se prema ranije navedenom kreće u rasponu q = (1,-1)
  • 51. Vrednovanje semantičkog sadržaja informacije semantička kvaliteta Mjera semantičke kvalitete obuhvaća težinu značenja. Posebno se odnosi na tzv proizvodnu upotrebljivost informacije, poput učinkovitosti primijenjenog algoritma u računalu, smanjenjenju memorijskog prostora i vremena obrade, prenosivost programa, pouzdanost programa, primijenjenom programskom jeziku i sl. Koliko pojedini elementi ovog vida informacije utječu na samu kvalitetu informacije ovisi i o subjektivnim procjenama, ali i o objektivno zatečenom stanju. Informacija bez kvalitete, prazna informacija ima q = 0, najkvalitetnija informacija ima q = 1, a najštetnija informacija ima q = -1
  • 52. Semantička relevantnost i važnost Kod informacije posebno se naglašava osobni interes koji donesena informacija daje korisniku, njegovom ostvarenju cilja, osobnom cilju Ono što osobi A može biti izuzetno važno, dakle rA = 1, može osobi B biti potpuno nevažno, dakle može imati rB = 0 Stoga je procjena iznosa parametra relevantnosti od strane neinformiranih promatrača za nepoznate osobe težak zadatak. Tako je npr prognoza vremena za zapadnu Australiju prosječnom hrvatskom gledatelju televizije potpuno irelevantna. Naprotiv, ako netko odavde putuje rođacima u zapadnu Australiju rado će pogledati na TV prognozu vremena i uopće se upoznati s tamošnjim vremenskim prilikama. Za tehnološke procese je relevantnost nebitna, jer nemaju osobni značaj - ili ne bi trebali biti tako projektirani.
  • 53. Aktualnost U mnogim je područjima života potrebno relevantnu i važnu informaciju dostaviti pravodobno. Podatak o zastarjeloj informaciji, “lanjskom snijegu”, ima iznos a=0 Visokoaktualna informacija ima a = 1. Za tehnološke procese je aktualnost nedvojbena i trajno konstantna veličina s a = 1, pa se niti ne procjenjuje posebno. Opadanje iznosa aktualnosti zavisi o vremenskim konstantama pojava na koje se odnose - već i mali prekid govora ili glazbe je štetan Tako su geološki podaci iako izuzetno stari još uvijek aktualni Istraživanjem nekih starih događaja se parametar aktualnosti mijenja Osobito kada se pravilnosti pojavljivanja mogu protegnuti na današnje događaje - dakle nešto davno može postati vrlo aktualno.
  • 54. Dostupnost Ni najvažnija informacija ako nije dostupna nema vrijednosti, dakle za nju je z = 0. Informacija koja je potpuno dostupna ima iznos z = 1. Baze podataka, biblioteke, informacijski centri, računarske mreže, internet povećavaju dostupnost informaciji. Nedostupnost se povećava zaštitnim kodom, klauzuriranosti informacije u pravu, medicini, filozofiji te namjerne klauzuriranosti kod nedostupnih, tajnih ili štićenih podataka poput industrijske svojine ili poslovnih tajni. Nedostupnost može biti i mjera manipulacije. Industrijski podaci moraju biti dostupni operatorima, tehnolozima ili voditeljima smjeni, iako selektivno. Smatra se da je dostupnost u proizvodnim procesima jednaka jedinici.
  • 55. Postojanje Postojanje informacije je pitanje da li informacija uopće postoji na svojem izvoru (ili materijalnoj kopiji). Potpuna upitnost postojanja izražava se iznosom parametra e = 0. Potpuna poznatost, osvjedočenost postojanja izražava se iznosom parametra e = 1. Tako je pitanje postojanje terapije raka želudca između 0 i 1, a isto to kod raka jetre jednako je ništici. Procesni i tehnološki podaci smatraju se da redovito postoje, iako često preko posrednog mjerenja. U teoriji sustava smatra se da neki podaci postoje iako nisu izmjerivi. Do takvih se podataka ne može dostupiti. U principu možemo reći da svi podaci na neki način postoje (Bayes).
  • 56. Mjera semantičkog sadržaja primjer Postojanje Dostupnost Aktualnost Relevantnost PROCES INTERNET VISOKA ŠKOLA Kvaliteta 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
  • 57. Mjera informatičkog sadržaja Pretvorbom tabličnog u pentagramski oblik dobiva se za površinu izraz A = F sin720 (ra+az+ze+eq+qr) / 2 (1) Nadopuna 1: faktor potpunosti F koji je jednak ništici kada su q, ili r ili a ili z ili e jednaki ništici a inače je F jednak jedinici. Dakle, ne smatra se informatičkim sadržajem kada ne postoji neki od parametara. Nadopuna 2: na iznos parametra q koji može biti između -1 i 1 Normalizacija na iznos semantičke mjere jednake maksimalno 100 ili -100 dobiva se relacijom S = 20 ( ra +az +ze + e|q| + |q|r) F sign q (2) Izrazite mjeru informatičkog sadržaja iz prethodnog primjera!
  • 59. Zalihost Zalihost ili redundancija jest postojanje nekog detalja, koda, poruke, signala kanala ili sustava više nego što je najnužnije potrebno za predstavljanje ili prijenos tražene informacije. Prijenosom redundantnog signala na primjer, dolazi do neučinkovite uporabe kanala, jer ne prenosi informaciju na svojoj najvećoj brzini Prikažemo li npr. signal DA i signal NE sljedećom shemom – – – – – – DA : ++--NE : +-+-+ dobivamo dosta zališnu shemu jer bi zadovoljilo i DA : + NE : Dakle imali bismo pet puta brži prijenos ili manji prostor skladištenja podatka
  • 60. Prednost zalihosti U slučaju smetnji ili šuma postoji bolja mogućnost ispravne interpretacije t *Kontrolirana ekspanzija informacije daje potpuniji opis procesa na izvoru informacije
  • 61. Zalihost u tehničkoj praksi Zalihost ponavljanjem u vremenu – ponavljanje poruke u vremenu u slučaju otkrivanja pogreške – periodičkim slanjem poruke Zalihost ponavljanjem u prostoru – slanjem poruke u više kanala – bilježenjem podatka na više mjesta Zalihost ponavljanjem u frekvenciji – slanjem poruka na više frekvencijskih područja Zalihost u funkciji - ponavljanjem uređaja, ili kritičnih dijelova uređaja - ponavljanjem softvera ili više načina uporabe softvera
  • 62. Uzorkovanje redundantnog signala Dobivaju se manje redundantni podaci Uzorkovanje frekvencijom višom od Nyquistove Primjer: – – – – a) originalni podaci(V): 2,56 2,05 2,98 8,01 4,87 b) zaokružene vrijednosti(V): 3, 2, 3, 8, 5 c) kodirani iznosi: --++, --+-, --++, +---, -+-+ d) niz impulsa u prijenosu / zapisu : --++--+---+++----+-+ Navedite razliku broj bitova nizova a) i d) !
  • 63. Diskretni informacijski izvor Izvor koji proizvodi konačan broj poruka naziva se diskretnim izvorom informacije Poruka može biti za početak znak poput slova, ili riječ kao smislena kombinacija znakova Kontinuirani izvor poput temperaturnog detektora ili mikrofona proizvodi neizmjerno različiti skup znakova. No većina od tih znakova beznačajna je za korisnika voditelja procesa ili slušatelja glazbe Pretpostavimo za početak da su uzastopne poruke diskretnog informacijskog izvora međusobno neovisni događaji Iznos informacije za svaki znak- poruku jednaka je – I = log (aposteriorna vjerojatnost/ apriorna vjerojatnost) (3) – vjerojatnosti se odnose na pojavljivanje datog znaka - poruke
  • 64. Ukupna informacija diskretnog izvora Kada nema šuma brojnik je u izrazu (3) jednak jedinici tj sigurno smo primili poslani znak, pa ostaje samo apriorna vjerojatnost pojave nekog znaka Stoga možemo izraziti ukupnu informaciju koju očekujemo od niza duljine n od k različitih znakova s poznatim apriornim vjerojatnostima pojave i-tog znaka P(i) kao Ukupna informacija = - n Σ P(i) log P(i) (4) gdje suma ide po svim k različitih znakova Prosječna informacija po znaku jednaka je entropiji tj H = -Σ P(i)log P(i) 1 < i < k (5) Entropija diskretnog izvora uvijek je manja od navedenog izraza. Zašto?
  • 65. Entropija složenog događaja Vjerojatnost pojave dvaju uzastopnih znakova i j H(ij) = - ΣΣ P(ij) log P(ij) 1<i,j<n (6) Opći iznos entropije nekog znaka kada je poznat njegov prethodnik jednak je H(j/i)= - ΣΣ P(ij) log P(j/i) (7). Vrijedi također H(ij) = H(i) + H(j/i)  H(i) + H(j) (8) Gornji se izrazi odnose i na izvore koji emitiraju znakove potpuno nezavisno. Razmotrimo slučaj gdje dva izvora označeni s i j istodobno proizvode znakove: izvor i proizvodi znakove A,B,C a izvor j proizvodi D,E,F, G – data je tablica vjerojatnost P(i) te uvjetne vjerojatnosti P(j/i)
  • 66. Tablica uvjetnih vjerojatnosti složenog događaja A C 1/2 P(i) B 1/3 1/6 P(j/i) D 1/4 3/10 1/6 P(j/i) E 1/4 1/5 ½ P(j/i) F 1/4 1/5 1/6 P(j/i) G 1/4 3/10 1/6
  • 67. Tablica vjerojatnosti složenog događaja - A B C D 1/8 1/10 1/36 E 1/8 1/15 1/12 F 1/8 1/15 1/36 G 1/8 1/10 1/36
  • 68. Entropija složenog događaja Iz (6) slijedi H(ij) = 3,416 bit/znak Iz (5) slijedi H(i) = 1,461 bit /znak Iz (7) i prethodnih tablica slijedi H(j/i) = 1,956 bit/znak Dakle vidimo da vrijedi relacija (8). Ako bismo računali entropiju izvora j (ovo nije jednostavno jer nemamo nigdje eksplicite dato pa računamo preko uvjetnih vjerojatnosti P(D) = P(A)*P(D/A) + P(B) * P(D/B)+ …,) dobili bismo H(j) = 1,977 bit /znak što bi dalo maksimum entropije H(ij)max = 3,458 bit/znak Pitanje: Jesu li to jako povezani izvori? Koliko?
  • 69. Entropija diskretiziranog kontinuiranog izvora Neka su vjerojatnosti diskretiziranog izvora informacije date tablicom i= 0 1 2 j=0 9/11 1/8 0 j=1 2/11 3/4 2/9 j=2 0 1/8 7/8 Vjerojatnosti p(0)=11/36, p(1)=4/9 , p(2)=1/4 računaju se iz površina ispod funkcije gustoće vjerojatnosti. Odatle je H(i) = 1,542 bit/impuls Računanje P(ij) = P(i)*P(j/i) daje P(00)=1/4, P(01)=1/18, P(02)=0, P(10) = 1/18, P(11) = 1/3, P(12)=1/18, P(20)=0, P(21)=1/18 P(22)=7/36. Odatle je H(j/i)=0,890 bit/znak, te je razlika 0,652 bit/znaku zbog međuznačnog utjecaja.
  • 70. Entropija kontinuiranog izvora Kontinuirani izvor ima kontinuiranu funkciju gustoće vjerojatnosti p(v) Ako uzmemo po analogiji s diskretnim izvodom diferencijal vjerojatnosti dv dobivamo za entropiju izraz - Σ p(vj) dv log (p(vj) dv) = =lim dv-0 -( Σ p(vj)(log p(vj)) dv + lim dv-0 -Σ p(vj) (logdv)dv = = - Ϊ p(v)log p(v) dv - lim dv-0 Σ p(vj)(log dv) dv (9) Kako dv0 drugi izraz teži u beskonačno jer log dv teži u minus beskonačno. Ako izostavimo ovaj član ono što možemo izračunati prvim članom je samo relativni iznos entropije. Računanje entropije za svaki konkretni slučaj mora uzeti u obzir i drugi član u izrazu (9). Npr ako pojačamo signal faktorom dva onda i dv biva dva puta veći pa je log1/dv= log2 + log 1/2dv odnosno za jedan bit manji!
  • 71. Rasprava o entropiji kontinuiranog signala Signali su ograničeni frekvencijskim pojasom. Kada se njihova funkcija distribucije postavi kao uniformna onda se postiže maksimum entropije signala. Kada signal ima maksimum entropije onda je maksimalan prijenos bitova po znaku! Druga je stvar kako se ponaša omjer signal/šum. Tu trebna očito težiti manjim pojačanjima šuma kada je signal manji. Inače se dobiva manji omjer signal /šum. Za signale Gaussovskog tipa ograničene snagom N je H = c * log N (10)
  • 72. Teleonomska entropija Ciljna ili teleonomska entropija razmatra entropiju pojedinačnih objekata u nekoj ciljnoj strukturi. Npr. raspored stolaca u učionici. Mjera podjele prostora u tom slučaju određuje prostorne segmente tzv Voronojeve dijagrame koje “zauzima” pojedini predmet. Odnos veličina tih prostora i njihova razdioba prema traženoj ciljnoj raspodjeli određuju trenutno stanje ciljne entropije. Teleonomsku entropiju je prvi izrazio filozof Rudolf Carnap (1956). Ona obuhvaća izračun prostora stanja informacije prema prostoru željenog stanja informacije.
  • 73. 3. Informacija i informacijska mreža
  • 74. Proces, mreža i obrada podataka Obrada podataka i proizvodni proces / usluga povezuju različite vrste komunikacija. U procesu se spontanim odvijanjem procesnih događaja povećava entropija. Svrhovitom obradom tih podataka i djelovanjem na proces postiže se ponovno smanjenje entropije u sustavu. To su povoljni, korisni informatički procesi. Postoje i nepovoljni procesi kod kojih se na pojavu smanjenja entropije djeluje suprotno tome, izaziva nered i šteta. Opća shema: – proces mreža obrada podataka
  • 75. Entropija u sustavu s obradom i komunikacijom Entropija se u sustavima održava na razini prirodne entropije tj raste bez djelovanja u suprotnom smjeru Entropija u sustavu s obradom podataka, informacijskom vezom te efektorima u procesu se općenito smanjuje i održava na razini ravnoteže procesne degradacije i informacijske akcije U prijelaznim režimima kada se tek uspostavlja informacijska obrada sustav teži iz stanja veće u stanje manje entropije. Sustav s obradom informacije i efektorima u procesu kada djeluje pod štetnim utjecajima povećava svoju entropiju do razine djelovanja tih sila Sustavi su redovito u ravnoteži prirodne entropije, sila za smanjenje i sila za povećanje entropije.
  • 76. Informacija i entropija u sustavu Slučaj 1. Korisna informacija je veća od entropije - ukupna entropija u sutavu pada Slučaj 2. Korisna informacija je jednaka entropiji u sustavu entropija sustava je u ravnoteži Slučaj 3. Korisna informacija je manja od entropije u sustavu entropija sustava raste Korisna informacija uključuje lanac: izvor informacije - prijenos i obrada podataka - odluka i djelovanje u povratu na proces / izvor Informacijski kanal je usmjerena veličina s najmanje jednim izvorom i najmanje jednim odredištem; sadržava izvor, koder informacije, koder kanala, prijenosni sustav, dekoder kanala, dekoder informacije i odredište - prijamnik.
  • 77. Informacijski kanal Informacijski kanal ima semantičku bazu koja je zajednička za izvor i korisnika, odredište Pragmatika i apobetika se pri tome mogu značajno razlikovati U tehničkom i informacijskom smislu razlikujemo kanale sa ili bez memorije, dakle kod kojih se prijenos informacije u nekom trenutku ne uvjetuje prethodnim prijenosom (znakom) Isto tako lučimo stacionarne i nestacionarne kanale, dakle kanale kojima se svojstva mijenjaju odnosno ne mijenjaju s vremenom Fizička i tehnička podrška informacijskom kanalu je vrlo različite prirode poput telefonske veze, telegrafa, satelitskih, radijskih komunikacija, do, po vlasničkom principu i izgradnji, različitih namjenskih ili vlasničkih mreža
  • 78. Osnovni parametri informacijskog kanala Kanali se razlikuju po kašnjanju u prijenosu, propusnoj moći, cijeni, pouzdanosti, kvaliteti usluge. Komunikacijska mreža čini barem 40% ukupne cijene nekog tehnološkog projekta - ako se gradi iznutra Kašnjenje u sustavu zbog obrade dato je srednjim vremenom Tw – Tw = Tx - u (11) – gdje su Tx srednje vrijeme odziva kanala / sustava a u je vrijeme obrade u čvorovima sustava
  • 79. 4. Bayesov teorem i Bayesov stavak Ako postoji događaj A, P(A)>0, pokušajmo odrediti kolika je vjerojatnost da neki drugi događaj B poprimi svojstvo događaja A. Dakle P(B/A) = P (AB) / P(A) (12) –B AB A
  • 80. Složeni događaj Ako je B neki događaj koji se prostire preko više područja A onda vrijedi P(BA1)+P(BA2)+… +P(BAn) = P(B) (13) Odnosno P(B)= P(B/A1)P(A1)+P(B/A2)P(A2)+…+P(B/An)P(An) (14). Obrnuto da događaj A poprimi vrijednost događaja B je P(A/B)=P(AB)/P(B) (15). Kako je P(AB) = P(BA) to vrijedi P(A/B)=P(B/A) P(A) / P(B) (16) Poopćenje za Ai ti događaj daje P(Ai/B)=P(B/Ai)P(Ai) / ( P(B/A1+…+P(B/An)P(An)) (17) što se zove Bayesov teorem koji povezuje apriornu i aposteriornu vjerojatnost tj vjerojatnosti prije i nakon pojave događaja Ai.
  • 81. Bayesov teorem - primjer Izvor informacije šalje s jednakom vjerojatnosti p=0,5 jedan od dva znaka 0 ili 1. Znamo s vjerojatnosti 0,001 da je moguće bilokoji od ova dva znaka krivo interpretirati. Dobili smo 1. Koliko je sigurno jedinica i poslana? P(A1/B)= 0,999 0,5 /(0,999 0,5 + 0,001 0,5) = 0,499/0,5 = 0,999 Dakle zbog jednake vjerojatnosti odašiljanja aposteriorna vjerojatnost jednaka je apriornoj. Što bi bilo da je p0=0,2? Bayesov stavak : Makako malo vjerojatan događaj ipak ima određenu iako vrlo vrlo malu vjerojatnost pojave.
  • 82. 5.Binarni simetrični kanal Kanal: bez memorije, dio je informacijskog sustava i stacionaran je. Na ulazu je skupina znakova A (a1,a2,a3,…aq) a na izlazu skupina znakova B (b1,b2,b3,…,bs). Ulazna abeceda je veća zbog mogućnosti ispravljanja greški redundancijom u kodu. Kanal opisuje skup uvjetnih vjerojatnosti P(bj/ai) =Pij tj vjerojatnosti da neki ulazni znak ai bude interpretiran kao izlazni znak bj. Dakle imamo shemu: p(a1)P11+p(a2)P21+ …+ p(aq)Pq1= p(b1) …. p(a1)P1s+p(a2)P2s+…+ p(aq)Pqs=p(bs) Ako kanal nema smetnji onda je za svaki i jedan Pij=1 a svi ostali jednaki su ništici. Tada je p(bj)=p(ai).
  • 83. Binarni simetrični kanal sa šumom/2 Rabimo sada Bayesovu formulu tj P(ai/bj)=P(bj/ai)p(ai) / Σ P(bj/ai)p(ai)=P(bj/ai)p(ai)/p(bj) (16) Svaki ulazni znak izaziva pojavu nekog izlaznog znaka. Problem je što mi ulaz ne poznajemo! Binarni simetrični kanal: p(a1=0)=p, p(a2=1)=1-p a1=0, a2 =1 P00=P11=P b1=0, b2=1 P10=P01=Q Što je Q? Kako ga možemo mjeriti?
  • 84. Binarni simetrični kanal/3 Uz uvjet da znamo koji je znak primljen treba odrediti vjerojatnost odašiljanja različitih znakova tj P(a=0,b=0)= Pp/ (Pp+Q(1-p)) P(a=1,b=0)=Q(1-p) / (Pp+Q(1-p)) P(a=0,b=1)=Qp/(Qp+P(1-p)) P(a=1,b=1)=P(1-p)/(Qp+P(1-p)) (17) Za P=0,9 Q=0,1 p(0)=19/20 p(1)=1/20 dobivamo iz (17) P(a=0,b=0)=171/172, P(a=1,b=0)=1/172, P(a=0,b=1)=19/28 te P(a=1,b=1)=9/28. Proizlazi da se, za navedeni primjer, bez obzira na to koji je znak poslan mora pretpostaviti da je poslana ništica! Isto je tako veći utjecaj izbora znakova na kanalu od šuma na kanalu.
  • 85. Entropije diskretnog kanala sa šumom Zamisao entropije može se primijeniti na ulazni i izlazni niz znakova, H(A)= Σp(ai)logp(ai), H(B)=Σp(bj)logp(bj) (18) Za uvjetne entropije H(A/B) iz H(A/bj)= Σ P(ai/bj) logP(ai/bj) H(A/B)= Σ p(bj) H(A/bj)=ΣΣ P(ai,bj)logP(ai/bj) H(A,B)=ΣΣ P(ai,bj) log P(ai,bj) … slikom H(A) H(A/B) I(A,B) H(B) H(B/A) H(A,B)
  • 86. Entropije diskretnog kanala sa šumom/5 Vrijedi: H(A/B)≤ H(A), H(B/A)≤H(B) H(A,B)=H(A)+H(B/A)=H(B)+H(A/B) H(A)+H(B) = H(A,B) za nezavisne A i B Transinformacija I(A,B)= H(A)+H(B) - H(A,B) (19). I(A,B)=H(B)- W W=ΣB P(b/a) log(1/ P(b/a))=Plog(1/P)+Qlog(1/Q)=H(P) (19a) I(A,B)=H(B)-H(P), uz p(b=0)=pP+(1-p)Q=x te p(b=1)=1-x slijedi I(A,B)=H(x)-H(P) Kapacitet C=maxAI(A,B)=1-H(P) (19b), jer je max(H(x)) jednako 1 za x=1/2
  • 87. 6. Markovljev izvor, kodiranje na izvoru, procesni izvori Izvori podataka često traže prilagodbu zbog svojeg optimalnog kodiranja. To se naziva kodiranje na izvoru. Uobičajena pretpostavka da su vjerojatnosti pojavljivanja znakova međusobno neovisne je dosta gruba i netočna. Uključuje zapravo gubitak memorije između pojava pojedinih znakova Uključenje memorije svojstvo je izvora Markovljevog tipa. Dakle vjerojatnost emitiranje nekog znaka ovisi o prethodnim znakovima, tj P(ai u intervalu t/ aj u intervalu t+1) = P(an u intervalu t-n,…, ai u intervalu t/ aj u intervalu t+1) (20). Markovljev proces je određen kada se zna početna raspodjela vjerojatnosti pojave znakova pj i matrica prijelaza izmedju svakog od znakova. Element matrice pij označava vjerojatnost da se iza znaka ai šalje znak aj.
  • 88. Markovljev izvor /2 Da bi izvor podataka Markovljevog tipa bio stacionaran mora biti ispunjeno pj = Σ pi *pij j=1,2,…a (21), odnosno u matričnom obliku ΠT pij = pij (22), gdje je T oznaka za transponiranu matricu. Markovljev izvor je izvor prvog reda kada ima memoriju prvog reda. Možete li procijeniti kolikog je reda cijena automobila kao Markovljev izvor? Što moramo uzeti u obzir? A kojeg je reda automobilska nezgoda? Markovljev izvor podataka može biti ergodičan ili neergodičan. Ergodičan je kada se izvor iz svakog stanja može u konačnom vremenu vratiti u svako stanje.
  • 89. Neergodičan Markovljev izvor Na slici je prikazan neergodičan Markovljev izvor: d b a Izvor se nikada ne vraća u početno stanje a! c e
  • 90. Kodiranje podataka Markovljeva izvora Pretpostavimo da prijelazna matrica Markovljeva izvora ima izgled: a b c – – – – – – – – – a 1/3 1/3 1/3 b 1/4 1/2 1/4 c 1/4 1/4 1/2 Višestrukim množenjem matrice samom sa sobom što je ispunjeno za homogenu nedjeljivu matricu dobivaju se tzv ravnotežne vjerojatnosti pojavljivanja znakova a,b,c kao pa=3/11, pb = 4/11 pc = 4/11. Kodiranjem matrice prijelaza Huffmanovim kodom za a=1, b=00 i c=01 slijedi: La = 1*1/3 + 2*1/3 +2*1/3 = 1,667 bita, Lb= 2*1/4+1*1/2+2*1/4= 1,5 bita i Lc= 1,5 bita U ravnoteži dobivamo prosječnu duljinu koda Lm=3/11La+4/11Lb+4/11Lc= 17/11 bita Kodiranjem prema frekvencijama pojavljivanja dobivamo L=2*3/11+2*4/11+1*4/11=18/11> Lm !
  • 91. Procesni izvori podataka Vrsta entropije Primjer varijable Skup znakova Brzina snimanja Razdioba podatka Entropija Tok podataka Vremenska Temperatur ni pretv. mA Tlak u cijevi 0-1 bar Onečišćenj e tla, 0-10 ppm Vrem. Raspored rada kem. reaktora Svakih 0,1mA 10 znak/s Jednolika 763 bit/znak 76,3 bit/znak Svaki 0,1 bar 1 znak/m Drugi korijen 3,25 bit/znak 3,25 bit/m Svaki ppm 1 znak/km2 Eksponenci 1,5 bit/znak 1,5 bit jalna /km2 Uk / isk 1 znak/dan Prostorna 2D prostorna Entropija uporabe Puk=0,7 Pisk=0,3 O,899 bit/znak 0,899 bit/dan
  • 92. Optimiranje procesnih izvora podataka Osnovno je što više reducirati nepotrebne obrade podataka. U tu svrhu najjednostavnije je izostaviti redundantne podatke. Smanjuje se razlučivanje osjetila ili povećava vremenski i prostorni korak snimanja. Ograničenje za brzo promjenjive procese je zahtjev Nyquistova teorema uzorkovanja ( uzimanje najmanje dva uzorka od najbrže promjene - kako se to nosi sa šumom?) Drugi je način ne uzimati u prvoj fronti one podatke za koje postoje izravna stohastička zamjena, sličnost. Ovo se naziva ortogonalizacija izvora podataka. Poseban je problem vjerodostojnost podatka pojedinog izvora. To se rješava poznavanjem povezanosti ponašanja tog izvora s ostalim izvorima podataka u procesu. Stoga je određena redundantnost snimanja nužna.
  • 93. 7. Shannonov teorem za binarni simetrični kanal
  • 94. Sheme odlučivanja Na prijamnoj strani odlučujemo, nakon dobivanja znaka bj, koji je znak ai poslan. Ovo ovisi o p(bj/ai) te o vjerojatnosti p(ai). Na primjer – b1 b2 b3 a1 0,5 0,3 0,2 a2 0,2 0,3 0,5 a3 0,3 0,3 0,4 Ovdje postoje tri pravila odlučivanja Pravilo 1: o(b1)=a1 o(b2)=a1 o(b3)=a2 Pravilo 2: o(b1)=a1 o(b2)=a2 o(b3)=a2 Pravilo 3: o(b1)=a1 o(b2)=a3 o(b3)=a2 Argumenti postoje u prilog svake pojedine odluke. Promatra se jedan znak u vremenskom nizu, a ne cijeli nizovi znakova.
  • 95. Sheme odlučivanja /2 U općem slučaju postoji qs shema odlučivanja, q je broj ulaznih a s broj izlaznih znakova. Stoga se uvodi pojam pravila najveće vjerojatnosti odnosno uzimaju se najvjerojatniji znakovi. Ako to primijenimo dobivamo za gornji slučaj i b1 : o(b1)=a1. Ako je dobiven b2 možemo uzeti jednu od odluka o(b2)= a1, o(b2)=a2 ili o(b2)=a3. Kada na prijamniku dobijemo b3 onda istim načinom odlučujemo za o(b3)=a3. Općenito je vjerojatnot pogreške odlučivanja pri dobivanju znaka bj jednaka P(E/bj)= 1- P (o(bj)/bj) (23)
  • 96. Prosječna pogreška odlučivanja Općenito je vjerojatnost pogreške pri prijamu znaka bj jednaka P(E/bj) = 1 - P( o(bj)/ bj) (24). Prosječna pogreška jednaka je uz p(a)=1/q Pe=Σ P(E/bj) p(bj)= 1 - 1/q * Σ P(bj/a ispr) (25), gdje je P(bj/ a ispr) vjerojatnost da je znak aispr bio uzrok dobivanja bj na prijamniku. Tada iz našeg primjera imamo Pe = 1 - 1/3 * (0,5 + 0,3 + 0,5) = 1 - 1/3 * 1,3 = 0,56667. Vidimo da je iznos prosječne pogreške znatan. Tim prije se vidi potreba uvođenja kodova koji povećanjem zalihosti smanjuju očekivanu pogrešku kod prijama.
  • 97. Pogreška na binarnom simetričnom kanalu Binarni simetrični kanal može prenositi informaciju sa smanjenom pogreškom ako se uvede zalihost. Pretpostavimo dakle da prenosimo 0 kodom (000) a 1 kodom (111). Tada su preostale kombinacije kodova neiskorištene. Pretpostavimo da je vjerojatnoast točnog prijenosa P a netočnog Q, Q<0,5. Za Q=P=0,5 imamo samo šum na kanalu i kapacitet C=0. Sada je vjerojatnost prijenosa bez greške jednaka P3, jedne pogreške je 3P2Q (ispravljivo!), dvije pogreške je 3PQ2 te tri pogreške Q3. Odatle je – – – – Pe ≈ Q2 (Q + 3P). Za P=0,99 dobivamo Pe ≈ 3*10 -4 vidimo da je minimalni Hammingov razmak detektor s najvećom razlučivošću.
  • 98. Shannonov teorem Teorem : Neka je dan binarni simetrični diskretni kanal bez memorije kapaciteta C>0. Tada postoji blok kod (n,k) i shema odlučivanja g tako da vrijedi da se prosječna pogreška može načinit po volji malena izborom dovoljno velikog n koji je po volji blizu granice kapaciteta kanala. Dokaz: Za kanal kojim prenosimo jedan od M jednako vjerojatnih znakova, tj p=1/M, informacija po prenešenom znaku ai je I(ai)= ln (1/p)=ln M (26). No, znamo da je kapacitet bin.sim.kan. jednaka (19c) C=1-H(P)=1-H(Q) po binarnom znaku, pa će za n znakova biti na granici kapaciteta tj I(ai)= n(C-ε1), gdje je epsilon neki mali pozitivni broj. Odatle je M= 2 exp n(C-ε1)= 2exp nC / 2 exp nε1 (27) (27). Povećanjem n uzimamo mali dio znakova koji prolaze kanalom blizu njegovog kapaciteta. Jesu li ti znakovi dovoljno različiti?
  • 99. Shannonov teorem /2 Slaganje n-bitnog Hammingova koda za prijenos informacije daje vjerojatnost greške po prenešenom bitu od Q=1-P, a očekujemo nQ pogrešaka. Dakle nalazimo se negdje oko sfere radiusa nQ oko znaka ai: nQ nε2 bj ai Radius r je broj, ε2 je malen tako da u zbroju s Q ne prelazi 1/2
  • 100. Shannonov teorem /3 Kod prijama se slika invertira: nQ bj ai nε2 Sada tražimo formulu za pogrešku zbog nemogućnosti ispravnog dekodiranja primljene poruke.
  • 101. Shannonov teorem /4 Slučaji Ispravan ai u S(r) Drugi ai u sferi S(r) Greška 1 da da da 2 da ne ne 3 ne da da 4 ne ne da
  • 102. Shannonov teorem /5 Vjerojatnost pogreške prijama je PE=P{ai ∉S(r)}+P{ai ∈S(r)}P{najmanje neki drugi kod je u S(r)} (28) Prvi član uključuje slučajeve 3 i 4, drugi član uključuje slučaj 1. Budući da je P{ai∈S(r)}≤1, a drugi član u (28) možemo pisati kao ΣA-ai P{a∈S(r)} onda dobivamo: PE ≤ δ + ΣA-ai P{a∈S(r)} (29), gdje δ=δ(ε2,n) možemo načiniti po volji malenim ako n dovoljno povećamo, tako da sfera radijusa r= n(Q+ε2) pokriva sve razmake osim za po volji mali broj slučajeva. Dakle prvi član odgovoran je za grešku za određeni poslani znak, a drugi član odgovara za brzinu prijenosa jer sadržava sve ostale M-1 članove, osim koda za ispravni znak.
  • 103. Shannonov teorem /6 Slučajni kod bira M n-bitnih riječi kao poruke. Sada je očekivana pogreška Pe ≤ δ + (Μ−1)Po a ∈ S(r) ≤ δ + MPo{a∈S(r)} aai (30). Za jednoliku vjerojatnost raspršenja svih kodova, osim ai, svuda po prostoru koda, vjerojatnost nalaženja u sferi S(r) jednaka je omjeru volumena sfere i ukupnog volumena, 2 exp n, dakle Po= N(r) / 2 exp n (31), N(r) je broj kodnih točaka u sferi S(r). Taj je broj za binarni simetrični kanal jednak N(r)=1 + C(n,1) + C(n,2) + …+ C(n,r) = Σ C(n,k), k=0,…,r (32). Iz poznatih r=(Q+ε2)n, Q+ε2<1/2, te Q+ε2 =λ dobivamo N(r)≤2 exp (n H(λ)), odnosno Po≤2exp(-n(1-H(λ)) (33).
  • 104. Shannonov teorem /7 Dakle, Pe ≤ δ + Μ 2exp (-n(1-H(λ))) (34). Eksponent u (34) (1-H(λ))= C - (H(Q+ε2) - H(Q)) Zbog konveksnosti se entropijska funkcija može u bilo kojoj točki ograničiti s tangentom na krivulju u toj točki tj H(Q+ε2) ≤ H(Q)+ ε2 dH/dQ, gdje zbog 0<Q<1/2 vrijedi dH/dQ = log (1-Q)/Q > 0. Odatle je 1-H(λ) ≥ C - ε2 log (1-Q)/Q = C - ε3. Odatle je Pe ≤ δ + Μ2exp (-n(C-ε3)), odnosno Pe ≤ δ + 2 exp(n(C-ε1)) 2 exp(-n(C-ε3))=δ+2exp(-n(ε1-ε3)) (35). Dakle uz izbor ε2 takvog da je ε1-ε3>0 prosječna pogreška Pe može biti po volji malena uz n dovoljno velik.
  • 105. Shannonov teorem /8 Vidimo da postoje teorijski pogodni kodovi za optimalan prijenos na kanalu sa šumom, sa zanemarivom pogreškom.Nadalje: kodovi mogu biti prilično dugi. Duge poruke zahtijevaju dugo prikupljanje podataka prije slanja, tj ništa se neće slati prije nego se dovoljno ne prikupi (čekanje!). Nadalje: kod nekog izvora ne znamo u kojoj je fazi kodiranja. Nadalje: knjiga kodova je jako velika, njezin je opis velik. Nadalje: nitko ne zna koji je od tih dugačkih kodova koja se moraju mučno ispravljati zapravo onaj najbolji. O tome u Shannona nema ni riječi! Očito je da za otkrivanje prave informacije treba jako puno vremena i čekanja: čak i uz naoko relativno povoljan kapacitet kanala. U ekspanziji koda se možda krije i neka druga zakonitost? Lema(F.J): ako vam neka informacija izgleda nejasna, a ne možete povećati brzinu kanala, onda vam preostaje strpljenje. Danas se svi bave povećanjem brzina kanala. Sama informacija pritom nije važna!
  • 106. 8. Železnikarove teze 1. Informacija je kružna spontana pojava informacije. – Kad izgovaramo rečenicu: “Iva pije vodu” gdje je tu kružnost, kamo spontanost? 2. Informacija posjeduje sposobnost samokontrole. - je li samokontrola osnovno svojstvo izvora informacije? - možemo li samokontrolu izvesti bez kružnosti? 3. Informacija unutar informacije iskazuje se kao protuinformacija pitanje - može li se samokontrola izvesti bez pitanja? 4. Uključenje informacije znači njeno ubacivanje, ugnježdenje, smještavanje u neko tijelo koje je razumije. - informacija bestjelesnog / neenergetskog je nepristupačna, ulazom u tjelesno - energetsko ona se postvaruje / manifestira - da bi tijelo razumjelo informaciju ono mora kao prvo razumjeti okoliš - no okoliš nije informacija - okoliš je zamagljenje informacije!
  • 107. Železnikarove teze /2 5. Informacijski paralelizam je informacija po sebi – paralelizam je inherentan informaciji – informacija je i paralelna i trenutna 6. Informacijska slijednost je spontana kružnost informacijske prirode – serijska priroda informacije teži svom izvoru, odatle i njezina kružnost 7. Ukupna fenomenologija živog i neživog je fenomenologija informacijskog oblika i informacijskog procesa – informacijski oblik i proces su dijalektička cjelina 8. Informacijski oblik je statička a informacijski proces dinamička informacijska slika fenomena – fenomeni se pojavljuju u statičkom (forma) i dinamičkom (sadržaj) obliku; u ovom potonjem su neopisivi - dok se ne oblikuju u statičkom – u računala je forma primarna veličina - ono je bez informatičkog sadržaja
  • 108. 9. Estimacija i interpretacija signala Trenutna frekvencija signala Pojam trenutne frekvencije vezan je za npr harmonijsko gibanje tijela, ili općenito vibraciju, tj broj titraja u jedinici vremena. Signal s(t), kada ga promatramo kao zbroj harmoničkih vibracija, možemo predočiti vlastitim spektrom pomoću Fourierove transformacije tj S(f) = ∫ s(t) e -j2πft dt, -∞< t < ∞ (36). Slično tome se signal može sintetizirati iz svojeg spektra kao s(t) = ∫ S(f) e j2πft df, -∞< f < ∞ (37). Postupci su opravdani za signale sa stalnim spektrima u vremenu! No u praksi nastupaju slučajevi s vremenski promjenjivim spektrima.
  • 109. Estimacija i interpretacija signala /2 Poopćenje pojma frekvencije na nestacionarne signale Van der Pol je 1947. razmatrao pojam trenutne frekvencije na signalu: s(t) = a cos (2πft + Θ) (38) a je amplituda, f je frekvencija a Θ je fazna konstanta, odnosno argument kosinus funkcije je faza Φ(t) = 2 πft + Θ . Dakle definirao je amplitudnu modulaciju kao a(t) = a0(1+µg(t)) (39). Faznu modulaciju je definirao kao Θ = Θ(1 + µg(t)) (40), a faza je argument kosinus funkcije u (38) postaje Φ(t) = 2πft + Θ(t) (41).
  • 110. Estimacija i interpretacija signala /3 Frekvencijska modulacija se ne može izraziti poput (39) jer ne dobivamo (41) već je potrebno rabiti izraz s(t) = a cos [∫ 2πfi(t) dt + Θ] (42), gdje je argument kosinus funkcije faza. Dakle imamo definiciju trenutne frekvencije fi kao fi(t) = 1/2π * d(φ)/dt (43). Gabor je predložio nalaženje trenutne frekvencije iz FT stvarnog signala pa modifikacijom spektra tako da se potisnu negativne a dvostruko pojačaju pozitivne frekvencije spektra signala, dakle z(t) = s(t) + jH(s(t)) (44), z(t) je Gaborov složeni signal, s(t) je stvarni signal a H je Hilbertova transformacija koja se definira kao: H(s(t)) = p.v. ∫ s(t-τ) / πτ dτ -∞<τ<∞ (45). P.v. je Cauchy-jeva principijelna vrijednost integrala (45).
  • 111. Estimacija i interpretacija signala /4 Opravdanje za svoj postupak Gabor je vidio kod izračunavanja centralnih momenata frekvencije signala, jer bi se svi neparni momenti spektara bili jednaki nuli, a to ne bi išlo u stvarnosti. Gaborov složeni signal naziva se analitički signal. Ville je izrazio trenutnu frekvenciju signala s(t)= a(t) cos φ(t) kao fi(t) = 1/2π d/dt(arg(z)) (46), gdje je z(t) analitički signal dat u (44). Ville veli nadalje da, ako je t.f. vremenski varira onda (intuitivno) i postoji neki trenutni spektar koji mu se pridružuje, gdje su srednje vrijednosti frekvencija u tom spektru te t.f. Uporabom Gaborovih prosječnih mjera dokazao je tu vezu prosječnih frekvencija i vremenskih prosjeka, odnosno ∫f*Z(f)2 df / ∫z(f)2 df = ∫fi*z(t)2dt / ∫z(t)2 dt (47), a granice integrala su preko područja -∞<f<∞, -∞<t<∞.
  • 112. Estimacija i interpretacija signala/5 Odatle su Ville i Wigner definirali raspodjelu signala po vremenu i frekvenciji (42cit), označenu kao W(t,f), koja svojim prvim momentom određuje trenutnu frekvenciju složenog signala. Ostali autori, poput Rihaczeka i Ackroyda ukazali su na točke u vremensko-frekvencijskoj ravnini gdje se koncentrira energija! Osnovni problem je u tome što mi jednu jedinstvenu pojavu u vremenu naime s(t) želimo prikazati dvjema funkcijama vremena, poput para ovojnica-faza ili realni-imaginarni dio. Ovo koji puta ide bez pogreške kao u slučaju kad razmatramo vrijedi li a(t)cosφ(t) + jH(a(t)cosφ(t)) = a(t)e jφ(t) (48). Rješenje (48) , prema Bedrosianu, je valjano ako spektar A(f) = F{a(t)} leži potpuno u području f< f0 a spektar F{cosφ(t)} postoji potpuno izvan tog područja. Dakle amplituda a(t) i faza φ(t) mogu se smatrati neovisnima samo ako spektar a(t) i cosφ(t) imaju odvojena frekvencijska područja.
  • 113. Estimacija i interpretacija signala /6 Trenutna frekvencija i grupno kašnjenje (GK) Složeni signal z(t) =a(t) exp(jθ(f)) ima složeni spektar oblika Z(f) = A(f) exp(jθ(f)) (49), gdje su a(t) i A(f) pozitivno definitne funkcije. Veličina zanimljiva za opis signala je grupno kašnjenje: τg(f) = -1/2 π * d/df θ(f) (50). Grupno kašnjenje može se predstaviti kao da je promjena vremena propagacije funkcija frekvencije impulsa koji putuje kroz linearni filter s impulsnim odzivom h(t) = s(t). Jasno je da fazni spektar θ(f) i GK ovise i o fazi i amplitudi vremenskog signala. Isto tako faza signala φ(t) i TF također ovise i o faznom i amplitudnom spektru. Za signal s(t), ako je vrijednost t= τg jedinstvena, smatramo da opisuje položaj signala u vremenskoj domeni. Ako je τg funkcija f tada opisuje lokalizaciju različitih komponenti spektra u vremenskoj domeni.
  • 114. Estimacija i interpretacija signala/7 Utjecaj umnoška BT na TF I GK Vrijeme trajanja T i širina pojasa B su značajke signala koje opisuju “epohu” pojave signala i njegova spektra. Smanjnjem trajanja signala u vremenu dolazimo do nestanka signala u šumu. No signal se katkada, iako manji od šuma može smatrati signalom u smislu njegove detekcije. To se naravno odnosi na ponavljajuće pojave. Djelatno trajanje signala je po dogovoru Ts2= ∫t2s(t)2 dt / ∫s(t)2 dt (51) a djelatna širina pojasa Bs2 = ∫f2S(f)2 df / ∫ S(f)2 df (52). Odnos između B i T možemo lako razmotriti ako signal s(t) usporimo ili ubrzamo. Razvučeni signal sr = s(rt), gdje je r faktor razvlačenja. Tada je pripadni spektar Sr(f) = 1/r S(f/r) , r>0 (53).
  • 115. Estimacija i interpretacija signala /8 Dakle rastezanje signala dovodi do sažimanja spektra. Odatle je odnos B i T vezan, odnosno umnožak BT= const za svaki signal. Dapače iz (51) i (52) slijedi da je minimalni BT= 1/4 π za gaussovski oblik signala. Signale s konačnim trajanjem spektrom i energijom ako imaju BT>10 smatraju se “asimptotskim signalima ”. Landau i Pollak su pronašli da signali s BT>5 imaju 99% energije u području definiranom unutar B i T. Dakako signali s malim BT u informatičkom smislu nisu dovoljno “bogati”. Njihove estimacije su slabe. Neke korisne definicije i svojstva asimptotskih signala s(t): Neki asimptotski signal s(t) je monokomponentan ako njegova trenutna frekvencija fi(t) točno predstavlja modulacijski zakon signala, jednoznačna je i postoji njen invers fi-1(t) Neki je asimptotski signal s(t) višekomponentan ako postoji konačan broj N monokomponentnih signala sj(t) takvih da u zbroju daju s(t). Samo jedna od njenih komponenata mora biti asimptotska. Dekompozicija je ovisna o primjeni!
  • 116. Estimacija i interpretacija signala/9 Monokomponentni signal Višekomponentni signali t t f t f f
  • 117. Estimacija i interpretacija signala /10 Svojstva asimptotskih signala 1. Energijska razdioba asimptotskog signala s(t) usredotočena je u konačnom vremensko-frekvencijskom području oko TF, a stupanj koncentracije je ovisan o umnošku BT. 2. Za jednokomponentni asimptotski signal s velikim BT i monotonim zakonom promjene može se pokazati da se fi(t) približava prema τg-1, tj ove su dvije funkcije međusobno inverzne. Tada fi(t) opisuje zakonitost frekvencijske modulacije signala s(t), a τg(f) predstavlja vremensko kašnjenje signala. 3. Za jednokomponentni asimptotski signal s malim BT ne vrijedi jednakost fi(t) = τg-1. Ne postoji niti fizikalno značenje koje se može pripisati ponašanju u t-f ravnini, iako je matematički dobro definirano. Dakle traži se monotonost ponašanja TF i veliki iznos BT-a. Monotonost osigurava jednu prasliku u području T, a veliki iznos BT osigurava da se svaki element u T preslikava na jednu sliku u B, dakle da postoji dominantnost jedne frekvencije npr. f0.
  • 118. 10. Pretraživanje podataka Pretraživanje podataka (data mining) je analitička tehnika kojom se grade modeli za obilježavanje podatka u cilju nalaženja informacije. Procjena uspješnosti skupe marketinške kampanje, otkrivanje bitnih uzroka kvarenja energetskih transformatora ili postizanje veće odzivnosti na potrebe kupca telefonske usluge - važan je motiv za opsežnu, skupu i često dugotrajnu analizu velike količine podataka. Tehnike kojima se služimo možemo grubo grupirati na: - pomoć pri boljem razumijevanju podataka - ugradnja značajki u podatke za njihovu kasniju analizu - omogućavanje mjerenja uspješnosti ugrađenih značajki Opisuje se niz postupaka od predobrade sirovih podataka do korisnih postupaka njihovih odvajanja i obilježavanja. Naglasak je na razumijevanju podataka već prije početka postupka obrade.
  • 119. Važnost podat(a)ka Iznosi podataka penju se brzo na milijarde jedinica. Ako želimo obilježiti živi svijet na nekom području tada za 2000 vrsta, u 2000 različitih lokaliteta te sa 2000 bajtova po lokalitetu imamo 8GBy podataka. Ipak zaključci koje možemo izvesti iz sintaksnih okvira računarskih podataka i semantička interpretacija njezinih vrijednosti je ograničena. Sve ovisi jako o kvaliteti podataka s kojima raspolažemo. Tehnike rijetko kada imaju sposobnost uporabe znanja iz date domene a zasigurno nemaju pristup obilju infromacije koja je na raspolaganju analitičaru. Stoga analitičar mora osigurati da se donose najbolji mogući podaci koji daju i najviše moguće iznose informacije. Kvaliteta podataka odnosi se na njihovu potpunost, odvojivost i razumljivost za analitičara. Potpunost ovisi o tome ne posjeduje li zapis sve podatke. Nedostatak podataka obezvređuje osobine sustava. Postoje neki načini da se nadiđe i takav slučaj.
  • 120. Važnost podat(a)ka /2 Odvojivost podataka odnosi se na lakoću kojom se mogu obilježavati klase podataka u datom skupu. Obilježavanje mora moći ići u smislu postizanja cilja obrade. Tako se obilježavanje podataka puta ne smije izbjeći kod analize problema trgovačkog putnika i sl. Često je to kombinacija obilježja koja igra ulogu u nalaženju informacije. No analitičar koji ne razumije područje rada teško će otkrivati svojstva obilježavanja! Razumljivost podataka može se kretati od poznavanja vrste podataka atributa (obilježnika) do razumijevnja stohastičkih modela koji se koriste i pravog sadržaja informacije. Semantičko razumijevanje značenja atributa bila bi poželjna osobina, no malo sustava za pretraživanje podataka posjeduje svojstvo uporabe domenskog znanja.
  • 121. Važnost podat(a)ka /3 Vrste podataka U biti postoje dvije vrste podataka: brojčani (kvantitativni) i simbolički (kvalitativni). Brojčani podaci (cjelobrojnici ili realni brojevi) donose svojstvo razlikovanja značajnosti dvaju podataka iz razlike njihovih brojčanih iznosa. Simbolički podaci ( brojke ili znakovi) donose svojstvo da im je za istu jedinicu različito značenje. Dakle za neko svojstvo obrade mora postojati neka skala obilježavanja simbola koja je primjerena datom cilju obrade. Često je već postizanje skale obilježavanja veliki doprinos pretraživanu podatka. Skale obilježja dakle moraju izrađivati eksperti iz područja problema koji se rješava datom obradom pretraživanja. Zadatak: poredajte po skali obilježja vaše informatičke uređaje: računalo, telefon (mobilni?), TV prijamnik, kućno zvonce. Ovisi li to i o okolnosti uporabe?
  • 122. Važnost podat(a)ka /4 Predočavanje podataka Kada skup podataka prelazi tri atributa ili 1000 jedinki teško ga je predstaviti s dovoljnom jasnoćom. Porast broja i složenosti podataka u računalima taj je problem samo povećao. Jako je teško stvarne podatke “vidjeti” kao nakupine, grozdove. Svakako da je dobro predočavanje podataka uvjet za njihovo bolje razumijevanje.Uz sve isto podatke ćemo najbolje predočavati tako da istaknemo one atribute, dimnezije gdje se najviše razlikuju. Isto tako možemo one dimenzije gdje se ne razlikuju naprosto zanemariti u predočavanju. Tako možemo prikaz smanjiti na onaj broj dimenzija 2,3 koji je najprimjereniji za predočavanje čovjeku. Nadalje, dovoljno je izabrati do stotinu oglednih podataka za prikaz od više od tisuću njih, da bi se dobio uvid u osnovna svojstva skupa podataka.
  • 123. Tehnika predobrade Predobrada podataka je važan korak u njihovom boljem prikazu korisniku, otkrivanju skrivenih svojstava i svođenju na oblik u kojem se mogu uspoređivati podaci iz različitih izvora. Postupci predobrade svode se na filtraciju, skaliranje, normalizaciju te regresiju dimenzije. No, bez obzira koji se postupak uvodi podaci nakon predobrade nisu više jednaki onim sirovim podacima. Budući da se radi o tome da ne znamo informacijski model na izvoru, niti mu možemo pristupiti, ne možemo doći do čistog informacijskog signala, a ne znamo ni model šuma niti mu možemo pristupiti a znamo samo mjerni signal, to je problem pristupu informaciji daleko teži nego izgleda. Naravno da predobradom samo smanjujemo neke od nepoznatih veličina, nikako sve.
  • 124. Tehnika predobrade /2 Opća shema predobrade Nedostupni model šuma Nedostupni šum Model=? Nedostupni inf. izvor Model=? * Filter Nedostupni inf. signal Mjerenje, podatak Predobrađeni podatak
  • 125. Tehnika predobrade /3 Filtriranje se može izraziti iz osnovne formule (Graupe, 176) yk = x k + nk (54), gdje je yk mjerenje, sirovi podatak, xk je signal a nk je aditivno dodani šum, k je k-ti vremenski interval. Filter daje procjenu, estimaciju xke signala xk samo na osnovici yk. Pri tome optimalni linearni filter zahtijeva poznavanje parametara modela signala i šuma. Linearni Wienerov filter u smislu minimuma kvadratnih odstupanja estimacije daje linearnu estimaciju xke informacijskog signala s obzirom na mjerenja tj xke = Σαi* yk-i sumiranje od 0<i<M (55), gdje su αi parametri filtera koji se izračunavaju prema minimumu kvadrata odstupanja od estimacije, a M je dubina utjecaja na estimaciju. Kada doprinos estimaciji s porastom M padne ispod nekog iznosa onda se daljnje računanje po dubini više ne uzima u obzir. Možemo li za niz podataka 4,6,3,7 izračunati α0 i α1?
  • 126. Tehnika predobrade /4 Norm iranje i skaliranje podataka Skaliranje je promjena mjerila podataka u smislu povećanja njihove razdvojivosti. Nakon skaliranja potrebno je često podatke podvrgnuti zajedničkom normiranju. Teorijski promatrano klasifikatori se mogu podučiti kako primijeniti odgovarajuće linearno ili nelinearno skaliranje podataka na svojim ulazima, što je vrlo složen postupak. Uobičajeni postupci preobrade je pretvorba podataka u podatke sa srednjom vrijednosti jednakoj ništici te normiranje varijance ulaznih atributa. Uzmimo da posjedujemo dva niza podataka: m1 = 3, 4, 6, 4 te m2 = 11,14, 15, 12. Postavimo ih linearnom pretvorbom u skalu1 - 10 Normiramo tako pretvorene podatke u nizove sa srednjom vrijednosti ništa. Pokušajmo ih pretvoriti u podatke s istom varijancom. Što opažamo? Kuda su nestale izvorne veličine? Možemo li ih obnoviti?
  • 127. Tehnika predobrade /5 Regresija Regresija je zajednički naziv za raznorodnu grupu postupaka kojima se smanjuje broj opisnih atributa promatranog skupa podataka. Uobičajeno je odrediti kolika je međusobna statistička ovisnost parametara, pa onda izostaviti one parametre koji su već dovoljno dobro predstavljeni drugim veličinama. Takvi međusobno neovisni parametri nazivaju se glavni parametri ili glavne analitičke komponente, GAK. Daljnja se obrada onda odvija na puno manjem broju GAK-a što pojednostavljuje prikaz i smanjuje broj pretraga. No, ostaje osnovni problem - kojom metodom to postići! Odnosno kakav model regresije rabiti. Linearna regresija tako svodi opis neke mjerne pojave y kao linearne kombinacije GAK-a x1 , x2 ... Sljedećom shemom: Y = a1 X1 + a2 X2 + a3 X3 + o (56), gdje je o oznaka za ostatak aproksimacije pojave. X1, X2 i X3 su tada GAK-e.
  • 129. Tehnika predobrade /6 Koeficijent korelacije niza y i x računa se prema izrazu r = 1/n *Σ (xi- xsr)(yi - ysr) / ( 1/n *Σ (xi- xsr)2 )1/2) * ( 1/n *Σ (yi - ysr)2) 1/2) (57), gdje je n broj parova događaja, xi i yi su podaci i-tog događaja xsr i ysr su srednje vrijednosti svakog niza. Koeficijent korelacije rangiranih nizova y i x računa se prema izrazu rq = 1- 6 Σ δ2/ n2 (n-1) (58), gdje je δ2 kvadrat razlike rangova dvaju nizova. Izraz (58) vrijedi za nizove sa svim različitim rangovima u pojedinom nizu. Što možemo dobiti ispitujući podatke iz Primjera ovim relacijama? Možemo li možda postaviti regresijski izraz? Kako se ponašaju nizovi na rang korelaciju?
  • 130. Tehnika klasifikacije Klasifikacija je postupak podjele ulaznih podataka prema krajnjem ishodu događaja. Moguća je postupcima samoorganizacije podatka dakle postupcima umjetne inteligencije poput umjetnih neuronskih (živčevnih) mreža, genetičkih algoritama, ili polukvalitativnih postupaka (Quacol algebra)- ili induktivnim postupcima - stablom ili pravilom odlučivanja, te statističke - CART metoda, statistička klasifikacija ili entropijska klasifikacija. Obradit ćemo samo neke od navedenih postupaka. Zajednička osobina svim metodama je unošenje jakih elemenata kvalitativnog u postupku donošenja odluke, pa ćemo na sklopu diskriminatora objasniti postupak pretvorbe kvantitativne u kvalitativnu veličinu. Drugi vrlo značajan element je pojačanje. Bilo da se radi o skaliranju ili normalizaciji, podaci su, kada uđu u postupak ili uređaj za klasifikaciju, izloženi značajnim pretvorbama. Takve pretvorbe vrlo je teško do kraja razumjeti, obrazložiti i interpretirati. Osobito kada se radi o samoorganiziranim postupcima.
  • 131. Sklop za diskriminaciju Sklop kojem se ulaz mijenja od -5V do 5V i koji ima prag okidanja smješten na 0V prikazan je shemom: Uul Uiz Uul t Uiz Uiz Uul Sklop pretvara ulazni niz koji je u rasponu +/- 5V u izlazni niz koji ima samo dva stanja + ili - . Na ovaj način na izlazu ne znamo koliko točno iznosi ulazni niz, ali znamo da li je veći ili manji od ništice.Dakle podatak je iz kvantitativnog prešao u kvalitativno područje: veće / manje.
  • 132. Sklop za zbrajanje i skaliranje Sklop za zrajanje s postupkom skaliranja dat je na shemi: X - ulaz, Y - izlaz, W - težinski udio, S - zbrajalo Koliki je Y ako su X1=5, X2=7, W1=1, W2=10? Tko dominira? Kako možemo ovu shemu izvesti elektronički, elektromehanički? X1 W1 S X2 Y=X1W1+X2W2 W2 Kako možemo na elektroničkom sklopu promijeniti W, X?
  • 133. Samoorganizacija Promotrimo sklop na slici (strjelice označavaju podešavanja ulaznih struja u sumatore npr promjenom otpora): Za svaku ulaznu pobudu može se podešavanjem dobiti odgovarajući izlazni odziv. Ovo podešavanje naziva se samoorganizacija. X1 s D s D s D s D X2 X3 s D s D s Y
  • 134. Klasifikacija podataka /5 Klasifikacija samoorganizacijom Svaka samoorganizacija sastoji se od strukture, mogućnosti njene promjene i kriterija prilagodbe. Opisujemo tri takve klasifikacije: neuralnom mrežom, genetičkim algoritmom i Quacol algoritmom(Medusa). Neuralnoj mreži se ne mijenje struktura, promjena je na razini težinskih udjela a kriterij prilagodbe je minimum odstupanja izlaza za dati skup ulaza. Ta se samoorganizacija izvodi u etapi učenja. U etapi klasifikacije se dati obrazac propušta kroz mrežu i opaža njen učin - tj kamo uzorak pripada po svojim atributima. Genetički algoritam polazi od skupa različitih struktura, ispituje prikladnost rješanja, uzima one najbolje, kombinira ih u nove strukture tako da u kombinaciji slučajnim izborom promijeni strukturu npr svakom stotom rješenju, pa dobivene strukture opet ispituje na prilagođenost….
  • 135. Klasifikacija podataka /6 Quacol (algebra kvalitativne korelacije) rangira ulazne podatke, normira i rangira njihove algebarske kombinacije čime generira različite algebarske strukture, pa one koje su kvalitativno najsličnije ciljnoj funkciji bira za nove algebarske strukture. Što je zajedničko svim samoorganiziranim postupcima? Pretvorba kvantitativno u kvalitativno odvija se u više uzastopnih koraka (cikličnost informacije!): – kod neuronske mreže se na diskriminatoru izvodi pretvorba kvantitativno - kvalitativno a na ulazu u sumator obrnuto. – Kod genetičkog algoritma su rekombinacija i mutacija kvalitativni koraci, a određivanje rezultata i biranje potomaka je kvalitativne prirode – kod Quacol algebre je rangiranje kvalitativni postupak, a određivanje rezultata i biranje najpovoljnijih algebarskih struktura je kvantitativan postupak.
  • 136. Klasifikacija podataka /7 Induktivne metode Dvije su induktivne metode: stablo indukcije i indukcijsko pravilo Kod indukcijskog stabla računa se grananje na stablu u grupi podataka po principu podjele u dvije grupe. Podaci se ispituju prema nekoj vrijednosti atributa npr X1≥3 u ovisnosti o ishodu npr Y=7. Ispituju se svi podaci. Ide se sve prema finijoj podjeli podataka sve dok se ne dosegnu kriteriji zaustavljanja. Često se računa informacijska dobit, kao kod ID3 postupka, pa kada je više nema onda se klasifikacija zaustavlja. Indukcijsko pravilo rabi mali skup prostornih i logičkih konstrukata, poput “NA”, “I”, “U DOTICAJU”, “ILI” koji tvore početni skup pravila zasnovan na nekom početnom kriteriju. Tim se pravilima klasificiraju podaci - uzorci I mjeri učinak klasifikacije. Nova se pravila dobivaju poopćenjima, specijalizacijama i opet ispituju…Poznat je sustav AQ-11 za klasifikaciju bolesti soje.
  • 137. Klasifikacija podataka /8 Statistička klasifikacija podataka Statistička parametarska klasifikacija: Podaci se dijele linijom u 2D prostoru (ravninom u 3D), tako da ona prolazi područjem gdje je u oba podijeljena skupa minimum kvadrata razlike od njegovog centra a maksimum razlike između podataka različitih grupa. Ako je potrebno jedan se od parametara skalira da bi se dobili traženi maksimumi, odnosno minimumi. Vodi se računa o tipu funkcije razdiobe vjerojatnosti Neparametarska statistička klasifikacija: izvodi se na sličan način kao parametarska, ali ne vodi računa o tipu raspodjele, već računa centre okupljanja (K-najbliži susjed) tako da postižu minimume razmaka untar grupe i maksimum između članova različitih grupa. CART(Classification And Regression Tree) metoda: dijeli skup podataka prema sve homogenijem sastavu do ispunjenja određenog kriterija. Svaka dioba ovisi samo o jdnoj vrijednosti jednog atributa i binarnog je tipa.Kada su parametri opisni onda se podjela izvodi po njima a kada su numerički određuju se regresijska pravila.
  • 138. Klasifikacija podataka /9 Entropijska klasifikacija Metoda se zasniva na grupiranju podataka prema parametru koji posjeduje maksimum informacije, odnosno minimum entropije. Računaju se udio entropije uvjetne vjerojatnosti p(cj/ai) da ishod bude cj ako je ulazni parametar a ima iznos ai, tj H*(cj/ai) = - Σ p(cj/ai) log p(cj/ai), za sve ai od 1 do n (59), gdje je n ukupan broj kombinacija ishoda cj i klasa atributa A. Taj se udio množi težinskim udjelom svakog iznosa ai ukupnom parametru A tj H(A) = Σ p(ai) H*(cj/ai) 1<ai<k (60), k je broj klasa atributa A. Odabiranjem najinformativnijeg atributa otvara se stablo klasifikacije za ostale atribute.
  • 139. Klasifikacija podataka /10 Kriteriji odrezivanja na stablu odlučivanja Dva su kriterija odrezivanja: kada broj slučajeva padne ispod nekog iznosa koji je značajan za donošenje odluke ili kada padne do iznosa kada se događa da u neku klasu više ne dospijeva nijedan slučaj. Nedogađanje slučaja izaziva umjetni pad entropije i “ruši” metodu, jer pad entropije tada ne predstavlja smanjenje nereda već nedostatak pojave! Ako imamo c slučaja u datoj klasi a g ishoda ( npr. porast snage, pad snage motora) te jednoliku raspodjelu gustoće vjerojatnosti ishoda tada je vjerojatnost dobivanja jedne ništice unutar nekog od ishoda jednaka P( jedan ishod =0) = ((g-1)/g)c ( 61). Za slučaj c=15, g=4 vjerojatnost u (61) jednaka je 0,01336. Računamo li pad entropije za slučaj g=4, c=15 npr iz obrasca H(5,5,4,1)=0,54956 na H(5,5,5,0)=0,47712 on iznosi H=0,07244 ili 15,8%, što je zamjetno.
  • 140. Klasifikacija podataka /11 Ako kao razumnu granicu za odrezivanje stabla uzmemo klase s 2% ili manje slučajeva od ukupnog broja, tada npr za se sve klase s manje od 740*0,02 ≈15 slučajeva dalje ne klasificiramo. Ovo može biti drugi kriterij - potpuno pragmatički. Analiza klasifikacijskih postupaka Nema “najbolje “ klasifikacijske tehnike. Prema svakom slučaju se mora posebno postupiti, prilagoditi. Ipak klasificiranje po maksimumu sličnosti i potpuno odvajanje klasa kakvo je u entropijskoj klasifikaciji daje joj prednost. No za veliki broj parametara i ova klasifikacija gubi uvjerljivost. Izračunajte koliko klasa ima u skupini podataka obilježenih s 10 parametara ako svaki ima dvije veličine!(1024 klasa) Koja najvrjednije informatičko svojstvo krije u sebi postupak klasifikacije? (selekcija)
  • 141. Postklasifikacijska analiza Klasifikacija je samo jedan dio posla. Drugi je odgovarajući prikaz rezultata klasifikacije i njegovo opravdanje. Analiza dobrote klasifikatora 1. Analiza postupka učenja 1.1 Uzima se samo jedan dio podataka i klasificira. Kada se klasifikator “uvježba” onda se njime klasificira pokusna skupina podataka (od 9:1 do 1:1). Pretrenirani klasifikator nema svojstvo generalizacije. 1.2 Uzima se n skupina uzoraka za učenje i testiranje. Računa se križna validacija s nasumce izabranim parovima uzoraka. Ispituje se statistička značajnost razlike postignutih rezultata. 1.3 Stvaraju se nove skupine uzoraka iz starih odgovarajućim zamjenama nešto slično slučaju 1.2. Tada se izvodi validacija postignutog i računaju odstupanja. Ova metoda ima nedostatak u pojavi predrasudnih ocjena. 2. Ubacivanje funkcije troška Procjenjuje se cijena neispravne klasifikacije - ovo je dosta teško vrednovati.
  • 142. Postklasifikacijska analiza /2 3. Analiza statističke značajnosti rezultata klasifikacije Matrica smušenosti Massy-jeva matrica A klas. Bklas. Apredv. N11 N12 Bpredv. N21 N22
  • 143. Postklasifikacijska analiza /3 N11 - broj primjera klase A ispravno klasificiranih N12 - broj primjeraka klase B neispravno klasificiranih N21 - broj primjeraka klase A neispravno klasificiranih N22 - broj primjeraka klase B ispravno klasificiranih vrijedi N = N11+N12+N21+N22 Hi-kvadrat test se rabi za testiranje statističke značajnosti rezultata klasifikacije. Zasniva se na razlici između opaženih (O) i očekivanih (E) frekvencija pojava: χ2 = Σ (O-E)2 / E za svih N slučajeva. (62). Za veliki χ2 odbacuje s tzv nulta hipoteza da je razlika slučajna, pa je i klasifikacija statistički značajna.
  • 144. 11. Govorna informacija - mrežni agenti Govorna informacija razmatrat će se sa stajališta: – 1. Postignuća automatskog prepoznavanja govora od strane strojeva – 2. Mogućnost automatskog čitanja pisanog teksta – 3. Mogućnost prikupljanja podataka u otvorenom sustavu - mrežnim agentima – 4. Načini izgradnje konverzacijskog mrežnog agenta – Slični postupci mogu se primijeniti i na području automatskog prepoznavanja slike, automatskog crtanja, prikupljanja slikovnog materijala i izrade umjetnog agenta za prikupljanje slikovnih obrazaca, njihovu analizu i prepoznavanje. – Sva navedena svojstva strojeva svode se na pitanje kako natjerati stroj da prepozna govor, tekst ili slikovni obrazac, te kako ga isprogramirati da sintetizira komunikaciju sve iz određene baze podataka - znanja prema određenom obrascu. – Dakle kako stroj naučiti značenju, semantici! Stroj dakako ne može naučiti semantiku, ali se može dobro isprogramirati za tu funkciju.
  • 145. Agent - komunikacijski posrednik Nedruštveni agent (Poole) Agent je nešto što djeluje u svijetu, poput osobe, robota, crva, vjetra, gravitacije, svjetiljke. Ciljni agenti djeluju prema preferencijama, vole neka stanja više od drugih, dok (naoko) besciljne agente zovemo “prirodom”. Uloga nekog agenta je stvar modelskih pretpostavki. Pas može u jednom scenariju biti ciljni, a u drugom prirodni agent. Agenti mogu imati osjetila, memoriju, aktore; oni zaključuju i djeluju u vremenu. Agent osjetilima ne mora odražavati pravu sliku svijeta u kojem djeluje. Agent može kontrolirati jedino svoju akciju, poruku u datom okolišu. Agent prevodi ulazni signal u izlaz u svakom trenutku vremena. To je ponašanje kauzalno jer ulazno-izlazni odziv može ovisiti samo o datom i prijašnjim ulazima i datom i prijašnjim izlazima. Nema govora o predviđanju ili inkurziji (sadašnje ponašanje ne ovisi o budućim stanjima). Ovakvo predstavljanje modelira svijet, agente i ciljeve njihovog ponašanja na neki projektirani (sub)optimalni način.
  • 146. Konverzacijski agent Konverzacijski agent (Allen, /6/) može potpuno sudjelovati u razmjeni informacije Kakav je to stroj? Zašto bi trebao komunicirati? Zašto bi trebao razumijevati ono što mu je preneseno? Možda zato što je jednostavno programiran za nešto takvo. Agent koji razgovara s bazom podataka naprosto 1. Prepoznaje i interpretira ulazno pitanje u logički oblik koji predstavlja upit za bazu podataka 2. Izvodi upit u bazi podataka i generira izlaz zasnovan na dobivenom odgovoru Ovo nije inteligentan agent, a ne može prepoznati ništa osim onoga što stoji u bazi podataka. Nema nezavisnosti u njeovom ponašanju, što bi dovelo do primisli da je agent inteligentan. Nešto više inteligencije dobili bismo predstavljanjem na način koji više odražava stvari koje motiviraju ljudsko ponašanje.
  • 147. Društveni agent Društveni agent (Castelfranchi) ne živi sam u svijetu njegove se osobine tvore na socijalnoj interakciji, koja nije reducirana na komunikaciju već je komunikacija zbog potrebe društvenosti, djeluju u zajedničkom svijetu, sučeljavaju se, utječu međusobno i ovise jedan o drugome. Ta je akcija zasnovana na ispoljavanju moći, uni(bi)lateralnom pokušaju utjecaja na drugog tako da mu mijenja pamćenje, memoriju i nakanu. Društvena akcija nije nužno i kooperativna akcija. Agenti i njihove akcije vođeni su ciljnom funkcijom. Često ponašanja agenta nisu praćena nekom internom (mentalnom) predstavom učina tog istog ponašanja. Cilj je interna predstava stanja svijeta koji je kandidat za: upravljačku i vodeću akciju s pomoću ponavljanja ispitivanja učina akcije ili suprotne predstavljanju, određivanje akcije pretraživanja i izabiranja, te kvalifikacije uspjeha ili neuspjeha. Cilj razlikuje društvenu od nedruštvene akcije. Akcija je moguća I na podspoznajnoj razini npr u umjetnim samoorganiziranim strukturama,ANN. Ovdje se razmatraju samo ciljno usmjerene akcije interno zasnovane na spoznajno vođenim agentima čije se akcije interno reguliraju ciljevima zasnovanim na uvjerenjima.
  • 148. Međudjelovanje agenata i ciljeva Prilagodba Uvođenje Negativno djelovanje Modifikacija plana u cilju izbjegavanja prepreke Navođenje drugog da napusti svoj prijeteći cilj Pozitivno djelovanje Prilagodba plana ubacivanjem iskorištenja akcije drugog Navođenje drugog da slijedi cilj koji je nama nužan
  • 149. Stupnjevi interakcije društvenih agenata Prvi stupanj: smetnja i ovisnost (vidjeti tablicu ranije datu) Drugi stupanj: slaba društvena akcija - uvjerenje u mišljenje drugog - tj traži se mogućnost predstavljanje mišljenja drugog agenta. Kooerdinacija je tada moguća na reaktivni način tj da se uoči porble ili na proaktivni način tj da se anticipiraju mogući ishodi akcije drugog Treći stupanj: delegiranje akcije drugog, gdje prvi agent treba ili želi akciju drugog agenta i uključuje je u svoj plan. Prvi agent ima povjerenje u drugog. Četvrti stupanj: jaka društena akcija - stvaranje ciljeva o akcijama i ciljevima drugog agenta. Peti stupanj: društveno prekrajanje cilja - agent dolazi do stupnja prihvaćanja novog cilja ili razloga za prihvaćanje ciljeva drugog agenta, dakle društveni agent je sposoban prihvatiti ciljeve izvana od drugih agenata drugih frupa poput zahtjeva, potreba, naredbi, normi. Razine kolaboracije: x prihvaća točno ono što mu je delegirao y, x prelazi tu razinu, no cilj y-a se ne mijenja, x zadovoljava rezultete traženog plana/akcije ali ih pritom mijenja (kritično!), x shvaća da je pretjerao i mijenja akciju ...
  • 150. Struktura komunikacije agenata Osnovna struktura komunikacije int. agenata sastoji se u potrebi definiranja dosega konteksta. Razgovor agenata možemo promatrati kao linearni segment sve dok se na počne pozivati na kontekst iskazan jednom ranije. U tom smislu možemo razlikovati događajni i komunikacijski od informatičkog dijela razgovora. Intuitivno je jasno kada se neki dio razgovora može izdvojiti. No ne postoji konsenzus o tome što je to segment razgovora. Osnovno je uvidjeti da: postoji tehnika analize rečenica unutar segmenta i postoji suodnos segmenata razgovora. Iz praktičnih razloga segment razgovora se sastoji od iskaza koji očitavaju lokalnu neproturječnost. Segement bi trebao imati sljedeća svojstva: – upotrebljivost neke tehnike za vremensko referiranje za postupak s kratkim izrazima (elipse) – čvrsto vrijeme i mjesto obilježava iskaze ili je napredovanje vremena i mjesta jednostavno – čvrsto određeni skup govornika i slušatelja sudjeluje u razgovoru – čvrsti skup pozadinskih pretpostavki je relevantan
  • 151. Opis događaja, informatički odnos, komunikacijski cilj Analizira se linearni niz događaja koji čini segment -u segmentu ne smije doći do promjene situacije - npr promjene broja konverzanata, skok u vremenu. Strukture segmenata mogu biti linearne, uklopljene. Ključne riječi odrđuju promjenu strukture događaja. Konverzanti se određuju svojim informatičkim (semantičkim) i komunikacijskim (volja, moć, apobetika, pragmatika) vidom. Informatički odnos uključuje pretpostavke o ponašanju okoliša. Komunikacijski cilj se u osnovici sastoji od prepoznavanja cilja sugovornika.
  • 152. Što je nužno za izgradnju konverzacijskog agenta Ljudi djeluju zato što imaju ciljeve, zbog svjesnosti situacije u kojoj se nalaze, a imaju pozitivne i negativne osjećaje prema datoj situaciji. Recimo da želite prijeći prometnu cestu na neoznačenom prijelazu. Tada morate: – – – – – – – promotriti cestu - opažaj imati predstavu o tome što se događa - uvjerenje moći stvoriti pozitivne / negativne osjećaje prema datoj situaciji želja / potreba biti u stanju izvoditi zaključke - planiranje / zaključivanje biti u stanju stvaranje odluke djelovanja - odlučnost biti u stanju održati namjeraveni tijek akcije - nakana moći djelovati i time promijeniti stanje - djelovanje Dakle, morate posjedovati četiri procesne (opažaj, planiranje, odlučnost i djelovanje) te tri spoznajne ( uvjerenje, želje i nakane) osobine.
  • 153. Što je nužno za izgradnju konverzacijskog agenta/2 Dijagram: uvjerenje - želje - nakane Planiranje Opažaj Uvjerenja Odlučnost Želje Nakane Djelovanj e
  • 154. Razgovor Razgovor kao linearni niz iskaza Pojam segmenta razgovora i ključnih fraza koji ukazuju na strukturu segmentacije Utjecaj strukture segmenta na interpretaciju pojedinih izraza posebno pridjeva Utjecaj međudjelovanja segmenta i zaključivanja za razumijevanje sadržaja razgovora Utjecaj vremenski ovisnih pojava i uzročno - posljedičnih pojava na segmentiranje razgovora Konačni model razumijevanja razgovora Primjer
  • 155. Komunikacija kao djelovanje među agentima Govor (slika, riječ, simbol, signal) nužno uključuje više agenata. Cilj govora je djelovanje jedne osobe na spoznajno stanje druge. Situacije: – Agent A signalizira znak X - Agent B to prepozna i koristi – Agent A signalizira znak X - ali iz drugog razloga - B prepozna i griješi – Agent A signalizira znak X - Agent B misli da je to neki drugi razlog i ne reagira – Dakle komunikacija se događa kada jedan agent namjerava komunicirati a drugi prepozna tu njegovu nakanu. Druga strana komunikacije je dogovoreni skup konvencija s unaprijed dogovorenim značenjem. – Postoji dakle važna razlika između fizičkog čina i komunikacijskog čina. – Austin je (1962) ustvrdio da postoje: čin lokucije (recimo: izgovaranje riječi) čin ilokucije ( čin izričaja značenja) čin perlokucije (stvarni učin, rezultat izgovorenog)
  • 156. Predstavljanje spoznajnih stanja Podaci su ono što postoji u bazama podataka. Ako međutim skupljamo znanje onda možemo oblikovati bazu znanja. Znanje se predstavlja u obliku općepoznatog znanja i znanja svojstvenog nekoj datoj situaciji. Opće znanje služi za razlučivanje značenja u dvosmislenim iskazima i situacijama. Specifično znanje služi za opis date situacije te za razlučivanje značenja riječi, signala u konkretnoj situaciji. Sustav za predstavljanje znanja sastoji se od baze znanja i pravila zaključivanja. Pravila zaključivanja izvode iz baze znanja nove iskaze, zaključke. Mnogi zaključci su sadržani u bazi znanja, ili se izvode iz baze znanja, tzv implikacijama. Tehnike zaključivanja su deduktivne ili nededuktivne. Deduktivno zaključivanje je logički opravdano. Nededuktivno zaključivanje može biti: učenje općeg iz posebnog (induktivno zaključivanje) ili zaključivanje na odziv iz pobude (abduktivno zaključivanje).
  • 157. Tehnika zaključivanja Zaključivanje tipa A ⊃B (glasi: ako A onda B) je deduktivno. Abduktivno je zaključivanje na A ako znamo da postoji B. Težinsko zaključivanje dozvoljava iznimke. Označava se s A ⇒B i glasi: ako vrijedi A⇒B a ¬B ne možemo dokazati tada zaključujemo da je B istinito. Tako rečenicu “Ptice lete” možemo predstaviti kao ∀ x PTICA(x)⇒LETI(x) (63). Ovakvo zaključivanje naziva se nemonotono. Postoji nemonotono zaključivanje drugog tipa zasnovanog na zamisli zatvorenog svijeta. Tada se za sve što ne možemo dokazati da je ispravno uzima da je neispravno (jezik Prolog). Za zaključivanje se rabi predikatska logika prvog reda (s proširenjima), tzv modalna logika, tako da se sheme predstavljanja znanja poput semantičke mreže ili okvira mogu relativno jednostavno obraditi.
  • 158. Predstavljanje znanja Obradimo djelovanje tipa “KUPNJA” sljedećim okvirom: Klasa akcije: KUPNJA(k) Uloge: Kupac, Prodavač, Predmet, Novac Ograničenja: Čovjek(Kupac), AgentProdaje(Prodavač), JestPredmet(Predmet) Vrijednost(Novac), Cijena(Predmet) Preduvjeti: POSJEDUJE(Kupac, Novac), POSJEDUJE(Prodavač, Predmet) Učini: ¬POSJEDUJE(Kupac,Novac),¬POSJEDUJE(Prodavač,Predmet) POSJEDUJE(Kupac,Predmet), POSJEDUJE(Prodavač,Novac) Opis: DAJE(Kupac,Prodavač,Novac), DAJE(Prodavač, Kupac, Predmet)
  • 159. Koherentno znanje Znanje o djelovanju uzročnosti i svakodnevnosti bitno je za razumijevanje informacijskog konteksta i jednoznačno djelovanje. Ovo je znanja osnovica za stvaranje očekivanja i usporedbe mogućih interpretacija ulazne pobude. Značajna je tu kontrola generiranja očekivanja. Koriste se postupci poput: referentnih znanja, očekivanja, razumijevanja stereotipičnih situacija, hijerarhijskih planova i zaključivanje tipa pobude-učina. Inteligentan agent ponaša se u krugovima postupaka: – 1. Promatra tekuću situaciju, uključivo i nadzor nad uspjehom neposredno poduzete akcije – 2. Odabire cilj, skup ciljeva, na koje se usredotočuje – 3. Započinje razvijati plan kako postići te ciljeve – 4. Izvodi akcije u planu kada ih smatra primjerenim
  • 160. Prostori uvjerenja Razmjena informacije je ograničena ako agent posjeduje samo jednu bazu znanja - svoju! Tada ne može npr predstaviti informaciju o uvjerenju drugog agenta. Nadalje, nema nikakve svijesti o sebi jer ne može razlikovati između onog što on vjeruje i onog što vidi u svijetu oko sebe. Dakle, nema osnovice ni za uporabu opažaja. Najjednostavnije rješenje jest podjela baze znanja na dva područja uvjerenja. Takav prostor je naprosto skup iskaza i sam po sebi je baza znanja. Svaka se može koristiti za predstavljanje nekog agentovog uvjerenja. Za razgovor dviju strana tada trebamo dva prostora: jedan za predstavljanje znanja jednog a drugi za predstavljanje znanja drugog agenta Ovo nije realističan model znanja jednog agenta, jer mu daje izravan uvid u znanje drugog agenta. Bolje je sve postaviti relativno na stranu agenta čije ponašanje modeliramo. Uvodimo predikat: UVJ(erenje).
  • 161. Predstavljanje agentovog uvjerenja UVJ(Ivo1,Pas(Fido1)) UVJ(Ivo1, ∀x:Pas(x), Laje(x)) UVJ(Ivo1,UVJ(Ana1, Pas(Fido1)) UVJ(Ivo1,UVJ(Ana1,∀x: Pas (x). Laje(x))) UVJ(Ivo1, UVJ(Ana1, ∀x: Pas(x), Laje(x) ⊃ Oštar(x)) Iskazi u modalnoj logici Prostor 1: Ivino uvjerenje Pas(Fido1) ∀x: Pas(x), Laje(x) UVJ(Ana, Prostor 2) Prostor 2: Ivino uvjerenje o Aninom uvjerenju Pas(Fido1) ∀x: Pas(x), Laje(x) ∀x: Pas(x), Laje(x) ⊃ Oštar(x) Iskazi u prostorima uvjerenja