121 teorija informacije_07-08

INFORMACIJSKA TEHNIKA
Teorija informacije
Predavač: prof.dr.sc. Franjo Jović
Kontakt: franjo.jovic@etfos.hr
tel: 031-224-615, utorak/srijeda11-12h

Satnica i izvođenje nastave
Predavanja: 30-45 h Auditorne vježbe: 8-12 h Laboratorijske vježbe: 8-12h -

Sadržaj predavanja
Pojam informacije. Filozofske osnove. Matematičko izražavanje.
Entropija. Entropija kontinuiranog izvora informacije. Pojavni i
obilježni oblici informacije. Bayesovi i Gittovi stavci. Kapacitet
informacijskog kanala. Shannonov teorem. Železnikarove teze.
Informacija na izvoru, njeno otkrivanje i kodiranje. Obrazac i
opažaj. Markovljev izvor. Kvaliteta izvora. Govorna informacija.
Mrežni agent kao informacijski izvor. Šum i kodiranje na kanalu.
Međuinformacija. Podaci i informacija. Signal i umnožak BT.
Analiza glavnih komponenti informacije. Carnapova entropija.
Klasifikacijski postupci. Statistička i entropijska klasifikacija.
Klastering. Postklasifikacijska analiza. Vrednovanje
semantičkog sadržaja. Mrežni informacijski multiagenti posrednici, osnovica .

Sadržaj vježbi
Kodiranje na informacijskom kanalu. Vlastiti
sadržaj informacije. Proračun entropije.
Proračun semantičkog sadržaja.
Proračun uvjetne entropije. Kodiranje
Markovljevih izvora. Filtriranje podataka.
Klasifikacijska analiza. Klasteriranje složenih
događaja. Projekt mrežnog agenta.
Proračun rizičnosti složenih događaja

Znanje, informacija i osnovna
pitanja filozofije
Uvodno izlaganje
Franjo Jović
Osijek 05.10.2006.

Što je filozofija
Filozofija razmatra cjelinu bitka u
odnosu na čovjeka i istinu koju
obuhvaća dublje od svake znanstvene
spoznaje
Nastupa kod osvještavanja ljudi
Smisao čiste filozofije bez znanosti se
pojavljuje tamo gdje se:
a) stvarnost sagledava u svom podrijetlu
b) stvarnost obrađuje poput unutrašnjeg
razgovora

Što je filozofija/2
c) otvara širina spoznatljivog
d) odvija ljudska komunikacija u
traženju istine
e) razum strpljivo održava budnim pred
onim najstranijim i pred osobnim
ograničenjima
Filozofija nas koncentrira time što nas
održava ljudima u našem sudjelovanju
u stvarnosti.

Podrijetlo filozofije
Pobuda filozofiranja leži u čuđenju,
sumnji, svijesti o izgubljenosti,
primicanju graničnih stanja: smrti,
slučaja, krivice, neoslonjivosti na svijet
Platon i Aristotel su izučavali u
začuđenosti samu bit bitka, Descartes
je u beskonačnosti nepoznatog tražio
ono nužno poznato; stoici su u patnji
sadašnjosti tražili smirenje duše.

Podrijetlo filozofije/2
Pritisak polazi od sigurnog tla do dubine
bitka do počovjekovljenja; ide do
komunikacije čovjek - čovjek.
Priopćenja koja pritom nastaju su
neodvojiva od sagledavanja istine: u
unutrašnjem postojanju, osvjetljavanju
ljubavi, približavanju savršenstvu

Spoznatljivo
Osnovno pitanje filozofije je: Što jest? Što je bitak,
osnovica svega što postoji, živog i neživog, vidljivog i
nevidljivog? Ono iz čega sve proizlazi?
Tales: Sve je voda! ..vatra, materija, duh, duhovno
živuća materija (hilozoizam)
No jesmo li voda koja misli? … To dovodi do
suprotnosti subjekt - objekt. Nema objekta bez
subjekta i obrnuto. Stvarnost je dakle spoznatljivo
koje se u toj suprotnosti pojavljuje. Spoznatljivo ne
postaje predmetom ali dolazi u pojavnost u dualnosti
ja-predmet. U tom promišljanju postoji i drugi rascijep:
predmet u odnosu na druge predmete.

Spoznatljivo/2
Kao razlika prema drugome proizilazi da je bitak
suprotstavljen ništavilu. Predmet ne može biti sve,
dakle ni cjelina bitka. Ni sam bitak. Svako
osmišljavanje nečega je izvlačenje toga iz
spoznatljivog. Dakle to stoji suprotstavljeno ne samo
meni već i drugim predmetima. Spoznatljivo je stoga
ono što se u promišljanju uvijek navještava.
Zamisao je u odnos na predmet neprirodna pojava u
uobičajenom razumijevanju odnosa. Mi želimo s
njezinom pomoći utjecati na vlastitu svjesnost bitka.
Zamisao sama po sebi je prazna, bespredmetna. No
svojim oblikom otvara beskonačne mogućnosti
pojave postojanja i postaje s obzirom na njega
transparentna.

Spoznatljivo/3
Mi promišljamo predmetno, slikovno. Moramo odatle
misleći predmetno postići usmjerenje na
bespredmetno spoznatljivog.
Egzistencijalno smo vezani na Boga /
transcendentalno a to sve putem znakova, simbola.
Božje postojanje je za nas stvarnost putem našeg
postojanja, dok inače postoji u drugim dimenzijama
potpuno različitim od našeg predmetnog svijeta.
Tako se spoznatljivo sastoji od naše svjesnosti po
kojoj smo svi jednaki, od životne stvarnosti po kojoj
smo međusobno odvojeni pojedinci i od egzistencije
u kojoj smo po svojoj snalažljivosti.

Spoznatljivo
Mistici transcendiraju dualnost objekt - subjekt,
poništavaju subjekt i odlaze u transcendentalno, no
ne mogu ga iskazati jer nije predmetljivo, nije izrecivo
Spoznatljivo je dakle:
–
–
–

bitak po sebi
transcendentalost (Bog)
svijet

Transcendentalno
Prorok Jeremija promišlja živog Boga. Grčki filozofi domišljaju
Boga kao pravilo. Oba razmišljanja svode se na to da Bog jest i
da postoji kao obdržavač i stvoritelj svijeta. Današnji filozofi
zaobilaze to pitanje, kao ono: što ne možemo znati radije
prešućujemo. Bog nije pristupačan promišljanjem već
vjerovanjem. Njegovo se postojanje ne može dokazati
matematikom ili empirijskim znanostima. No ni dokazani Bog ne
bi bio Bog već predmet.
Odakle vjera? Iz ljudske slobode. U svojoj slobodi nisam po sebi
samom već sam sebi u njemu darovan; ne mogu svoju slobodu
iznuditi. U svojoj najvećoj slobodi sam slobodan i od sebe i
svoje vezanosti za svijet. Dakle najdublje sam vezan za
transcendentalno. Bog je po meni odlučnost u kojoj postojim.
On je sadašnjost postojanja a ne sadržaj znanja. U njemu je
izvjesnost životne prakse /1,Karl Jaspers/.

Bezuvjetni zahtjev
BZ postoji u ljubavi, borbi, u visoko postavljenim
ciljevima. Obilježje BZ jest da mu je život u cjelini
osnova no ne posljednja. Za ostvarenje BZ je
svejedno odnosi li se na ideju, ljubav ili vjernost. Nije
podložan volatilnosti života. U krajnjoj granici
prekoračuje život i dovodi do gubitka bitka, do
neizbježne smrti. Uvjetni zahtjev se po svaku cijenu
obraća životu.
Sokrat, Thomas Morus, Bruno, umrli su za svoju
istinu
BZ ima svoj korijen u nama samima, s time da me provlači kroz
nešto što nisam samo ja po sebi. To nije ono što se želi nego
ono zbog čega se želi. To je stav vjere, težina jedne duše.

Bezuvjetni zahtjev/2
Razabiremo li mi svoje osnove i ciljeve svojih postupaka
ostajemo u uvjetovanom. Tek život iz nepredmetnog osnova je
života u BZ. BZ je duboko ukorijenjen u ono čime smo ispunjeni.
Opredmećeni BZ je fanatizam i tiranija
Komunikacija zaljubljenih u ljubavnoj bitci - možda i ona može
biti lažna
BZ je vanvremensko. Ono je konstruktivna dobrota.
Zlo nastupa u tri oblika
– kao moralni čin odluke tipa želja / zadaća
– kao etični čin kada odluke BZ stoji u ovisnosti uvjetovanog (čistoća
motiva)
– kao metafizički čin biti motiva: ljubav (od koje se živi) / mržnja
(izvlačenje iz transcendentalnog)

Ostala pitanja filozofije
Što je čovjek
– sloboda, djelovanje, transcendentalnost

Što je svijet
– svijet i prolaznost
– svijet i ono vječno u njemu

Povijest čovječanstva, filozofije, religije
– je li ipak nečastivi pomagač Bogu

Filozofska neovisnost
– Filozof je neovisan od materijalne zapetljanosti, plemena,
asket, nije prestrašen, neovisan o religiji, politici, uređenju
države, smrti
– filozofiranje je škola neovisnosti a ne posjedovanje
neovisnosti.

1.Pojam i matematičko
izražavanje informacije

“Mislim da smo trenutno u predkopernikanskom razdoblju spoznaje i
primjene informacije” Marijan Miković, 2004., osobno priopćenje

Informacija i propast EPR pokusa
Na temelju članka Einsteina, Rosena i Podolskog (1935) “Can
quantum-mechanical description of physical reality be
considered complete?” izradio je John Bell prijedlog provjere
istodobne pojave informacije na udaljenim mjestima npr u
pokusu s polariziranim zrakama svjetlosti. Ovo su spomenuta tri
autora naveli kao nešto nemoguće. Pokus su 1982. godine
izveli Aspect, Roger i Dalibard i pokazali da se informacija
pojavljuje istodobno na udaljenim mjestima, dakle neovisno o
brzini svjetlosti. Ovime je informacija pokazala da posjeduje
svojstvo (barem) četvrte prostorne dimenzije jer se može
iskazati istodobno na bilokojem mjestu treće dimenzije prostora.
Naprosto dolazeći iz njegovog “ne prostora”.
Istodobno i materija(energija) je pokazala da je nedjeljivo
“vezana” uz informaciju! Obje činjenice bile su “previše” za
dotadašnje poimanje stvarnosti.

Informacija i propast EPR pokusa/2
Neovisnost o prostornoj dimenziji 3D prostora čini i striktno čuvanje
informacije te dostup do informacije vrlo osjetljivim ako ne i nemogućim
zahvatom u užem smislu te riječi. Naravno ukoliko je informacija
upakirana u materijalnom aspektu prostora.
Mi smo propašću EPR pokusa dovedeni na “golu ledinu” gdje je samo
pitanje vremena i sredstava kada će apsolutno nedostupna materijalno
pakirana informacija biti stvar prošlosti. Ograničenje će biti naša
spoznajna sposobnost, dakako.

Drugo je pitanje ne posjedujemo li već takva saznanja u
podsvijesti? No informacija u podsvjesti je isto tako i
“nedostupna informacija”. Osim ako nismo vješti u npr
tumačenju snova...

Opažaj - obrazac - informacija
Poučavanje o informaciji je stoga poučavanje o mišljenju.
Poučavanje o mišljenju ne smije biti poučavanje o klasičnoj logici, jer je
logika nešto konkretno i opipljivo, nešto čisto i formalno gotovo poput
matematike. Logika je osim toga samo sukladna mitu u paru logos –
mithos /2, de Saussure Ferdinand/.
U svojoj osnovnoj prirodi logika je alat opažanja, ona ukazuje na ono
implicitno, na proturječno.
Porota se na sudu bavi istraživanjem iskustva zločina. Činjenice
povećavaju opažaj. Logika čini implicitno eksplicitnim.
Eksplicitne činjenice povezuju se u obrazac. U poučavanju obično se
informacija izvlači iz gotovih obrazaca i “suho” predstavlja. Tada naša
pažnja ide brzo prema informaciji.
U stvarnom životu doći do informacije je mučan postupak. Skup. O
tome ćemo ovdje raspravljati. O gruboj tehnici dobivanja obrazaca.
Iz podataka, signala, znakova, zvukova - podsvješću se ne kanimo
baviti. Niti snovima.

Obrazac - oblik - ideja
Obrazac bi mogao biti nešto što se ponavlja, nekakav red,
odnos, nešto što mi opažamo i uspoređujemo s nečim nama
ranije poznatim
Definicija, deBono /3/: Kada se dogodi pokret iz sadašnjeg
stanja u neko sljedeće stanje s vjerojatnošću iznad očekivanog
tada se stvara obrazac:
– ova definicija uključuje aktora obrasca
– moguću ideju o akciji koju on izvodi, te
– moguću posljedicu te akcije
Obrasci mogu biti simultani, sinkronijski ili slijedni, dijakronijski.
Njihovo pojavljivanje u jeziku poput nečega što je “postavljeno
van volje pohranitelja” nešto što više izražava svojstvo duha
nego prirodu stvari /2/. No izgleda da je materijal koji generira
obrazac u prednosti pred Gestaltom, oblikom, da je pojava u
prednosti pred formom.

Obrazac - oblik - ideja /2
De Saussure je izveo dihotomiju jezika (langue) i govora
(parole) iz prvobitnog zajedništva u jezičkoj djelatnosti
(language). Dakle postoji pojedinčev i skupni (povijesni) vid
jezika /2/.
Jezik i kodovi u komunikaciji nisu mogući bez sustava stvaranja
obrazaca. Riječi su kodovi. One pokreću akcije u memoriji
slušatelja. One djeluju kao okidači obrazaca. Riječima se naš
razum vodi od stanja do stanja (preko nespoznatljivih
međustanja).
Po nekim obrascima. Do ideja. Ali i obrnuto: od ideja (iz
nadprostora??).
Prikazuju se dva modela obrasca informacije: model stolnjaka i
model želatine. Zašto su to informacijski modeli?

Model stolnjaka
Mjesto A pokazuje otisak neke
pravilne mrlje
Mjesto B pokazuje otisak
nepravilnog oblika

A

C

Mjesto C pokazuje još veći
nepravilni otisak
Jesu li podaci o prošlim
događajima zapisani?
Jesu li ti podaci lako izmjenjivi?

B

Jesu li podaci međusobno
povezani? Prostorom,
vremenom?

Model želatine

a

b

Dotok tople tekućine otapa sve
više i više želatinu.
Otopljena tekućina u području a
i b se širi.
Kada se područja a i b spoje
sve što padne bit će samo
zajednički doprinos.
Sve što padne izvana neće biti
doprinos.
Koji najvažniji informatički
proces je tu u igri?
Selekcija!

Ideje i informacija
Obrada informacije (gdje je ta informacija koja se izgubila u
podacima) - ili zašto je Napoleon izgubio bitku kod Trafalgara
( pa zbog sporijeg punjenja topova!)
Informacijsko prokletstvo na kineski način- Dabogda živjeli u
zanimljivim vremenima! Ili, ako se bavite tuđom
informacijom/idejom tada se ne bavite vlastitom.
Slika - sve je započelo izgleda jednostavnim crtežima - iako,
prije slika bile su piramide (i samo suglasnici) jedne davne
civilizacije.

Ideje i informacija /2
Riječ ( u početku su riječi bile svete: izgovaranjem riječi
nastajala je pojava) - zato su i Egipćani vjerojatno zazirali od
skraćenicama prikazanih riječi npr. koloid = ko(tač)+lo(tos)
+id(em), no Midianiti se nisu bojali i … nastali su suglasnici, a u
Grčkoj i samoglasnici.
Pismo današnje dobi nastalo je u Feniciji i Grčkoj, no za brojeve
su se pobrinuli Babilonci i - Arapi; pred 5000 godina su Kinezi
davali doktorate iz matematike

...= B ;A

=

Slijede pravila, strojevi, tehnologija, inteligencija, ideje, ljudski
element - tu leži informacija!

Osnovna svojstva informacije
Spontanost, nepredvidljivost, slojevitost, kružnost, povratnost
Informira i biva informirana, protuinformacija - pitanje, prostor
ukotvljenosti, opkoljenosti, proširenje informacije, prag
Nastaje i nestaje, briše se, prekriva, ponavlja,
Serijska, paralelna, paralelna pa serijska
Apsolut, osobnost, bolno spoznajna, svjesna, podsvjesna
Informacija je komunikacija i njen nedostatak,
Vanjska - unutrašnja, povjerljiva, javna, nedostupna,
nespoznatljiva, jednostavna, tajanstvena, simbolična,
prosvjetljenje, razum, moć
Informacija je riječ koja bijaše na početku, izraz više sile,
unutrašnji glas...

Osnovna svojstva
informacije/2
Informacija je činjenica, detalj, laž, promidžba, instinkt, intuicija
Informacija je u pozivu, djelovanju, volji
Informacija je univerzalna, ćudljiva, (ne)dohvatljiva
Provjerava se informacijom, pitamo se što je to, bojimo se moći
informacije, krijemo je
Pojavljuje se na začudnim mjestima i skrivenim putovima, u
postupku koji je entitet i proces istodobno, događanje i
prestanak događanja,
Informacija je nadzor, vođenje i povratna veza; šum i smetnja
su informacija,
Nevidljiva je i sveprisutna, ona je sve to rečeno i puno više
Nastaje voljom i razumom.
To je fundamentalna veličina, ni energija niti materija

Nastanak i spremanje
informacije
Pojam informacije osnova je za mnoge znanosti i tehničke
discipline: kibernetiku, automatiku, biologiju, povijest, teologiju,
ekonomiju, proizvodne tehnologije, filozofiju
Osnovni Shannonov teorem koji pojam informacije uspješno
veže uz vjerojatnost pojave pojedinih znakova, riječi komentira
Karl Steinbach: “To je kao kada biste smatrali kilogram zlata i
kilogram pijeska jednako vrijednim”
Norbert Wiener piše: “Informacija je informacija ni materija niti
energija”
Gittov 1. stav: Fundamentalnu veličinu informaciju ne možemo
pripisati materiji.
Ovime se “čisti” materijalni procesi isključuju kao izvori
informacije.

informacije/2
Stav 2: Informacija nastaje samo putem volje (nakane)

I  vd2
Inf.

Volja

No informacija iz nekog izvora je to bolja što je veća inteligencija
i znanje tog izvora, dakle informacija = inteligencija (d) * znanje
(d) * volja (v) = v*d2

informacije/3
Povezivanje volje informacije i inteligencije / znanja odražava
pojavu na izvoru informacije. Osnova priopćenja informacije je
volja pojedinca. Veća volja daje veći učin. Konstanta
proporcionalnosti ovisi o umnošku inteligencije i znanja autora
informacije. Ovo je intuitivni model, dakako.
Informacija služi svrsi vođenja sustava u kojem je stvorena,
radom ne slučajem. Dakle informacija je nešto blisko politici, ali i
tehnici, medicini, pravu.
Stav 3. Pri svim tehničkim i uopće umjetnim sustavima
informacija tvori njenu nematerijalnu osnovicu.
Informacije se može pohranjivati na materijalnu osnovicu,
štoviše, idealno je upravo ono pohranjivanje gdje se modificira
određena (prostorna) dimenzija materijalnog medija drugom
dimenzijom informacijskog svijeta (vremenom)

Razine, oblici i vrste informacije
Pet je različitih vidova informacije: statistika, sintaksa,
semantika, pragmatika i apobetika. Primjer govorne informacije:
abeceda
rječnik
jezik
informacija

a, b, c

Ivo

kôd

Ivo gleda

gramatika

:Ivo gleda

smisao

akcija?

Razine, oblici i vrste informacije/2
Statistički vid određuje kvantitetu, količinu informacijskih
znakova, predanu ili primljenu, brzinu protoka znakova,
znakovnih grupa, riječi.
Gramatička točnost i jasnoća informacije pri tome nije bitna, jer
se svaka pogreška u prijenosu jednako tretira.
Informacija se obrađuje posredno preko vjerojatnosti
pojavljivanja informacijskih znakova.
Statistički vid osnovica je mjerenja informacije. Kako se to može
obaviti? Pa preko statističke mjere: relativne frekvencije
pojavljivanja informacijskih znakova.

Iza oblikovanja znakova, slova, grafema, fonema u riječi,
simbola, stoji sintaksa (syntaxis - poredak, order, Anordnung).
Pravila se odnose na znakove pisanih jezika, kodne signale,
slikovne znakove, notno pismo, računalne kodove, genetičke
kodove, plesne znakove pčela, mirisne znakove kukaca,
znakovlje gluhonijemih. Pravila se uče ili nasljeđuju.
U sintaksu spadaju pravila pisanja, izbor simbola i njihovih
kombinacija, pravila biranja riječi, tvorbe rečenice, načini na koje
se rečenica mijenja. Gramatika. Na razini koda se odražava i
odlučuje o tome ima li predloženi sustav kreativnu ili samo
reproduktivnu značajku.
Kreativni kodovi imaju u pravilu sintetička, integrativna,
asocijativna a reproduktivni analitička, disocijativna svojstva.

Razine oblici i vrste informacije/4
Semantika (semantikos - obilježavajući, sema = znak) je
smisao, sadržaj, poruka, iskaz, značenje niza znakova, riječi
neke poruke.
Stav 4: samo je ono informacija što sadrži (barem) semantiku,
značenje.
Ovo znači da odašiljatelj (i primatelj) informacije posjeduju
određeni duhovni koncept, kojim je moguće prihvatiti značenje
informacije.
Tek se postojanjem jezika informacija može pohranjivati na
materijalnim nositeljima. Informacija je nepromjenjiva bez obzira
na vrstu prijenosnog medija ili sustava zapisa. Ova
invarijantnost uzrokovana je njezinom nematerijalnom prirodom.

Razine, oblici i vrste informacije /5
Razlikujemo:
prirodne jezike (preko 5000 jezika)
umjetne jezike (esperanto, gluhonijemi, zastavice, prometna
pravila),
umjetne formalne jezike (programski, matematički, logički,
kemijski, notni),
posebne jezike tehnike, znakovni jezik nacrta,
posebne jezike žive prirode (dupini, glavonošci, pauci, ..)

Kodiranje značenja u prirodnim i umjetnim jezicima postiže se
pojedinim ili složenim djelovanjem sljedećih sredstava:
–
–
–
–
–
–

oblikovanjem
stilistikom
fonetikom
intonacijom
gestikom
semantičkim sredstvima: homonimima, homofonima, metaforama,
metonimijama, ironijom, anomalijom,…

Pri tome su predajnik i prijemnik ili inteligentno biće
ili inteligencijom stvoreni umjetni sustavi.


Pragmatika (pragmatike - vještina ispravnog rukovanja)
Svaki prijenos informacije ima za cilj ili nakanu izazvati na
prijemnoj strani odgovarajući učin, događaj. Da bi to postigla
predajna strana se služi: molbom, pitanjem, kukanjem,
poučavanjem, opominjanjem, pritiskom, naredbom, a sve u cilju
rukovanja predajnom stranom.
Informacija se stoga može nazvati i strukturom koja na
predajnoj strani izaziva određeni učin. Ona je manipulativna.
Možemo razlikovati
– kruto postupanje,

kao kod programiranja strojeva, izgradnje stanice, funkcija disanja,
instinktivno rukovanje
dresura životinja

Pragmatika - fleksibilno i kreativno rukovanje
informacijom
–
–
–
–

uvježbano rukovanje ljudima, oblici učtivosti, kretnje obrtnika
jednostavno djelovanje ljudi
intuitivno nastupanje ljudi
inteligentno ponašanje ljudi slobodne volje

Sva navedena ponašanja rezultat su upravo
primljene informacije, dakle
komuniciranja, ali i onog naučenog,
iskustvenog.

Apobetika (apobeinon - događaj, uspjeh, rezultat)
razmatra svrhovitost, cilj odašiljanja informacije.
Primjeri su kod životinja osiguranje životnog prostora,
kod ljudi su potreba komunikacije i dogovora o
zajedničkom cilju, životu.
Uvijek se u slučaju naglašavanja ili potiskivanja cilja
treba biti oprezan, jer se radi o najvišem vidu
prijenosa informacije, pa i šteta za primatelja može
biti najveća.

Dakle izvoru informacije treba posvetiti dužnu pozornost! Kod
informacije nekog izvora specifičan je!
Izbjegavanje dohvata informacije je opasno, jer smo bez
informacije neupućeni.
Dohvaćanje informacije je opasno, jer nas dobivanje informacije
kada je nismo spremni primiti može “satrti” - stoga u pravilu
vrijedi:

Kada je čovjek spreman da je primi - informacija
dolazi. Skrivanje od informacije je također opasno!
No suprotstavljeni koncepti se utjelovljuju i sukobljavaju opet u živom
dijalogu! U dijalogu autora (duha) i junaka (duše). Život je konflikt.
Konflikt je prirodan.

Kvalitete izvora informacije
Kvaliteta izvora Kval. semantike i Kvaliteta
pragmatike
događaja
Zamisao rješenja, Cilj
Inteligencija

Genijalnost

funkcije
Optimalnost,
strategija
Vrijeme provedbe

Stanje znanja

Tehnologija

Funkcija

Domišljatost

Programiranje

Scenarij

Bogatstvo ideja

Minijaturizacija

Nakana
Smisao

Vrste informacije:
Proizvodna, pogonska, komunikacijska
Podrijetlo informacije:
– kopirana informacija (CD, DNK, fotokopija, reprodukcija
slike), u pravilu se svakim kopiranjem nešto gubi; zašto?
– reproduktivna informacija (interpretacija teksta, glazbe, dijela
softvera), u pravilu se svakom reprodukcijom nešto dobiva;
zašto?
– kreativna informacija: voljom, sposobnošću i talentom
pojedinca nastaje nova vrijednost poput jezika, teksta, koda,
sustava, glazbe, slike, patenta, postupka, saznanja.

Poseban oblik informacije je hologram. Izgleda da je DNK jedan
vid holograma. Osnovno svojstvo holograma je zapisivanje
informacije u nižoj dimenziji prostora. Tako se 1D hologram
može rabiti za zapis 2D podatka, 2D za zapis 3D itd. Drugo je
svojstvo integrativnost: iako se dio holograma može izgubiti
sadržaj ostaje. Treće svojstvo je linearnost: hologram čuva
spremljeno vjerno reproducirajući osnovni oblik.
Može se očekivati veća uporaba ovog vida pohrane i aktiviranja
informacije. Aktiviranjem holograma događa se i mogućnost
promjene sadržaja (relaksacije) u smislu smanjenja
hologramskog “šuma”. Na taj način se, uz ostalo brane i naše
stanice od smetnji izazvanih izgaranjem ATP-a, toksikacijom ili
napadom virusa.

Primjer relaksacije holograma:
nerelaksirani hologram s greškom

relaksacija

relaksirani oporavljeni hologram

Kvaliteta i korisnost
informacije
Informacija može biti upotrebljiva ili neupotrebljiva
što ovisi o okolnostima.
No bez obzira na to ona može biti po svojoj mjeri samo
kvalitativnog a nikako kvantitativnog značenja.
Po svojoj semantičkoj vrijednosti i korisnosti razlikujemo
pet stupnjeva vrednovanja:
izuzetno važnu, važnu, korisnu, beskorisnu i štetnu informaciju.
Ova procjena je često stvar pojedinca, iako postoje posve jasni
etički obrasci koji su podloga procjeni. Postoji savjest.

Kvaliteta i korisnost informacije/2

Izuzetno važna informacija: visoki sadržaj apobetike
Važna informacija: značajna za postizanje cilja
Korisna informacija: općeg značenja, u smislu
kontakta, izobrazbe, zabave, dnevnih događaja
Beskorisna informacija: općeniti podaci, banalnosti,
besmislene novosti, gubitak vremena
Štetna informacija: inf. s negativnim posljedicama ,
vodi k zabludama, štetnim događajima, defektima a
postiže se svjesnim ili u zabludi datim iskazima,
lažima, podmetanjima, šarlatanstvom, ljutnjom,
sektašenjem, ideologizacijom, šundom.

Važnost i korisnost informacije
Korisnost je objektivna
komponenta informacije
– vrijedi za većinu ljudi
– nije upotrebljiva ako ne
postoji ili nije ostvariva
– često neotkrivene
činjenice
– neobjavljena inf.
– zaboravljena inf.
– beskorisnost je vezana i
za nemogućnost
djelovanja

Važnost je pojedinčeva
komponenta informacije
– važnost za pojedinca nije
isto što i za neku drugu
osobu
– općenita važnost inf. je
samo relativno važna
pojedincu
– velika većina inf. je
pojedincu irelevantna
– velika je važnost
pojedincu svaka njemu
štetna informacija

Vrednovanje semantičkog sadržaja informacije
Veličine koje obuhvaćaju semantičku kvalitetu informacije u cilju
njene možebitne kvantifikacije ili barem relativne usporedbe su
semantička kvaliteta q
relevantnost r
novost (aktualnost) a
dostupnost z
postojanje e
To su semantičke veličine osobnog značaja informacije,
korisničke
Kreću se dogovorno u rasponu od 0 do 1 osim q koji se prema
ranije navedenom kreće u rasponu q = (1,-1)

Vrednovanje semantičkog sadržaja informacije semantička kvaliteta
Mjera semantičke kvalitete obuhvaća težinu značenja. Posebno
se odnosi na tzv proizvodnu upotrebljivost informacije, poput
učinkovitosti primijenjenog algoritma u računalu, smanjenjenju
memorijskog prostora i vremena obrade, prenosivost programa,
pouzdanost programa, primijenjenom programskom jeziku i sl.
Koliko pojedini elementi ovog vida informacije utječu na samu
kvalitetu informacije ovisi i o subjektivnim procjenama, ali i o
objektivno zatečenom stanju.
Informacija bez kvalitete, prazna informacija ima q = 0,
najkvalitetnija informacija ima q = 1, a najštetnija informacija ima
q = -1

Semantička relevantnost i važnost
Kod informacije posebno se naglašava osobni interes koji
donesena informacija daje korisniku, njegovom ostvarenju cilja,
osobnom cilju
Ono što osobi A može biti izuzetno važno, dakle rA = 1, može
osobi B biti potpuno nevažno, dakle može imati rB = 0
Stoga je procjena iznosa parametra relevantnosti od strane
neinformiranih promatrača za nepoznate osobe težak zadatak.
Tako je npr prognoza vremena za zapadnu Australiju
prosječnom hrvatskom gledatelju televizije potpuno irelevantna.
Naprotiv, ako netko odavde putuje rođacima u zapadnu
Australiju rado će pogledati na TV prognozu vremena i uopće se
upoznati s tamošnjim vremenskim prilikama.
Za tehnološke procese je relevantnost nebitna, jer nemaju
osobni značaj - ili ne bi trebali biti tako projektirani.

Aktualnost
U mnogim je područjima života potrebno relevantnu i važnu
informaciju dostaviti pravodobno.
Podatak o zastarjeloj informaciji, “lanjskom snijegu”, ima iznos
a=0
Visokoaktualna informacija ima a = 1.
Za tehnološke procese je aktualnost nedvojbena i trajno
konstantna veličina s a = 1, pa se niti ne procjenjuje posebno.
Opadanje iznosa aktualnosti zavisi o vremenskim konstantama pojava
na koje se odnose - već i mali prekid govora ili glazbe je štetan
Tako su geološki podaci iako izuzetno stari još uvijek aktualni
Istraživanjem nekih starih događaja se parametar aktualnosti mijenja
Osobito kada se pravilnosti pojavljivanja mogu protegnuti na današnje
događaje - dakle nešto davno može postati vrlo aktualno.

Dostupnost
Ni najvažnija informacija ako nije dostupna nema vrijednosti,
dakle za nju je z = 0.
Informacija koja je potpuno dostupna ima iznos z = 1.
Baze podataka, biblioteke, informacijski centri, računarske
mreže, internet povećavaju dostupnost informaciji.
Nedostupnost se povećava zaštitnim kodom, klauzuriranosti
informacije u pravu, medicini, filozofiji te namjerne
klauzuriranosti kod nedostupnih, tajnih ili štićenih podataka
poput industrijske svojine ili poslovnih tajni. Nedostupnost može
biti i mjera manipulacije.
Industrijski podaci moraju biti dostupni operatorima, tehnolozima
ili voditeljima smjeni, iako selektivno. Smatra se da je
dostupnost u proizvodnim procesima jednaka jedinici.

Postojanje
Postojanje informacije je pitanje da li informacija uopće postoji
na svojem izvoru (ili materijalnoj kopiji).
Potpuna upitnost postojanja izražava se iznosom parametra e =
0.
Potpuna poznatost, osvjedočenost postojanja izražava se
iznosom parametra e = 1.
Tako je pitanje postojanje terapije raka želudca između 0 i 1, a
isto to kod raka jetre jednako je ništici.
Procesni i tehnološki podaci smatraju se da redovito postoje,
iako često preko posrednog mjerenja.
U teoriji sustava smatra se da neki podaci postoje iako nisu
izmjerivi. Do takvih se podataka ne može dostupiti.
U principu možemo reći da svi podaci na neki način postoje
(Bayes).

Mjera semantičkog sadržaja primjer

Postojanje

Dostupnost

Aktualnost

Relevantnost

PROCES
INTERNET
VISOKA ŠKOLA
Kvaliteta

1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0

Mjera informatičkog sadržaja
Pretvorbom tabličnog u pentagramski oblik dobiva se za
površinu izraz
A = F sin720 (ra+az+ze+eq+qr) / 2
(1)
Nadopuna 1: faktor potpunosti F koji je jednak ništici kada su q,
ili r ili a ili z ili e jednaki ništici a inače je F jednak jedinici. Dakle,
ne smatra se informatičkim sadržajem kada ne postoji neki od
parametara.
Nadopuna 2: na iznos parametra q koji može biti između -1 i 1
Normalizacija na iznos semantičke mjere jednake maksimalno
100 ili -100 dobiva se relacijom
S = 20 ( ra +az +ze + e|q| + |q|r) F sign q
(2)
Izrazite mjeru informatičkog sadržaja iz prethodnog primjera!

2. Entropija kontinuiranog
izvora informacije

Zalihost
Zalihost ili redundancija jest postojanje nekog detalja, koda,
poruke, signala kanala ili sustava više nego što je najnužnije
potrebno za predstavljanje ili prijenos tražene informacije.
Prijenosom redundantnog signala na primjer, dolazi do
neučinkovite uporabe kanala, jer ne prenosi informaciju na
svojoj najvećoj brzini
Prikažemo li npr. signal DA i signal NE sljedećom shemom
–
–
–
–
–
–

DA : ++--NE : +-+-+
dobivamo dosta zališnu shemu jer bi zadovoljilo i
DA : +
NE : Dakle imali bismo pet puta brži prijenos ili manji prostor skladištenja
podatka

Prednost zalihosti
U slučaju smetnji ili šuma postoji bolja mogućnost
ispravne interpretacije

t

*Kontrolirana ekspanzija informacije daje potpuniji
opis
procesa na izvoru informacije

Zalihost u tehničkoj praksi
Zalihost ponavljanjem u vremenu
– ponavljanje poruke u vremenu u slučaju otkrivanja pogreške
– periodičkim slanjem poruke
Zalihost ponavljanjem u prostoru
– slanjem poruke u više kanala
– bilježenjem podatka na više mjesta
Zalihost ponavljanjem u frekvenciji
– slanjem poruka na više frekvencijskih područja
Zalihost u funkciji
- ponavljanjem uređaja, ili kritičnih dijelova uređaja
- ponavljanjem softvera ili više načina uporabe softvera

Uzorkovanje redundantnog signala
Dobivaju se manje redundantni podaci
Uzorkovanje frekvencijom višom od Nyquistove
Primjer:
–
–
–
–

a) originalni podaci(V): 2,56 2,05 2,98 8,01 4,87
b) zaokružene vrijednosti(V): 3, 2, 3, 8, 5
c) kodirani iznosi: --++, --+-, --++, +---, -+-+
d) niz impulsa u prijenosu / zapisu : --++--+---+++----+-+

Navedite razliku broj bitova nizova a) i d) !

Diskretni informacijski izvor
Izvor koji proizvodi konačan broj poruka naziva se diskretnim
izvorom informacije
Poruka može biti za početak znak poput slova, ili riječ kao
smislena kombinacija znakova
Kontinuirani izvor poput temperaturnog detektora ili mikrofona
proizvodi neizmjerno različiti skup znakova. No većina od tih
znakova beznačajna je za korisnika voditelja procesa ili
slušatelja glazbe
Pretpostavimo za početak da su uzastopne poruke diskretnog
informacijskog izvora međusobno neovisni događaji
Iznos informacije za svaki znak- poruku jednaka je
– I = log (aposteriorna vjerojatnost/ apriorna vjerojatnost) (3)
– vjerojatnosti se odnose na pojavljivanje datog znaka - poruke

Ukupna informacija diskretnog izvora
Kada nema šuma brojnik je u izrazu (3) jednak jedinici tj sigurno
smo primili poslani znak, pa ostaje samo apriorna vjerojatnost
pojave nekog znaka
Stoga možemo izraziti ukupnu informaciju koju očekujemo od
niza duljine n od k različitih znakova s poznatim apriornim
vjerojatnostima pojave i-tog znaka P(i) kao
Ukupna informacija = - n Σ P(i) log P(i)
(4)
gdje suma ide po svim k različitih znakova
Prosječna informacija po znaku jednaka je entropiji tj
H = -Σ P(i)log P(i) 1 < i < k
(5)
Entropija diskretnog izvora uvijek je manja od navedenog izraza.
Zašto?

Entropija složenog događaja
Vjerojatnost pojave dvaju uzastopnih znakova i j
H(ij) = - ΣΣ P(ij) log P(ij) 1<i,j<n
(6)
Opći iznos entropije nekog znaka kada je poznat njegov
prethodnik jednak je
H(j/i)= - ΣΣ P(ij) log P(j/i)
(7).
Vrijedi također
H(ij) = H(i) + H(j/i)  H(i) + H(j)
(8)
Gornji se izrazi odnose i na izvore koji emitiraju znakove
potpuno nezavisno.
Razmotrimo slučaj gdje dva izvora označeni s i j istodobno
proizvode znakove: izvor i proizvodi znakove A,B,C a izvor j
proizvodi D,E,F, G
– data je tablica vjerojatnost P(i) te uvjetne vjerojatnosti P(j/i)

Tablica uvjetnih vjerojatnosti složenog događaja

A

C

1/2

P(i)

B
1/3

1/6

P(j/i)

D

1/4

3/10

1/6

P(j/i)

E

1/4

1/5

½

P(j/i)

F

1/4

1/5

1/6

P(j/i)

G

1/4

3/10

1/6

Tablica vjerojatnosti složenog događaja
-

A

B

C

D

1/8

1/10

1/36

E

1/8

1/15

1/12

F

1/8

1/15

1/36

G

1/8

1/10

1/36

Entropija složenog događaja
Iz (6) slijedi H(ij) = 3,416 bit/znak
Iz (5) slijedi H(i) = 1,461 bit /znak
Iz (7) i prethodnih tablica slijedi
H(j/i) = 1,956 bit/znak
Dakle vidimo da vrijedi relacija (8).
Ako bismo računali entropiju izvora j (ovo nije jednostavno jer
nemamo nigdje eksplicite dato pa računamo preko uvjetnih
vjerojatnosti P(D) = P(A)*P(D/A) + P(B) * P(D/B)+ …,) dobili
bismo
H(j) = 1,977 bit /znak što bi dalo maksimum entropije
H(ij)max = 3,458 bit/znak
Pitanje: Jesu li to jako povezani izvori? Koliko?

Entropija diskretiziranog kontinuiranog
izvora
Neka su vjerojatnosti diskretiziranog izvora informacije date
tablicom
i= 0
1
2
j=0 9/11
1/8
0
j=1 2/11
3/4
2/9
j=2 0
1/8
7/8
Vjerojatnosti p(0)=11/36, p(1)=4/9 , p(2)=1/4 računaju se iz
površina ispod funkcije gustoće vjerojatnosti.
Odatle je H(i) = 1,542 bit/impuls
Računanje P(ij) = P(i)*P(j/i) daje P(00)=1/4, P(01)=1/18,
P(02)=0, P(10) = 1/18, P(11) = 1/3, P(12)=1/18, P(20)=0,
P(21)=1/18 P(22)=7/36. Odatle je H(j/i)=0,890 bit/znak, te je
razlika 0,652 bit/znaku zbog međuznačnog utjecaja.

Entropija kontinuiranog izvora

Kontinuirani izvor ima kontinuiranu funkciju gustoće vjerojatnosti
p(v)
Ako uzmemo po analogiji s diskretnim izvodom diferencijal
vjerojatnosti dv dobivamo za entropiju izraz
- Σ p(vj) dv log (p(vj) dv) =
=lim dv-0 -( Σ p(vj)(log p(vj)) dv + lim dv-0 -Σ p(vj) (logdv)dv =
= - Ϊ p(v)log p(v) dv - lim dv-0 Σ p(vj)(log dv) dv (9)
Kako dv0 drugi izraz teži u beskonačno jer log dv teži u minus
beskonačno. Ako izostavimo ovaj član ono što možemo
izračunati prvim članom je samo relativni iznos entropije.
Računanje entropije za svaki konkretni slučaj mora uzeti u obzir
i drugi član u izrazu (9). Npr ako pojačamo signal faktorom dva
onda i dv biva dva puta veći pa je log1/dv= log2 + log 1/2dv
odnosno za jedan bit manji!

Rasprava o entropiji kontinuiranog signala
Signali su ograničeni frekvencijskim pojasom. Kada se njihova
funkcija distribucije postavi kao uniformna onda se postiže
maksimum entropije signala.
Kada signal ima maksimum entropije onda je maksimalan
prijenos bitova po znaku!
Druga je stvar kako se ponaša omjer signal/šum.
Tu trebna očito težiti manjim pojačanjima šuma kada je signal
manji. Inače se dobiva manji omjer signal /šum.
Za signale Gaussovskog tipa ograničene snagom N je
H = c * log N
(10)

Teleonomska entropija
Ciljna ili teleonomska entropija razmatra entropiju pojedinačnih
objekata u nekoj ciljnoj strukturi. Npr. raspored stolaca u
učionici. Mjera podjele prostora u tom slučaju određuje
prostorne segmente tzv Voronojeve dijagrame koje “zauzima”
pojedini predmet. Odnos veličina tih prostora i njihova razdioba
prema traženoj ciljnoj raspodjeli određuju trenutno stanje ciljne
entropije. Teleonomsku entropiju je prvi izrazio filozof Rudolf
Carnap (1956). Ona obuhvaća izračun prostora stanja
informacije prema prostoru željenog stanja informacije.

3. Informacija i informacijska
mreža

Proces, mreža i obrada podataka
Obrada podataka i proizvodni proces / usluga povezuju različite
vrste komunikacija.
U procesu se spontanim odvijanjem procesnih događaja
povećava entropija. Svrhovitom obradom tih podataka i
djelovanjem na proces postiže se ponovno smanjenje entropije
u sustavu. To su povoljni, korisni informatički procesi. Postoje i
nepovoljni procesi kod kojih se na pojavu smanjenja entropije
djeluje suprotno tome, izaziva nered i šteta.
Opća shema:
–

proces

mreža

obrada podataka

Entropija u sustavu s obradom i komunikacijom
Entropija se u sustavima održava na razini prirodne entropije tj
raste bez djelovanja u suprotnom smjeru
Entropija u sustavu s obradom podataka, informacijskom vezom
te efektorima u procesu se općenito smanjuje i održava na
razini ravnoteže procesne degradacije i informacijske akcije
U prijelaznim režimima kada se tek uspostavlja informacijska
obrada sustav teži iz stanja veće u stanje manje entropije.
Sustav s obradom informacije i efektorima u procesu kada
djeluje pod štetnim utjecajima povećava svoju entropiju do
razine djelovanja tih sila
Sustavi su redovito u ravnoteži prirodne entropije, sila za
smanjenje i sila za povećanje entropije.

Informacija i entropija u sustavu
Slučaj 1. Korisna informacija je veća od entropije - ukupna
entropija u sutavu pada
Slučaj 2. Korisna informacija je jednaka entropiji u sustavu entropija sustava je u ravnoteži
Slučaj 3. Korisna informacija je manja od entropije u sustavu entropija sustava raste
Korisna informacija uključuje lanac: izvor informacije - prijenos i
obrada podataka - odluka i djelovanje u povratu na proces /
izvor
Informacijski kanal je usmjerena veličina s najmanje jednim
izvorom i najmanje jednim odredištem; sadržava izvor, koder
informacije, koder kanala, prijenosni sustav, dekoder kanala,
dekoder informacije i odredište - prijamnik.

Informacijski kanal
Informacijski kanal ima semantičku bazu koja je zajednička za
izvor i korisnika, odredište
Pragmatika i apobetika se pri tome mogu značajno razlikovati
U tehničkom i informacijskom smislu razlikujemo kanale sa ili
bez memorije, dakle kod kojih se prijenos informacije u nekom
trenutku ne uvjetuje prethodnim prijenosom (znakom)
Isto tako lučimo stacionarne i nestacionarne kanale, dakle
kanale kojima se svojstva mijenjaju odnosno ne mijenjaju s
vremenom
Fizička i tehnička podrška informacijskom kanalu je vrlo različite
prirode poput telefonske veze, telegrafa, satelitskih, radijskih
komunikacija, do, po vlasničkom principu i izgradnji, različitih
namjenskih ili vlasničkih mreža

Osnovni parametri informacijskog kanala
Kanali se razlikuju po kašnjanju u prijenosu, propusnoj moći,
cijeni, pouzdanosti, kvaliteti usluge.
Komunikacijska mreža čini barem 40% ukupne cijene nekog
tehnološkog projekta - ako se gradi iznutra
Kašnjenje u sustavu zbog obrade dato je srednjim vremenom
Tw
– Tw = Tx - u
(11)
– gdje su Tx srednje vrijeme odziva kanala / sustava a u je vrijeme
obrade u čvorovima sustava

4. Bayesov teorem i Bayesov stavak
Ako postoji događaj A, P(A)>0, pokušajmo odrediti kolika je
vjerojatnost da neki drugi događaj B poprimi svojstvo događaja
A.
Dakle P(B/A) = P (AB) / P(A)
(12)

–B
AB

A

Složeni događaj
Ako je B neki događaj koji se prostire preko više područja A
onda vrijedi P(BA1)+P(BA2)+… +P(BAn) = P(B)
(13)
Odnosno
P(B)= P(B/A1)P(A1)+P(B/A2)P(A2)+…+P(B/An)P(An) (14).
Obrnuto da događaj A poprimi vrijednost događaja B je
P(A/B)=P(AB)/P(B)
(15).
Kako je P(AB) = P(BA) to vrijedi
P(A/B)=P(B/A) P(A) / P(B)
(16)
Poopćenje za Ai ti događaj daje
P(Ai/B)=P(B/Ai)P(Ai) / ( P(B/A1+…+P(B/An)P(An))
(17)
što se zove Bayesov teorem koji povezuje apriornu i
aposteriornu vjerojatnost tj vjerojatnosti prije i nakon pojave
događaja Ai.

Bayesov teorem - primjer
Izvor informacije šalje s jednakom vjerojatnosti p=0,5 jedan od
dva znaka 0 ili 1. Znamo s vjerojatnosti 0,001 da je moguće
bilokoji od ova dva znaka krivo interpretirati. Dobili smo 1. Koliko
je sigurno jedinica i poslana?
P(A1/B)= 0,999 0,5 /(0,999 0,5 + 0,001 0,5) = 0,499/0,5 = 0,999
Dakle zbog jednake vjerojatnosti odašiljanja aposteriorna
vjerojatnost jednaka je apriornoj. Što bi bilo da je p0=0,2?
Bayesov stavak : Makako malo vjerojatan događaj ipak ima
određenu iako vrlo vrlo malu vjerojatnost pojave.

5.Binarni simetrični kanal
Kanal: bez memorije, dio je informacijskog sustava i stacionaran
je.
Na ulazu je skupina znakova A (a1,a2,a3,…aq) a na izlazu
skupina znakova B (b1,b2,b3,…,bs). Ulazna abeceda je veća
zbog mogućnosti ispravljanja greški redundancijom u kodu.
Kanal opisuje skup uvjetnih vjerojatnosti P(bj/ai) =Pij tj
vjerojatnosti da neki ulazni znak ai bude interpretiran kao izlazni
znak bj.
Dakle imamo shemu:
p(a1)P11+p(a2)P21+ …+ p(aq)Pq1= p(b1)
….
p(a1)P1s+p(a2)P2s+…+ p(aq)Pqs=p(bs)
Ako kanal nema smetnji onda je za svaki i jedan Pij=1 a svi
ostali jednaki su ništici. Tada je p(bj)=p(ai).

Binarni simetrični kanal sa šumom/2
Rabimo sada Bayesovu formulu tj
P(ai/bj)=P(bj/ai)p(ai) / Σ P(bj/ai)p(ai)=P(bj/ai)p(ai)/p(bj)
(16)
Svaki ulazni znak izaziva pojavu nekog izlaznog znaka.
Problem je što mi ulaz ne poznajemo!
Binarni simetrični kanal: p(a1=0)=p, p(a2=1)=1-p
a1=0, a2 =1
P00=P11=P
b1=0, b2=1
P10=P01=Q

Što je Q? Kako ga možemo mjeriti?

Binarni simetrični kanal/3
Uz uvjet da znamo koji je znak primljen treba odrediti
vjerojatnost odašiljanja različitih znakova tj
P(a=0,b=0)= Pp/ (Pp+Q(1-p))
P(a=1,b=0)=Q(1-p) / (Pp+Q(1-p))
P(a=0,b=1)=Qp/(Qp+P(1-p))
P(a=1,b=1)=P(1-p)/(Qp+P(1-p))
(17)
Za P=0,9 Q=0,1 p(0)=19/20 p(1)=1/20 dobivamo iz (17)
P(a=0,b=0)=171/172, P(a=1,b=0)=1/172, P(a=0,b=1)=19/28 te
P(a=1,b=1)=9/28.
Proizlazi da se, za navedeni primjer, bez obzira na to koji je
znak poslan mora pretpostaviti da je poslana ništica! Isto je tako
veći utjecaj izbora znakova na kanalu od šuma na kanalu.

Entropije diskretnog kanala sa šumom
Zamisao entropije može se primijeniti na ulazni i izlazni niz znakova,
H(A)= Σp(ai)logp(ai), H(B)=Σp(bj)logp(bj)
(18)
Za uvjetne entropije H(A/B) iz
H(A/bj)= Σ P(ai/bj) logP(ai/bj)
H(A/B)= Σ p(bj) H(A/bj)=ΣΣ P(ai,bj)logP(ai/bj)
H(A,B)=ΣΣ P(ai,bj) log P(ai,bj) … slikom

H(A)

H(A/B) I(A,B) H(B) H(B/A)

H(A,B)

Entropije diskretnog kanala sa
šumom/5
Vrijedi:
H(A/B)≤ H(A), H(B/A)≤H(B)
H(A,B)=H(A)+H(B/A)=H(B)+H(A/B)
H(A)+H(B) = H(A,B) za nezavisne A i B
Transinformacija I(A,B)= H(A)+H(B) - H(A,B)
(19).
I(A,B)=H(B)- W
W=ΣB P(b/a) log(1/ P(b/a))=Plog(1/P)+Qlog(1/Q)=H(P) (19a)
I(A,B)=H(B)-H(P), uz p(b=0)=pP+(1-p)Q=x te p(b=1)=1-x slijedi
I(A,B)=H(x)-H(P)
Kapacitet C=maxAI(A,B)=1-H(P)
(19b),
jer je max(H(x)) jednako 1 za x=1/2

6. Markovljev izvor, kodiranje na izvoru,
procesni izvori
Izvori podataka često traže prilagodbu zbog svojeg optimalnog
kodiranja. To se naziva kodiranje na izvoru.
Uobičajena pretpostavka da su vjerojatnosti pojavljivanja
znakova međusobno neovisne je dosta gruba i netočna.
Uključuje zapravo gubitak memorije između pojava pojedinih
znakova
Uključenje memorije svojstvo je izvora Markovljevog tipa. Dakle
vjerojatnost emitiranje nekog znaka ovisi o prethodnim
znakovima, tj
P(ai u intervalu t/ aj u intervalu t+1) = P(an u intervalu t-n,…,
ai u intervalu t/ aj u intervalu t+1)
(20).
Markovljev proces je određen kada se zna početna raspodjela
vjerojatnosti pojave znakova pj i matrica prijelaza izmedju
svakog od znakova. Element matrice pij označava vjerojatnost
da se iza znaka ai šalje znak aj.

Markovljev izvor /2

Da bi izvor podataka Markovljevog tipa bio stacionaran mora biti
ispunjeno
pj = Σ pi *pij j=1,2,…a
(21),
odnosno u matričnom obliku
ΠT pij = pij
(22),
gdje je T oznaka za transponiranu matricu.
Markovljev izvor je izvor prvog reda kada ima memoriju prvog
reda.
Možete li procijeniti kolikog je reda cijena automobila kao
Markovljev izvor? Što moramo uzeti u obzir? A kojeg je reda
automobilska nezgoda?
Markovljev izvor podataka može biti ergodičan ili neergodičan.
Ergodičan je kada se izvor iz svakog stanja može u konačnom
vremenu vratiti u svako stanje.

Neergodičan Markovljev izvor
Na slici je prikazan neergodičan Markovljev izvor:

d

b
a

Izvor se nikada ne vraća u
početno stanje a!

c
e

Kodiranje podataka Markovljeva
izvora

Pretpostavimo da prijelazna matrica Markovljeva izvora ima
izgled:
a
b
c
–
–
–
–

–
–
–
–
–

a
1/3
1/3
1/3
b
1/4
1/2
1/4
c
1/4
1/4
1/2
Višestrukim množenjem matrice samom sa sobom što je ispunjeno
za homogenu nedjeljivu matricu dobivaju se tzv ravnotežne
vjerojatnosti pojavljivanja znakova a,b,c kao pa=3/11, pb = 4/11 pc
= 4/11.
Kodiranjem matrice prijelaza Huffmanovim kodom za a=1, b=00 i
c=01 slijedi: La = 1*1/3 + 2*1/3 +2*1/3 = 1,667 bita,
Lb= 2*1/4+1*1/2+2*1/4= 1,5 bita i Lc= 1,5 bita
U ravnoteži dobivamo prosječnu duljinu koda
Lm=3/11La+4/11Lb+4/11Lc= 17/11 bita
Kodiranjem prema frekvencijama pojavljivanja dobivamo
L=2*3/11+2*4/11+1*4/11=18/11> Lm !

Procesni izvori podataka
Vrsta
entropije

Primjer
varijable

Skup
znakova

Brzina
snimanja

Razdioba
podatka

Entropija

Tok
podataka

Vremenska

Temperatur
ni pretv.
mA
Tlak u
cijevi
0-1 bar
Onečišćenj
e tla, 0-10
ppm
Vrem.
Raspored
rada kem.
reaktora

Svakih
0,1mA

10 znak/s

Jednolika

763
bit/znak

76,3
bit/znak

Svaki 0,1
bar

1 znak/m

Drugi
korijen

3,25
bit/znak

3,25 bit/m

Svaki ppm

1 znak/km2 Eksponenci 1,5 bit/znak 1,5 bit
jalna
/km2

Uk / isk

1 znak/dan

Prostorna
2D
prostorna
Entropija
uporabe

Puk=0,7
Pisk=0,3

O,899
bit/znak

0,899
bit/dan

Optimiranje procesnih izvora podataka
Osnovno je što više reducirati nepotrebne obrade podataka. U
tu svrhu najjednostavnije je izostaviti redundantne podatke.
Smanjuje se razlučivanje osjetila ili povećava vremenski i
prostorni korak snimanja. Ograničenje za brzo promjenjive
procese je zahtjev Nyquistova teorema uzorkovanja ( uzimanje
najmanje dva uzorka od najbrže promjene - kako se to nosi sa
šumom?)
Drugi je način ne uzimati u prvoj fronti one podatke za koje
postoje izravna stohastička zamjena, sličnost. Ovo se naziva
ortogonalizacija izvora podataka.
Poseban je problem vjerodostojnost podatka pojedinog izvora.
To se rješava poznavanjem povezanosti ponašanja tog izvora s
ostalim izvorima podataka u procesu. Stoga je određena
redundantnost snimanja nužna.

7. Shannonov teorem za binarni
simetrični kanal

Sheme odlučivanja
Na prijamnoj strani odlučujemo, nakon dobivanja znaka bj, koji
je znak ai poslan. Ovo ovisi o p(bj/ai) te o vjerojatnosti p(ai). Na
primjer
–

b1

b2

b3

a1
0,5
0,3
0,2
a2
0,2
0,3
0,5
a3
0,3
0,3
0,4
Ovdje postoje tri pravila odlučivanja

Pravilo 1: o(b1)=a1 o(b2)=a1 o(b3)=a2
Argumenti postoje u prilog svake pojedine odluke. Promatra se jedan
znak u vremenskom nizu, a ne cijeli nizovi znakova.

Sheme odlučivanja /2
U općem slučaju postoji qs shema odlučivanja, q je broj ulaznih
a s broj izlaznih znakova. Stoga se uvodi pojam pravila najveće
vjerojatnosti odnosno uzimaju se najvjerojatniji znakovi. Ako to
primijenimo dobivamo za gornji slučaj i b1 : o(b1)=a1.
Ako je dobiven b2 možemo uzeti jednu od odluka
o(b2)= a1, o(b2)=a2 ili o(b2)=a3.
Kada na prijamniku dobijemo b3 onda istim načinom
odlučujemo za o(b3)=a3.
Općenito je vjerojatnot pogreške odlučivanja pri dobivanju
znaka bj jednaka
P(E/bj)= 1- P (o(bj)/bj)
(23)

Prosječna pogreška odlučivanja
Općenito je vjerojatnost pogreške pri prijamu znaka bj jednaka
P(E/bj) = 1 - P( o(bj)/ bj)
(24).
Prosječna pogreška jednaka je uz p(a)=1/q
Pe=Σ P(E/bj) p(bj)= 1 - 1/q * Σ P(bj/a ispr)
(25),
gdje je P(bj/ a ispr) vjerojatnost da je znak aispr bio uzrok
dobivanja bj na prijamniku. Tada iz našeg primjera imamo
Pe = 1 - 1/3 * (0,5 + 0,3 + 0,5) = 1 - 1/3 * 1,3 = 0,56667.
Vidimo da je iznos prosječne pogreške znatan. Tim prije se vidi
potreba uvođenja kodova koji povećanjem zalihosti smanjuju
očekivanu pogrešku kod prijama.

Pogreška na binarnom simetričnom
kanalu

Binarni simetrični kanal može prenositi informaciju sa
smanjenom pogreškom ako se uvede zalihost. Pretpostavimo
dakle da prenosimo 0 kodom (000) a 1 kodom (111). Tada su
preostale kombinacije kodova neiskorištene. Pretpostavimo da
je vjerojatnoast točnog prijenosa P a netočnog Q, Q<0,5. Za
Q=P=0,5 imamo samo šum na kanalu i kapacitet C=0.
Sada je vjerojatnost prijenosa bez greške jednaka P3, jedne
pogreške je 3P2Q (ispravljivo!), dvije pogreške je 3PQ2 te tri
pogreške Q3. Odatle je
–
–
–
–

Pe ≈ Q2 (Q + 3P).
Za P=0,99 dobivamo
Pe ≈ 3*10 -4
vidimo da je minimalni Hammingov razmak detektor s najvećom
razlučivošću.

Shannonov teorem
Teorem : Neka je dan binarni simetrični diskretni kanal bez
memorije kapaciteta C>0. Tada postoji blok kod (n,k) i shema
odlučivanja g tako da vrijedi da se prosječna pogreška može
načinit po volji malena izborom dovoljno velikog n koji je po volji
blizu granice kapaciteta kanala.
Dokaz:
Za kanal kojim prenosimo jedan od M jednako vjerojatnih znakova, tj
p=1/M, informacija po prenešenom znaku ai je
I(ai)= ln (1/p)=ln M
(26).
No, znamo da je kapacitet bin.sim.kan. jednaka (19c) C=1-H(P)=1-H(Q)
po binarnom znaku, pa će za n znakova biti na granici kapaciteta tj
I(ai)= n(C-ε1), gdje je epsilon neki mali pozitivni broj. Odatle je
M= 2 exp n(C-ε1)= 2exp nC / 2 exp nε1 (27)
(27).
Povećanjem n uzimamo mali dio znakova koji prolaze kanalom blizu
njegovog kapaciteta. Jesu li ti znakovi dovoljno različiti?

Shannonov teorem /2
Slaganje n-bitnog Hammingova koda za prijenos informacije
daje vjerojatnost greške po prenešenom bitu od Q=1-P, a
očekujemo nQ pogrešaka. Dakle nalazimo se negdje oko sfere
radiusa nQ oko znaka ai:

nQ

nε2

bj

ai

Radius r je broj, ε2 je malen tako da u zbroju s Q ne prelazi 1/2

Shannonov teorem /3
Kod prijama se slika invertira:

nQ

bj

ai

nε2

Sada tražimo formulu za pogrešku zbog nemogućnosti ispravnog
dekodiranja primljene poruke.

Shannonov teorem /4
Slučaji

Ispravan ai u
S(r)

Drugi ai u
sferi S(r)

Greška

1

da

da

da

2

da

ne

ne

3

ne

da

da

4

ne

ne

da

Shannonov teorem /5
Vjerojatnost pogreške prijama je
PE=P{ai ∉S(r)}+P{ai ∈S(r)}P{najmanje neki drugi kod je u S(r)}
(28)
Prvi član uključuje slučajeve 3 i 4, drugi član uključuje slučaj 1.
Budući da je P{ai∈S(r)}≤1, a drugi član u (28) možemo pisati
kao
ΣA-ai P{a∈S(r)} onda dobivamo:
PE ≤ δ + ΣA-ai P{a∈S(r)}

(29),

gdje δ=δ(ε2,n) možemo načiniti po volji malenim ako n dovoljno
povećamo, tako da sfera radijusa r= n(Q+ε2) pokriva sve
razmake osim za po volji mali broj slučajeva.
Dakle prvi član odgovoran je za grešku za određeni poslani
znak, a drugi član odgovara za brzinu prijenosa jer sadržava
sve ostale M-1 članove, osim koda za ispravni znak.

Shannonov teorem /6
Slučajni kod bira M n-bitnih riječi kao poruke. Sada je očekivana
pogreška
Pe ≤ δ + (Μ−1)Po a ∈ S(r) ≤ δ + MPo{a∈S(r)} aai
(30).
Za jednoliku vjerojatnost raspršenja svih kodova, osim ai, svuda
po prostoru koda, vjerojatnost nalaženja u sferi S(r) jednaka je
omjeru volumena sfere i ukupnog volumena, 2 exp n, dakle
Po= N(r) / 2 exp n
(31),
N(r) je broj kodnih točaka u sferi S(r). Taj je broj za binarni
simetrični kanal jednak
N(r)=1 + C(n,1) + C(n,2) + …+ C(n,r) = Σ C(n,k), k=0,…,r
(32).
Iz poznatih r=(Q+ε2)n, Q+ε2<1/2, te Q+ε2 =λ dobivamo
N(r)≤2 exp (n H(λ)), odnosno Po≤2exp(-n(1-H(λ))
(33).

Shannonov teorem /7
Dakle, Pe ≤ δ + Μ 2exp (-n(1-H(λ)))
(34).
Eksponent u (34) (1-H(λ))= C - (H(Q+ε2) - H(Q))
Zbog konveksnosti se entropijska funkcija može u bilo kojoj
točki ograničiti s tangentom na krivulju u toj točki tj
H(Q+ε2) ≤ H(Q)+ ε2 dH/dQ, gdje zbog 0<Q<1/2 vrijedi
dH/dQ = log (1-Q)/Q > 0. Odatle je
1-H(λ) ≥ C - ε2 log (1-Q)/Q = C - ε3.
Odatle je Pe ≤ δ + Μ2exp (-n(C-ε3)), odnosno
Pe ≤ δ + 2 exp(n(C-ε1)) 2 exp(-n(C-ε3))=δ+2exp(-n(ε1-ε3))
(35).
Dakle uz izbor ε2 takvog da je ε1-ε3>0 prosječna pogreška Pe
može biti po volji malena uz n dovoljno velik.

Shannonov teorem /8
Vidimo da postoje teorijski pogodni kodovi za optimalan prijenos
na kanalu sa šumom, sa zanemarivom pogreškom.Nadalje:
kodovi mogu biti prilično dugi. Duge poruke zahtijevaju dugo
prikupljanje podataka prije slanja, tj ništa se neće slati prije nego
se dovoljno ne prikupi (čekanje!).
Nadalje: kod nekog izvora ne znamo u kojoj je fazi kodiranja.
Nadalje: knjiga kodova je jako velika, njezin je opis velik.
Nadalje: nitko ne zna koji je od tih dugačkih kodova koja se
moraju mučno ispravljati zapravo onaj najbolji. O tome u
Shannona nema ni riječi! Očito je da za otkrivanje prave
informacije treba jako puno vremena i čekanja: čak i uz naoko
relativno povoljan kapacitet kanala.
U ekspanziji koda se možda krije i neka druga zakonitost?
Lema(F.J): ako vam neka informacija izgleda nejasna, a ne možete
povećati brzinu kanala, onda vam preostaje strpljenje. Danas se svi
bave povećanjem brzina kanala. Sama informacija pritom nije važna!

8. Železnikarove teze
1. Informacija je kružna spontana pojava informacije.
– Kad izgovaramo rečenicu: “Iva pije vodu” gdje je tu kružnost, kamo
spontanost?

2. Informacija posjeduje sposobnost samokontrole.
- je li samokontrola osnovno svojstvo izvora informacije?
- možemo li samokontrolu izvesti bez kružnosti?

3. Informacija unutar informacije iskazuje se kao protuinformacija pitanje
- može li se samokontrola izvesti bez pitanja?
4. Uključenje informacije znači njeno ubacivanje, ugnježdenje,
smještavanje u neko tijelo koje je razumije.
- informacija bestjelesnog / neenergetskog je nepristupačna, ulazom u
tjelesno - energetsko ona se postvaruje / manifestira
- da bi tijelo razumjelo informaciju ono mora kao prvo razumjeti okoliš - no
okoliš nije informacija - okoliš je zamagljenje informacije!

Železnikarove teze /2
5. Informacijski paralelizam je informacija po sebi
– paralelizam je inherentan informaciji
– informacija je i paralelna i trenutna
6. Informacijska slijednost je spontana kružnost informacijske prirode
– serijska priroda informacije teži svom izvoru, odatle i njezina kružnost
7. Ukupna fenomenologija živog i neživog je fenomenologija informacijskog
oblika i informacijskog procesa
– informacijski oblik i proces su dijalektička cjelina
8. Informacijski oblik je statička a informacijski proces dinamička informacijska
slika fenomena
– fenomeni se pojavljuju u statičkom (forma) i dinamičkom (sadržaj) obliku; u
ovom potonjem su neopisivi - dok se ne oblikuju u statičkom
– u računala je forma primarna veličina - ono je bez informatičkog sadržaja

9. Estimacija i interpretacija signala
Trenutna frekvencija signala
Pojam trenutne frekvencije vezan je za npr harmonijsko gibanje
tijela, ili općenito vibraciju, tj broj titraja u jedinici vremena.
Signal s(t), kada ga promatramo kao zbroj harmoničkih
vibracija, možemo predočiti vlastitim spektrom pomoću
Fourierove transformacije tj
S(f) = ∫ s(t) e -j2πft dt,
-∞< t < ∞
(36).
Slično tome se signal može sintetizirati iz svojeg spektra kao
s(t) = ∫ S(f) e j2πft df,
-∞< f < ∞
(37).
Postupci su opravdani za signale sa stalnim spektrima u
vremenu!
No u praksi nastupaju slučajevi s vremenski promjenjivim
spektrima.

Estimacija i interpretacija signala /2
Poopćenje pojma frekvencije na nestacionarne
signale
Van der Pol je 1947. razmatrao pojam trenutne frekvencije na
signalu:
s(t) = a cos (2πft + Θ)
(38)
a je amplituda, f je frekvencija a Θ je fazna konstanta, odnosno
argument kosinus funkcije je faza Φ(t) = 2 πft + Θ . Dakle
definirao je amplitudnu modulaciju kao
a(t) = a0(1+µg(t))
(39).
Faznu modulaciju je definirao kao
Θ = Θ(1 + µg(t))
(40),
a faza je argument kosinus funkcije u (38) postaje
Φ(t) = 2πft + Θ(t)
(41).

Frekvencijska modulacija se ne može izraziti poput (39) jer ne
dobivamo (41) već je potrebno rabiti izraz
s(t) = a cos [∫ 2πfi(t) dt + Θ]
(42),
gdje je argument kosinus funkcije faza. Dakle imamo definiciju
trenutne frekvencije fi kao
fi(t) = 1/2π * d(φ)/dt
(43).
Gabor je predložio nalaženje trenutne frekvencije iz FT stvarnog
signala pa modifikacijom spektra tako da se potisnu negativne a
dvostruko pojačaju pozitivne frekvencije spektra signala, dakle
z(t) = s(t) + jH(s(t))
(44),
z(t) je Gaborov složeni signal, s(t) je stvarni signal a H je
Hilbertova transformacija koja se definira kao:
H(s(t)) = p.v. ∫ s(t-τ) / πτ dτ -∞<τ<∞ (45).
P.v. je Cauchy-jeva principijelna vrijednost integrala (45).

Opravdanje za svoj postupak Gabor je vidio kod izračunavanja
centralnih momenata frekvencije signala, jer bi se svi
neparni momenti spektara bili jednaki nuli, a to ne bi išlo u
stvarnosti. Gaborov složeni signal naziva se analitički signal.
Ville je izrazio trenutnu frekvenciju signala s(t)= a(t) cos φ(t) kao
fi(t) = 1/2π d/dt(arg(z))
(46),
gdje je z(t) analitički signal dat u (44). Ville veli nadalje da, ako je t.f.
vremenski varira onda (intuitivno) i postoji neki trenutni spektar koji mu
se pridružuje, gdje su srednje vrijednosti frekvencija u tom spektru te t.f.
Uporabom Gaborovih prosječnih mjera dokazao je tu vezu prosječnih
frekvencija i vremenskih prosjeka, odnosno
∫f*Z(f)2 df / ∫z(f)2 df = ∫fi*z(t)2dt / ∫z(t)2 dt
(47),
a granice integrala su preko područja -∞<f<∞, -∞<t<∞.

Estimacija i interpretacija signala/5
Odatle su Ville i Wigner definirali raspodjelu signala po vremenu i
frekvenciji (42cit), označenu kao W(t,f), koja svojim prvim momentom
određuje trenutnu frekvenciju složenog signala. Ostali autori, poput
Rihaczeka i Ackroyda ukazali su na točke u vremensko-frekvencijskoj
ravnini gdje se koncentrira energija!
Osnovni problem je u tome što mi jednu jedinstvenu pojavu u vremenu
naime s(t) želimo prikazati dvjema funkcijama vremena, poput para
ovojnica-faza ili realni-imaginarni dio. Ovo koji puta ide bez pogreške
kao u slučaju kad razmatramo vrijedi li
a(t)cosφ(t) + jH(a(t)cosφ(t)) = a(t)e jφ(t)
(48).
Rješenje (48) , prema Bedrosianu, je valjano ako spektar A(f) = F{a(t)}
leži potpuno u području f< f0 a spektar F{cosφ(t)} postoji potpuno
izvan tog područja. Dakle amplituda a(t) i faza φ(t) mogu se smatrati
neovisnima samo ako spektar a(t) i cosφ(t) imaju odvojena
frekvencijska područja.

Trenutna frekvencija i grupno kašnjenje (GK)
Složeni signal z(t) =a(t) exp(jθ(f)) ima složeni spektar oblika
Z(f) = A(f) exp(jθ(f))
(49),
gdje su a(t) i A(f) pozitivno definitne funkcije.
Veličina zanimljiva za opis signala je grupno kašnjenje:
τg(f) = -1/2 π * d/df θ(f)
(50).
Grupno kašnjenje može se predstaviti kao da je promjena vremena
propagacije funkcija frekvencije impulsa koji putuje kroz linearni filter s
impulsnim odzivom h(t) = s(t). Jasno je da fazni spektar θ(f) i GK ovise i
o fazi i amplitudi vremenskog signala. Isto tako faza signala φ(t) i TF
također ovise i o faznom i amplitudnom spektru.
Za signal s(t), ako je vrijednost t= τg jedinstvena, smatramo da opisuje
položaj signala u vremenskoj domeni. Ako je τg funkcija f tada opisuje
lokalizaciju različitih komponenti spektra u vremenskoj domeni.

Utjecaj umnoška BT na TF I GK
Vrijeme trajanja T i širina pojasa B su značajke signala
koje opisuju “epohu” pojave signala i njegova spektra.
Smanjnjem trajanja signala u vremenu dolazimo do nestanka
signala u šumu. No signal se katkada, iako manji od šuma može
smatrati signalom u smislu njegove detekcije. To se naravno
odnosi na ponavljajuće pojave. Djelatno trajanje signala je po
dogovoru
Ts2= ∫t2s(t)2 dt / ∫s(t)2 dt
(51)
a djelatna širina pojasa
Bs2 = ∫f2S(f)2 df / ∫ S(f)2 df

(52).

Odnos između B i T možemo lako razmotriti ako signal s(t)
usporimo ili ubrzamo. Razvučeni signal sr = s(rt), gdje je r faktor
razvlačenja. Tada je pripadni spektar
Sr(f) = 1/r S(f/r) , r>0
(53).

Dakle rastezanje signala dovodi do sažimanja spektra. Odatle je
odnos B i T vezan, odnosno umnožak BT= const za svaki
signal. Dapače iz (51) i (52) slijedi da je minimalni BT= 1/4 π za
gaussovski oblik signala. Signale s konačnim trajanjem
spektrom i energijom ako imaju BT>10 smatraju se
“asimptotskim signalima ”. Landau i Pollak su pronašli da
signali s BT>5 imaju 99% energije u području definiranom
unutar B i T. Dakako signali s malim BT u informatičkom smislu
nisu dovoljno “bogati”. Njihove estimacije su slabe.
Neke korisne definicije i svojstva asimptotskih signala s(t):
Neki asimptotski signal s(t) je monokomponentan ako
njegova trenutna frekvencija fi(t) točno predstavlja modulacijski
zakon signala, jednoznačna je i postoji njen invers fi-1(t)
Neki je asimptotski signal s(t) višekomponentan ako postoji
konačan broj N monokomponentnih signala sj(t) takvih da u
zbroju daju s(t). Samo jedna od njenih komponenata mora biti
asimptotska. Dekompozicija je ovisna o primjeni!

Monokomponentni signal

Višekomponentni signali
t

t
f
t

f

f

Svojstva asimptotskih signala
1. Energijska razdioba asimptotskog signala s(t) usredotočena
je u konačnom vremensko-frekvencijskom području oko TF, a
stupanj koncentracije je ovisan o umnošku BT.
2. Za jednokomponentni asimptotski signal s velikim BT i
monotonim zakonom promjene može se pokazati da se fi(t)
približava prema τg-1, tj ove su dvije funkcije međusobno
inverzne. Tada fi(t) opisuje zakonitost frekvencijske modulacije
signala s(t), a τg(f) predstavlja vremensko kašnjenje signala.
3. Za jednokomponentni asimptotski signal s malim BT ne vrijedi
jednakost fi(t) = τg-1. Ne postoji niti fizikalno značenje koje se
može pripisati ponašanju u t-f ravnini, iako je matematički dobro
definirano.
Dakle traži se monotonost ponašanja TF i veliki iznos BT-a.
Monotonost osigurava jednu prasliku u području T, a veliki iznos BT
osigurava da se svaki element u T preslikava na jednu sliku u B, dakle
da postoji dominantnost jedne frekvencije npr. f0.

10. Pretraživanje podataka
Pretraživanje podataka (data mining) je analitička tehnika
kojom se grade modeli za obilježavanje podatka u cilju
nalaženja informacije. Procjena uspješnosti skupe marketinške
kampanje, otkrivanje bitnih uzroka kvarenja energetskih
transformatora ili postizanje veće odzivnosti na potrebe kupca
telefonske usluge - važan je motiv za opsežnu, skupu i često
dugotrajnu analizu velike količine podataka. Tehnike kojima se
služimo možemo grubo grupirati na:
- pomoć pri boljem razumijevanju podataka
- ugradnja značajki u podatke za njihovu kasniju analizu
- omogućavanje mjerenja uspješnosti ugrađenih značajki
Opisuje se niz postupaka od predobrade sirovih podataka do
korisnih postupaka njihovih odvajanja i obilježavanja. Naglasak
je na razumijevanju podataka već prije početka postupka
obrade.

Važnost podat(a)ka
Iznosi podataka penju se brzo na milijarde jedinica. Ako želimo
obilježiti živi svijet na nekom području tada za 2000 vrsta, u
2000 različitih lokaliteta te sa 2000 bajtova po lokalitetu imamo
8GBy podataka. Ipak zaključci koje možemo izvesti iz sintaksnih
okvira računarskih podataka i semantička interpretacija njezinih
vrijednosti je ograničena. Sve ovisi jako o kvaliteti podataka s
kojima raspolažemo. Tehnike rijetko kada imaju sposobnost
uporabe znanja iz date domene a zasigurno nemaju pristup
obilju infromacije koja je na raspolaganju analitičaru. Stoga
analitičar mora osigurati da se donose najbolji mogući podaci
koji daju i najviše moguće iznose informacije.
Kvaliteta podataka odnosi se na njihovu potpunost,
odvojivost i razumljivost za analitičara.
Potpunost ovisi o tome ne posjeduje li zapis sve podatke.
Nedostatak podataka obezvređuje osobine sustava. Postoje
neki načini da se nadiđe i takav slučaj.

Važnost podat(a)ka /2
Odvojivost podataka odnosi se na lakoću kojom se mogu
obilježavati klase podataka u datom skupu. Obilježavanje mora
moći ići u smislu postizanja cilja obrade. Tako se obilježavanje
podataka puta ne smije izbjeći kod analize problema trgovačkog
putnika i sl. Često je to kombinacija obilježja koja igra ulogu u
nalaženju informacije. No analitičar koji ne razumije područje
rada teško će otkrivati svojstva obilježavanja!
Razumljivost podataka može se kretati od poznavanja vrste
podataka atributa (obilježnika) do razumijevnja stohastičkih
modela koji se koriste i pravog sadržaja informacije. Semantičko
razumijevanje značenja atributa bila bi poželjna osobina, no
malo sustava za pretraživanje podataka posjeduje svojstvo
uporabe domenskog znanja.

Vrste podataka
U biti postoje dvije vrste podataka: brojčani (kvantitativni) i
simbolički (kvalitativni).
Brojčani podaci (cjelobrojnici ili realni brojevi) donose svojstvo
razlikovanja značajnosti dvaju podataka iz razlike njihovih
brojčanih iznosa.
Simbolički podaci ( brojke ili znakovi) donose svojstvo da im je
za istu jedinicu različito značenje. Dakle za neko svojstvo
obrade mora postojati neka skala obilježavanja simbola koja
je primjerena datom cilju obrade. Često je već postizanje skale
obilježavanja veliki doprinos pretraživanu podatka. Skale
obilježja dakle moraju izrađivati eksperti iz područja problema
koji se rješava datom obradom pretraživanja.
Zadatak: poredajte po skali obilježja vaše informatičke uređaje:
računalo, telefon (mobilni?), TV prijamnik, kućno zvonce. Ovisi li
to i o okolnosti uporabe?

Predočavanje podataka
Kada skup podataka prelazi tri atributa ili 1000 jedinki teško ga
je predstaviti s dovoljnom jasnoćom. Porast broja i složenosti
podataka u računalima taj je problem samo povećao. Jako je
teško stvarne podatke “vidjeti” kao nakupine, grozdove.
Svakako da je dobro predočavanje podataka uvjet za njihovo
bolje razumijevanje.Uz sve isto podatke ćemo najbolje
predočavati tako da istaknemo one atribute, dimnezije gdje se
najviše razlikuju. Isto tako možemo one dimenzije gdje se ne
razlikuju naprosto zanemariti u predočavanju. Tako možemo
prikaz smanjiti na onaj broj dimenzija 2,3 koji je najprimjereniji
za predočavanje čovjeku. Nadalje, dovoljno je izabrati do stotinu
oglednih podataka za prikaz od više od tisuću njih, da bi se
dobio uvid u osnovna svojstva skupa podataka.

Tehnika predobrade
Predobrada podataka je važan korak u njihovom boljem prikazu
korisniku, otkrivanju skrivenih svojstava i svođenju na oblik u
kojem se mogu uspoređivati podaci iz različitih izvora.
Postupci predobrade svode se na filtraciju, skaliranje,
normalizaciju te regresiju dimenzije. No, bez obzira koji se
postupak uvodi podaci nakon predobrade nisu više jednaki onim
sirovim podacima.
Budući da se radi o tome da ne znamo informacijski model na
izvoru, niti mu možemo pristupiti, ne možemo doći do čistog
informacijskog signala, a ne znamo ni model šuma niti mu
možemo pristupiti a znamo samo mjerni signal, to je problem
pristupu informaciji daleko teži nego izgleda.
Naravno da predobradom samo smanjujemo neke od
nepoznatih veličina, nikako sve.

Tehnika predobrade /2
Opća shema predobrade
Nedostupni model
šuma
Nedostupni šum
Model=?

Nedostupni
inf. izvor

Model=?

*

Filter

Nedostupni
inf. signal

Mjerenje, podatak

Predobrađeni
podatak

Filtriranje se može izraziti iz osnovne formule (Graupe, 176)
yk = x k + nk
(54),
gdje je yk mjerenje, sirovi podatak, xk je signal a nk je aditivno
dodani šum, k je k-ti vremenski interval. Filter daje procjenu,
estimaciju xke signala xk samo na osnovici yk. Pri tome optimalni
linearni filter zahtijeva poznavanje parametara modela
signala i šuma. Linearni Wienerov filter u smislu minimuma
kvadratnih odstupanja estimacije daje linearnu estimaciju xke
informacijskog signala s obzirom na mjerenja tj
xke = Σαi* yk-i sumiranje od 0<i<M
(55),
gdje su αi parametri filtera koji se izračunavaju prema
minimumu kvadrata odstupanja od estimacije, a M je dubina
utjecaja na estimaciju. Kada doprinos estimaciji s porastom M
padne ispod nekog iznosa onda se daljnje računanje po dubini
više ne uzima u obzir.
Možemo li za niz podataka 4,6,3,7 izračunati α0 i α1?

Norm iranje i skaliranje podataka
Skaliranje je promjena mjerila podataka u smislu povećanja
njihove razdvojivosti. Nakon skaliranja potrebno je često
podatke podvrgnuti zajedničkom normiranju. Teorijski
promatrano klasifikatori se mogu podučiti kako primijeniti
odgovarajuće linearno ili nelinearno skaliranje podataka na
svojim ulazima, što je vrlo složen postupak.
Uobičajeni postupci preobrade je pretvorba podataka u podatke
sa srednjom vrijednosti jednakoj ništici te normiranje varijance
ulaznih atributa.
Uzmimo da posjedujemo dva niza podataka: m1 = 3, 4, 6, 4 te
m2 = 11,14, 15, 12. Postavimo ih linearnom pretvorbom u
skalu1 - 10 Normiramo tako pretvorene podatke u nizove sa
srednjom vrijednosti ništa. Pokušajmo ih pretvoriti u podatke s
istom varijancom. Što opažamo? Kuda su nestale izvorne
veličine? Možemo li ih obnoviti?


Regresija
Regresija je zajednički naziv za raznorodnu grupu postupaka
kojima se smanjuje broj opisnih atributa promatranog skupa
podataka.
Uobičajeno je odrediti kolika je međusobna statistička ovisnost
parametara, pa onda izostaviti one parametre koji su već
dovoljno dobro predstavljeni drugim veličinama. Takvi
međusobno neovisni parametri nazivaju se glavni parametri ili
glavne analitičke komponente, GAK. Daljnja se obrada onda
odvija na puno manjem broju GAK-a što pojednostavljuje prikaz
i smanjuje broj pretraga. No, ostaje osnovni problem - kojom
metodom to postići! Odnosno kakav model regresije rabiti.
Linearna regresija tako svodi opis neke mjerne pojave y kao
linearne kombinacije GAK-a x1 , x2 ... Sljedećom shemom:
Y = a1 X1 + a2 X2 + a3 X3 + o
(56),
gdje je o oznaka za ostatak aproksimacije pojave. X1, X2 i X3
su tada GAK-e.

Primjer regresije podataka
Y

X1

X2

X3

X4

5

1

4

-3

2

8

0.2

6

-2

3

12

2

7

-1

2

15

0,6

10

1

1

-6

2

-3

2

0,6

Koeficijent korelacije niza y i x računa se prema izrazu
r = 1/n *Σ (xi- xsr)(yi - ysr) / ( 1/n *Σ (xi- xsr)2 )1/2) *
( 1/n *Σ (yi - ysr)2) 1/2)
(57),
gdje je n broj parova događaja, xi i yi su podaci i-tog događaja xsr i ysr
su srednje vrijednosti svakog niza.
Koeficijent korelacije rangiranih nizova y i x računa se prema izrazu
rq = 1- 6 Σ δ2/ n2 (n-1)
(58),
gdje je δ2 kvadrat razlike rangova dvaju nizova. Izraz (58) vrijedi za
nizove sa svim različitim rangovima u pojedinom nizu.
Što možemo dobiti ispitujući podatke iz Primjera ovim relacijama?
Možemo li možda postaviti regresijski izraz?
Kako se ponašaju nizovi na rang korelaciju?

Tehnika klasifikacije
Klasifikacija je postupak podjele ulaznih podataka prema krajnjem
ishodu događaja. Moguća je postupcima samoorganizacije podatka dakle postupcima umjetne inteligencije poput umjetnih neuronskih
(živčevnih) mreža, genetičkih algoritama, ili polukvalitativnih postupaka
(Quacol algebra)- ili induktivnim postupcima - stablom ili pravilom
odlučivanja, te statističke - CART metoda, statistička klasifikacija ili
entropijska klasifikacija.
Obradit ćemo samo neke od navedenih postupaka. Zajednička osobina
svim metodama je unošenje jakih elemenata kvalitativnog u postupku
donošenja odluke, pa ćemo na sklopu diskriminatora objasniti postupak
pretvorbe kvantitativne u kvalitativnu veličinu.
Drugi vrlo značajan element je pojačanje. Bilo da se radi o skaliranju ili
normalizaciji, podaci su, kada uđu u postupak ili uređaj za klasifikaciju,
izloženi značajnim pretvorbama.
Takve pretvorbe vrlo je teško do kraja razumjeti, obrazložiti i
interpretirati. Osobito kada se radi o samoorganiziranim postupcima.

Sklop za diskriminaciju
Sklop kojem se ulaz mijenja od -5V do 5V i koji ima prag
okidanja smješten na 0V prikazan je shemom:
Uul
Uiz

Uul

t

Uiz

Uiz
Uul

Sklop pretvara ulazni niz koji je u rasponu +/- 5V u izlazni niz koji ima
samo dva stanja + ili - . Na ovaj način na izlazu ne znamo koliko točno
iznosi ulazni niz, ali znamo da li je veći ili manji od ništice.Dakle podatak
je iz kvantitativnog prešao u kvalitativno područje: veće / manje.

Sklop za zbrajanje i skaliranje
Sklop za zrajanje s postupkom skaliranja dat je na shemi:
X - ulaz, Y - izlaz, W - težinski udio, S - zbrajalo
Koliki je Y ako su X1=5, X2=7, W1=1, W2=10? Tko dominira?
Kako možemo ovu shemu izvesti elektronički,
elektromehanički?

X1

W1
S

X2

Y=X1W1+X2W2

W2

Kako možemo na elektroničkom sklopu promijeniti W, X?

Samoorganizacija
Promotrimo sklop na slici (strjelice označavaju podešavanja
ulaznih struja u sumatore npr promjenom otpora):
Za svaku ulaznu pobudu može se podešavanjem dobiti
odgovarajući izlazni odziv. Ovo podešavanje naziva se
samoorganizacija.
X1

s

D

s

D

s

D

s

D

X2

X3

s

D

s

D

s

Y

Klasifikacija podataka /5
Klasifikacija samoorganizacijom
Svaka samoorganizacija sastoji se od strukture, mogućnosti
njene promjene i kriterija prilagodbe.
Opisujemo tri takve klasifikacije: neuralnom mrežom, genetičkim
algoritmom i Quacol algoritmom(Medusa).
Neuralnoj mreži se ne mijenje struktura, promjena je na razini
težinskih udjela a kriterij prilagodbe je minimum odstupanja
izlaza za dati skup ulaza. Ta se samoorganizacija izvodi u etapi
učenja. U etapi klasifikacije se dati obrazac propušta kroz mrežu
i opaža njen učin - tj kamo uzorak pripada po svojim atributima.
Genetički algoritam polazi od skupa različitih struktura, ispituje
prikladnost rješanja, uzima one najbolje, kombinira ih u nove
strukture tako da u kombinaciji slučajnim izborom promijeni
strukturu npr svakom stotom rješenju, pa dobivene strukture
opet ispituje na prilagođenost….

Quacol (algebra kvalitativne korelacije) rangira ulazne podatke,
normira i rangira njihove algebarske kombinacije čime generira
različite algebarske strukture, pa one koje su kvalitativno
najsličnije ciljnoj funkciji bira za nove algebarske strukture.
Što je zajedničko svim samoorganiziranim postupcima?
Pretvorba kvantitativno u kvalitativno odvija se u više uzastopnih
koraka (cikličnost informacije!):
– kod neuronske mreže se na diskriminatoru izvodi pretvorba
kvantitativno - kvalitativno a na ulazu u sumator obrnuto.
– Kod genetičkog algoritma su rekombinacija i mutacija kvalitativni
koraci, a određivanje rezultata i biranje potomaka je kvalitativne
prirode
– kod Quacol algebre je rangiranje kvalitativni postupak, a
određivanje rezultata i biranje najpovoljnijih algebarskih struktura je
kvantitativan postupak.


Induktivne metode
Dvije su induktivne metode: stablo indukcije i indukcijsko pravilo
Kod indukcijskog stabla računa se grananje na stablu u grupi
podataka po principu podjele u dvije grupe. Podaci se ispituju
prema nekoj vrijednosti atributa npr X1≥3 u ovisnosti o ishodu
npr Y=7. Ispituju se svi podaci. Ide se sve prema finijoj podjeli
podataka sve dok se ne dosegnu kriteriji zaustavljanja. Često se
računa informacijska dobit, kao kod ID3 postupka, pa kada je
više nema onda se klasifikacija zaustavlja.
Indukcijsko pravilo rabi mali skup prostornih i logičkih
konstrukata, poput “NA”, “I”, “U DOTICAJU”, “ILI” koji tvore
početni skup pravila zasnovan na nekom početnom kriteriju. Tim
se pravilima klasificiraju podaci - uzorci I mjeri učinak
klasifikacije. Nova se pravila dobivaju poopćenjima,
specijalizacijama i opet ispituju…Poznat je sustav AQ-11 za
klasifikaciju bolesti soje.

Statistička klasifikacija podataka
Statistička parametarska klasifikacija: Podaci se dijele linijom u 2D

prostoru (ravninom u 3D), tako da ona prolazi područjem gdje je u oba
podijeljena skupa minimum kvadrata razlike od njegovog centra a maksimum
razlike između podataka različitih grupa. Ako je potrebno jedan se od
parametara skalira da bi se dobili traženi maksimumi, odnosno minimumi. Vodi
se računa o tipu funkcije razdiobe vjerojatnosti

Neparametarska statistička klasifikacija: izvodi se na sličan način kao

parametarska, ali ne vodi računa o tipu raspodjele, već računa centre okupljanja
(K-najbliži susjed) tako da postižu minimume razmaka untar grupe i maksimum
između članova različitih grupa.

CART(Classification And Regression Tree) metoda: dijeli skup

podataka prema sve homogenijem sastavu do ispunjenja određenog kriterija.
Svaka dioba ovisi samo o jdnoj vrijednosti jednog atributa i binarnog je tipa.Kada
su parametri opisni onda se podjela izvodi po njima a kada su numerički
određuju se regresijska pravila.

Entropijska klasifikacija
Metoda se zasniva na grupiranju podataka prema parametru
koji posjeduje maksimum informacije, odnosno minimum
entropije.
Računaju se udio entropije uvjetne vjerojatnosti p(cj/ai) da ishod
bude cj ako je ulazni parametar a ima iznos ai, tj
H*(cj/ai) = - Σ p(cj/ai) log p(cj/ai), za sve ai od 1 do n (59),
gdje je n ukupan broj kombinacija ishoda cj i klasa atributa A.
Taj se udio množi težinskim udjelom svakog iznosa ai ukupnom
parametru A tj
H(A) = Σ p(ai) H*(cj/ai)
1<ai<k
(60),
k je broj klasa atributa A.
Odabiranjem najinformativnijeg atributa otvara se stablo
klasifikacije za ostale atribute.

Kriteriji odrezivanja na stablu odlučivanja
Dva su kriterija odrezivanja: kada broj slučajeva padne ispod nekog
iznosa koji je značajan za donošenje odluke ili kada padne do iznosa
kada se događa da u neku klasu više ne dospijeva nijedan slučaj.
Nedogađanje slučaja izaziva umjetni pad entropije i “ruši” metodu, jer
pad entropije tada ne predstavlja smanjenje nereda već nedostatak
pojave!
Ako imamo c slučaja u datoj klasi a g ishoda ( npr. porast snage, pad
snage motora) te jednoliku raspodjelu gustoće vjerojatnosti ishoda tada
je vjerojatnost dobivanja jedne ništice unutar nekog od ishoda jednaka
P( jedan ishod =0) = ((g-1)/g)c
( 61).
Za slučaj c=15, g=4 vjerojatnost u (61) jednaka je 0,01336.
Računamo li pad entropije za slučaj g=4, c=15 npr iz obrasca
H(5,5,4,1)=0,54956 na H(5,5,5,0)=0,47712 on iznosi H=0,07244 ili
15,8%, što je zamjetno.

Ako kao razumnu granicu za odrezivanje stabla uzmemo klase
s 2% ili manje slučajeva od ukupnog broja, tada npr za se sve
klase s manje od 740*0,02 ≈15 slučajeva dalje ne klasificiramo.
Ovo može biti drugi kriterij - potpuno pragmatički.
Analiza klasifikacijskih postupaka
Nema “najbolje “ klasifikacijske tehnike. Prema svakom slučaju
se mora posebno postupiti, prilagoditi. Ipak klasificiranje po
maksimumu sličnosti i potpuno odvajanje klasa kakvo je u
entropijskoj klasifikaciji daje joj prednost. No za veliki broj
parametara i ova klasifikacija gubi uvjerljivost.
Izračunajte koliko klasa ima u skupini podataka obilježenih s 10
parametara ako svaki ima dvije veličine!(1024 klasa)
Koja najvrjednije informatičko svojstvo krije u sebi postupak
klasifikacije? (selekcija)

Postklasifikacijska analiza
Klasifikacija je samo jedan dio posla. Drugi je odgovarajući
prikaz rezultata klasifikacije i njegovo opravdanje.
Analiza dobrote klasifikatora
1. Analiza postupka učenja
1.1 Uzima se samo jedan dio podataka i klasificira. Kada se klasifikator
“uvježba” onda se njime klasificira pokusna skupina podataka (od 9:1 do 1:1).
Pretrenirani klasifikator nema svojstvo generalizacije.
1.2 Uzima se n skupina uzoraka za učenje i testiranje. Računa se križna
validacija s nasumce izabranim parovima uzoraka. Ispituje se statistička
značajnost razlike postignutih rezultata.
1.3 Stvaraju se nove skupine uzoraka iz starih odgovarajućim zamjenama nešto slično slučaju 1.2. Tada se izvodi validacija postignutog i računaju
odstupanja. Ova metoda ima nedostatak u pojavi predrasudnih ocjena.

2. Ubacivanje funkcije troška
Procjenjuje se cijena neispravne klasifikacije - ovo je dosta teško
vrednovati.

Postklasifikacijska analiza /2
3. Analiza statističke značajnosti rezultata klasifikacije
Matrica smušenosti

Massy-jeva
matrica

A klas.

Bklas.

Apredv.

N11

N12

Bpredv.

N21

N22

Postklasifikacijska analiza /3
N11 - broj primjera klase A ispravno klasificiranih
N12 - broj primjeraka klase B neispravno klasificiranih
N21 - broj primjeraka klase A neispravno klasificiranih
N22 - broj primjeraka klase B ispravno klasificiranih
vrijedi N = N11+N12+N21+N22
Hi-kvadrat test se rabi za testiranje statističke značajnosti
rezultata klasifikacije. Zasniva se na razlici između opaženih (O)
i očekivanih (E) frekvencija pojava:
χ2 = Σ (O-E)2 / E za svih N slučajeva. (62).
Za veliki χ2 odbacuje s tzv nulta hipoteza da je razlika slučajna,
pa je i klasifikacija statistički značajna.

11. Govorna informacija - mrežni agenti
Govorna informacija razmatrat će se sa stajališta:
– 1. Postignuća automatskog prepoznavanja govora od strane
strojeva
– 2. Mogućnost automatskog čitanja pisanog teksta
– 3. Mogućnost prikupljanja podataka u otvorenom sustavu - mrežnim
agentima
– 4. Načini izgradnje konverzacijskog mrežnog agenta
– Slični postupci mogu se primijeniti i na području automatskog
prepoznavanja slike, automatskog crtanja, prikupljanja slikovnog
materijala i izrade umjetnog agenta za prikupljanje slikovnih
obrazaca, njihovu analizu i prepoznavanje.
– Sva navedena svojstva strojeva svode se na pitanje kako natjerati stroj da
prepozna govor, tekst ili slikovni obrazac, te kako ga isprogramirati da
sintetizira komunikaciju sve iz određene baze podataka - znanja prema
određenom obrascu.
– Dakle kako stroj naučiti značenju, semantici! Stroj dakako ne može naučiti
semantiku, ali se može dobro isprogramirati za tu funkciju.

Agent - komunikacijski posrednik
Nedruštveni agent (Poole)
Agent je nešto što djeluje u svijetu, poput osobe, robota, crva,
vjetra, gravitacije, svjetiljke. Ciljni agenti djeluju prema
preferencijama, vole neka stanja više od drugih, dok (naoko)
besciljne agente zovemo “prirodom”. Uloga nekog agenta je
stvar modelskih pretpostavki. Pas može u jednom scenariju biti
ciljni, a u drugom prirodni agent.
Agenti mogu imati osjetila, memoriju, aktore; oni zaključuju i
djeluju u vremenu. Agent osjetilima ne mora odražavati pravu
sliku svijeta u kojem djeluje. Agent može kontrolirati jedino svoju
akciju, poruku u datom okolišu. Agent prevodi ulazni signal u
izlaz u svakom trenutku vremena. To je ponašanje kauzalno jer
ulazno-izlazni odziv može ovisiti samo o datom i prijašnjim
ulazima i datom i prijašnjim izlazima. Nema govora o
predviđanju ili inkurziji (sadašnje ponašanje ne ovisi o budućim
stanjima). Ovakvo predstavljanje modelira svijet, agente i ciljeve
njihovog ponašanja na neki projektirani (sub)optimalni način.

Konverzacijski agent
Konverzacijski agent (Allen, /6/) može potpuno sudjelovati u
razmjeni informacije
Kakav je to stroj? Zašto bi trebao komunicirati? Zašto bi trebao
razumijevati ono što mu je preneseno?
Možda zato što je jednostavno programiran za nešto takvo.
Agent koji razgovara s bazom podataka naprosto
1. Prepoznaje i interpretira ulazno pitanje u logički oblik koji
predstavlja upit za bazu podataka
2. Izvodi upit u bazi podataka i generira izlaz zasnovan na
dobivenom odgovoru
Ovo nije inteligentan agent, a ne može prepoznati ništa osim
onoga što stoji u bazi podataka. Nema nezavisnosti u njeovom
ponašanju, što bi dovelo do primisli da je agent inteligentan.
Nešto više inteligencije dobili bismo predstavljanjem na način
koji više odražava stvari koje motiviraju ljudsko ponašanje.

Društveni agent
Društveni agent (Castelfranchi) ne živi sam u svijetu njegove
se osobine tvore na socijalnoj interakciji, koja nije reducirana na

komunikaciju već je komunikacija zbog potrebe društvenosti, djeluju u
zajedničkom svijetu, sučeljavaju se, utječu međusobno i ovise jedan o
drugome. Ta je akcija zasnovana na ispoljavanju moći,
uni(bi)lateralnom pokušaju utjecaja na drugog tako da mu mijenja
pamćenje, memoriju i nakanu. Društvena akcija nije nužno i
kooperativna akcija. Agenti i njihove akcije vođeni su ciljnom funkcijom.
Često ponašanja agenta nisu praćena nekom internom (mentalnom)
predstavom učina tog istog ponašanja. Cilj je interna predstava stanja
svijeta koji je kandidat za: upravljačku i vodeću akciju s pomoću
ponavljanja ispitivanja učina akcije ili suprotne predstavljanju,
određivanje akcije pretraživanja i izabiranja, te kvalifikacije uspjeha ili
neuspjeha. Cilj razlikuje društvenu od nedruštvene akcije. Akcija je
moguća I na podspoznajnoj razini npr u umjetnim samoorganiziranim
strukturama,ANN. Ovdje se razmatraju samo ciljno usmjerene akcije
interno zasnovane na spoznajno vođenim agentima čije se akcije
interno reguliraju ciljevima zasnovanim na uvjerenjima.

Međudjelovanje agenata i ciljeva
Prilagodba

Uvođenje

Negativno
djelovanje

Modifikacija plana u
cilju izbjegavanja
prepreke

Navođenje drugog da
napusti svoj prijeteći
cilj

Pozitivno
djelovanje

Prilagodba plana
ubacivanjem
iskorištenja akcije
drugog

Navođenje drugog da
slijedi cilj koji je nama
nužan

Stupnjevi interakcije društvenih agenata
Prvi stupanj: smetnja i ovisnost (vidjeti tablicu ranije datu)
Drugi stupanj: slaba društvena akcija - uvjerenje u mišljenje drugog - tj
traži se mogućnost predstavljanje mišljenja drugog agenta.
Kooerdinacija je tada moguća na reaktivni način tj da se uoči porble ili
na proaktivni način tj da se anticipiraju mogući ishodi akcije drugog
Treći stupanj: delegiranje akcije drugog, gdje prvi agent treba ili želi
akciju drugog agenta i uključuje je u svoj plan. Prvi agent ima
povjerenje u drugog.
Četvrti stupanj: jaka društena akcija - stvaranje ciljeva o akcijama i
ciljevima drugog agenta.
Peti stupanj: društveno prekrajanje cilja - agent dolazi do stupnja
prihvaćanja novog cilja ili razloga za prihvaćanje ciljeva drugog agenta,
dakle društveni agent je sposoban prihvatiti ciljeve izvana od drugih
agenata drugih frupa poput zahtjeva, potreba, naredbi, normi.
Razine kolaboracije: x prihvaća točno ono što mu je delegirao y, x
prelazi tu razinu, no cilj y-a se ne mijenja, x zadovoljava rezultete
traženog plana/akcije ali ih pritom mijenja (kritično!), x shvaća da je
pretjerao i mijenja akciju ...

Struktura komunikacije agenata
Osnovna struktura komunikacije int. agenata sastoji se u potrebi
definiranja dosega konteksta. Razgovor agenata možemo promatrati
kao linearni segment sve dok se na počne pozivati na kontekst iskazan
jednom ranije. U tom smislu možemo razlikovati događajni i
komunikacijski od informatičkog dijela razgovora. Intuitivno je jasno
kada se neki dio razgovora može izdvojiti. No ne postoji konsenzus o
tome što je to segment razgovora. Osnovno je uvidjeti da: postoji
tehnika analize rečenica unutar segmenta i postoji suodnos segmenata
razgovora. Iz praktičnih razloga segment razgovora se sastoji od iskaza
koji očitavaju lokalnu neproturječnost. Segement bi trebao imati
sljedeća svojstva:
– upotrebljivost neke tehnike za vremensko referiranje za postupak s kratkim
izrazima (elipse)
– čvrsto vrijeme i mjesto obilježava iskaze ili je napredovanje vremena i
mjesta jednostavno
– čvrsto određeni skup govornika i slušatelja sudjeluje u razgovoru
– čvrsti skup pozadinskih pretpostavki je relevantan

Opis događaja, informatički odnos,
komunikacijski cilj
Analizira se linearni niz događaja koji čini segment -u segmentu
ne smije doći do promjene situacije - npr promjene broja
konverzanata, skok u vremenu.
Strukture segmenata mogu biti linearne, uklopljene. Ključne
riječi odrđuju promjenu strukture događaja.
Konverzanti se određuju svojim informatičkim (semantičkim) i
komunikacijskim (volja, moć, apobetika, pragmatika) vidom.
Informatički odnos uključuje pretpostavke o ponašanju okoliša.
Komunikacijski cilj se u osnovici sastoji od prepoznavanja cilja
sugovornika.

Što je nužno za izgradnju konverzacijskog
agenta
Ljudi djeluju zato što imaju ciljeve, zbog svjesnosti situacije u
kojoj se nalaze, a imaju pozitivne i negativne osjećaje prema
datoj situaciji.
Recimo da želite prijeći prometnu cestu na neoznačenom
prijelazu. Tada morate:
–
–
–
–
–
–
–

promotriti cestu - opažaj
imati predstavu o tome što se događa - uvjerenje
moći stvoriti pozitivne / negativne osjećaje prema datoj situaciji želja / potreba
biti u stanju izvoditi zaključke - planiranje / zaključivanje
biti u stanju stvaranje odluke djelovanja - odlučnost
biti u stanju održati namjeraveni tijek akcije - nakana
moći djelovati i time promijeniti stanje - djelovanje

Dakle, morate posjedovati četiri procesne (opažaj, planiranje, odlučnost
i djelovanje) te tri spoznajne ( uvjerenje, želje i nakane) osobine.

Što je nužno za izgradnju konverzacijskog
agenta/2
Dijagram: uvjerenje - želje - nakane

Planiranje
Opažaj
Uvjerenja
Odlučnost
Želje

Nakane

Djelovanj
e

Razgovor
Razgovor kao linearni niz iskaza
Pojam segmenta razgovora i ključnih fraza koji ukazuju na
strukturu segmentacije
Utjecaj strukture segmenta na interpretaciju pojedinih izraza
posebno pridjeva
Utjecaj međudjelovanja segmenta i zaključivanja za
razumijevanje sadržaja razgovora
Utjecaj vremenski ovisnih pojava i uzročno - posljedičnih pojava
na segmentiranje razgovora
Konačni model razumijevanja razgovora
Primjer

Komunikacija kao djelovanje među
agentima
Govor (slika, riječ, simbol, signal) nužno uključuje više agenata. Cilj govora je
djelovanje jedne osobe na spoznajno stanje druge.
Situacije:
– Agent A signalizira znak X - Agent B to prepozna i koristi
– Agent A signalizira znak X - ali iz drugog razloga - B prepozna i griješi
– Agent A signalizira znak X - Agent B misli da je to neki drugi razlog i ne
reagira
– Dakle komunikacija se događa kada jedan agent namjerava komunicirati a
drugi prepozna tu njegovu nakanu. Druga strana komunikacije je
dogovoreni skup konvencija s unaprijed dogovorenim značenjem.
– Postoji dakle važna razlika između fizičkog čina i komunikacijskog čina.
– Austin je (1962) ustvrdio da postoje:
čin lokucije (recimo: izgovaranje riječi)
čin ilokucije ( čin izričaja značenja)
čin perlokucije (stvarni učin, rezultat izgovorenog)

Predstavljanje spoznajnih stanja
Podaci su ono što postoji u bazama podataka. Ako međutim
skupljamo znanje onda možemo oblikovati bazu znanja. Znanje
se predstavlja u obliku općepoznatog znanja i znanja
svojstvenog nekoj datoj situaciji. Opće znanje služi za
razlučivanje značenja u dvosmislenim iskazima i situacijama.
Specifično znanje služi za opis date situacije te za razlučivanje
značenja riječi, signala u konkretnoj situaciji.
Sustav za predstavljanje znanja sastoji se od baze znanja i
pravila zaključivanja. Pravila zaključivanja izvode iz baze znanja
nove iskaze, zaključke. Mnogi zaključci su sadržani u bazi
znanja, ili se izvode iz baze znanja, tzv implikacijama.
Tehnike zaključivanja su deduktivne ili nededuktivne.
Deduktivno zaključivanje je logički opravdano. Nededuktivno
zaključivanje može biti: učenje općeg iz posebnog (induktivno
zaključivanje) ili zaključivanje na odziv iz pobude (abduktivno
zaključivanje).

Tehnika zaključivanja
Zaključivanje tipa A ⊃B (glasi: ako A onda B) je deduktivno.
Abduktivno je zaključivanje na A ako znamo da postoji B.
Težinsko zaključivanje dozvoljava iznimke. Označava se s
A ⇒B i glasi: ako vrijedi A⇒B a ¬B ne možemo dokazati tada
zaključujemo da je B istinito. Tako rečenicu “Ptice lete” možemo
predstaviti kao
∀ x PTICA(x)⇒LETI(x)
(63).
Ovakvo zaključivanje naziva se nemonotono.
Postoji nemonotono zaključivanje drugog tipa zasnovanog na
zamisli zatvorenog svijeta. Tada se za sve što ne možemo
dokazati da je ispravno uzima da je neispravno (jezik Prolog).
Za zaključivanje se rabi predikatska logika prvog reda (s
proširenjima), tzv modalna logika, tako da se sheme
predstavljanja znanja poput semantičke mreže ili okvira mogu
relativno jednostavno obraditi.

Predstavljanje znanja
Obradimo djelovanje tipa “KUPNJA” sljedećim okvirom:

Klasa akcije: KUPNJA(k)
Uloge: Kupac, Prodavač, Predmet, Novac
Ograničenja: Čovjek(Kupac), AgentProdaje(Prodavač), JestPredmet(Predmet)
Vrijednost(Novac), Cijena(Predmet)
Preduvjeti: POSJEDUJE(Kupac, Novac), POSJEDUJE(Prodavač, Predmet)
Učini: ¬POSJEDUJE(Kupac,Novac),¬POSJEDUJE(Prodavač,Predmet)
POSJEDUJE(Kupac,Predmet), POSJEDUJE(Prodavač,Novac)
Opis: DAJE(Kupac,Prodavač,Novac), DAJE(Prodavač, Kupac, Predmet)

Koherentno znanje
Znanje o djelovanju uzročnosti i svakodnevnosti bitno je za
razumijevanje informacijskog konteksta i jednoznačno
djelovanje. Ovo je znanja osnovica za stvaranje očekivanja i
usporedbe mogućih interpretacija ulazne pobude. Značajna je tu
kontrola generiranja očekivanja. Koriste se postupci poput:
referentnih znanja, očekivanja, razumijevanja stereotipičnih
situacija, hijerarhijskih planova i zaključivanje tipa pobude-učina.
Inteligentan agent ponaša se u krugovima postupaka:
– 1. Promatra tekuću situaciju, uključivo i nadzor nad uspjehom
neposredno poduzete akcije
– 2. Odabire cilj, skup ciljeva, na koje se usredotočuje
– 3. Započinje razvijati plan kako postići te ciljeve
– 4. Izvodi akcije u planu kada ih smatra primjerenim

Prostori uvjerenja
Razmjena informacije je ograničena ako agent posjeduje samo
jednu bazu znanja - svoju! Tada ne može npr predstaviti
informaciju o uvjerenju drugog agenta. Nadalje, nema nikakve
svijesti o sebi jer ne može razlikovati između onog što on vjeruje
i onog što vidi u svijetu oko sebe. Dakle, nema osnovice ni za
uporabu opažaja.
Najjednostavnije rješenje jest podjela baze znanja na dva
područja uvjerenja. Takav prostor je naprosto skup iskaza i sam
po sebi je baza znanja. Svaka se može koristiti za
predstavljanje nekog agentovog uvjerenja. Za razgovor dviju
strana tada trebamo dva prostora: jedan za predstavljanje
znanja jednog a drugi za predstavljanje znanja drugog agenta
Ovo nije realističan model znanja jednog agenta, jer mu daje izravan uvid
u znanje drugog agenta. Bolje je sve postaviti relativno na stranu agenta
čije ponašanje modeliramo. Uvodimo predikat: UVJ(erenje).

Predstavljanje agentovog uvjerenja
UVJ(Ivo1,Pas(Fido1))
UVJ(Ivo1, ∀x:Pas(x),
Laje(x))
UVJ(Ivo1,UVJ(Ana1,
Pas(Fido1))
UVJ(Ivo1,UVJ(Ana1,∀x:
Pas (x). Laje(x)))
UVJ(Ivo1, UVJ(Ana1,
∀x: Pas(x), Laje(x) ⊃
Oštar(x))

Iskazi u modalnoj logici

Prostor 1: Ivino uvjerenje
Pas(Fido1)
∀x: Pas(x), Laje(x)
UVJ(Ana, Prostor 2)

Prostor 2: Ivino uvjerenje o Aninom uvjerenju
Pas(Fido1)
∀x: Pas(x), Laje(x)
∀x: Pas(x), Laje(x) ⊃ Oštar(x)

Iskazi u prostorima uvjerenja

121 teorija informacije_07-08

Recommandé

Recommandé

Contenu connexe

Similaire à 121 teorija informacije_07-08

Similaire à 121 teorija informacije_07-08 (10)

121 teorija informacije_07-08