Gegevensbanken En Gebruikers

Gegevensbanken
en hun gebruikers
Prof. Erik Duval
2009 - 2010

1

http://www.slideshare.net/erik.duval

2

• inleiding
• een voorbeeld
• kenmerken van de gegevensbankbenadering
• betrokken personen
• personen op de achtergrond
• voordelen van het gebruik van gegevensbanken
• implicaties van de gegevensbankbenadering
• wanneer geen gegevensbanken gebruiken

3

• programma-gegevens
• korte levensduur:variabelen, objecten
werkgeheugen
• lange levensduur: persistent
bestanden en gegevensbanken
• interpretatie gegevens
gedeﬁnieerd in programma
• record, klasse, ...

6

• Bestanden

• elk programma deﬁnieert structuur

• meerdere programma’s: redundantie of omzetten

• Gegevensbanken

• data + metadata die structuur beschrijft

• onafhankelijk van programma’s die er mee werken

Wat zou KULeuven gegevensbank
over studenten bevatten?

Gegevensbank

• een verzameling centraal beheerde, permanent opgeslagen
gegevens die op elk tijdstip voor verschillende toepassingen
beschikbaar moet zijn
• behoeften
• alle gegevens van belang voor alle voorziene toepassingen
• elke toepassing ziet voor haar relevante gegevens
• verschillende toepassingen delen dezelfde gegevens
12

terminologie
• gegevensbanksysteem
= gegevensbank (gegevens zelf)
+ gegevensbankbeheerssysteem
(DataBase Management System)
• DBMS
• creatie gegevensbankstructuur (schema)
• toevoegen, weglaten, wijzigen gegevens
• opvragen gegevens
14

kenmerken

• onafhankelijk van programma’s (self-describing)
• gegevensabstractie:
• details van implementatie verborgen ➥
• meerdere “views” naargelang van de toepassing ➥
• meerdere gebruikers

16

• Administrator (DBA: database administrator)
• beheerder van de gegevensbank
• verleent toegang tot (een deel van)
gegevensbank
• Ontwerper van de gegevensbank
• identificeert relevante gegevens
• definieert gepaste structuren
• definieert views voor groepen van gebruikers

20

http://www.itprofessional.be/blogs/112581/sql%2dque%2d/?utm_source=it_itpro_daily&utm_medium=newsletter&utm_term=&utm_content=0_art_list&utm_campaign=daily

21

• Eindgebruikers
• Toevallige gebruikers
• "nu en dan" informatie, hoog-niveau vraagtaal
• Naïeve (parametrische) gebruikers
• intensief gebruik, steeds dezelfde
voorgeprogrammeerde bewerkingen
• vb: reservatie vliegtuigtickets, ...
• Gebruikers met complexe wensen
• leren zelf alle details van het DBMS
• Alleenstaande gebruikers
• programmapakketten22met gemakkelijke interface

• Systeemanalysten
• bepalen de noden van de gebruiker
• speciﬁceren transacties
• Toepassingsprogrammeurs
• implementeren speciﬁcaties

23

• DBMS ontwerpers en ontwikkelaars
• Ontwikkelaars van tools
• vb. graﬁsche interface voor gegevensbankontwerp
• vb. generatie van testgegevens,
simulatie van de werking van de gegevensbank
• Operators en onderhoudspersoneel
• nieuwe versies installeren,
• hardwarebenodigdheden opvolgen

24

Redundantie
• verschillende programma's hebben zelfde gegevens nodig
• zelfde gegevens in verschillende bestanden
• meer werk om gegevens in te voeren
• verspilling van geheugenruimte
• bestanden kunnen inconsistent worden
• gegevensbank vermijdt of beperkt redundantie
• sla elk gegeven slechts 1 keer op
• indien toch redundantie nodig (bv. voor efﬁciëntie):
goed gedocumenteerd 26

• Niet-toegelaten toegang beperken
• Bepaalde gegevens afschermen voor bepaalde gebruikers
• Persistente opslag
• traditionele gegevensbanken: relatief ingewikkeld
• "impedance mismatch problem"

• → objectgerichte gegevensbanken

• → automatisch genereren van interface-software

27

• Opslagstructuren voor effciënte verwerking van queries
• indexen, buffering
• query-verwerking en -optimalisatie
• Back-up en herstel
• DBMS moet GB in oorspronkelijke toestand herstellen
• per ongeluk wissen / wijzigen van gegevens
• crash tijdens ingewikkelde aanpassing van GB
• Verschillende gebruikersinterfaces
• aangepast aan verschillende groepen gebruikers
28

• Complexe relaties tussen gegevens voorstellen en gebruiken
• vb. geef alle punten van student Smith (#17) in het jaar
2005 (met bijhorende cursus).
• punten opzoeken in GRADE_REPORT
• bijhorende secties opzoeken in SECTION
• voor die secties die in het juiste jaar vallen:
cursusnaam opzoeken via COURSE
• resultaten combineren

29

• Integriteitsbeperkingen opleggen
• vb. verbanden tussen verschillende relaties
• Waarde voor SectionIdentiﬁer in GRADE_REPORT
moet voorkomen in SECTION
• Geen 2 studenten met zelfde StudentNumber
• ...
• beperkingen volgen uit semantiek van gegevens
(business rules)
• gebruiker moet beperkingen kunnen deﬁniëren
• of: DBMS controleert en legt op
• of: update- of invoer-programma’s controleren

• Inferentie en automatische acties
• sommige gegevensbanksystemen bieden de mogelijkheid om
nieuwe informatie af te leiden uit de opgeslagen feiten
(=inferentie van nieuwe informatie): deductieve
gegevensbanksystemen
• automatisch acties ondernemen volgens bepaalde regels:
• triggers
• stored procedures
• active database systems

• meer standaardisatie voor gegevensbeheer
• DBA beheert alle gegevens, kan standaard opleggen
• ﬂexibiliteit
• veranderingen mogelijk zonder toepassingsprogramma's te
moeten herschrijven
• verminderde ontwikkelingstijd voor nieuwe toepassingen
• beschikbaarheid van up-to-date informatie
• elke wijziging direct voor iedereen zichtbaar
• schaalvergroting → efﬁciënter beheer

• hiërarchisch en netwerk gegevensbanken
• conceptuele relaties vermengd met fysische opslag
• efﬁciënte toegang
• aanpassing voor nieuwe queries
moeilijk en weinig efﬁciënt
• enkel via programmeertalen

• relationele gegevensbanken
• fysische opslag gescheiden
van conceptuele relaties
• wiskundige grondslag
• hoog niveau opvraagtaal
• gegevensbank kan
gereorganiseerd worden
zonder impact op queries
• commerciële systemen:
1980 - eerst erg traag
• nu dominant June 1970

• object-gerichte gegevensbanken
• geen “impedance mismatch”
• maar
• complex model
• geen vroege standaard
• nu: niche
• CAD/CAM, multimedia, ...
• web
• vaak uit gegevensbanken: Linux+Apache+Mysql+Php
• XML

• nieuwe toepassingen
• wetenschappelijke gegevens, grid
• beelden: satelliet, medisch, ...
• video
• data mining
• Geograﬁsche Informatie Systemen
• tijdsreeks
• vereisen extra concepten

Wanneer niet?
• investering niet verantwoord
• hardware en software (DBMS)
• opleiding
• ...
• voordelen niet nodig
• ﬂexibele verwerking
• beveiliging, concurrentie, herstel, integriteit
• ...
38

Gegevensbanken En Gebruikers

Recommandé

Recommandé

Contenu connexe

Similaire à Gegevensbanken En Gebruikers

Similaire à Gegevensbanken En Gebruikers (20)

Plus de Erik Duval

Plus de Erik Duval (20)

Gegevensbanken En Gebruikers