SlideShare une entreprise Scribd logo
Bases de données :

 Introduction et
    Objectifs
2


                       1. Introduction
• Les entreprises gèrent des volumes de données très grands
   – Giga, Terra, Péta –octets
   – Numériques, Textuelles, Multi-média (images, films,...)
• Il faut pouvoir facilement
   – Archiver les données sur mémoires secondaires permanente
   – Retrouver les données pertinentes à un traitement
   – Mettre à jour les données variant dans le temps
• Les données sont structurées et identifiées
   – Données élémentaires ex: Votre salaire, Votre note en BD
   – Données composées ex: Votre CV, vos résultats de l'année
   – Identifiant humain ex: NSS ou machine: P26215
• Qu'est-ce qu'une BD ?
   – Collection de données structurées reliées par des relations
   – Interrogeable et modifiable par des langages de haut niveau
3


           La hiérarchie des mémoires
Capacité         Mémoire
   vs            terciaire
Coût &                            • Un accès disque est environ
Vitesse                             100,000 fois plus lent qu’un
                                    accès mémoire!
5-10 ms          Mémoire
                                  •    ⇒
                secondaire
                                      – Eviter les accès disques
                                           • grande mémoire principale

80-200 ns    Mémoire principale       – Amortir les accès disques
                 (RAM)                     • placement des données
                                      – Minimiser le nombre d’accès disques
3-10 ns       Cache (SRAM)                 • méthodes d’accès


2-5 ns           Registres
4


                       Un peu d'histoire
• Années 60:
   – Récipients logique de données  fichiers sur dique
   – Accès séquentiel puis sur clé
       • Lire (Nomf, Article), Ecrire (Nomf, Article)
       • Lire (Nomf, Article, Clé), Ecrire (Nomf, article, Clé)

• Années 70:
   – Avènement des Bases de Données Réseaux (BD)
   – Ensemble de fichiers reliés par des pointeurs
   – Langage d'interrogation par navigation
• Années 80:
   – Avènement des Bases de Données Relationnelles (BDR)
   – Relations entre ensemble de données
   – Langage d'interrogation par assertion logique
Systèmes de fichiers         Caractéristiques
                                                  5




Comptabilité      Chirurgie



                               Problèmes

Consultations    Psychiatrie
Format des fichiers                    Caractéristiques
                                                                  6



                                       Plusieurs applications
                                        plusieurs formats
    Dupont            Dupond
    Symptomes : y
    Turlututu : sqj
                      Turlututusqjsk
                      Symptom: yyyy
                       Analyses xxxx
                                        plusieurs langages
    Symptomes : y
    Turlututu : sdd   Turlututudhjsd
    Analyses : xxx     Analyses :xx




                                       Problèmes
                                        Difficultés de gestion




    Duhpon            Duipont
                      Turlututu : sq

    Symptomes : yy    Symptomyyyy
    Analyses : xxxx    Analysesxxxx

    Symptomes : yy    Turlututudhjsd
Redondance (données) Caractéristiques                               7



                                        Plusieurs applications
                                         plusieurs formats
     Dupont            Dupond
     Symptomes : y
     Turlututu : sqj
                       Turlututusqjsk
                       Symptom: yyyy
                        Analyses xxxx
                                         plusieurs langages
     Symptomes : y
     Turlututu : sdd   Turlututudhjsd
     Analyses : xxx     Analyses :xx
                                        Redondance de données




                                        Problèmes
                                         Difficultés de gestion
                                         Incohérence des données



     Duhpon            Duipont
                       Turlututu : sq

     Symptomes : yy    Symptomyyyy
     Analyses : xxxx    Analysesxxxx

     Symptomes : yy    Turlututudhjsd
Interrogations                                                 Caractéristiques
                                                                                                 8



                                                               Plusieurs applications
 ComptaSoft                                                     plusieurs formats
              Dupont            Dupond




                                                  ChiruSoft
              Symptomes : y
              Turlututu : sqj
                                Turlututusqjsk
                                Symptom: yyyy
                                 Analyses xxxx
                                                                plusieurs langages
              Symptomes : y
              Turlututu : sdd   Turlututudhjsd
              Analyses : xxx     Analyses :xx
                                                               Redondance de données
                                                               Pas de facilité d’interrogation
                                                                Question ⇒développement




                                                               Problèmes
                                                                  Difficultés de gestion
                                                                  Incohérence des données
                                                                  Coûts élevés
                                                                  Maintenance difficile
                                                 PsychiaSoft
ConsultSoft




              Duhpon            Duipont
                                Turlututu : sq

              Symptomes : yy    Symptomyyyy
              Analyses : xxxx    Analysesxxxx

              Symptomes : yy    Turlututudhjsd
Pannes ???                                       Caractéristiques
                                                                                                 9



                                                               Plusieurs applications
 ComptaSoft                                                     plusieurs formats
              Dupont            Dupond




                                                  ChiruSoft
              Symptomes : y
              Turlututu : sqj
                                Turlututusqjsk
                                Symptom: yyyy
                                 Analyses xxxx
                                                                plusieurs langages
              Symptomes : y
              Turlututu : sdd   Turlututudhjsd
              Analyses : xxx     Analyses :xx
                                                               Redondance de données
                                                               Pas de facilité d’interrogation
                                                                Question ⇒développement

                                                               Redondance de code


                                                               Problèmes
                                                                  Difficultés de gestion
                                                                  Incohérence des données
                                                                  Coûts élevés
                                                                  Maintenance difficile
                                                 PsychiaSoft
ConsultSoft




              Duhpon            Duipont
                                Turlututu : sq
                                                                  Gestion de pannes ???
              Symptomes : yy    Symptomyyyy
              Analyses : xxxx    Analysesxxxx

              Symptomes : yy    Turlututudhjsd
Partage de données                                               Caractéristiques
                                                                                                   10



                                                                 Plusieurs applications
   ComptaSoft                                                     plusieurs formats
                Dupont            Dupond




                                                    ChiruSoft
                Symptomes : y
                Turlututu : sqj
                                  Turlututusqjsk
                                  Symptom: yyyy
                                   Analyses xxxx
                                                                  plusieurs langages
                Symptomes : y
                Turlututu : sdd   Turlututudhjsd
                Analyses : xxx     Analyses :xx
                                                                 Redondance de données
                                                                 Pas de facilité d’interrogation
                                                                  Question ⇒développement

                                                                 Redondance de code


                                                                 Problèmes
                                                                    Difficultés de gestion
                                                                    Incohérence des données
                                                                    Coûts élevés
                                                                    Maintenance difficile
                                                   PsychiaSoft
  ConsultSoft




                Duhpon            Duipont
                                  Turlututu : sq
                                                                    Gestion de pannes ???
                Symptomes : yy
                Analyses : xxxx
                                  Symptomyyyy
                                   Analysesxxxx                     Partage des données ???
                Symptomes : yy    Turlututudhjsd
Confidentialité                                                Caractéristiques
                                                                                                 11



                                                               Plusieurs applications
 ComptaSoft                                                     plusieurs formats
              Dupont            Dupond




                                                  ChiruSoft
              Symptomes : y
              Turlututu : sqj
                                Turlututusqjsk
                                Symptom: yyyy
                                 Analyses xxxx
                                                                plusieurs langages
              Symptomes : y
              Turlututu : sdd   Turlututudhjsd
              Analyses : xxx     Analyses :xx
                                                               Redondance de données
                                                               Pas de facilité d’interrogation
                                                                Question ⇒développement

                                                               Redondance de code


                                                               Problèmes
                                                                  Difficultés de gestion
                                                                  Incohérence des données
                                                                  Coûts élevés
                                                                  Maintenance difficile
                                                 PsychiaSoft
ConsultSoft




              Duhpon            Duipont
                                Turlututu : sq
                                                                  Gestion de pannes ???
              Symptomes : yy
              Analyses : xxxx
                                Symptomyyyy
                                 Analysesxxxx                     Partage des données ???
              Symptomes : yy    Turlututudhjsd

                                                                  Confidentialité ???
12


    L’approche ‘‘Bases de données’’
• Modélisation des données
   Eliminer la redondance de données
   Centraliser et organiser correctement les données
   Plusieurs niveaux de modélisation
   Outils de conception


• Logiciel «Système de Gestion de Bases de Données»
  Factorisation des modules de contrôle des applications
     - Interrogation, cohérence, partage, gestion de pannes, etc…
  Administration facilitées des données
13

             Modélisation du réel

Réel

             • Indépendant du
Modèle         modèle de données

conceptuel   • Indépendant du
               SGBD                    Médecin          effectue          Visite



             • Dépendant du
Modèle         modèle de données
                                   Codasyl       Relationnel       Objet           XML
logique      • Indépendant du
               SGBD


Modèle       • Dépendant du
               modèle de données
                                        • Organisation physique des données
                                        • Structures de stockage des données
Physique     • Dépendant du SGBD        • Structures accélératrices (index)
14

        Modélisation Relationnelle (1)
                                      Champs, attributs,
Relation ou table                        colonnes


                    Id-D   Nom      Prénom
                     1     Dupont   Pierre
                     2     Durand    Paul
                     3     Masse     Jean
                    ….     ……..      ……




                                              Tuples, lignes ou
                                                  n-uplets
15

                  Modélisation Relationnelle (2)
       Docteurs                                                                                  Prescriptions
Id-D    Nom       Prénom                                                                Id-V     Ligne    Id-M    Posologie
 1     Dupont      Pierre
                                     Visites                                                1     1        12     1 par jour
 2     Durand       Paul                                                                    1     2         5     10 gouttes
                               Id-D     Id-P   Id-V     Date            Prix
 3     Masse        Jean                                                                    2     1         8     2 par jour
                                 1       2      1      15 juin          250
….     ……..         ……                                                                      2     2        12     1 par jour
                                 1       1      2     12 août           180
                                 2       2      3     13 juillet        350                 2     3         3      2 gouttes

                                 2       3      4      1 mars           250                 ….    ….       ….     …………


                Patients
Id-P    Nom        Prénom     Ville                                                     Médicaments
 1     Lebeau      Jacques    Paris                              Id-M             Nom                    Description
 2      Troger      Zoe       Evry                                 1          Aspegic 1000       ……………………………..
 3       Doe        John      Paris                                2            Fluisédal        ……………………………..
 4      Perry       Paule    Valenton                              3           Mucomyst          ……………………………..
 ….     …….         …….       …….                                  ….            ……..            ……………………………..
2. Objectifs des SGBD                                                    16




                          I- Indépendance
                              Physique


        X - Standards                           II- Indépendance
                                                     Logique


IX - Gestion de la                                     III – Langage de
 confidentialité                                         manipulation


VIII - Concurrence            BD                       IV - Gestion des
      d’accès                                                vues


      VII - Gestion des                        V - Optimisation des
           pannes                                   questions


                          VI - Gestion de la
                              cohérence
17


       I - Indépendance Physique
• Indépendance des programmes
  d'applications vis à vis du modèle physique :
  – Possibilité de modifier les structures de stockage
    (fichiers, index, chemins d'accès, …) sans modifier
    les programmes;
  – Ecriture des applications par des non-spécialistes
    des fichiers et des structures de stockage;
  – Meilleure portabilité des applications et
    indépendance vis à vis du matériel.
18


                        II - Indépendance Logique
Les applications peuvent définir des vues logiques de la BD
        Gestion des médicaments                                                  Cabinet du Dr. Masse
                   Nombre_Médicaments                                                                                                                        Prescription
                                                                                                                                                  Id - V    Ligne     Id - M      Posologie
 Id-M       Nom             Description   Nombre                                           Visites
                                                                                                                                                    1        1          12        1 par jour
                                                                                  Id - D     Id - P   Id - V   Date            Prix
                                                                                                                                                    1        2          5         10 gouttes
  1      Aspegic 1000   ……………………………..       30                                      1          2        1      15 juin         250
                                                                                                                                                   ….       ….         ….         …………
                                                                                    2          3        4      1 mars          250
  2        Fluisédal    ……………………………..       20
                                                            Patients
  3       Mucomyst      ……………………………..      230     Id - P   Nom        Prénom                                                                     Médicament
                                                     1      Lebeau     Jacques                                        Id - M            Nom                         Description
 ….         ……..        ……………………………..      …..       2      Troger      Zoe                                              1        Aspegic 1000             ……………………………..

                                                    ….      …….        …….                                               2            Fluisédal            ……………………………..
                                                                                                                         3            Mucomyst             ……………………………..
                                                                                                                         ….            ……..                ……………………………..
19


Avantages de l’indépendance logique
• Possibilité pour chaque application d'ignorer les besoins des
  autres (bien que partageant la même BD).
• Possibilité d'évolution de la base de données sans réécriture
  des applications :
   – ajout de champs, ajout de relation, renommage de champs.

• Possibilité d'intégrer des applications existantes sans
  modifier les autres.
• Possibilité de limiter les conséquences du partage : Données
  confidentielles.
20


         III - Manipulation aisée
• La manipulation se fait via un langage déclaratif
   – La question déclare l’objectif sans décrire la méthode
   – Le langage suit une norme commune à tous les SGBD
   – SQL : Structured Query Langage

• Sémantique
   – Logique du 1er ordre ++
• Syntaxe (aperçu !)
   – SELECT <structure des résultats>
   – FROM <relations>
   – WHERE <conditions>
21


IV – Des vues multiples des données
• Les vues permettent d’implémenter l’indépendance logique
  en permettant de créer des relations virtuelles
• Vue = Question stockée
• Le SGBD stocke la définition et non le résultat
• Exemple :
   –   la vue des patients parisiens
   –   la vue des docteurs avec leurs patients
   –   La vue des services statistiques
   –   ...
22


       V –Exécution et Optimisation
• Traduction automatique des questions déclaratives en
  programmes procéduraux :
    Utilisation de l’algèbre relationnelle

• Optimisation automatique des questions
    Utilisation de l’aspect déclaratif de SQL
    Gestion centralisée des chemins d'accès (index, hachages, …)
    Techniques d’optimisation poussées

• Economie de l'astuce des programmeurs
   – milliers d'heures d'écriture et de maintenance de logiciels.
23


               VI - Intégrité Logique
• Objectif : Détecter les mises à jour erronées

• Contrôle sur les données élémentaires
   – Contrôle de types: ex: Nom alphabétique
   – Contrôle de valeurs: ex: Salaire mensuel entre 5 et 50kf

• Contrôle sur les relations entre les données
   – Relations entre données élémentaires:
      • Prix de vente > Prix d'achat
   – Relations entre objets:
      • Un électeur doit être inscrit sur une seule liste électorale
24


          Contraintes d’intégrité
• Avantages :
  – simplification du code des applications
  – sécurité renforcée par l'automatisation
  – mise en commun des contraintes


• Nécessite :
  – un langage de définition de contraintes d'intégrité
  – la vérification automatique de ces contraintes
25


               VII - Intégrité Physique
• Motivations : Tolérance aux fautes
   –   Transaction Failure : Contraintes d'intégrité, Annulation
   –   System Failure : Panne de courant, Crash serveur ...
   –   Media Failure : Perte du disque
   –   Communication Failure : Défaillance du réseau

• Objectifs :
   – Assurer l'atomicité des transactions
   – Garantir la durabilité des effets des transactions commises

• Moyens :
   – Journalisation : Mémorisation des états successifs des données
   – Mécanismes de reprise
26


                  Transaction

                  Incohérence possible...
  Etat cohérent                             Etat cohérent


Begin                                                   Commit
                    Transaction



         Begin
          CEpargne = CEpargne - 3000
          CCourant = CCourant + 3000
         Commit T1
27


             Atomicité et Durabilité


   ATOMICITE                            DURABILITE
                        Panne
Begin                           Begin
 CEpargne = CEpargne - 3000      CEpargne = CEpargne - 3000
 CCourant = CCourant + 3000      CCourant = CCourant + 3000
Commit T1                       Commit T1
                                          Crash disque



 Annuler le débit !!            S’assurer que le
                                virement a été fait !
28


         VIII - Partage des données


               BD




• Accès concurrent aux mêmes données
Conflits d’accès !!
29


             Isolation et Cohérence


                BD



• Le SGBD gère les accès concurrents
 Chacun à l’impression d’être seul (Isolation)
 Cohérence conservée (Pas de maj conflictuelles)
30


               IX – Confidentialité
• Objectif : Protéger les données de la BD contre des accès
  non autorisés

• Deux niveaux :
   – Connexion restreinte aux usagers répertoriés (mot de passe)
   – Privilèges d'accès aux objets de la base

• Usagers : Usager ou groupe d’usagers

• Objets : Relation, Vue, autres objets (procédures, etc.)
31


               X - Standardisation
• L’approche bases de données est basée sur plusieurs
  standards
   – Langage SQL (SQL1, SQL2, SQL3)
   – Communication SQL CLI (ODBC / JDBC)
   – Transactions (X/Open DTP, OSI-TP)


• Force des standards
   – Portabilité
   – Interopérabilté
   – Applications multisources…
3. Architecture des
                        SGBD sont très liées au mode de
Les architectures physiques de SGBD
répartition.
— BD centralisée
— BD client/serveur
— BD client/multi-serveurs
— BD répartie
— BD hétérogène
— BD mobile
Le challenge se déplace des Péta-bases aux Pico-bases.
— Péta-bases => parallélisme et grandes mémoires
— Pico-bases => faible empreinte et forte sécurité
33

Architecture centralisée

                               Terminaux passifs




                                    réseau




                                   Mainframe
Appli 1   Appli 2    Appli n



            SGBD

           données
Architecture client-
        serveur
                                Clients intelligents


Appli 1
           Appli 2
                      Appli n         réseau




                                      serveur



          SGBD


 code       données
35

                   Architecture Client-
                     Multiserveurs

                            Appli 1
                      SQL             SQL


                   ODBC                     ODBC

                                                SQL
         SQL



       SGBD 1                                  SGBD 2

code     données                        code     données
Architecture
                          répartie
                   Appli 1
                             Appli 2
                                       Appli n




       SGBD 1                                    SGBD 2

code     données                        code       données
Architecture
           mobile
                             Clients intelligents
                                   mobiles



       Données répliquées
        et/ou personnelles     Réseau sans fil




                                   serveur



        SGBD


code        données
38

 4. Applications traditionnelles
           des SGBD
• OLTP (On Line Transaction Processing)
  –   Cible des SGBD depuis leur existence
  –   Banques, réservation en ligne ...
  –   Très grand nombre de transactions en parallèle
  –   Transactions simples

• OLAP (On Line Analytical Processing)
  – Entrepôts de données, DataCube, Data Mining …
  – Faible nombre de transactions
  – Transactions très complexes
39


                Evolution des BD

               BD             BD          BD ‘light’    PicoDBMS
           d’entreprise   personnelles   (PDA / Tél.)   carte à puce

Capacité


  Prix


Nombre

Contenu connexe

Tendances

Algorithme & structures de données Chap I
Algorithme & structures de données Chap IAlgorithme & structures de données Chap I
Algorithme & structures de données Chap I
Ines Ouaz
 
Les System de Gestion de Base de Données
Les System de Gestion de Base de DonnéesLes System de Gestion de Base de Données
Les System de Gestion de Base de Données
MONJIHWIDEG
 
cours base de données
cours base de donnéescours base de données
cours base de données
Yassine Badri
 
Chap1: Cours en C++
Chap1: Cours en C++Chap1: Cours en C++
Chap1: Cours en C++
Aziz Darouichi
 
cours algorithme et structure de données 1er année
cours algorithme et structure de données 1er annéecours algorithme et structure de données 1er année
cours algorithme et structure de données 1er année
Missaoui Abdelbaki
 
Chapitre6: Surcharge des opérateurs
Chapitre6:  Surcharge des opérateursChapitre6:  Surcharge des opérateurs
Chapitre6: Surcharge des opérateurs
Aziz Darouichi
 
Chp3 - Diagramme de Classes
Chp3 - Diagramme de ClassesChp3 - Diagramme de Classes
Chp3 - Diagramme de Classes
Lilia Sfaxi
 
Cours : les listes chainées Prof. KHALIFA MANSOURI
Cours : les listes chainées  Prof. KHALIFA MANSOURI Cours : les listes chainées  Prof. KHALIFA MANSOURI
Cours : les listes chainées Prof. KHALIFA MANSOURI
Mansouri Khalifa
 
Introduction à Python
Introduction à PythonIntroduction à Python
Introduction à Python
Abdoulaye Dieng
 
Python For Data Science - French Course
Python For Data Science - French CoursePython For Data Science - French Course
Python For Data Science - French Course
Haytam EL YOUSSFI
 
Création de bases de données
Création de bases de donnéesCréation de bases de données
Création de bases de données
Riadh ASSOUAK
 
Analyse merise Prof. Khalifa MANSOURI
Analyse merise Prof. Khalifa MANSOURIAnalyse merise Prof. Khalifa MANSOURI
Analyse merise Prof. Khalifa MANSOURI
Mansouri Khalifa
 
Cours Piles et files en utilisant lesl istes chainées Prof. KHALIFA MANSOURI
Cours Piles et files en utilisant lesl istes chainées Prof. KHALIFA MANSOURI Cours Piles et files en utilisant lesl istes chainées Prof. KHALIFA MANSOURI
Cours Piles et files en utilisant lesl istes chainées Prof. KHALIFA MANSOURI
Mansouri Khalifa
 
base de données -note de cours
base de données -note de cours base de données -note de cours
base de données -note de cours
Yassine Badri
 
Chap1V2019: Cours en C++
Chap1V2019: Cours en C++Chap1V2019: Cours en C++
Chap1V2019: Cours en C++
Aziz Darouichi
 
Chapitre2fonctionscppv2019
Chapitre2fonctionscppv2019Chapitre2fonctionscppv2019
Chapitre2fonctionscppv2019
Aziz Darouichi
 
chp1-Intro à l'urbanisation des SI.pdf
chp1-Intro à l'urbanisation des SI.pdfchp1-Intro à l'urbanisation des SI.pdf
chp1-Intro à l'urbanisation des SI.pdf
Lilia Sfaxi
 
Système d’exploitation: Principe
Système d’exploitation: PrincipeSystème d’exploitation: Principe
Système d’exploitation: Principe
Souhaib El
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
Lilia Sfaxi
 
Python.pptx
Python.pptxPython.pptx
Python.pptx
Jaouad Rachek
 

Tendances (20)

Algorithme & structures de données Chap I
Algorithme & structures de données Chap IAlgorithme & structures de données Chap I
Algorithme & structures de données Chap I
 
Les System de Gestion de Base de Données
Les System de Gestion de Base de DonnéesLes System de Gestion de Base de Données
Les System de Gestion de Base de Données
 
cours base de données
cours base de donnéescours base de données
cours base de données
 
Chap1: Cours en C++
Chap1: Cours en C++Chap1: Cours en C++
Chap1: Cours en C++
 
cours algorithme et structure de données 1er année
cours algorithme et structure de données 1er annéecours algorithme et structure de données 1er année
cours algorithme et structure de données 1er année
 
Chapitre6: Surcharge des opérateurs
Chapitre6:  Surcharge des opérateursChapitre6:  Surcharge des opérateurs
Chapitre6: Surcharge des opérateurs
 
Chp3 - Diagramme de Classes
Chp3 - Diagramme de ClassesChp3 - Diagramme de Classes
Chp3 - Diagramme de Classes
 
Cours : les listes chainées Prof. KHALIFA MANSOURI
Cours : les listes chainées  Prof. KHALIFA MANSOURI Cours : les listes chainées  Prof. KHALIFA MANSOURI
Cours : les listes chainées Prof. KHALIFA MANSOURI
 
Introduction à Python
Introduction à PythonIntroduction à Python
Introduction à Python
 
Python For Data Science - French Course
Python For Data Science - French CoursePython For Data Science - French Course
Python For Data Science - French Course
 
Création de bases de données
Création de bases de donnéesCréation de bases de données
Création de bases de données
 
Analyse merise Prof. Khalifa MANSOURI
Analyse merise Prof. Khalifa MANSOURIAnalyse merise Prof. Khalifa MANSOURI
Analyse merise Prof. Khalifa MANSOURI
 
Cours Piles et files en utilisant lesl istes chainées Prof. KHALIFA MANSOURI
Cours Piles et files en utilisant lesl istes chainées Prof. KHALIFA MANSOURI Cours Piles et files en utilisant lesl istes chainées Prof. KHALIFA MANSOURI
Cours Piles et files en utilisant lesl istes chainées Prof. KHALIFA MANSOURI
 
base de données -note de cours
base de données -note de cours base de données -note de cours
base de données -note de cours
 
Chap1V2019: Cours en C++
Chap1V2019: Cours en C++Chap1V2019: Cours en C++
Chap1V2019: Cours en C++
 
Chapitre2fonctionscppv2019
Chapitre2fonctionscppv2019Chapitre2fonctionscppv2019
Chapitre2fonctionscppv2019
 
chp1-Intro à l'urbanisation des SI.pdf
chp1-Intro à l'urbanisation des SI.pdfchp1-Intro à l'urbanisation des SI.pdf
chp1-Intro à l'urbanisation des SI.pdf
 
Système d’exploitation: Principe
Système d’exploitation: PrincipeSystème d’exploitation: Principe
Système d’exploitation: Principe
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Python.pptx
Python.pptxPython.pptx
Python.pptx
 

En vedette

Introduction aux SGBD
Introduction aux SGBDIntroduction aux SGBD
Introduction aux SGBD
Christophe Vaudry
 
Merise+ +exercices+mcd+-+corrigés
Merise+ +exercices+mcd+-+corrigésMerise+ +exercices+mcd+-+corrigés
Merise+ +exercices+mcd+-+corrigés
Majid CHADAD
 
exercices base de données - sql
exercices  base de données - sql exercices  base de données - sql
exercices base de données - sql
Yassine Badri
 
Types of databases
Types of databasesTypes of databases
Types of databases
PAQUIAAIZEL
 
Introduction to database
Introduction to databaseIntroduction to database
Introduction to database
Pongsakorn U-chupala
 
La historia de mi vida joselin cervantes
La historia de mi vida joselin cervantesLa historia de mi vida joselin cervantes
La historia de mi vida joselin cervantes
joselinCervantes
 
Los derechos humanos en el contexto de la violencia política peruana de los ú...
Los derechos humanos en el contexto de la violencia política peruana de los ú...Los derechos humanos en el contexto de la violencia política peruana de los ú...
Los derechos humanos en el contexto de la violencia política peruana de los ú...
Carlos Alberto Zavala Rodríguez
 
Ppt Einstein
Ppt EinsteinPpt Einstein
Ppt Einstein
jeanquirozm
 
Ben harrath arijtp3 les règles d'association
Ben harrath arijtp3 les règles d'association Ben harrath arijtp3 les règles d'association
Ben harrath arijtp3 les règles d'association
ARIJ BenHarrath
 
Les nouveautés de System Center Configuration Manager vNext
Les nouveautés de System Center Configuration Manager vNextLes nouveautés de System Center Configuration Manager vNext
Les nouveautés de System Center Configuration Manager vNext
Microsoft Décideurs IT
 
Community managers
Community managersCommunity managers
Community managers
Antonella Miñano Mendez
 
Hotel android
Hotel androidHotel android
Hotel android
gh hassen
 
Exportación y bibliografía
Exportación y bibliografíaExportación y bibliografía
Exportación y bibliografía
ahlemdris
 
Cavas arbol de los sueños
Cavas arbol de los sueñosCavas arbol de los sueños
Cavas arbol de los sueños
francyamu
 
Grupo 3 informática
Grupo 3 informáticaGrupo 3 informática
Grupo 3 informática
Nena Suriaga
 
Le Mag Sud Ouest
Le Mag Sud OuestLe Mag Sud Ouest
Le Mag Sud Ouest
Jean-Christophe Elineau
 
Archivierung von Video
Archivierung von VideoArchivierung von Video
Archivierung von Video
yvesnie
 
System Center 2012, la machinerie de l'ITIL
System Center 2012, la machinerie de l'ITILSystem Center 2012, la machinerie de l'ITIL
System Center 2012, la machinerie de l'ITIL
Microsoft Décideurs IT
 
Operación de-fraccionarios
Operación de-fraccionariosOperación de-fraccionarios
Operación de-fraccionarios
mafecarmon21
 

En vedette (20)

Introduction aux SGBD
Introduction aux SGBDIntroduction aux SGBD
Introduction aux SGBD
 
Cours Excel
Cours ExcelCours Excel
Cours Excel
 
Merise+ +exercices+mcd+-+corrigés
Merise+ +exercices+mcd+-+corrigésMerise+ +exercices+mcd+-+corrigés
Merise+ +exercices+mcd+-+corrigés
 
exercices base de données - sql
exercices  base de données - sql exercices  base de données - sql
exercices base de données - sql
 
Types of databases
Types of databasesTypes of databases
Types of databases
 
Introduction to database
Introduction to databaseIntroduction to database
Introduction to database
 
La historia de mi vida joselin cervantes
La historia de mi vida joselin cervantesLa historia de mi vida joselin cervantes
La historia de mi vida joselin cervantes
 
Los derechos humanos en el contexto de la violencia política peruana de los ú...
Los derechos humanos en el contexto de la violencia política peruana de los ú...Los derechos humanos en el contexto de la violencia política peruana de los ú...
Los derechos humanos en el contexto de la violencia política peruana de los ú...
 
Ppt Einstein
Ppt EinsteinPpt Einstein
Ppt Einstein
 
Ben harrath arijtp3 les règles d'association
Ben harrath arijtp3 les règles d'association Ben harrath arijtp3 les règles d'association
Ben harrath arijtp3 les règles d'association
 
Les nouveautés de System Center Configuration Manager vNext
Les nouveautés de System Center Configuration Manager vNextLes nouveautés de System Center Configuration Manager vNext
Les nouveautés de System Center Configuration Manager vNext
 
Community managers
Community managersCommunity managers
Community managers
 
Hotel android
Hotel androidHotel android
Hotel android
 
Exportación y bibliografía
Exportación y bibliografíaExportación y bibliografía
Exportación y bibliografía
 
Cavas arbol de los sueños
Cavas arbol de los sueñosCavas arbol de los sueños
Cavas arbol de los sueños
 
Grupo 3 informática
Grupo 3 informáticaGrupo 3 informática
Grupo 3 informática
 
Le Mag Sud Ouest
Le Mag Sud OuestLe Mag Sud Ouest
Le Mag Sud Ouest
 
Archivierung von Video
Archivierung von VideoArchivierung von Video
Archivierung von Video
 
System Center 2012, la machinerie de l'ITIL
System Center 2012, la machinerie de l'ITILSystem Center 2012, la machinerie de l'ITIL
System Center 2012, la machinerie de l'ITIL
 
Operación de-fraccionarios
Operación de-fraccionariosOperación de-fraccionarios
Operación de-fraccionarios
 

Introduction aux bases de données

  • 1. Bases de données : Introduction et Objectifs
  • 2. 2 1. Introduction • Les entreprises gèrent des volumes de données très grands – Giga, Terra, Péta –octets – Numériques, Textuelles, Multi-média (images, films,...) • Il faut pouvoir facilement – Archiver les données sur mémoires secondaires permanente – Retrouver les données pertinentes à un traitement – Mettre à jour les données variant dans le temps • Les données sont structurées et identifiées – Données élémentaires ex: Votre salaire, Votre note en BD – Données composées ex: Votre CV, vos résultats de l'année – Identifiant humain ex: NSS ou machine: P26215 • Qu'est-ce qu'une BD ? – Collection de données structurées reliées par des relations – Interrogeable et modifiable par des langages de haut niveau
  • 3. 3 La hiérarchie des mémoires Capacité Mémoire vs terciaire Coût & • Un accès disque est environ Vitesse 100,000 fois plus lent qu’un accès mémoire! 5-10 ms Mémoire • ⇒ secondaire – Eviter les accès disques • grande mémoire principale 80-200 ns Mémoire principale – Amortir les accès disques (RAM) • placement des données – Minimiser le nombre d’accès disques 3-10 ns Cache (SRAM) • méthodes d’accès 2-5 ns Registres
  • 4. 4 Un peu d'histoire • Années 60: – Récipients logique de données  fichiers sur dique – Accès séquentiel puis sur clé • Lire (Nomf, Article), Ecrire (Nomf, Article) • Lire (Nomf, Article, Clé), Ecrire (Nomf, article, Clé) • Années 70: – Avènement des Bases de Données Réseaux (BD) – Ensemble de fichiers reliés par des pointeurs – Langage d'interrogation par navigation • Années 80: – Avènement des Bases de Données Relationnelles (BDR) – Relations entre ensemble de données – Langage d'interrogation par assertion logique
  • 5. Systèmes de fichiers Caractéristiques 5 Comptabilité Chirurgie Problèmes Consultations Psychiatrie
  • 6. Format des fichiers Caractéristiques 6 Plusieurs applications  plusieurs formats Dupont Dupond Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Problèmes  Difficultés de gestion Duhpon Duipont Turlututu : sq Symptomes : yy Symptomyyyy Analyses : xxxx Analysesxxxx Symptomes : yy Turlututudhjsd
  • 7. Redondance (données) Caractéristiques 7 Plusieurs applications  plusieurs formats Dupont Dupond Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Redondance de données Problèmes  Difficultés de gestion  Incohérence des données Duhpon Duipont Turlututu : sq Symptomes : yy Symptomyyyy Analyses : xxxx Analysesxxxx Symptomes : yy Turlututudhjsd
  • 8. Interrogations Caractéristiques 8 Plusieurs applications ComptaSoft  plusieurs formats Dupont Dupond ChiruSoft Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Redondance de données Pas de facilité d’interrogation  Question ⇒développement Problèmes  Difficultés de gestion  Incohérence des données  Coûts élevés  Maintenance difficile PsychiaSoft ConsultSoft Duhpon Duipont Turlututu : sq Symptomes : yy Symptomyyyy Analyses : xxxx Analysesxxxx Symptomes : yy Turlututudhjsd
  • 9. Pannes ??? Caractéristiques 9 Plusieurs applications ComptaSoft  plusieurs formats Dupont Dupond ChiruSoft Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Redondance de données Pas de facilité d’interrogation  Question ⇒développement Redondance de code Problèmes  Difficultés de gestion  Incohérence des données  Coûts élevés  Maintenance difficile PsychiaSoft ConsultSoft Duhpon Duipont Turlututu : sq  Gestion de pannes ??? Symptomes : yy Symptomyyyy Analyses : xxxx Analysesxxxx Symptomes : yy Turlututudhjsd
  • 10. Partage de données Caractéristiques 10 Plusieurs applications ComptaSoft  plusieurs formats Dupont Dupond ChiruSoft Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Redondance de données Pas de facilité d’interrogation  Question ⇒développement Redondance de code Problèmes  Difficultés de gestion  Incohérence des données  Coûts élevés  Maintenance difficile PsychiaSoft ConsultSoft Duhpon Duipont Turlututu : sq  Gestion de pannes ??? Symptomes : yy Analyses : xxxx Symptomyyyy Analysesxxxx  Partage des données ??? Symptomes : yy Turlututudhjsd
  • 11. Confidentialité Caractéristiques 11 Plusieurs applications ComptaSoft  plusieurs formats Dupont Dupond ChiruSoft Symptomes : y Turlututu : sqj Turlututusqjsk Symptom: yyyy Analyses xxxx  plusieurs langages Symptomes : y Turlututu : sdd Turlututudhjsd Analyses : xxx Analyses :xx Redondance de données Pas de facilité d’interrogation  Question ⇒développement Redondance de code Problèmes  Difficultés de gestion  Incohérence des données  Coûts élevés  Maintenance difficile PsychiaSoft ConsultSoft Duhpon Duipont Turlututu : sq  Gestion de pannes ??? Symptomes : yy Analyses : xxxx Symptomyyyy Analysesxxxx  Partage des données ??? Symptomes : yy Turlututudhjsd  Confidentialité ???
  • 12. 12 L’approche ‘‘Bases de données’’ • Modélisation des données  Eliminer la redondance de données  Centraliser et organiser correctement les données  Plusieurs niveaux de modélisation  Outils de conception • Logiciel «Système de Gestion de Bases de Données» Factorisation des modules de contrôle des applications - Interrogation, cohérence, partage, gestion de pannes, etc… Administration facilitées des données
  • 13. 13 Modélisation du réel Réel • Indépendant du Modèle modèle de données conceptuel • Indépendant du SGBD Médecin effectue Visite • Dépendant du Modèle modèle de données Codasyl Relationnel Objet XML logique • Indépendant du SGBD Modèle • Dépendant du modèle de données • Organisation physique des données • Structures de stockage des données Physique • Dépendant du SGBD • Structures accélératrices (index)
  • 14. 14 Modélisation Relationnelle (1) Champs, attributs, Relation ou table colonnes Id-D Nom Prénom 1 Dupont Pierre 2 Durand Paul 3 Masse Jean …. …….. …… Tuples, lignes ou n-uplets
  • 15. 15 Modélisation Relationnelle (2) Docteurs Prescriptions Id-D Nom Prénom Id-V Ligne Id-M Posologie 1 Dupont Pierre Visites 1 1 12 1 par jour 2 Durand Paul 1 2 5 10 gouttes Id-D Id-P Id-V Date Prix 3 Masse Jean 2 1 8 2 par jour 1 2 1 15 juin 250 …. …….. …… 2 2 12 1 par jour 1 1 2 12 août 180 2 2 3 13 juillet 350 2 3 3 2 gouttes 2 3 4 1 mars 250 …. …. …. ………… Patients Id-P Nom Prénom Ville Médicaments 1 Lebeau Jacques Paris Id-M Nom Description 2 Troger Zoe Evry 1 Aspegic 1000 …………………………….. 3 Doe John Paris 2 Fluisédal …………………………….. 4 Perry Paule Valenton 3 Mucomyst …………………………….. …. ……. ……. ……. …. …….. ……………………………..
  • 16. 2. Objectifs des SGBD 16 I- Indépendance Physique X - Standards II- Indépendance Logique IX - Gestion de la III – Langage de confidentialité manipulation VIII - Concurrence BD IV - Gestion des d’accès vues VII - Gestion des V - Optimisation des pannes questions VI - Gestion de la cohérence
  • 17. 17 I - Indépendance Physique • Indépendance des programmes d'applications vis à vis du modèle physique : – Possibilité de modifier les structures de stockage (fichiers, index, chemins d'accès, …) sans modifier les programmes; – Ecriture des applications par des non-spécialistes des fichiers et des structures de stockage; – Meilleure portabilité des applications et indépendance vis à vis du matériel.
  • 18. 18 II - Indépendance Logique Les applications peuvent définir des vues logiques de la BD Gestion des médicaments Cabinet du Dr. Masse Nombre_Médicaments Prescription Id - V Ligne Id - M Posologie Id-M Nom Description Nombre Visites 1 1 12 1 par jour Id - D Id - P Id - V Date Prix 1 2 5 10 gouttes 1 Aspegic 1000 …………………………….. 30 1 2 1 15 juin 250 …. …. …. ………… 2 3 4 1 mars 250 2 Fluisédal …………………………….. 20 Patients 3 Mucomyst …………………………….. 230 Id - P Nom Prénom Médicament 1 Lebeau Jacques Id - M Nom Description …. …….. …………………………….. ….. 2 Troger Zoe 1 Aspegic 1000 …………………………….. …. ……. ……. 2 Fluisédal …………………………….. 3 Mucomyst …………………………….. …. …….. ……………………………..
  • 19. 19 Avantages de l’indépendance logique • Possibilité pour chaque application d'ignorer les besoins des autres (bien que partageant la même BD). • Possibilité d'évolution de la base de données sans réécriture des applications : – ajout de champs, ajout de relation, renommage de champs. • Possibilité d'intégrer des applications existantes sans modifier les autres. • Possibilité de limiter les conséquences du partage : Données confidentielles.
  • 20. 20 III - Manipulation aisée • La manipulation se fait via un langage déclaratif – La question déclare l’objectif sans décrire la méthode – Le langage suit une norme commune à tous les SGBD – SQL : Structured Query Langage • Sémantique – Logique du 1er ordre ++ • Syntaxe (aperçu !) – SELECT <structure des résultats> – FROM <relations> – WHERE <conditions>
  • 21. 21 IV – Des vues multiples des données • Les vues permettent d’implémenter l’indépendance logique en permettant de créer des relations virtuelles • Vue = Question stockée • Le SGBD stocke la définition et non le résultat • Exemple : – la vue des patients parisiens – la vue des docteurs avec leurs patients – La vue des services statistiques – ...
  • 22. 22 V –Exécution et Optimisation • Traduction automatique des questions déclaratives en programmes procéduraux :  Utilisation de l’algèbre relationnelle • Optimisation automatique des questions  Utilisation de l’aspect déclaratif de SQL  Gestion centralisée des chemins d'accès (index, hachages, …)  Techniques d’optimisation poussées • Economie de l'astuce des programmeurs – milliers d'heures d'écriture et de maintenance de logiciels.
  • 23. 23 VI - Intégrité Logique • Objectif : Détecter les mises à jour erronées • Contrôle sur les données élémentaires – Contrôle de types: ex: Nom alphabétique – Contrôle de valeurs: ex: Salaire mensuel entre 5 et 50kf • Contrôle sur les relations entre les données – Relations entre données élémentaires: • Prix de vente > Prix d'achat – Relations entre objets: • Un électeur doit être inscrit sur une seule liste électorale
  • 24. 24 Contraintes d’intégrité • Avantages : – simplification du code des applications – sécurité renforcée par l'automatisation – mise en commun des contraintes • Nécessite : – un langage de définition de contraintes d'intégrité – la vérification automatique de ces contraintes
  • 25. 25 VII - Intégrité Physique • Motivations : Tolérance aux fautes – Transaction Failure : Contraintes d'intégrité, Annulation – System Failure : Panne de courant, Crash serveur ... – Media Failure : Perte du disque – Communication Failure : Défaillance du réseau • Objectifs : – Assurer l'atomicité des transactions – Garantir la durabilité des effets des transactions commises • Moyens : – Journalisation : Mémorisation des états successifs des données – Mécanismes de reprise
  • 26. 26 Transaction Incohérence possible... Etat cohérent Etat cohérent Begin Commit Transaction Begin CEpargne = CEpargne - 3000 CCourant = CCourant + 3000 Commit T1
  • 27. 27 Atomicité et Durabilité ATOMICITE DURABILITE Panne Begin Begin CEpargne = CEpargne - 3000 CEpargne = CEpargne - 3000 CCourant = CCourant + 3000 CCourant = CCourant + 3000 Commit T1 Commit T1 Crash disque  Annuler le débit !!  S’assurer que le virement a été fait !
  • 28. 28 VIII - Partage des données BD • Accès concurrent aux mêmes données Conflits d’accès !!
  • 29. 29 Isolation et Cohérence BD • Le SGBD gère les accès concurrents  Chacun à l’impression d’être seul (Isolation)  Cohérence conservée (Pas de maj conflictuelles)
  • 30. 30 IX – Confidentialité • Objectif : Protéger les données de la BD contre des accès non autorisés • Deux niveaux : – Connexion restreinte aux usagers répertoriés (mot de passe) – Privilèges d'accès aux objets de la base • Usagers : Usager ou groupe d’usagers • Objets : Relation, Vue, autres objets (procédures, etc.)
  • 31. 31 X - Standardisation • L’approche bases de données est basée sur plusieurs standards – Langage SQL (SQL1, SQL2, SQL3) – Communication SQL CLI (ODBC / JDBC) – Transactions (X/Open DTP, OSI-TP) • Force des standards – Portabilité – Interopérabilté – Applications multisources…
  • 32. 3. Architecture des SGBD sont très liées au mode de Les architectures physiques de SGBD répartition. — BD centralisée — BD client/serveur — BD client/multi-serveurs — BD répartie — BD hétérogène — BD mobile Le challenge se déplace des Péta-bases aux Pico-bases. — Péta-bases => parallélisme et grandes mémoires — Pico-bases => faible empreinte et forte sécurité
  • 33. 33 Architecture centralisée Terminaux passifs réseau Mainframe Appli 1 Appli 2 Appli n SGBD données
  • 34. Architecture client- serveur Clients intelligents Appli 1 Appli 2 Appli n réseau serveur SGBD code données
  • 35. 35 Architecture Client- Multiserveurs Appli 1 SQL SQL ODBC ODBC SQL SQL SGBD 1 SGBD 2 code données code données
  • 36. Architecture répartie Appli 1 Appli 2 Appli n SGBD 1 SGBD 2 code données code données
  • 37. Architecture mobile Clients intelligents mobiles Données répliquées et/ou personnelles Réseau sans fil serveur SGBD code données
  • 38. 38 4. Applications traditionnelles des SGBD • OLTP (On Line Transaction Processing) – Cible des SGBD depuis leur existence – Banques, réservation en ligne ... – Très grand nombre de transactions en parallèle – Transactions simples • OLAP (On Line Analytical Processing) – Entrepôts de données, DataCube, Data Mining … – Faible nombre de transactions – Transactions très complexes
  • 39. 39 Evolution des BD BD BD BD ‘light’ PicoDBMS d’entreprise personnelles (PDA / Tél.) carte à puce Capacité Prix Nombre