mars2005_BD

296 vues

Publié le

0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
296
Sur SlideShare
0
Issues des intégrations
0
Intégrations
9
Actions
Partages
0
Téléchargements
41
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

mars2005_BD

  1. 1. Base dedonnées Mounir JELASSI Institut National de la Statistique 12 Mars 2005 Le centre de formation et d’appui à la décentralisation de Tunis
  2. 2. Quitter Page suivante À la fin de ce module, l’étudiant devrait être en mesure de … • définir une base de données; •situer les bases de données dans le processus géomatique; • identifier les étapes d’élaboration d’une base de données; • appliquer les grands principes de modélisation; • construire un modèle conceptuel des données; • normaliser partiellement une base de données; Page précédenteDébut Objectifs
  3. 3. Base de données à référence spatiale Page précédenteDébutQuitter Page suivante B- Situation des bases de données en géomatique C- Modélisation d’une base de données 1- Définitions 2- Modèle conceptuel des données A- Définitions
  4. 4. Base de données à référence spatiale Page précédenteDébutQuitter Page suivante B- Situation des bases de données en géomatique C- Modélisation d’une base de données 1- Définitions 2- Modèle conceptuel des données A- Définitions
  5. 5. A- Définitions Page précédenteDébutQuitter Page suivante • Base de données (BD): C’est un ensemble de données informatiques structuré en fichiers inter-reliés et organisés logiquement à partir d’un modèle portant sur un univers donné et destiné à gérer l’information sur ce sujet. Un seul fichier ou plusieurs fichiers non reliés ne constituent pas une BD mais un gestionnaire de fichiers. • Base de données à référence spatiale (BDRS): Il s’agit d’une BD conçue de telle sorte que certaines des données peuvent êtres localisables lorsqu’elles sont associées à des données graphiques via un programme gérant de l’information géographique ou spatiale.
  6. 6. Page précédenteDébutQuitter Page suivante Une BD doit satisfaire aux cinq (5) critères suivants : • être construite sur une bonne représentation du monde réel; • ne pas contenir d’information redondante; • conserver l’indépendance des programmes par rapport aux données; • assurer la sécurité et la confidentialité des données dans un environnement où plusieurs utilisateurs ayant des besoins variés peuvent interagir simultanément sur ces ensembles de données; • viser la performance des applications. A- Définitions
  7. 7. Page précédenteDébutQuitter Page suivante • Système de gestion de base de données (SGBD): C’est un ensemble de programmes informatiques ou de logiciels permettant de… • structurer les données pour former une BD; • collecter ou saisir les données; • emmagasiner ou stocker les données; • traiter et interroger les données; • partager et sécuriser les données; • diffuser les résultats. A- Définitions
  8. 8. Page précédenteDébutQuitter Page suivante Ce système comprend un ensemble de fonctions permettant de… • créer et décrire les composantes de tables (colonnes, contraintes, index, etc.); • manipuler c'est-à-dire ajouter, modifier, annuler, calculer les données contenues dans les tables de la BD; • questionner ou interroger les données de la BD; • partager et protéger les données de la BD. Microsoft Access est un programme de ce type. A- Définitions
  9. 9. Page précédenteDébutQuitter Page suivante • Système d’information géographique (SIG): Un système d'information géographique est un ensemble organisé de matériels informatiques, de logiciels, de données géographiques et de personnel capable de saisir, stocker, mettre à jour, manipuler, analyser et présenter toutes formes d'informations géographiquement référencées. De BLOMAC, Françoise, GAL, Rony et al. (1994). Arc/Info, concepts et applications en géomatique. Paris, Hermès, p. 25. Le système d'information géographique est d'abord un outil de gestion de bases de données graphiques (géographiques) et descriptives (alphanumériques). Les bases de données à référence spatiale s’inscrivent dans le processus de développement de tout système d’information géographique (SIG). A- Définitions
  10. 10. Page précédenteDébutQuitter Page suivante •Méthode de développement de système: Méthode conçue par les technologies de l’information et de l’informatique afin que les différentes étapes d’implantation d’un SIG soient cohérentes, structurées et concourent à un but unique. Exemples : Méthode de Merise (France) Méthode Information Engineering Méthode Productivité Plus (DMR) A- Définitions
  11. 11. Base de données à référence spatiale Page précédenteDébutQuitter Page suivante B- Situation des bases de données en géomatique C- Modélisation d’une base de données 1- Définitions 2- Modèle conceptuel des données A- Définitions
  12. 12.  Le coût de l’acquisition des données géographique représente 70% des coûts de mise en œuvre des SIG.  L’importance et le volume des informations stockées de nos jours par les organisations d’une certaine dimension  Assurer une bonne disponibilité de ces données.  Pouvoir réaliser certains traitements et la diffusion des résultats .  Conserver la géométrie et les données descriptives reliées à ces éléments géométriques. Page précédenteDébutQuitter Page suivante B- Situation des bases de données en géomatique La necessité de la structuration et le stockage des données dans des bases de données, ainsi la rationalisation des procédures d’accès et de traitement.
  13. 13. Page précédenteDébutQuitter Page suivante Lors du développement d’un SIG, le géomaticien, le spécialiste en informatique ou en technologie de l’information doit passer à travers diverses étapes qui vont permettre une implantation efficace du système d’information. Les méthodes de développement de SIG sont basées sur les étapes du cycle de vie des systèmes d’information traditionnels, c’est-à-dire ceux sans référence spatiale. Le modèle de développement de SIG du Centre de Recherche en géomatique de l’Université Laval de Québec (CRG) comporte les six étapes suivantes: B- Situation des bases de données en géomatique
  14. 14. Page précédenteDébutQuitter Page suivante Étapes indépendantes de la technologie Étapes dépendantes de la technologie Chacune de ces étapes a trois niveaux d’application: • Les données • Les traitements • L’organisation Dans ce cours, nous traiterons seulement le MCD. C’est à l’étape de la conception du système et à celle de la réalisation que se constitue la base de données à référence spatiale. B- Situation des bases de données en géomatique
  15. 15. Page précédenteDébutQuitter Page suivante 1. Évaluation d’opportunité On évalue de façon globale, les besoins, la durée de développement, les coûts prévus, les ressources humaines requises pour développer le SIG. 2. Analyse et inventaire détaillée de l’existant On fait l’inventaire et l’analyse détaillés des données, des traitements et des composantes de l’organisation. Cette étape fournit une image complète et à jour de l’organisation présente. 3. Conception du futur système On détermine l’architecture à mettre en place relativement aux données (modélisation conceptuelle des données), des traitements (modélisation conceptuelle des traitements) et des composantes organisationnelles (modélisation conceptuelle de l'organisation). Il en résulte une description complète du système à réaliser. B- Situation des bases de données en géomatique
  16. 16. Page précédenteDébutQuitter Page suivante 4. Réalisation À cette étape, on crée le système tel que conçu à l’étape précédente. C’est ici qu’on procède notamment aux modélisations logique (MLD) et physique (MPD) des données et à la collecte ou à la conversion de celles-ci. 5. Implantation On installe toutes les composantes du nouveau système au sein de l’organisation (en parallèle avec l’ancien) et on le vérifie. 6. Opération Il ne reste qu’à utiliser le nouveau système dans les opérations courantes. B- Situation des bases de données en géomatique
  17. 17. Page précédenteDébutQuitter Page suivante Démarche de réalisation technique d’un SIG B- Situation des bases de données en géomatique
  18. 18. Base de données à référence spatiale Page précédenteDébutQuitter Page suivante B- Situation des bases de données en géomatique C- Modélisation d’une base de données 1- Définitions 2- Modèle conceptuel des données A- Définitions
  19. 19. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante Tout système d'information (géographique ou non) est, en fait, le résultat de la structuration et la représentation d'une thématique ou d'une partie d’une thématique qu'on veut traiter de façon informatique. Pour représenter ce sujet, des auteurs, spécialistes en technologie de l’information, ont développé des méthodes graphiques, les modélisations. Tout processus de création de base de données et de système d'information (avec ou sans référence spatiale) contient donc des phases dédiées à la réalisation de modèles. Ces modélisations sont produites à l'étape de la conception du futur système mais également à celle de la réalisation et touchent tout autant les données que les traitements et l'organisation. Dans ce cours, nous nous attarderons seulement aux modélisations des données au niveau conceptuel.
  20. 20. Base de données à référence spatiale 1- Définitions Page précédenteDébutQuitter Page suivante C- Modélisation d’une base de données 2- Modèle conceptuel des données
  21. 21. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante • Modélisation : 1. La modélisation consiste à décrire un champ d'activité au moyen d'outils graphiques, afin de mieux en comprendre le fonctionnement et d'être à même de poser un diagnostic à son sujet. Labbé, Céline. Modéliser les données. Éditions Pratik, collection Comprendre. BoisBriand, 2002, 254 pages. 2. La modélisation consiste à définir une réalité abstraite à l'aide d'outils de représentation, de telle sorte que l'information que l'on peut tirer du modèle résultant coïncide avec les manifestations apparentes de la réalité décrite. Carrier Pierre, Hudon Rémi et Jean Suzanne. Bases de données dans le développement de systèmes. Gaëtan Morin Éditeur. Boucherville, 1991, 224 pages. 1- Définitions
  22. 22. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante • Modèle de données : 1. C'est un schéma résultant de la modélisation et montrant la partie de la réalité que nous voulons informatiser. 2. C'est une représentation des données utilisées par une organisation et des associations entre ces données qui sont nécessaires pour répondre aux besoins en information de cette organisation. Labbé, 2002. Il existe trois modèles dédiés aux données soit les modèles conceptuel, logique et physique. 1- Définitions • Formalisme : Règles de représentation graphique. La page suivante montre une partie d’un modèle avec son formalisme.
  23. 23. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante 1- Définitions
  24. 24. Base de données à référence spatiale 1- Définitions Page précédenteDébutQuitter Page suivante C- Modélisation d’une base de données 2- Modèle conceptuel des données
  25. 25. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante Le modèle conceptuel des données (MCD) a pour but de décrire de façon formelle les données qui seront utilisées par le système d'information. Il s'agit donc d'une représentation des données, facilement compréhensible, permettant de décrire le système d'information [géographique] à l'aide d'entités, d’attributs et de relations. CommentCaMarche.net, 2004. Ce modèle est dit conceptuel parce qu’il représente un ensemble de concepts, c'est-à-dire le sujet à traiter tel que compris (donc le ‘quoi’ informatiser) plutôt que la structure physique (le ‘comment’ informatiser) de la base de données. Le modèle est obtenu en tenant compte des étapes antérieures du processus de création de SIG soit l'évaluation d'opportunité (entrevues, observations) et de l'analyse et de l'inventaire de l'existant. 2- Modèle conceptuel des données (MCD)
  26. 26. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante Le MCD élimine la redondance de données en appliquant des règles appelées ‘formes normales’. Le MCD est construit selon un formalisme facile à comprendre et INDÉPENDANT de la technologie ou du SGBD qui sera utilisé. Nous verrons le formalisme ‘entité-relation’ beaucoup utilisé en pays francophones. C’est le formalisme le plus approprié et le plus utilisé pour ce niveau de modélisation. D’autres formalismes tels les formalismes étendus, UML, etc. sont également utilisés mais ne font pas l’objet de ce cours. 2- Modèle conceptuel des données (MCD)
  27. 27. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante Principes de base du MCD Les objets du monde réel sont rassemblés en classes, chaque classe regroupant des objets de même nature, ayant en commun les mêmes types de caractéristiques et, pour ce qui concerne les données localisables, ayant un même type de géométrie. Ces objets sont appelés entités et possèdent des propriétés. De BLOMAC, Françoise, GAL, Rony et al, 1994 Exemple: pour une entité appelée COMMUNE, les propriétés peuvent être son nom, son code d’identification, sa superficie, sa population, etc. 2- Modèle conceptuel des données (MCD)
  28. 28. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante • ATTRIBUT : Caractéristique ou propriété Information élémentaire représentant la plus petite partie manipulée dans l’entreprise et ayant un sens. • Exemples: code commune, nom commune, population, etc. • Règles: Un attribut ne doit pas être: - décomposable : adresse Numéro, rue, ville. - calculé : Prix TTC - redondante 2- Modèle conceptuel des données (MCD)
  29. 29. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante • ENTITE : C’est une association de propriétés correspondant à un type d’objet ayant un intérêt pour l’entreprise. • Exemples : Commune, secteur, logement,… 2- Modèle conceptuel des données (MCD) LOGEMENT Code logement Type logement Numéro postal Rue Ville Superficie • Régles : -Parmi les propriétés d’une entité , il existe un sous ensemble qui joue le rôle d’identifiant (ex: code logement). - Un identifiant permet de connaître sans aucune ambiguité toutes occurrences. (sa valeur doit être unique et non nulle)
  30. 30. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante Voici un autre exemple d’entité avec ses attributs et son identifiant. 2- Modèle conceptuel des données (MCD) Attributs Identifiant Nom de l’entité Entité
  31. 31. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante • Relation : Il s’agit du lien (association) entre une ou plusieurs entités. Elle est représentée par une ellipse et reliée à l’entité au moyen d’un lien appelé connecteur. Le nom de la relation sera celui des deux entités reliées avec un verbe décrivant cette relation. 2- Modèle conceptuel des données (MCD) Exemple:
  32. 32. Page précédenteDébutQuitter Page suivante 2- Modèle conceptuel des données (MCD) Relation binaire si elle implique deux entités; Régles: - Collection : l’ensemble d’entité intervenant dans une relation. - Une relation peut être porteuse ou non d’attributs. - La dimension d’une relation: le nombre d’entités entrant dans la collection Relation ternaire (ou complexe) si elle implique trois entités ( n_aire) Relation réflexive si elle implique une seule entité;
  33. 33. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante • Cardinalité : Les cardinalités permettent de caractériser le lien qui existe entre une entité et la relation à laquelle elle est reliée. CommentCaMarche.net, 2004. C'est les nombres minimum et maximum d’occurrences de la relation que peut avoir un objet. 2- Modèle conceptuel des données (MCD) Regles: - Les seules valeurs possibles sont : (0,1), (0,N), (1,1) et (1,N) - Les cardinalités traduisent les régles de gestion.
  34. 34. Page précédenteDébutQuitter Page suivante 2- Modèle conceptuel des données (MCD) Exemple: COMMUNE Code commune Nom commune SECTEUR Code secteur Nom secteur Sec APPARTIENT com1,N 0,1 Pour insérer les cardinalités adéquates, il faut poser les bonnes questions. Et les réponses à ces questions doivent se référer strictement et uniquement à la réalité du projet à développer.
  35. 35. Page précédenteDébutQuitter Page suivante 2- Modèle conceptuel des données (MCD) • Type de relation : Les cardinalités permettent de déterminer le type de relation existant entre deux entités, ce qui aura un impact lors de la modélisation logique et physique des données et donc sur la structure finale de la base de données. Il existe trois grands types de relation soit… 1 : 1 dite relation un à un; 1 : N dite relation un à plusieurs ou père-fils; N : N dite relation plusieurs à plusieurs. Le type de relation est déterminé par la borne maximale de chaque entité liée. Ainsi, l’exemple précédent est donc une relation un à plusieurs.
  36. 36. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante • Domaine : Il représente un secteur d’activité regroupant un ensemble d’entités qui partagent des liens avec ce secteur. Il est représenté par un rectangle. Ainsi, les entités CHAMP et AGRICULTEUR pourraient faire partie du domaine agricole. 2- Modèle conceptuel des données (MCD)
  37. 37. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante 2- Modèle conceptuel des données (MCD) • Normalisation d’un MCD : La normalisation est une série de règles qui permettent d'analyser le comportement des attributs d'une entité, leur dépendance mutuelle et leur dépendance par rapport à l'identifiant. Ce processus d'analyse et de regroupement organise efficacement les éléments dans un modèle donc dans la base de données au moyen des règles appelées formes normales. Deux objectifs principaux sont visés par cette opération: • éliminer les redondances; • s'assurer que les éléments de données seront bien dans la table à laquelle ils doivent appartenir. La normalisation aide à valider le modèle créé.
  38. 38. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante 2- Modèle conceptuel des données (MCD) • Dépendance fonctionnelle : La notion de dépendance fonctionnelle est un des principes fondamentaux de la normalisation. Elle étudie la relation entre l'identifiant d'une entité et les autres attributs de la même entité. Pour une entité, les attributs autres que l’dentifiant doivent en dependance fonctionnelle monovalué avec cet identifiant .
  39. 39. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante 2- Modèle conceptuel des données (MCD) Code Nom Prénom Programme Année MARL123932 Martineau Luc Géomatique 2004 TREM381298 Tremblay Marc Géomatique Informatique 2004 CORD492010 Corbeil Dorothée Géomatique 2003 Entité Table correspondante dans la BD L’attribut programme ne répond pas au critère puisque, pour le second enregistrement, deux valeurs peuvent être admises pour un même identifiant. Si cette situation peut se produire dans notre réalité, il faut alors exclure l’attribut et créer une nouvelle entité avec l’attribut exclu.
  40. 40. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante 2- Modèle conceptuel des données (MCD) Une fois les règles de normalisation et le formalisme appliqués, nous obtenons un modèle conceptuel des données valide et fonctionnel. Retenons que, si la modélisation est toujours effectuée à partir du constat d’une situation donnée, elle peut donner lieu à plusieurs solutions (MCD) possibles et ce, même si tous s’entendent sur les objectifs à atteindre. Le problème vient du fait que cette opération est du domaine de la perception de la réalité et que celle-ci varie grandement d’un individu à l’autre, d’une organisation à l’autre. Un modèle sera privilégié et constituera la base des étapes ultérieures de modélisation. Voici un exemple d’un MCD fonctionnel, bien que très incomplet, sur le plan de la problématique.
  41. 41. Page précédenteDébutQuitter Page suivante 2- Modèle conceptuel des données (MCD) Aller au MLD Aller au MPD DELEGATION Code délégation Nom délégation SECTEUR Code secteur Nom secteur Sec APPARTIENT del 1,N 1,1 GOUVERNORAT Code gouvernorat Nom Gouvernorat Del Est composé Guv 1,N 1,1 Unités adminstratives Logement Code logement Type Superficie adresse Autre_bati Code bati Usage adresse Log se situe1 Sec AB se situe sec del 1,N 1,N 1,1 1,1 Constructions
  42. 42. C- Modélisation d’une base de données Page précédenteDébutQuitter Page suivante 2- Modèle conceptuel des données (MCD) Exercice de modélisation conceptuelle. Nous utiliserons, pour ce faire, le logiciel Silverrun et le module EAX de la compagnie Magna Solutions. Consultez la documentation papier fournie pour réaliser l’exercice. Si vous le voulez, cliquez sur les thèmes ci-dessous pour voir une démonstration de l’utilisation du programme. 1- Créer les entités et les attributs. 2- Créer les relations et leurs cardinalités.
  43. 43. Page précédenteQuitter Questions
  44. 44. Page précédenteQuitter Fin de la présentation Merci de votre attention!

×