Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Gautier Poupeau
Support de l'intervention effectuée au cours de la séance dédiée aux lacs de données du séminaire "Nouveaux paradigmes de l'Archive" organisée par le DICEN-CNAM et les Archives nationales
A Brief History of Database Management (SQL, NoSQL, NewSQL)Abdelkader OUARED
What's the Difference Between SQL, NoSQL, and NewSQL
SQL is a relational database management system (RDBMS) based on ... NewSQL tries to bring some of the features and scalability of NoSQL to SQL.
Objectif général : Concevoir une base de données
Objectifs opérationnels :
- Comprendre les différents concepts entourant les BD
- Comprendre les concepts associés aux BD relationnelles
- Établir un dictionnaire de données (DD)
- Structurer les données du DD
- Construire un Modèle Conceptuel des Données (MCD)
- Transformer un MCD en Modèle logique de données (MLD)
- Normaliser un MLD
Ce cours de base de données est présenté en mode diaporama, il est préparé et dédié aux étudiants en 1er cycle spécialité informatique et pour ceux qui s’intéressent à la gestion de la base de données.
Ce cours est réparti comme suit :
La première partie présente une introduction générale sur la base de données.
La deuxième partie est consacrée aux bases de données relationnelles, c'est-à-dire aux bases conçues suivant le modèle relationnel et manipulées en utilisant l'algèbre relationnelle. Il s'agit de la méthode la plus courante pour organiser et accéder à des ensembles de données.
La dernière partie constitue, enfin, une bonne introduction au langage SQL (Structured Query Language) qui peut être considéré comme le langage d'accès normalisé aux bases de données relationnelles.
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Gautier Poupeau
Support de l'intervention effectuée au cours de la séance dédiée aux lacs de données du séminaire "Nouveaux paradigmes de l'Archive" organisée par le DICEN-CNAM et les Archives nationales
A Brief History of Database Management (SQL, NoSQL, NewSQL)Abdelkader OUARED
What's the Difference Between SQL, NoSQL, and NewSQL
SQL is a relational database management system (RDBMS) based on ... NewSQL tries to bring some of the features and scalability of NoSQL to SQL.
Objectif général : Concevoir une base de données
Objectifs opérationnels :
- Comprendre les différents concepts entourant les BD
- Comprendre les concepts associés aux BD relationnelles
- Établir un dictionnaire de données (DD)
- Structurer les données du DD
- Construire un Modèle Conceptuel des Données (MCD)
- Transformer un MCD en Modèle logique de données (MLD)
- Normaliser un MLD
Ce cours de base de données est présenté en mode diaporama, il est préparé et dédié aux étudiants en 1er cycle spécialité informatique et pour ceux qui s’intéressent à la gestion de la base de données.
Ce cours est réparti comme suit :
La première partie présente une introduction générale sur la base de données.
La deuxième partie est consacrée aux bases de données relationnelles, c'est-à-dire aux bases conçues suivant le modèle relationnel et manipulées en utilisant l'algèbre relationnelle. Il s'agit de la méthode la plus courante pour organiser et accéder à des ensembles de données.
La dernière partie constitue, enfin, une bonne introduction au langage SQL (Structured Query Language) qui peut être considéré comme le langage d'accès normalisé aux bases de données relationnelles.
IODS : Retour d’expériences au sein du Center for Data ScienceBorderCloud
Le Center for Data Science de l’université Paris Saclay met en oeuvre une solution opérationnelle depuis 2016 afin de référencer toutes les sources de données, fichiers ou d’API au sein de l’université. Nous verrons quelles opportunités apportent le respect des standards et bonnes pratiques pour faciliter la réutilisation et la valorisation des données de la recherche.
Version ouverte à tous : http://linkedwiki.com
Version de l’université Paris Saclay : https://io.datascience-paris-saclay.fr
SIBD101-Introduction aux bases de données.pdfNadim ELSAKAAN
Cours introductif aux bases de données; un premier pas dans le monde des BDDs et des systèmes d'informations pour les apprentis ingénieurs en informatique et domaines relatifs, principalement des deuxièmes aux troisièmes années des premiers cycles de la graduation.
Etude de visualisation des données selon le modèle LRM - Journée professionne...ABES
Etude de visualisation des données selon le modèle LRM
Présentation lors de la 4e journée professionnelle du groupe Systèmes & Données (BnF, 15 novembre 2019) du programme Transition Bibliographique : N’oubliez pas les données d’autorité
Raphaëlle Poveda, Maité Roux - Abes
IODS : Retour d’expériences au sein du Center for Data ScienceBorderCloud
Le Center for Data Science de l’université Paris Saclay met en oeuvre une solution opérationnelle depuis 2016 afin de référencer toutes les sources de données, fichiers ou d’API au sein de l’université. Nous verrons quelles opportunités apportent le respect des standards et bonnes pratiques pour faciliter la réutilisation et la valorisation des données de la recherche.
Version ouverte à tous : http://linkedwiki.com
Version de l’université Paris Saclay : https://io.datascience-paris-saclay.fr
SIBD101-Introduction aux bases de données.pdfNadim ELSAKAAN
Cours introductif aux bases de données; un premier pas dans le monde des BDDs et des systèmes d'informations pour les apprentis ingénieurs en informatique et domaines relatifs, principalement des deuxièmes aux troisièmes années des premiers cycles de la graduation.
Etude de visualisation des données selon le modèle LRM - Journée professionne...ABES
Etude de visualisation des données selon le modèle LRM
Présentation lors de la 4e journée professionnelle du groupe Systèmes & Données (BnF, 15 novembre 2019) du programme Transition Bibliographique : N’oubliez pas les données d’autorité
Raphaëlle Poveda, Maité Roux - Abes
Dans un contexte où la transmission et l'installation d'agriculteurs sont des enjeux cruciaux pour la profession agricole, de nouveaux agriculteurs s'installent chaque année et, parmi eux, certains Bac+5 ou plus. Les cursus des écoles d'ingénieurs n'ont pas vocation à former de futurs agriculteurs. Pourtant, certains apprenants ayant suivi ces cursus BAC + 5, qu'ils soient ou non issus du milieu agricole, tentent l'aventure de l'entrepreneuriat agricole. Qui sont-ils ? Quelles sont leurs motivations et visions ? Comment travaillent-ils ?
Si la baisse de la productivité est effective dans toutes les économies développées... elle est particulièrement marquée en France. Au niveau national, cet essoufflement touche tous les secteurs, et plus particulièrement celui de l’industrie, usuellement caractérisé par des gains de productivité élevés. Depuis la crise Covid, le secteur industriel contribue pour 35 % environ à cette perte, alors qu’il ne représente que 9,3 % de la valeur ajoutée nationale brute en 2023. Dans ce contexte, est-il possible de mener une politique de réindustrialisation du pays sans y associer un objectif de hausse des gains de productivité ?Non rappelle ce Cube. Au contraire, ces deux objectifs, jusqu’alors indépendants l’un de l’autre, sont désormais deux défis à relever conjointement. En analysant les différents explications à la baisse de celle-ci observée en France et dans les autres économies développées, ce Cube suggère que l’augmenter en parallèle d’une politique de réindustrialisation sous-entend une réallocation des facteurs de production vers les entreprises industrielles à fort potentiel. Elle suppose également une une meilleure affectation des ressources.
2. 2 grandes catégories de problèmes
informatiques
L’analyse et la mise au point d’algorithmes
L’analyse et la structuration de types de données.
présentes dans toute démarche informatique
mais
l’une généralement l’emporte sur l’autre
3. Exemples
L’informatique scientifique.
– Algorithmes complexes
– Types de données relativement simples (entier, réel,
vecteur, matrice)
L’informatique de gestion
– Algorithmes très simples
– Types de données complexes (prise en compte de
clients, représentants, commandes …)
4. Une définition des bases de
données
Une base de données représente un
ensemble de données de l’entreprise
mémorisé par un ordinateur, qui est utilisé
par de nombreuses personnes et dont
l’organisation est régie par un modèle de
données.
5. Banques de données
Une banque de données représente
l’ensemble des informations mémorisées par
un ordinateur concernant un domaine
scientifique économique ou culturel donné et
cela d’une façon aussi exhaustive que
possible
6. Exemple de banque de données
BIAM : tous les médicaments pouvant être
utilisés en France
– Donne les caractéristiques connues à ce jour
– A la disposition de tout le corps médical
concerné
7. Exemple de base de données
La base de données d’une société automobile
– Contient les informations ayant un rapport avec la
gestion de la société
– Caractère de confidentialité
8. La base de données doit satisfaire
5 critères
Bonne représentation du monde réel
Non redondance de l’information
Indépendance des programmes par rapport
aux données
Sécurité et confidentialité des données
Partage des données
9. Bonne représentation du monde
réel
Une image aussi fidèle que possible de la réalité à tout
instant
Une représentation fidèle une information fiable et à jour
Contraintes d’intégrité
– Définissent un état cohérent de la base
– Exprimées simplement
– vérifiées automatiquement à chaque insertion, modification ou
suppression des données
10. Non redondance de l’information
Pas de duplication de l’information
11. Indépendance des programmes par
rapport aux données
Modifications apportées à la structure de la base par un
changement du monde réel
Et non
Pour une application particulière
Partager les données
12. Sécurité et confidentialité des
données
Données partagées
– Les informations confidentielles ne sont accessibles qu’aux
personnes habilitées
– Associer à chaque utilisateur des droits d’accès aux données
Sécurité et protection des supports physiques des
informations contre toute altération ou destruction
(résistance aux pannes)
Une panne survient,
il faut pouvoir récupérer une base dans un état « sain »
- Récupérer les données dans l’état dans lequel elles étaient
avant la modification
- Terminer l’opération interrompue
13. Partage des données
Bien que partageant des ressources
communes, les applications doivent être
performantes
Permettre aux utilisateurs d’accéder aux
mêmes données au même moment
14. Accès aux mêmes données en
même moment
Problème simple à résoudre
– Interrogations
– Contexte mono-utilisateur
Problème non simple à résoudre
– Modifications
– Contexte multi-utilisateurs
Permettre à plusieurs utilisateurs de modifier la même
donnée en même temps
Assurer un résultat d’interrogation cohérent
15. Le modèle de données
Le résultat de la conception d’une base de données
est une description de données
La description des données est effectuée en utilisant
un modèle de données
Le modèle de données est un outil intellectuel
permettant de comprendre l’organisation logique des
données. C’est un ensemble de concepts et de règles
permettant de construire avec les types de données
une représentation de la réalité
16. Une définition du modèle de
données
Un modèle de données représente un
ensemble de concepts qui permet de
construire une représentation
organisationnelle de l’entreprise
17. Les SGBD (Systèmes de Gestion de
Bases de Données)
Un SGBD représente un ensemble coordonné de
logiciels qui permet de décrire, mémoriser,
manipuler, traiter, interroger les ensembles de
données constituant la base. Il assure la sécurité
et la confidentialité des données dans un
environnement où de nombreux utilisateurs ayant
des besoins variés peuvent interagir
simultanément sur ces ensembles de données.
18. Les types de base de données
1ère génération : les années 70
– Modèles hiérarchiques
– Modèles en réseau
2ème génération : année 1980
– Modèles relationnels
– Modèles entités-relations
3ème génération
– Modèles objet (SGBD : O2, ORACLE)
19. 1ère génération
Les modèles hiérarchiques
Structure de données exprimée à
l’aide d’une hiérarchie arborescente
à plusieurs niveaux
Chaque niveau est constitué par un ou plusieurs
groupes de données, pouvant se décomposer, à
leur tour, en groupes de données ou en données
élémentaires (feuilles de l’arborescence)
20. 1ère génération
Les modèles en réseau
Extension du modèle hiérarchique :
les liens entre objets peuvent
exister sans restriction
21. 1ère génération
Les modèles en réseau
Pour retrouver une donnée dans une telle
modélisation, il faut connaître le chemin
d’accès (les liens)
Les programmes dépendent de la structure de
données
Des SGBD : IDMS, TOTAL, MDBS-III
22. 2ème génération
Les modèles relationnels
La structure de données est formée par un
système de relations (représentation tabulaire)
Chaque relation représente un phénomène ou
un objet du monde de l’entreprise
Une relation est un ensemble de n-uplets (n
fixe) qui correspondent chacun à une propriété
de l’objet à décrire
23. 2ème génération
Les modèles relationnels
DEPARTEMENT, PROJET, EMPLOYE,
EMP-PROJET sont les relations
Les lignes dessinées sont les
liens entre les relations
24. 2ème génération
Les modèles relationnels
Il n’est plus nécessaire de décrire explicitement
les liens
Les chemins d’accès sont indépendants de la
modélisation
DES SGBD : INGRES, ORACLE, DBASE2,
ACCESS
25. 2ème génération
Le modèle entités-relations
Modèle de représentation et de structuration des
données
Modèle sémantique
– Comprendre l’organisation des données
– Visualiser l’organisation des données
Non destiné directement à l’implémentation de ces
données
Conception d’une base de données
– Réalisation d’un modèle entités-relations
– Transformation de ce modèle en modèle relationnel
directement implémentable