Comment mettre en relation données et documents pour produire une informati...Antidot
Comment mettre en relation données et documents pour produire une information métier plus riche et plus utile ?
Présentation d'Antidot Information Factory et de l'approche Linked Enterprise Data, par Pierre Col, directeur marketing d'Antidot.
Retours d'expérience de Pierre Boudigues, directeur Projets et SI de Electre, et Marc Pautrat, responsable SI éditoriaux du Groupe Moniteur.
Ce cours de base de données est présenté en mode diaporama, il est préparé et dédié aux étudiants en 1er cycle spécialité informatique et pour ceux qui s’intéressent à la gestion de la base de données.
Ce cours est réparti comme suit :
La première partie présente une introduction générale sur la base de données.
La deuxième partie est consacrée aux bases de données relationnelles, c'est-à-dire aux bases conçues suivant le modèle relationnel et manipulées en utilisant l'algèbre relationnelle. Il s'agit de la méthode la plus courante pour organiser et accéder à des ensembles de données.
La dernière partie constitue, enfin, une bonne introduction au langage SQL (Structured Query Language) qui peut être considéré comme le langage d'accès normalisé aux bases de données relationnelles.
Linked Enterprise Data ou comment disposer d'une vue consolidée des donnéesAntidot
Diaporama de la présentation faite le 12 juin 2012 par Gautier Poupeau à l'occasion de la keynote "Web sémantique et Big Data" organisée dans le cadre de l'événement Time2Marketing
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...Blue DME
Présentation réalisée par Blue DME et COVEA lors du salon Big Data Paris 2017, le 6 mars.
Retour d'expérience "Accélérer la connaissance des clients et des risques grâce à la donnée externe" dans l'assurance (données open data, données partenaires payantes, etc.).
Contexte, innovations d'usage et technologiques et retours d'expérience des data scientists, actuaires et experts data.
Innovation récompensée le 7 mars dans le même salon avec le trophée B2B remporté.
Technologies utilisées : hadoop spark, machine learning.
Arrow Group: Techday Big Data - Etat et Enjeu pour l'AssuranceArrow Group
Retrouvez notre techday sur le Big Data, qui présente l'état du Big Data et les enjeux pour le monde de l'assurance avec une présentation de notre projet Square Predict.
http://www.square-solutions.com/accueil/square-predict-big-data-assurance/
Comment connecter les données d'ingénierie? Open Services for Lifecycle Colla...Axel Reichwein
- Particularités des graphes de connaissances pour ingénieurs
- Pourquoi et comment connecter les données d'ingénierie?
- Utilité actuelle graphes de connaissances pour ingénieurs
- Solutions potentielles futures basées sur les graphes de connaissances
- Défis d'origine humaine et technique
Gestion des données d'entreprise à l'ère de MongoDB et du Data LakeMongoDB
> Présentation du pipeline EDM (Enterprise Data Management, ou « gestion de données d'entreprise »)
> Problèmes actuels
> Brève présentation de MongoDB
> Les différentes étapes d'un pipeline EDM
> L'avenir de l'architecture EDM
> Étude de cas et scénarios
> Leçons tirées du Data Lake
La solution GDI (Global Data Inquirer) est une solution de data science développée par Assystem.
Elle permet d’extraire une description exhaustive des installations (ontologies) et d’alimenter :
- des bases de données propriétaires
- des modèles de simulations ou MBSE (ingénierie système basée sur les modèles)
- un moteur de recherche sémantique
Les informations pertinentes accumulées sur toute la durée vie d’une installation, sont ainsi rapidement accessibles malgré la masse de documents.
La Duck Conf - Initier un Datalab : rien à voir avec ce que j'imaginais !OCTO Technology
Présentation du talk de Frederic Petit.
Mettre en place un Datalab, c'est simple, il suffit d'installer un cluster Hadoop ! Et bien non : 3 mois après le lancement de projet, toujours pas d'Hadoop mais des data-scientists heureux et productifs !
La recette d'un bon datalab : étudier les données, assurer leur qualité et qualifier des use cases métier précis.
Comment mettre en relation données et documents pour produire une informati...Antidot
Comment mettre en relation données et documents pour produire une information métier plus riche et plus utile ?
Présentation d'Antidot Information Factory et de l'approche Linked Enterprise Data, par Pierre Col, directeur marketing d'Antidot.
Retours d'expérience de Pierre Boudigues, directeur Projets et SI de Electre, et Marc Pautrat, responsable SI éditoriaux du Groupe Moniteur.
Ce cours de base de données est présenté en mode diaporama, il est préparé et dédié aux étudiants en 1er cycle spécialité informatique et pour ceux qui s’intéressent à la gestion de la base de données.
Ce cours est réparti comme suit :
La première partie présente une introduction générale sur la base de données.
La deuxième partie est consacrée aux bases de données relationnelles, c'est-à-dire aux bases conçues suivant le modèle relationnel et manipulées en utilisant l'algèbre relationnelle. Il s'agit de la méthode la plus courante pour organiser et accéder à des ensembles de données.
La dernière partie constitue, enfin, une bonne introduction au langage SQL (Structured Query Language) qui peut être considéré comme le langage d'accès normalisé aux bases de données relationnelles.
Linked Enterprise Data ou comment disposer d'une vue consolidée des donnéesAntidot
Diaporama de la présentation faite le 12 juin 2012 par Gautier Poupeau à l'occasion de la keynote "Web sémantique et Big Data" organisée dans le cadre de l'événement Time2Marketing
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...Blue DME
Présentation réalisée par Blue DME et COVEA lors du salon Big Data Paris 2017, le 6 mars.
Retour d'expérience "Accélérer la connaissance des clients et des risques grâce à la donnée externe" dans l'assurance (données open data, données partenaires payantes, etc.).
Contexte, innovations d'usage et technologiques et retours d'expérience des data scientists, actuaires et experts data.
Innovation récompensée le 7 mars dans le même salon avec le trophée B2B remporté.
Technologies utilisées : hadoop spark, machine learning.
Arrow Group: Techday Big Data - Etat et Enjeu pour l'AssuranceArrow Group
Retrouvez notre techday sur le Big Data, qui présente l'état du Big Data et les enjeux pour le monde de l'assurance avec une présentation de notre projet Square Predict.
http://www.square-solutions.com/accueil/square-predict-big-data-assurance/
Comment connecter les données d'ingénierie? Open Services for Lifecycle Colla...Axel Reichwein
- Particularités des graphes de connaissances pour ingénieurs
- Pourquoi et comment connecter les données d'ingénierie?
- Utilité actuelle graphes de connaissances pour ingénieurs
- Solutions potentielles futures basées sur les graphes de connaissances
- Défis d'origine humaine et technique
Gestion des données d'entreprise à l'ère de MongoDB et du Data LakeMongoDB
> Présentation du pipeline EDM (Enterprise Data Management, ou « gestion de données d'entreprise »)
> Problèmes actuels
> Brève présentation de MongoDB
> Les différentes étapes d'un pipeline EDM
> L'avenir de l'architecture EDM
> Étude de cas et scénarios
> Leçons tirées du Data Lake
La solution GDI (Global Data Inquirer) est une solution de data science développée par Assystem.
Elle permet d’extraire une description exhaustive des installations (ontologies) et d’alimenter :
- des bases de données propriétaires
- des modèles de simulations ou MBSE (ingénierie système basée sur les modèles)
- un moteur de recherche sémantique
Les informations pertinentes accumulées sur toute la durée vie d’une installation, sont ainsi rapidement accessibles malgré la masse de documents.
La Duck Conf - Initier un Datalab : rien à voir avec ce que j'imaginais !OCTO Technology
Présentation du talk de Frederic Petit.
Mettre en place un Datalab, c'est simple, il suffit d'installer un cluster Hadoop ! Et bien non : 3 mois après le lancement de projet, toujours pas d'Hadoop mais des data-scientists heureux et productifs !
La recette d'un bon datalab : étudier les données, assurer leur qualité et qualifier des use cases métier précis.
3. D O I ( D i g i t a l O b j e c t I d e n t i f i e r )
3
Métadonnées obligatoires
•Titre
•Auteur(s)
•Année
•Diffuseur
•Identifiant
Métadonnées facultatives
Landing Page (URL)
DOI (Digital Object Identifier)
CITATION DES OBJETS DIGITAUX
4. 4
AGENCE D’ENREGISTREMENT (RA)
DOI
DOI DOIDOI
Identifié par un préfixe fourni par la RA
EDITEUR /PRODUCTEUR (de DOI)
Citation du DOI dont préfixe/identifiant
ARTICLE
DOI
LECTEUR
DOI préfixe/identifiant
Landing page (URL)
5. D O I ( D i g i t a l O b j e c t I d e n t i f i e r )
5
Sur quoi porte un DOI ?
Qui définit ces informations ?
Que contiennent exactement ces
informations ?
…
6. DOI (PID)
L’ENGAGEMENT DE LA PART DE L’ÉDITEUR DU DOI DE MAINTENIR LA
PÉRENNITÉ DU LIEN ENTRE
L’IDENTIFIANT (CITABLE) / UNE LANDING PAGE (PERTINENTE)
6
8. LES ACTEURS
STEVEN CHRIS BRAD GEORGE
Responsable de plusieurs centres
de données dans le domaine de la
paléontologie, Steven veut
pouvoir promouvoir leur
reconnaissance dans les articles.
PI chevronné, Chris produit de
nombreux jeux de données, qu’il
corrige de temps en temps.
Il aime que son travail soit utilisé
mais il souhaite savoir par qui
Scientifique accompli, Brad est
désireux d’accompagner ces
articles de références précises à
des jeux de données qu’il a
récupérés
Toujours méfiant du travail du
travail de Brad, George veut
vérifier les résultats obtenus par
celui-ci.Quoi d’autre ?
8
9. LES ACTEURS
MATT BEN JUDI JACK
Responsable informatique d’un
centre de données de Steven
Responsable informatique d’une
agence d’enregistrement
(RegistrationAgency) de PID
Tutelle du centre de Steven, Judi
souhaite que son support soit
souligné dans les articles.
Quelqu’un qui n’est aucune des
personnes précédentes…
9
11. DONNÉES
DATACITE EST L’AGENCE D’ENREGISTREMENT DES DOI RELATIFS AUX DONNÉES.
L’INIST (CNRS) EST LE RELAIS FRANÇAIS DE DATACITE
11
12. L e s u j e t d e l a c i t a t i o n
Cas statique
Des donnéesUn instrument Un jeu de données
Une base de données Un sous ensemble significatif de
données
Un sous ensemble arbitraire de
données
L’ensemble des données
mesurées par un instrument
12
Cas dynamique
Un programme / projet
14. L e s l a n d i n g s p a g e s s t a t i q u e s
Des donnéesUn instrument Un jeu de données
Une base de données Un sous ensemble significatif de
données
Un sous ensemble arbitraire de
données
L’ensemble des données
mesurées par un instrument
14
Site web général
Un programme / projet
Catalogue de métadonnées*
* Fiche de l’instrument, parfois du jeu
15. Add Image
C i t a t i o n d e p r o g r a m m e / p r o j e t
15
Add Image
EFFICACITÉ…
Le site web indique le DOI à utiliser
Accès à la base de données
www.projet.com
DOI
L’article référence le DOI
Mon article
DOI
DOI
DOI
Données
16. Add Image
Add Image
C i t a t i o n d ’ i n s t r u m e n t / j e u d e d o n n é e s
16
Add Image
GRANULARITÉ ?
Le catalogue indique le DOI à utiliser
Accès données/métadonnées
catalogue.projet.com
DOI
L’article référence le DOI
Mon article
DOI
DOI
DOI
Fiche de
métadonnées
18. L i m i t e s d e l a c i t a t i o n s t a t i q u e
18
Granularité arbitraire
• Un jeu de données peut évoluer dans le temps
•Un jeu de données peut être corrigé
• La citation peut porter sur plusieurs ou des parties de jeux de données
Imprecision de la
citation
• Citation trop large
•Nécessité de compléter la citation
•Mise en place de stratégies de contournement (snapshots,exports)
• Non reproductibilité
19. C i t e r p r é c i s é m e n t ?
19
DOI Série temporelle
DOI Série temporelle
DOI Série temporelleDOI Série temporelle
DOI Série temporelle
DOI ?
20. L e s l a n d i n g s p a g e s d y n a m i q u e s
Des donnéesUn instrument Un jeu de données
Une base de données Un sous ensemble significatif de
données
Un sous ensemble arbitraire de
données
L’ensemble des données
mesurées par un instrument
20
Magasin de requêtes
Un programme / projet
21. Add Image
Add Image
C i t a t i o n d e d o n n é e s – P r é c o n i s a t i o n s R D A
21
Add Image
COMPLEXITÉ
L’extracteur propose un DOI pour les données
Permet de récupérer les données d’un DOI
extracteur.projet.com
L’article référence le DOI
Mon article
DOI
Fiche de
métadonnées
DOIDOI
DOI
23. QUESTIONS
Peut-on avoir des DOI différents portant sur
une cible identique ?
Les DOI permettent de suivre facilement
l’utilisation des données ?
L’identifiant du DOI doit-il porter un sens ?
Peut-on publier des DOI pour des données qui
ne sont pas les siennes ?
AERIS peut-il publier des DOI pour Steven,
Brad, …?
25. A c t i o n s a u t o u r d e l a c i t a t i o n
25
Citation statique
• Rédaction document de préconisation (interpôle)
• Mise en place d’outils d’aide à la citation
• Mise en place d’outils de vérification des landing pages
Citation dynamique
• Participation travaux EnvriPlus et RDA
•Mise en place d’un pilote (IAGOS)