SlideShare une entreprise Scribd logo
1  sur  27
Votre « data » je vous la sers
comment ?
Journée d’étude "Big et Open Data : conséquences et compétences pour les
professionnels de l'information ?”,
Rennes, 28 mai 2015
Dominique Cotte
Réflexions sur la nébuleuse de la « data » et les
impacts sur les activités des professionnels de
l’information.
1
Déroulé
• Introduction
• Prolégomènes : du document à la « data » et retour
• Open Data
• Open Resarch Data
• Les promesses du Big Data
• Conclusion sur les activités et spécialités de la gestion de
l’information
2
Data
Open
Linked
Big
Long
Introduction : Une nouvelle série d’objets à prendre en
compte, comment, pourquoi ?
3
Une nouvelle
manière de mettre
en valeur et en
relation des
éléments singuliers
pour produire de
la connaissanceSmart
Web de données
Documents, données, hybrides…
• Sont-ils des opposables ?
• Quels rapports entretiennent ces objets ?
• Passe-t-on d’un monde à un autre monde ?
4
Construction, structure
• Est-il légitime de dire d’un document qu’il
est « non structuré » ?
• Et de l’opposer aux données qui seraient,
par nature « structurées » ?
5
Brevet
6
Article scientifique
« Une » de
journal
Des approches plus fines des contenus des
documents
• Data mining, text mining
• Balisage
• Gestion de contenus structurés
• Outils de recherche
7
De nouvelles sources : les documents, dé-composés
8
Du
document… … à la donnée
Édité
Autoporteur
Possédant un sens global
Pérenne
Détachée
Volatile
Recombinable
Dynamique
« Le mouvement d’atomisation conduit les professionnels de l’information à
changer d’échelle pour l’organisation, la documentation et la description,
l’archivage, la mémorisation… des données, de leur appareillage, de leurs
métadonnées. »
8
Les modes de production de la donnée
• Recueil automatique, capteurs
• Réseaux sociaux
• Production documentaire démultipliée
• Appareillages scientifiques
• Métadonnées
9
Trois exemples
• Domaine des énergies fossiles : « dématérialistation » de
rapports papier parfois anciens (permanence de l’information
incluse dans ces études) afin de pouvoir en exploiter et traiter
les contenus (dont les données )
• Les cahiers de laboratoire dans l’industrie pharmaceutique
• Publications de l’OCDE, problématique de la ré-utilisation de
contenus éditoriaux et de la mixité entre des contenus
analytiques (séries statistiques, datasets, et d’éléments de
monographie)
10
Cahier de laboratoire
11
Pratiques hétérogènes
Ecritures mixtes
Copier/coller
Analogique/numérique
Site d’accès aux publications de l’OCDE
12
Ce qu’implique l’exploitation des données
13
Au documentDe la donnée
Protocoles de recueil
Mise en collections
Traitements
Plans de gestion
Documentarisation
Mises en perspectives
Mises en formes
Commentaires
Métadonnées
13
L’open Data et ses qualifications
documentaires
Qualification
Recherche
Description de contenu
Métadonnées
Qualité des données
Systèmes d’information
Indexation
14
La data dans « l’open research data »
15
Investigations
Expériences
Data
datasets
Etudes,
communications
Bases
documen-
taires
Une complexification du paysage
documentaire, comme « écosystème »
16
Données (quantitatif)
Travaux préparatoires
Publications, actes, articles
Retombées, vulgarisation
Blogs,
collaboratif Qualification
Curation
Accompagnement
Médiation
• Promesse technique :
• Quantitatif
• Volume
• Vitesse
• Infrastructures
• Capteurs
• Mobilité 17
Les promesses des « données massives »
http://www.internetlivestats.com/twitter-statistics/
(consulté le 13 janvier 2015)
18
• « Grand » çà commence quand ?
• Promesse d’usages :
• Variété : rapprochement de ressources
• Emergence de nouvelles connaissances via des inférences et des
rapprochements d’information
• Prédictions d’événements (démarche probabiliste)
19
Les promesses des « données massives »
• Les univers de déploiement :
• Marketing et vente
• Comportement clients
• Santé
• Tourisme et territoires
• Sécurité
• …
20
Les promesses des « données massives »
• Data scientists
• Statisticiens
• Professionnels de
l’information
• …
• La marguerite de la data :
21
Les promesses des « données massives »
• Atouts (en général)
• Connaissances et pratiques :
• Des données et de leur description
• Des référentiels
• Des outils de traitement : text mining, analyse statistique, sémantique
• Contenus spécifiques
• Maillage, « dé-silotage »
• Dématérialisation de documents
• Approches métiers des fonds et des documents
• Validation, Véracité
22
Impacts sur activités des professionnels de l’information
• Exemple : mise en commun de catalogues
• Cycle vertueux
• Récupération de données pour enrichir des contenus
• Ex. avis de lecteurs de Babelio, Libfly
• Open Data, récupération de biographies
• Exposition des données
• Mise en visibilité
• Echange
• Mutualisation
• Fédération de catalogues
• Rebonds et circulation dans les données
• Enrichissement et redressement des données et retour au producteur
• Ex. ISIDORE (Huma-Num CNRS)
23
Impacts sur activités des professionnels de l’information
• Enjeux et opportunités
• Pilotage : mieux connaître les environnements et les publics
• Rapprocher corpus et données
• Accès aux données de la recherche
• Accès aux données publiques
• Accès aux ressources (ou aux références) à partir des données
• Améliorer l’exposition et la visibilité des fonds
• Enrichir les catalogues
• Exposer les éléments cachés dans de nouvelles formes de mises en relation
(cf. CARTIER A., Bibliothèque et OpenData. Et si on ouvrait les bibliothèques sur l’avenir ?, Mémoire Enssib,2013)
24
Impacts sur activités des professionnels de l’information
Besoins
• Repérage, Qualification
• Modèles, formats, référentiels
• Curation
• Documentarisation
• Mise en liens, rapprochements
25
Conclusion
• Des objets documentaires qui s’hybrident sous l’influence des
technologies numériques
• Des spécialités qui doivent dialoguer pour confronter des expériences
• Des emprunts nécessaires en termes de réflexions, méthodes,
techniques, modèles, formats…
26
Merci de votre attention.
27

Contenu connexe

Tendances

Construire des outils pour la gestion des données de la recherche dans une co...
Construire des outils pour la gestion des données de la recherche dans une co...Construire des outils pour la gestion des données de la recherche dans une co...
Construire des outils pour la gestion des données de la recherche dans une co...Lesticetlart Invisu
 
Presentation Millennium Ent 23032006
Presentation Millennium Ent 23032006Presentation Millennium Ent 23032006
Presentation Millennium Ent 23032006Guillaume Hatt
 
Visite guidée au pays de la donnée - Introduction et tour d'horizon
Visite guidée au pays de la donnée - Introduction et tour d'horizonVisite guidée au pays de la donnée - Introduction et tour d'horizon
Visite guidée au pays de la donnée - Introduction et tour d'horizonGautier Poupeau
 
Présentation de Philippe Prat et Lorène Béchard
Présentation de Philippe Prat et Lorène BéchardPrésentation de Philippe Prat et Lorène Béchard
Présentation de Philippe Prat et Lorène BéchardAssociationAF
 
9 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_20179 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_2017Bertrand Tavitian
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesGautier Poupeau
 
Accompagnement actif des chercheurs à la gestion et au partage des données de...
Accompagnement actif des chercheurs à la gestion et au partage des données de...Accompagnement actif des chercheurs à la gestion et au partage des données de...
Accompagnement actif des chercheurs à la gestion et au partage des données de...Lesticetlart Invisu
 
Antidot Information Factory - AIF
Antidot Information Factory - AIFAntidot Information Factory - AIF
Antidot Information Factory - AIFAntidot
 
Jabes 2021 - Les Actus de l'Abes, partie 1
Jabes 2021 - Les Actus de l'Abes, partie 1Jabes 2021 - Les Actus de l'Abes, partie 1
Jabes 2021 - Les Actus de l'Abes, partie 1ABES
 
Documation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifiéDocumation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifiéAntidot
 
La publication scientifique et le libre accès
La publication scientifique et le libre accèsLa publication scientifique et le libre accès
La publication scientifique et le libre accèsPascale Laurent
 
"Aperçu globale des Objectifs de formation Du nouveau CountrySTAT"
"Aperçu globale des Objectifs de formation Du nouveau CountrySTAT""Aperçu globale des Objectifs de formation Du nouveau CountrySTAT"
"Aperçu globale des Objectifs de formation Du nouveau CountrySTAT"FAO
 
Catalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesCatalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesDesconnets Jean-Christophe
 

Tendances (19)

Construire des outils pour la gestion des données de la recherche dans une co...
Construire des outils pour la gestion des données de la recherche dans une co...Construire des outils pour la gestion des données de la recherche dans une co...
Construire des outils pour la gestion des données de la recherche dans une co...
 
Entrepôt de données ouvertes IRD. Un service en ligne pour l’ouverture et le ...
Entrepôt de données ouvertes IRD. Un service en ligne pour l’ouverture et le ...Entrepôt de données ouvertes IRD. Un service en ligne pour l’ouverture et le ...
Entrepôt de données ouvertes IRD. Un service en ligne pour l’ouverture et le ...
 
Presentation Millennium Ent 23032006
Presentation Millennium Ent 23032006Presentation Millennium Ent 23032006
Presentation Millennium Ent 23032006
 
Visite guidée au pays de la donnée - Introduction et tour d'horizon
Visite guidée au pays de la donnée - Introduction et tour d'horizonVisite guidée au pays de la donnée - Introduction et tour d'horizon
Visite guidée au pays de la donnée - Introduction et tour d'horizon
 
Présentation de Philippe Prat et Lorène Béchard
Présentation de Philippe Prat et Lorène BéchardPrésentation de Philippe Prat et Lorène Béchard
Présentation de Philippe Prat et Lorène Béchard
 
Presentation entrepot polescience-v73-ssbonus
Presentation entrepot polescience-v73-ssbonusPresentation entrepot polescience-v73-ssbonus
Presentation entrepot polescience-v73-ssbonus
 
9 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_20179 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_2017
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de données
 
Documentation IRD Occitanie : Outils et Services
Documentation IRD Occitanie : Outils et ServicesDocumentation IRD Occitanie : Outils et Services
Documentation IRD Occitanie : Outils et Services
 
Accompagnement actif des chercheurs à la gestion et au partage des données de...
Accompagnement actif des chercheurs à la gestion et au partage des données de...Accompagnement actif des chercheurs à la gestion et au partage des données de...
Accompagnement actif des chercheurs à la gestion et au partage des données de...
 
Entreposer ses donnees-JeudIST IRD 20181213
Entreposer ses donnees-JeudIST IRD 20181213Entreposer ses donnees-JeudIST IRD 20181213
Entreposer ses donnees-JeudIST IRD 20181213
 
Antidot Information Factory - AIF
Antidot Information Factory - AIFAntidot Information Factory - AIF
Antidot Information Factory - AIF
 
Jabes 2021 - Les Actus de l'Abes, partie 1
Jabes 2021 - Les Actus de l'Abes, partie 1Jabes 2021 - Les Actus de l'Abes, partie 1
Jabes 2021 - Les Actus de l'Abes, partie 1
 
Documation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifiéDocumation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifié
 
La publication scientifique et le libre accès
La publication scientifique et le libre accèsLa publication scientifique et le libre accès
La publication scientifique et le libre accès
 
"Aperçu globale des Objectifs de formation Du nouveau CountrySTAT"
"Aperçu globale des Objectifs de formation Du nouveau CountrySTAT""Aperçu globale des Objectifs de formation Du nouveau CountrySTAT"
"Aperçu globale des Objectifs de formation Du nouveau CountrySTAT"
 
Bigdata opensource
Bigdata opensourceBigdata opensource
Bigdata opensource
 
Introduction aux données de la recherche
Introduction aux données de la rechercheIntroduction aux données de la recherche
Introduction aux données de la recherche
 
Catalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesCatalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiatives
 

Similaire à Votre "data" je vous la sers comment ?

Evolution de la bibliothèque scientifique: La nouvelle stratégie LIBER 2018-2022
Evolution de la bibliothèque scientifique: La nouvelle stratégie LIBER 2018-2022Evolution de la bibliothèque scientifique: La nouvelle stratégie LIBER 2018-2022
Evolution de la bibliothèque scientifique: La nouvelle stratégie LIBER 2018-2022Jeannette Frey
 
Cersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsCersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsolivier
 
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...olivier
 
OpenData : au-delà des publications, le partage des données de la recherche e...
OpenData : au-delà des publications, le partage des données de la recherche e...OpenData : au-delà des publications, le partage des données de la recherche e...
OpenData : au-delà des publications, le partage des données de la recherche e...Thierry Chanier
 
Pratiques informationnelles
Pratiques informationnellesPratiques informationnelles
Pratiques informationnelleselisepelletier
 
Tic recherche-scientifique
Tic recherche-scientifiqueTic recherche-scientifique
Tic recherche-scientifiquelazoumi ouarfli
 
préservation de l'information numérique formation 2015
préservation de l'information numérique formation 2015préservation de l'information numérique formation 2015
préservation de l'information numérique formation 2015Pascal Romain
 
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnement
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnementRetour sur 5 années d'évolution des problématiques IST : rapport d'étonnement
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnementAntoine Blanchard
 
Diffuser les résultats de la veille avec les outils de "curation" : Scoop.it,...
Diffuser les résultats de la veille avec les outils de "curation" : Scoop.it,...Diffuser les résultats de la veille avec les outils de "curation" : Scoop.it,...
Diffuser les résultats de la veille avec les outils de "curation" : Scoop.it,...URFIST de Rennes
 
Le projet du SCD de Nice: une approche globale des données de la recherche
Le projet du SCD de Nice: une approche globale des données de la rechercheLe projet du SCD de Nice: une approche globale des données de la recherche
Le projet du SCD de Nice: une approche globale des données de la rechercheMathieu Saby
 
Projets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersProjets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersEmmanuelle Morlock
 
Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...Gilbert Paquette
 
Bibliothécaire comme valeur ajoutée
Bibliothécaire comme valeur ajoutéeBibliothécaire comme valeur ajoutée
Bibliothécaire comme valeur ajoutéeElsa Drevon
 
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Pierre Naegelen
 
Stage outils curation_2012-05-03
Stage outils curation_2012-05-03Stage outils curation_2012-05-03
Stage outils curation_2012-05-03Dominique-Alain JAN
 
IODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceIODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceBorderCloud
 
Retour d'expérience sur la coopération avec les revues scientifiques à l'éche...
Retour d'expérience sur la coopération avec les revues scientifiques à l'éche...Retour d'expérience sur la coopération avec les revues scientifiques à l'éche...
Retour d'expérience sur la coopération avec les revues scientifiques à l'éche...Françoise Gouzi
 

Similaire à Votre "data" je vous la sers comment ? (20)

Stage pgd 2021-04-07
Stage pgd 2021-04-07Stage pgd 2021-04-07
Stage pgd 2021-04-07
 
Evolution de la bibliothèque scientifique: La nouvelle stratégie LIBER 2018-2022
Evolution de la bibliothèque scientifique: La nouvelle stratégie LIBER 2018-2022Evolution de la bibliothèque scientifique: La nouvelle stratégie LIBER 2018-2022
Evolution de la bibliothèque scientifique: La nouvelle stratégie LIBER 2018-2022
 
Cersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsCersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutions
 
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
 
Mc jacquemot piv2017_c
Mc jacquemot piv2017_cMc jacquemot piv2017_c
Mc jacquemot piv2017_c
 
OpenData : au-delà des publications, le partage des données de la recherche e...
OpenData : au-delà des publications, le partage des données de la recherche e...OpenData : au-delà des publications, le partage des données de la recherche e...
OpenData : au-delà des publications, le partage des données de la recherche e...
 
Pratiques informationnelles
Pratiques informationnellesPratiques informationnelles
Pratiques informationnelles
 
Tic recherche-scientifique
Tic recherche-scientifiqueTic recherche-scientifique
Tic recherche-scientifique
 
préservation de l'information numérique formation 2015
préservation de l'information numérique formation 2015préservation de l'information numérique formation 2015
préservation de l'information numérique formation 2015
 
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnement
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnementRetour sur 5 années d'évolution des problématiques IST : rapport d'étonnement
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnement
 
Diffuser les résultats de la veille avec les outils de "curation" : Scoop.it,...
Diffuser les résultats de la veille avec les outils de "curation" : Scoop.it,...Diffuser les résultats de la veille avec les outils de "curation" : Scoop.it,...
Diffuser les résultats de la veille avec les outils de "curation" : Scoop.it,...
 
Le projet du SCD de Nice: une approche globale des données de la recherche
Le projet du SCD de Nice: une approche globale des données de la rechercheLe projet du SCD de Nice: une approche globale des données de la recherche
Le projet du SCD de Nice: une approche globale des données de la recherche
 
Projets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersProjets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiers
 
Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...
 
Bibliothécaire comme valeur ajoutée
Bibliothécaire comme valeur ajoutéeBibliothécaire comme valeur ajoutée
Bibliothécaire comme valeur ajoutée
 
Presentation jeudistv2
Presentation jeudistv2Presentation jeudistv2
Presentation jeudistv2
 
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
 
Stage outils curation_2012-05-03
Stage outils curation_2012-05-03Stage outils curation_2012-05-03
Stage outils curation_2012-05-03
 
IODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceIODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data Science
 
Retour d'expérience sur la coopération avec les revues scientifiques à l'éche...
Retour d'expérience sur la coopération avec les revues scientifiques à l'éche...Retour d'expérience sur la coopération avec les revues scientifiques à l'éche...
Retour d'expérience sur la coopération avec les revues scientifiques à l'éche...
 

Dernier

To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentationbahija babzine
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformersbahija babzine
 
Recurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptxRecurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptxbahija babzine
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023France Travail
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...France Travail
 
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attalcontact Elabe
 

Dernier (6)

To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentation
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformers
 
Recurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptxRecurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptx
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
 
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
 

Votre "data" je vous la sers comment ?

  • 1. Votre « data » je vous la sers comment ? Journée d’étude "Big et Open Data : conséquences et compétences pour les professionnels de l'information ?”, Rennes, 28 mai 2015 Dominique Cotte Réflexions sur la nébuleuse de la « data » et les impacts sur les activités des professionnels de l’information. 1
  • 2. Déroulé • Introduction • Prolégomènes : du document à la « data » et retour • Open Data • Open Resarch Data • Les promesses du Big Data • Conclusion sur les activités et spécialités de la gestion de l’information 2
  • 3. Data Open Linked Big Long Introduction : Une nouvelle série d’objets à prendre en compte, comment, pourquoi ? 3 Une nouvelle manière de mettre en valeur et en relation des éléments singuliers pour produire de la connaissanceSmart Web de données
  • 4. Documents, données, hybrides… • Sont-ils des opposables ? • Quels rapports entretiennent ces objets ? • Passe-t-on d’un monde à un autre monde ? 4
  • 5. Construction, structure • Est-il légitime de dire d’un document qu’il est « non structuré » ? • Et de l’opposer aux données qui seraient, par nature « structurées » ? 5
  • 7. Des approches plus fines des contenus des documents • Data mining, text mining • Balisage • Gestion de contenus structurés • Outils de recherche 7
  • 8. De nouvelles sources : les documents, dé-composés 8 Du document… … à la donnée Édité Autoporteur Possédant un sens global Pérenne Détachée Volatile Recombinable Dynamique « Le mouvement d’atomisation conduit les professionnels de l’information à changer d’échelle pour l’organisation, la documentation et la description, l’archivage, la mémorisation… des données, de leur appareillage, de leurs métadonnées. » 8
  • 9. Les modes de production de la donnée • Recueil automatique, capteurs • Réseaux sociaux • Production documentaire démultipliée • Appareillages scientifiques • Métadonnées 9
  • 10. Trois exemples • Domaine des énergies fossiles : « dématérialistation » de rapports papier parfois anciens (permanence de l’information incluse dans ces études) afin de pouvoir en exploiter et traiter les contenus (dont les données ) • Les cahiers de laboratoire dans l’industrie pharmaceutique • Publications de l’OCDE, problématique de la ré-utilisation de contenus éditoriaux et de la mixité entre des contenus analytiques (séries statistiques, datasets, et d’éléments de monographie) 10
  • 11. Cahier de laboratoire 11 Pratiques hétérogènes Ecritures mixtes Copier/coller Analogique/numérique
  • 12. Site d’accès aux publications de l’OCDE 12
  • 13. Ce qu’implique l’exploitation des données 13 Au documentDe la donnée Protocoles de recueil Mise en collections Traitements Plans de gestion Documentarisation Mises en perspectives Mises en formes Commentaires Métadonnées 13
  • 14. L’open Data et ses qualifications documentaires Qualification Recherche Description de contenu Métadonnées Qualité des données Systèmes d’information Indexation 14
  • 15. La data dans « l’open research data » 15 Investigations Expériences Data datasets Etudes, communications Bases documen- taires
  • 16. Une complexification du paysage documentaire, comme « écosystème » 16 Données (quantitatif) Travaux préparatoires Publications, actes, articles Retombées, vulgarisation Blogs, collaboratif Qualification Curation Accompagnement Médiation
  • 17. • Promesse technique : • Quantitatif • Volume • Vitesse • Infrastructures • Capteurs • Mobilité 17 Les promesses des « données massives »
  • 19. • « Grand » çà commence quand ? • Promesse d’usages : • Variété : rapprochement de ressources • Emergence de nouvelles connaissances via des inférences et des rapprochements d’information • Prédictions d’événements (démarche probabiliste) 19 Les promesses des « données massives »
  • 20. • Les univers de déploiement : • Marketing et vente • Comportement clients • Santé • Tourisme et territoires • Sécurité • … 20 Les promesses des « données massives » • Data scientists • Statisticiens • Professionnels de l’information • …
  • 21. • La marguerite de la data : 21 Les promesses des « données massives »
  • 22. • Atouts (en général) • Connaissances et pratiques : • Des données et de leur description • Des référentiels • Des outils de traitement : text mining, analyse statistique, sémantique • Contenus spécifiques • Maillage, « dé-silotage » • Dématérialisation de documents • Approches métiers des fonds et des documents • Validation, Véracité 22 Impacts sur activités des professionnels de l’information
  • 23. • Exemple : mise en commun de catalogues • Cycle vertueux • Récupération de données pour enrichir des contenus • Ex. avis de lecteurs de Babelio, Libfly • Open Data, récupération de biographies • Exposition des données • Mise en visibilité • Echange • Mutualisation • Fédération de catalogues • Rebonds et circulation dans les données • Enrichissement et redressement des données et retour au producteur • Ex. ISIDORE (Huma-Num CNRS) 23 Impacts sur activités des professionnels de l’information
  • 24. • Enjeux et opportunités • Pilotage : mieux connaître les environnements et les publics • Rapprocher corpus et données • Accès aux données de la recherche • Accès aux données publiques • Accès aux ressources (ou aux références) à partir des données • Améliorer l’exposition et la visibilité des fonds • Enrichir les catalogues • Exposer les éléments cachés dans de nouvelles formes de mises en relation (cf. CARTIER A., Bibliothèque et OpenData. Et si on ouvrait les bibliothèques sur l’avenir ?, Mémoire Enssib,2013) 24 Impacts sur activités des professionnels de l’information
  • 25. Besoins • Repérage, Qualification • Modèles, formats, référentiels • Curation • Documentarisation • Mise en liens, rapprochements 25
  • 26. Conclusion • Des objets documentaires qui s’hybrident sous l’influence des technologies numériques • Des spécialités qui doivent dialoguer pour confronter des expériences • Des emprunts nécessaires en termes de réflexions, méthodes, techniques, modèles, formats… 26
  • 27. Merci de votre attention. 27