SlideShare une entreprise Scribd logo
BOSA.be
INTEC Brussel
2018-08-21
Bart Hanssens
SPF BOSA Transformation digitale
Big Data &
Open Data
• Data
• Quelques concepts
• Big Data
• Qu'est-ce que c'est + exemples
• Open Data
• Qu'est-ce que c'est + exemples
• Questions ?
Agenda
2
Data
3
• Données (électroniques)
• Photos, documents, cartes, données de mesure …
• Structuré ou non-structuré
Qu'est-ce que data ?
4
• Métadonnées sont également des données
• Données sur des autres données
• Souvent utiliser pour la recherche
• Par exemple:
• Donnée: vidéo YouTube
• Métadonnées: titre, date, nom de l’artiste, …
Qu’est-ce que metadata ?
5
• Enregistrer et récupérer des données, ça coûte
• Du temps, de l’argent, de l’espace
• La collecte de données ne suffit pas
• Le but est de faire quelque chose avec les donnéess
• Une analyse correcte des données peut être très difficile
• La sécurité des données est importante
• Surtout lorsque des données privés sont stockées/traitées
Points d’attention (méta)données
6
Big Data
7
Taille Data (environ)
Zettabyte ZB 15 ZB: toutes les données sur internet
Exabyte EB 2 EB: (par jour) nouvelles données dans le monde entier
Petabyte PB 4 PB: (par jour) data sur Facebook
Terabyte TB 8 TB: disque dur plus large (consommateur)
Gigabyte GB 60 GB: Wikipedia en anglais (sans historique)
3 GB: (par heure) film Netflix en qualité HD
1 GB: (par mois) limite d‘un abonnement GSM bon marché
Megabyte MB 2 MB: présentation PowerPoint
Kilobyte kB 3 KB: texte d’une page A4
Byte B
Combien est beaucoup ?
8
Type Prix par GB (environ) Max. vitesse de lecture (environ)
Disque dur 0.03 EUR 250 MB/s
Clé USB 0.2 EUR 150 MB/s
SSD m.2 0.3 EUR 3 500 MB/s
DDR4 RAM 10 EUR 25 600 MB/s
Comparaison mémoire / stockage
9
Type Commentaire Max.vitesse (en réalitié)
4G 5 MB/s
Wifi (n) 5 GHz 30 MB/s
Wifi (ac) 90 MB/s
Ethernet (Gigabit) 115 MB/s
Ethernet (10 GbE) 1 150 MB/s
MAREA Câble réseau Est USA - Espagne 20 000 000 MB/s
Comparaison vitesse de téléchargement
10
Dans les articles sur Big Data, on parle souvent de "V":
• Volume: beaucoup de données
• Velocity: traitement rapide
• Variety: structures et sources différentes
Actuellement des "V" supplémentaires sont mentionnés
• Value: valeur
• …
Les “V”s de Big Data
11
• Produire et stocker des données devient moins cher
• De plus en plus services "personnels" basés sur données:
• Google: publicité basée sur des recherches
• Netflix: suggestions de films
• TomTom: trajets plus rapides basés sur info embouteillages
• “Internet of Things”, “Smart City”, “Connected Cars”
• De plus en plus de communication entre les machines
Pourquoi de plus en plus Big Data ?
12
• Des capteurs partout, (souvent) connectés::
• Smartphones avec GPS, camera et capteur de mouvement
• Capteur de qualité de l’air, radiation, …
• Systèmes d’alarme, domotique
• Cameras et détecteurs trafic
• Voitures (autonomes)
• Capteurs dans des machines industrielles
Internet des Objets
13
• Online et médiaux sociaux
• Twitter, Facebook, Google, …
• Sciences
• Météo et climat, physique, astronomie
• Banques et industrie
• Bourse, assurances, chimie, secteur de santé
• Mobilité et transport
• Circulation plus fluide, voitures autonomes
• Sports
Applications
14
• Avantages et désavantages
• “Si le produit est gratuit alors vous êtes le produit ”
• Souvent l'intention de vendre quelque chose, basé sur
• Quelles applications vous utilisez et quand
• Où vous êtes, et avec qui
• Quelles pages, vidéos ... vous regardez et partagez
• Le produits que vous avez déjà acheté en ligne
• …
Exemple: médiaux sociaux et plateformes en ligne
15
• Grande quantité de photos et de mesures
• La terre: photos de bâtiments, température
• L’espace: étoiles, planètes
• USA: 25+ PB data, code et exemples NASA
• https://open.nasa.gov/open-data
• Belgique:
• Agriculture: croissance des cultures (https://watchitgrow.be)
• Plateforme Terrascope (https://terrascope.be)
Exemple: données satellite
16
Exemple: est-ce que ma commune est verte?
17
• Véhicules enregistrent la situation sur la route
• Trous sur la route, glace, routes glissantes, …
• L'information est partagée
• Avertissement aux véhicules dans le voisinage
• Message au gestionnaire de la route (souffleuse à neige …)
• Exemple: « BADA » projet Volvo / Scania (Suède)
• http://www.nvfnorden.org/library/Files/Per-
Olof%20Svensk_BADA%207%20June%202017.pdf
Exemple: améliorer la situation des autoroutes
18
• Beaucoup de gens garde leur mobile à portée de main
• En contact avec les antennes
• Opérateurs peuvent faire des analyses des événements
• Quel trajet les visiteurs suivent-ils ?
• Combien de temps restent-ils ?
• Exemple: Proximus MyAnalytics
• https://www.proximusanalytics.be
• Rapports anonymisés (payants)
• Seules des données Proximus (estimation autres opérateurs)
Exemple: visiteurs d’un événement basé sur GSM
19
Exemple: célébration Diables Rouges
20
• « La vie deviendra-t-elle plus chère en Belgique ? »
• Achats tels que nourriture/boisson… carburant, vêtements
• Influence indirecte sur l'indexation (augmentation) du loyer
• E.a. articles scannés aux caisses des supermarchés
• Comparaison n'est pas toujours facile
• Produits saisonniers, même produit / autre code
• https://statbel.fgov.be/fr/propos-de-
statbel/methodologie/analyses
Exemple: prix de consommation Statbel
21
• Formule 1
• 100 – 300 capteurs par bolide F1
• Vitesse, pression des pneus, freins, carburant …
• Football: FC Barcelona
• (big) data analytics
• Performance sportive, interaction personnalisée aves les fans
Exemples: sports
22
• CERN “Large Hadron Collider” accélérateur de particules
• 10 PB/s, « seulement » 30 PB données / an sont conservées
• https://home.cern/about/computing/processing-what-record
• NASA “Square Kilometre Array” télescope
• Prêt en 2024 ? 1 EB/jour, au moins 200 PB/an conservé
• https://www.skatelescope.org
Exemple: science
23
Analyse et visualisation des données
24
• Le stockage des données devient moins cher
• Tout n'est pas utile pour l’analyse
• Pas toujours clair ce qui a / n'a pas d'influence
• Souvent fait pour prédictions ou améliorer quelque chose
• Prévoir le temps, la qualité de l'air, les ventes, ...
• Détection de la fraude
• Composer de nouveaux matériaux et médicaments
Analyse de données
25
• « Entraîner » les machines de reconnaître des structures
• Images: personnes, panneaux de signalisation, tumeurs
• Textes et produits: catégorisation automatique
• Recherche sur le ML par les grandes entreprises TIC
• https://www.tensorflow.org (Google)
• http://www.paddlepaddle.org (Baidu)
• http://torch.ch (Facebook)
• https://www.ibm.com/watson (IBM)
Machine learning
26
• Par exemple via “notebooks” ou “dashboards”
• Alternative en ligne pour rapports et documents
• Particulièrement populaire auprès des chercheurs
• Peut aussi être utilisé sans big data
• Souvent écrit en Python, “R” et/ou Javascript
• http://shiny.rstudio.com
• http://jupyter.org
Visualisation des données
27
Plateformes Big Data
28
Quand Big Data / comment choisir les composants ?
29
• N'a de sens que pour de grandes quantités de données
• Terabytes ou plus
• Beaucoup de composants différents
• évoluent encore très vite
• Ne devraient pas tous être utilisés
• Aucun système parfait dans toutes les situations
• Recherches compliquées ou pas ?
• Données structurées ou non-structurées ?
• Interaction avec d'autres systèmes ?
Apache Hadoop
30
Plateforme Big Data Hadoop
31
• Pas la seule plateforme, mais très populaire
• Se compose de différents composants
• HDFS, MapReduce, …
• Java open source: usage libre sur vos propres serveurs
• Paquets commerciaux: Cloudera, MapR, Hortonworks …
• Installation sur vos propres machines ou “dans le cloud”
• Amazon, Google, Microsoft, Oracle, SAP …
• Attention: pas gratuit, stocker/récupérer les données coûte
Hadoop HDFS, simplifié
32
HDFS
Apache Hadoop HDFS
33
• Système de fichiers distribué
• (partie des) disques séparés se comportent comme 1
• Optimisé pour les grandes opérations de lecture « batch »
• Pas pour des petites opérations d'écriture “random”
• Peut être utilisé avec de nombreux disques "normaux"
• Même milliers de machines, dizaines de milliers de disques
• Centaines de petabytes
• Données automatiquement distribuées et copiées
• Détection + réparation rapide des erreurs (ex: disque cassé)
Pourquoi diviser les données / plusieurs systèmes ?
34
• Lecture / écriture des données n'est pas infiniment rapide
• Distribuer le travail entre différentes machines
• Éviter que les utilisateurs doivent attendre trop longtemps
• Faciliter la résolution des problèmes
• Machines et réseaux peuvent temporairement échouer
MapReduce
35
• Manière d'exécuter des tâches en parallèle
• Ex: compter mots, chercher
• Très grandes quantités de données
• (beaucoup) plus que rentre à la mémoire
• Destiné aux tâches où toutes les données sont lues 1 fois
• Distribuer les calculs
• Exécuter le plus près possible des données
• Éviter d'envoyer des données dans les deux sens
• Combiner les résultats
Apache HBase
36
• Base de données qui peuvent tourner sur HDFS
• Très grandes bases de données (milliards de lignes)
• Ne remplace pas les bases de données "classiques"
• Pas des enquêtes compliquées
• Pas beaucoup de structure
• Postgresql, Oracle… ont des fonctions supplémentaires
Quelques autres composants
37
• Apache Cassandra
• Également une base de données
• "Toujours disponible" plus important que « même données »
• Apache Hive
• Langage comme SQL, au-dessus de Hadoop
• Facilite l'utilisation d'Hadoop
Aperçu simplifié
38
HDFS
HBase
Map
Reduce
API
API
Hive
• Apache open source
• https://projects.apache.org/projects.html?category#big-data
• http://hadoop.apache.org
• http://spark.apache.org
• Communauté Big Data:
• http://bigdata.be
• Évènement annuel Data Science:
• https://datasciencebe.com
Quelques liens big data / data science
39
Apache Spark
40
Caractéristiques Apache Spark
41
• Peut fonctionner sur HDFS ou séparément
• Alternative à MapReduce
• Peut effectuer des traitements en mémoire
• Beaucoup plus rapide pour petites quantités de données
• Plus pratique pour parcourir mêmes données plusieurs fois
Open Data
42
• Données sans informations sensibles / personnelles
• Oui: statistiques
• Non: dossier médical
• Dans un format facile à traiter
• Ex: tableaux au format MS-Excel, CSV, XML …
• Peut être utilisé gratuitement par tout le monde
• Aussi à des fins commerciales
Qu’est ce que Open Data ?
43
Open
Data
Big
Data
Open Data et Big Data
44
• Big data n’est pas toujours open data
• Ex: données des entreprises ne sont pas publiques / gratuites
• Open data n’est pas toujours big data
• Exemple: liste des écoles bruxelloises est courte
Open Data et Big Data (2)
45
• Généralement des services publics
• Villes, régions, gouvernement fédéral …
• Payé par les impôts des citoyens et des entreprises
• Obligations imposées par l'Union européenne
• Parfois des entreprises
• Ex: entreprises louant des vélos ou des voitures
• Souvent aussi des personnes / bénévoles
• Ex: WikiPedia, OpenStreetMap, …
Qui publie des données ouvertes ?
46
• Surtout les villes publient des info d'adresses
• Places, piscines, …
• Données cartographiques
• Limites communales, carte 3D (Flandre) …
• Beaucoup de statistiques
• Population par commune, prix moyens, ...
De quel type de données s'agit-il ?
47
• Combiner avec autres données
• Publier des articles
• Ex: prix moyen maison/appartement par commune
• Créer des sites web
• Ex: https://ici.brussels/fr
• Créer des apps
• Ex: “Top Baby Names”: prénoms le plus populaires
Que faire avec open data ?
48
Exemple: site web Limbourg en chiffres
49
• Différentes formats sont utilisés
• CSV, MS-Excel, XML, JSON…
• Différentes par région possible
• Mentionner la source est parfois obligatoire, parfois pas
• Souvent pas de garantie de disponibilité / mises à jour
• Pas de contrat
Points d’attention open data
50
• Portail open data:
• https://data.gov.be
• Évènement annuel open data:
• http://www.openbelgium.be
• Communauté OpenKnowledge:
• https://www.openknowledge.be
Quelques liens autour l’open data
51
Questions ?
52
BOSA.be
@BartHanssens
bart.hanssens@bosa.fgov.be
opendata@belgium.be
Merci !

Contenu connexe

Tendances

Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Pierre Naegelen
 
Big data
Big dataBig data
Big data
Yosra ADDALI
 
La "Data science" au service des entreprises
La "Data science" au service des entreprisesLa "Data science" au service des entreprises
La "Data science" au service des entreprises
Aymen ZAAFOURI
 
Big Data: Concepts, techniques et démonstration de Apache Hadoop
Big Data: Concepts, techniques et démonstration de Apache HadoopBig Data: Concepts, techniques et démonstration de Apache Hadoop
Big Data: Concepts, techniques et démonstration de Apache Hadoop
hajlaoui jaleleddine
 
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
olivier
 
google books et les libraires
google books et les librairesgoogle books et les libraires
google books et les librairesolivier
 
Portails de bibliothèques
Portails de bibliothèquesPortails de bibliothèques
Portails de bibliothèques
Pierre Naegelen
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
Vincent de Stoecklin
 
Exploiter les données issues de Wikipedia
Exploiter les données issues de WikipediaExploiter les données issues de Wikipedia
Exploiter les données issues de Wikipedia
Robert Viseur
 
L'archivage du Web, présentation college de france
L'archivage du Web, présentation college de franceL'archivage du Web, présentation college de france
L'archivage du Web, présentation college de france
Julien Masanès
 
L'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de BiblissimaL'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de Biblissima
Equipex Biblissima
 

Tendances (12)

Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
 
Big data
Big dataBig data
Big data
 
La "Data science" au service des entreprises
La "Data science" au service des entreprisesLa "Data science" au service des entreprises
La "Data science" au service des entreprises
 
Rmll opendata-2013
Rmll opendata-2013Rmll opendata-2013
Rmll opendata-2013
 
Big Data: Concepts, techniques et démonstration de Apache Hadoop
Big Data: Concepts, techniques et démonstration de Apache HadoopBig Data: Concepts, techniques et démonstration de Apache Hadoop
Big Data: Concepts, techniques et démonstration de Apache Hadoop
 
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
 
google books et les libraires
google books et les librairesgoogle books et les libraires
google books et les libraires
 
Portails de bibliothèques
Portails de bibliothèquesPortails de bibliothèques
Portails de bibliothèques
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
 
Exploiter les données issues de Wikipedia
Exploiter les données issues de WikipediaExploiter les données issues de Wikipedia
Exploiter les données issues de Wikipedia
 
L'archivage du Web, présentation college de france
L'archivage du Web, présentation college de franceL'archivage du Web, présentation college de france
L'archivage du Web, présentation college de france
 
L'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de BiblissimaL'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de Biblissima
 

Similaire à Big data et open data

L'écosystème régional du Big Data
L'écosystème régional du Big DataL'écosystème régional du Big Data
L'écosystème régional du Big Data
Robert Viseur
 
Big data
Big dataBig data
Big data
Sameh Mbm
 
La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4 La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4
OCTO Technology
 
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
Galsungen
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
Mouhsine LAKHDISSI
 
Parcours Big Data @ Cetic (6 mai 2014)
Parcours Big Data @ Cetic (6 mai 2014)Parcours Big Data @ Cetic (6 mai 2014)
Parcours Big Data @ Cetic (6 mai 2014)
Agence du Numérique (AdN)
 
Data Publica
Data PublicaData Publica
Data Publica
Etalab
 
BigData_Technologies_PL.pdf
BigData_Technologies_PL.pdfBigData_Technologies_PL.pdf
BigData_Technologies_PL.pdf
MissaouiWissal
 
Du Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processusDu Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processus
CHAKER ALLAOUI
 
BigData_Technologies_PL.pdf
BigData_Technologies_PL.pdfBigData_Technologies_PL.pdf
BigData_Technologies_PL.pdf
AhmedToujani1
 
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.ioComment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io
Hervé Bourdon
 
Étude comparative sur la valorisation du big data pour les contenus audiovisuels
Étude comparative sur la valorisation du big data pour les contenus audiovisuelsÉtude comparative sur la valorisation du big data pour les contenus audiovisuels
Étude comparative sur la valorisation du big data pour les contenus audiovisuels
Thomas Malice
 
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
Amal Abid
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
Philippe METAYER
 
Introduction à la big data v3
Introduction à la big data v3 Introduction à la big data v3
Introduction à la big data v3
Mehdi TAZI
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015IBM France Lab
 
15 03 16_data sciences pour l'actuariat_f. soulie fogelman
15 03 16_data sciences pour l'actuariat_f. soulie fogelman15 03 16_data sciences pour l'actuariat_f. soulie fogelman
15 03 16_data sciences pour l'actuariat_f. soulie fogelmanArthur Charpentier
 
Compte-Rendu rencontre du groupe Culture du Datalab
Compte-Rendu rencontre du groupe Culture du DatalabCompte-Rendu rencontre du groupe Culture du Datalab
Compte-Rendu rencontre du groupe Culture du DatalabDatalab_PDL
 

Similaire à Big data et open data (20)

L'écosystème régional du Big Data
L'écosystème régional du Big DataL'écosystème régional du Big Data
L'écosystème régional du Big Data
 
Big data
Big dataBig data
Big data
 
La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4 La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4
 
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
Parcours Big Data @ Cetic (6 mai 2014)
Parcours Big Data @ Cetic (6 mai 2014)Parcours Big Data @ Cetic (6 mai 2014)
Parcours Big Data @ Cetic (6 mai 2014)
 
Data Publica
Data PublicaData Publica
Data Publica
 
BigData_Technologies_PL.pdf
BigData_Technologies_PL.pdfBigData_Technologies_PL.pdf
BigData_Technologies_PL.pdf
 
Du Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processusDu Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processus
 
BigData_Technologies_PL.pdf
BigData_Technologies_PL.pdfBigData_Technologies_PL.pdf
BigData_Technologies_PL.pdf
 
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.ioComment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io
 
Étude comparative sur la valorisation du big data pour les contenus audiovisuels
Étude comparative sur la valorisation du big data pour les contenus audiovisuelsÉtude comparative sur la valorisation du big data pour les contenus audiovisuels
Étude comparative sur la valorisation du big data pour les contenus audiovisuels
 
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Base de données
Base de donnéesBase de données
Base de données
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
 
Introduction à la big data v3
Introduction à la big data v3 Introduction à la big data v3
Introduction à la big data v3
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
 
15 03 16_data sciences pour l'actuariat_f. soulie fogelman
15 03 16_data sciences pour l'actuariat_f. soulie fogelman15 03 16_data sciences pour l'actuariat_f. soulie fogelman
15 03 16_data sciences pour l'actuariat_f. soulie fogelman
 
Compte-Rendu rencontre du groupe Culture du Datalab
Compte-Rendu rencontre du groupe Culture du DatalabCompte-Rendu rencontre du groupe Culture du Datalab
Compte-Rendu rencontre du groupe Culture du Datalab
 

Plus de Bart Hanssens

OpenFed, a Drupal distribution
OpenFed, a Drupal distributionOpenFed, a Drupal distribution
OpenFed, a Drupal distribution
Bart Hanssens
 
Open Summer of Code in Belgium
Open Summer of Code in BelgiumOpen Summer of Code in Belgium
Open Summer of Code in Belgium
Bart Hanssens
 
Open Belgium 2022: Prepare To Code
Open Belgium 2022: Prepare To CodeOpen Belgium 2022: Prepare To Code
Open Belgium 2022: Prepare To Code
Bart Hanssens
 
Werkgroep metadata: INSPIRE - DCAT-AP mapping
Werkgroep metadata: INSPIRE - DCAT-AP mappingWerkgroep metadata: INSPIRE - DCAT-AP mapping
Werkgroep metadata: INSPIRE - DCAT-AP mapping
Bart Hanssens
 
Overzicht DCAT-AP
Overzicht DCAT-APOverzicht DCAT-AP
Overzicht DCAT-AP
Bart Hanssens
 
Quarkus, Jib én OpenJ9
Quarkus, Jib én OpenJ9Quarkus, Jib én OpenJ9
Quarkus, Jib én OpenJ9
Bart Hanssens
 
Open Data at the Federal Level 2021
Open Data at the Federal Level 2021Open Data at the Federal Level 2021
Open Data at the Federal Level 2021
Bart Hanssens
 
Open Data workshop Agoria ICT
Open Data workshop Agoria ICTOpen Data workshop Agoria ICT
Open Data workshop Agoria ICT
Bart Hanssens
 
Atelier Open Data / Agoria ICT
Atelier Open Data / Agoria ICTAtelier Open Data / Agoria ICT
Atelier Open Data / Agoria ICT
Bart Hanssens
 
Open Source and Open Data
Open Source and Open DataOpen Source and Open Data
Open Source and Open Data
Bart Hanssens
 
Données ouvertes
Données ouvertesDonnées ouvertes
Données ouvertes
Bart Hanssens
 
Open Data
Open DataOpen Data
Open Data
Bart Hanssens
 
Open Community Projects
Open Community ProjectsOpen Community Projects
Open Community Projects
Bart Hanssens
 
From webform to API using microframeworks
From webform to API using microframeworksFrom webform to API using microframeworks
From webform to API using microframeworks
Bart Hanssens
 
Linked Data: Introductie
Linked Data: IntroductieLinked Data: Introductie
Linked Data: Introductie
Bart Hanssens
 
JavaVMs en GraalVM
JavaVMs en GraalVMJavaVMs en GraalVM
JavaVMs en GraalVM
Bart Hanssens
 
Open data, what's cooking at the federal level 2020
Open data, what's cooking at the federal level 2020Open data, what's cooking at the federal level 2020
Open data, what's cooking at the federal level 2020
Bart Hanssens
 
BOSA DG DT: opendata et intégrateur de services
BOSA DG DT: opendata et intégrateur de servicesBOSA DG DT: opendata et intégrateur de services
BOSA DG DT: opendata et intégrateur de services
Bart Hanssens
 
Local and Regional digital transformation in Belgium
Local and Regional digital transformation in BelgiumLocal and Regional digital transformation in Belgium
Local and Regional digital transformation in Belgium
Bart Hanssens
 
Voordeel halen uit zoekmachines en semantic web
Voordeel halen uit zoekmachines en semantic webVoordeel halen uit zoekmachines en semantic web
Voordeel halen uit zoekmachines en semantic web
Bart Hanssens
 

Plus de Bart Hanssens (20)

OpenFed, a Drupal distribution
OpenFed, a Drupal distributionOpenFed, a Drupal distribution
OpenFed, a Drupal distribution
 
Open Summer of Code in Belgium
Open Summer of Code in BelgiumOpen Summer of Code in Belgium
Open Summer of Code in Belgium
 
Open Belgium 2022: Prepare To Code
Open Belgium 2022: Prepare To CodeOpen Belgium 2022: Prepare To Code
Open Belgium 2022: Prepare To Code
 
Werkgroep metadata: INSPIRE - DCAT-AP mapping
Werkgroep metadata: INSPIRE - DCAT-AP mappingWerkgroep metadata: INSPIRE - DCAT-AP mapping
Werkgroep metadata: INSPIRE - DCAT-AP mapping
 
Overzicht DCAT-AP
Overzicht DCAT-APOverzicht DCAT-AP
Overzicht DCAT-AP
 
Quarkus, Jib én OpenJ9
Quarkus, Jib én OpenJ9Quarkus, Jib én OpenJ9
Quarkus, Jib én OpenJ9
 
Open Data at the Federal Level 2021
Open Data at the Federal Level 2021Open Data at the Federal Level 2021
Open Data at the Federal Level 2021
 
Open Data workshop Agoria ICT
Open Data workshop Agoria ICTOpen Data workshop Agoria ICT
Open Data workshop Agoria ICT
 
Atelier Open Data / Agoria ICT
Atelier Open Data / Agoria ICTAtelier Open Data / Agoria ICT
Atelier Open Data / Agoria ICT
 
Open Source and Open Data
Open Source and Open DataOpen Source and Open Data
Open Source and Open Data
 
Données ouvertes
Données ouvertesDonnées ouvertes
Données ouvertes
 
Open Data
Open DataOpen Data
Open Data
 
Open Community Projects
Open Community ProjectsOpen Community Projects
Open Community Projects
 
From webform to API using microframeworks
From webform to API using microframeworksFrom webform to API using microframeworks
From webform to API using microframeworks
 
Linked Data: Introductie
Linked Data: IntroductieLinked Data: Introductie
Linked Data: Introductie
 
JavaVMs en GraalVM
JavaVMs en GraalVMJavaVMs en GraalVM
JavaVMs en GraalVM
 
Open data, what's cooking at the federal level 2020
Open data, what's cooking at the federal level 2020Open data, what's cooking at the federal level 2020
Open data, what's cooking at the federal level 2020
 
BOSA DG DT: opendata et intégrateur de services
BOSA DG DT: opendata et intégrateur de servicesBOSA DG DT: opendata et intégrateur de services
BOSA DG DT: opendata et intégrateur de services
 
Local and Regional digital transformation in Belgium
Local and Regional digital transformation in BelgiumLocal and Regional digital transformation in Belgium
Local and Regional digital transformation in Belgium
 
Voordeel halen uit zoekmachines en semantic web
Voordeel halen uit zoekmachines en semantic webVoordeel halen uit zoekmachines en semantic web
Voordeel halen uit zoekmachines en semantic web
 

Dernier

Productivité et politique industrielles: deux défis à relever conjointement
Productivité et politique industrielles: deux défis à relever conjointementProductivité et politique industrielles: deux défis à relever conjointement
Productivité et politique industrielles: deux défis à relever conjointement
La Fabrique de l'industrie
 
Estimations ELABE BFMTV ABSTENTION élections européennes 2024
Estimations ELABE BFMTV ABSTENTION élections européennes 2024Estimations ELABE BFMTV ABSTENTION élections européennes 2024
Estimations ELABE BFMTV ABSTENTION élections européennes 2024
contact Elabe
 
Les Français et les élections législatives
Les Français et les élections législativesLes Français et les élections législatives
Les Français et les élections législatives
contact Elabe
 
Actualisation estimation élections européennes 2024
Actualisation estimation élections européennes 2024Actualisation estimation élections européennes 2024
Actualisation estimation élections européennes 2024
contact Elabe
 
Etat de l’opinion - Journée CCR CAT « Protégeons l’assurabilité »
Etat de l’opinion - Journée CCR CAT « Protégeons l’assurabilité »Etat de l’opinion - Journée CCR CAT « Protégeons l’assurabilité »
Etat de l’opinion - Journée CCR CAT « Protégeons l’assurabilité »
contact Elabe
 
Webinaire Qui sont les jeunes installés avec un bac +5 ?
Webinaire Qui sont les jeunes installés avec un bac +5 ?Webinaire Qui sont les jeunes installés avec un bac +5 ?
Webinaire Qui sont les jeunes installés avec un bac +5 ?
Institut de l'Elevage - Idele
 
Les Français et les élections européennes - 9ème vague
Les Français et les élections européennes - 9ème vagueLes Français et les élections européennes - 9ème vague
Les Français et les élections européennes - 9ème vague
contact Elabe
 
Estimation élections européennes 2024 ELABE
Estimation élections européennes 2024 ELABEEstimation élections européennes 2024 ELABE
Estimation élections européennes 2024 ELABE
contact Elabe
 
Webinaire_les aides aux investissements.pptx
Webinaire_les aides aux investissements.pptxWebinaire_les aides aux investissements.pptx
Webinaire_les aides aux investissements.pptx
Institut de l'Elevage - Idele
 
Deuxième actualisation estimation élections européennes 2024
Deuxième actualisation estimation élections européennes 2024Deuxième actualisation estimation élections européennes 2024
Deuxième actualisation estimation élections européennes 2024
contact Elabe
 
Comprendre le vote aux élections européennes du 9 juin 2024
Comprendre le vote aux élections européennes du 9 juin 2024Comprendre le vote aux élections européennes du 9 juin 2024
Comprendre le vote aux élections européennes du 9 juin 2024
contact Elabe
 

Dernier (11)

Productivité et politique industrielles: deux défis à relever conjointement
Productivité et politique industrielles: deux défis à relever conjointementProductivité et politique industrielles: deux défis à relever conjointement
Productivité et politique industrielles: deux défis à relever conjointement
 
Estimations ELABE BFMTV ABSTENTION élections européennes 2024
Estimations ELABE BFMTV ABSTENTION élections européennes 2024Estimations ELABE BFMTV ABSTENTION élections européennes 2024
Estimations ELABE BFMTV ABSTENTION élections européennes 2024
 
Les Français et les élections législatives
Les Français et les élections législativesLes Français et les élections législatives
Les Français et les élections législatives
 
Actualisation estimation élections européennes 2024
Actualisation estimation élections européennes 2024Actualisation estimation élections européennes 2024
Actualisation estimation élections européennes 2024
 
Etat de l’opinion - Journée CCR CAT « Protégeons l’assurabilité »
Etat de l’opinion - Journée CCR CAT « Protégeons l’assurabilité »Etat de l’opinion - Journée CCR CAT « Protégeons l’assurabilité »
Etat de l’opinion - Journée CCR CAT « Protégeons l’assurabilité »
 
Webinaire Qui sont les jeunes installés avec un bac +5 ?
Webinaire Qui sont les jeunes installés avec un bac +5 ?Webinaire Qui sont les jeunes installés avec un bac +5 ?
Webinaire Qui sont les jeunes installés avec un bac +5 ?
 
Les Français et les élections européennes - 9ème vague
Les Français et les élections européennes - 9ème vagueLes Français et les élections européennes - 9ème vague
Les Français et les élections européennes - 9ème vague
 
Estimation élections européennes 2024 ELABE
Estimation élections européennes 2024 ELABEEstimation élections européennes 2024 ELABE
Estimation élections européennes 2024 ELABE
 
Webinaire_les aides aux investissements.pptx
Webinaire_les aides aux investissements.pptxWebinaire_les aides aux investissements.pptx
Webinaire_les aides aux investissements.pptx
 
Deuxième actualisation estimation élections européennes 2024
Deuxième actualisation estimation élections européennes 2024Deuxième actualisation estimation élections européennes 2024
Deuxième actualisation estimation élections européennes 2024
 
Comprendre le vote aux élections européennes du 9 juin 2024
Comprendre le vote aux élections européennes du 9 juin 2024Comprendre le vote aux élections européennes du 9 juin 2024
Comprendre le vote aux élections européennes du 9 juin 2024
 

Big data et open data

  • 1. BOSA.be INTEC Brussel 2018-08-21 Bart Hanssens SPF BOSA Transformation digitale Big Data & Open Data
  • 2. • Data • Quelques concepts • Big Data • Qu'est-ce que c'est + exemples • Open Data • Qu'est-ce que c'est + exemples • Questions ? Agenda 2
  • 4. • Données (électroniques) • Photos, documents, cartes, données de mesure … • Structuré ou non-structuré Qu'est-ce que data ? 4
  • 5. • Métadonnées sont également des données • Données sur des autres données • Souvent utiliser pour la recherche • Par exemple: • Donnée: vidéo YouTube • Métadonnées: titre, date, nom de l’artiste, … Qu’est-ce que metadata ? 5
  • 6. • Enregistrer et récupérer des données, ça coûte • Du temps, de l’argent, de l’espace • La collecte de données ne suffit pas • Le but est de faire quelque chose avec les donnéess • Une analyse correcte des données peut être très difficile • La sécurité des données est importante • Surtout lorsque des données privés sont stockées/traitées Points d’attention (méta)données 6
  • 8. Taille Data (environ) Zettabyte ZB 15 ZB: toutes les données sur internet Exabyte EB 2 EB: (par jour) nouvelles données dans le monde entier Petabyte PB 4 PB: (par jour) data sur Facebook Terabyte TB 8 TB: disque dur plus large (consommateur) Gigabyte GB 60 GB: Wikipedia en anglais (sans historique) 3 GB: (par heure) film Netflix en qualité HD 1 GB: (par mois) limite d‘un abonnement GSM bon marché Megabyte MB 2 MB: présentation PowerPoint Kilobyte kB 3 KB: texte d’une page A4 Byte B Combien est beaucoup ? 8
  • 9. Type Prix par GB (environ) Max. vitesse de lecture (environ) Disque dur 0.03 EUR 250 MB/s Clé USB 0.2 EUR 150 MB/s SSD m.2 0.3 EUR 3 500 MB/s DDR4 RAM 10 EUR 25 600 MB/s Comparaison mémoire / stockage 9
  • 10. Type Commentaire Max.vitesse (en réalitié) 4G 5 MB/s Wifi (n) 5 GHz 30 MB/s Wifi (ac) 90 MB/s Ethernet (Gigabit) 115 MB/s Ethernet (10 GbE) 1 150 MB/s MAREA Câble réseau Est USA - Espagne 20 000 000 MB/s Comparaison vitesse de téléchargement 10
  • 11. Dans les articles sur Big Data, on parle souvent de "V": • Volume: beaucoup de données • Velocity: traitement rapide • Variety: structures et sources différentes Actuellement des "V" supplémentaires sont mentionnés • Value: valeur • … Les “V”s de Big Data 11
  • 12. • Produire et stocker des données devient moins cher • De plus en plus services "personnels" basés sur données: • Google: publicité basée sur des recherches • Netflix: suggestions de films • TomTom: trajets plus rapides basés sur info embouteillages • “Internet of Things”, “Smart City”, “Connected Cars” • De plus en plus de communication entre les machines Pourquoi de plus en plus Big Data ? 12
  • 13. • Des capteurs partout, (souvent) connectés:: • Smartphones avec GPS, camera et capteur de mouvement • Capteur de qualité de l’air, radiation, … • Systèmes d’alarme, domotique • Cameras et détecteurs trafic • Voitures (autonomes) • Capteurs dans des machines industrielles Internet des Objets 13
  • 14. • Online et médiaux sociaux • Twitter, Facebook, Google, … • Sciences • Météo et climat, physique, astronomie • Banques et industrie • Bourse, assurances, chimie, secteur de santé • Mobilité et transport • Circulation plus fluide, voitures autonomes • Sports Applications 14
  • 15. • Avantages et désavantages • “Si le produit est gratuit alors vous êtes le produit ” • Souvent l'intention de vendre quelque chose, basé sur • Quelles applications vous utilisez et quand • Où vous êtes, et avec qui • Quelles pages, vidéos ... vous regardez et partagez • Le produits que vous avez déjà acheté en ligne • … Exemple: médiaux sociaux et plateformes en ligne 15
  • 16. • Grande quantité de photos et de mesures • La terre: photos de bâtiments, température • L’espace: étoiles, planètes • USA: 25+ PB data, code et exemples NASA • https://open.nasa.gov/open-data • Belgique: • Agriculture: croissance des cultures (https://watchitgrow.be) • Plateforme Terrascope (https://terrascope.be) Exemple: données satellite 16
  • 17. Exemple: est-ce que ma commune est verte? 17
  • 18. • Véhicules enregistrent la situation sur la route • Trous sur la route, glace, routes glissantes, … • L'information est partagée • Avertissement aux véhicules dans le voisinage • Message au gestionnaire de la route (souffleuse à neige …) • Exemple: « BADA » projet Volvo / Scania (Suède) • http://www.nvfnorden.org/library/Files/Per- Olof%20Svensk_BADA%207%20June%202017.pdf Exemple: améliorer la situation des autoroutes 18
  • 19. • Beaucoup de gens garde leur mobile à portée de main • En contact avec les antennes • Opérateurs peuvent faire des analyses des événements • Quel trajet les visiteurs suivent-ils ? • Combien de temps restent-ils ? • Exemple: Proximus MyAnalytics • https://www.proximusanalytics.be • Rapports anonymisés (payants) • Seules des données Proximus (estimation autres opérateurs) Exemple: visiteurs d’un événement basé sur GSM 19
  • 21. • « La vie deviendra-t-elle plus chère en Belgique ? » • Achats tels que nourriture/boisson… carburant, vêtements • Influence indirecte sur l'indexation (augmentation) du loyer • E.a. articles scannés aux caisses des supermarchés • Comparaison n'est pas toujours facile • Produits saisonniers, même produit / autre code • https://statbel.fgov.be/fr/propos-de- statbel/methodologie/analyses Exemple: prix de consommation Statbel 21
  • 22. • Formule 1 • 100 – 300 capteurs par bolide F1 • Vitesse, pression des pneus, freins, carburant … • Football: FC Barcelona • (big) data analytics • Performance sportive, interaction personnalisée aves les fans Exemples: sports 22
  • 23. • CERN “Large Hadron Collider” accélérateur de particules • 10 PB/s, « seulement » 30 PB données / an sont conservées • https://home.cern/about/computing/processing-what-record • NASA “Square Kilometre Array” télescope • Prêt en 2024 ? 1 EB/jour, au moins 200 PB/an conservé • https://www.skatelescope.org Exemple: science 23
  • 24. Analyse et visualisation des données 24
  • 25. • Le stockage des données devient moins cher • Tout n'est pas utile pour l’analyse • Pas toujours clair ce qui a / n'a pas d'influence • Souvent fait pour prédictions ou améliorer quelque chose • Prévoir le temps, la qualité de l'air, les ventes, ... • Détection de la fraude • Composer de nouveaux matériaux et médicaments Analyse de données 25
  • 26. • « Entraîner » les machines de reconnaître des structures • Images: personnes, panneaux de signalisation, tumeurs • Textes et produits: catégorisation automatique • Recherche sur le ML par les grandes entreprises TIC • https://www.tensorflow.org (Google) • http://www.paddlepaddle.org (Baidu) • http://torch.ch (Facebook) • https://www.ibm.com/watson (IBM) Machine learning 26
  • 27. • Par exemple via “notebooks” ou “dashboards” • Alternative en ligne pour rapports et documents • Particulièrement populaire auprès des chercheurs • Peut aussi être utilisé sans big data • Souvent écrit en Python, “R” et/ou Javascript • http://shiny.rstudio.com • http://jupyter.org Visualisation des données 27
  • 29. Quand Big Data / comment choisir les composants ? 29 • N'a de sens que pour de grandes quantités de données • Terabytes ou plus • Beaucoup de composants différents • évoluent encore très vite • Ne devraient pas tous être utilisés • Aucun système parfait dans toutes les situations • Recherches compliquées ou pas ? • Données structurées ou non-structurées ? • Interaction avec d'autres systèmes ?
  • 31. Plateforme Big Data Hadoop 31 • Pas la seule plateforme, mais très populaire • Se compose de différents composants • HDFS, MapReduce, … • Java open source: usage libre sur vos propres serveurs • Paquets commerciaux: Cloudera, MapR, Hortonworks … • Installation sur vos propres machines ou “dans le cloud” • Amazon, Google, Microsoft, Oracle, SAP … • Attention: pas gratuit, stocker/récupérer les données coûte
  • 33. Apache Hadoop HDFS 33 • Système de fichiers distribué • (partie des) disques séparés se comportent comme 1 • Optimisé pour les grandes opérations de lecture « batch » • Pas pour des petites opérations d'écriture “random” • Peut être utilisé avec de nombreux disques "normaux" • Même milliers de machines, dizaines de milliers de disques • Centaines de petabytes • Données automatiquement distribuées et copiées • Détection + réparation rapide des erreurs (ex: disque cassé)
  • 34. Pourquoi diviser les données / plusieurs systèmes ? 34 • Lecture / écriture des données n'est pas infiniment rapide • Distribuer le travail entre différentes machines • Éviter que les utilisateurs doivent attendre trop longtemps • Faciliter la résolution des problèmes • Machines et réseaux peuvent temporairement échouer
  • 35. MapReduce 35 • Manière d'exécuter des tâches en parallèle • Ex: compter mots, chercher • Très grandes quantités de données • (beaucoup) plus que rentre à la mémoire • Destiné aux tâches où toutes les données sont lues 1 fois • Distribuer les calculs • Exécuter le plus près possible des données • Éviter d'envoyer des données dans les deux sens • Combiner les résultats
  • 36. Apache HBase 36 • Base de données qui peuvent tourner sur HDFS • Très grandes bases de données (milliards de lignes) • Ne remplace pas les bases de données "classiques" • Pas des enquêtes compliquées • Pas beaucoup de structure • Postgresql, Oracle… ont des fonctions supplémentaires
  • 37. Quelques autres composants 37 • Apache Cassandra • Également une base de données • "Toujours disponible" plus important que « même données » • Apache Hive • Langage comme SQL, au-dessus de Hadoop • Facilite l'utilisation d'Hadoop
  • 39. • Apache open source • https://projects.apache.org/projects.html?category#big-data • http://hadoop.apache.org • http://spark.apache.org • Communauté Big Data: • http://bigdata.be • Évènement annuel Data Science: • https://datasciencebe.com Quelques liens big data / data science 39
  • 41. Caractéristiques Apache Spark 41 • Peut fonctionner sur HDFS ou séparément • Alternative à MapReduce • Peut effectuer des traitements en mémoire • Beaucoup plus rapide pour petites quantités de données • Plus pratique pour parcourir mêmes données plusieurs fois
  • 43. • Données sans informations sensibles / personnelles • Oui: statistiques • Non: dossier médical • Dans un format facile à traiter • Ex: tableaux au format MS-Excel, CSV, XML … • Peut être utilisé gratuitement par tout le monde • Aussi à des fins commerciales Qu’est ce que Open Data ? 43
  • 45. • Big data n’est pas toujours open data • Ex: données des entreprises ne sont pas publiques / gratuites • Open data n’est pas toujours big data • Exemple: liste des écoles bruxelloises est courte Open Data et Big Data (2) 45
  • 46. • Généralement des services publics • Villes, régions, gouvernement fédéral … • Payé par les impôts des citoyens et des entreprises • Obligations imposées par l'Union européenne • Parfois des entreprises • Ex: entreprises louant des vélos ou des voitures • Souvent aussi des personnes / bénévoles • Ex: WikiPedia, OpenStreetMap, … Qui publie des données ouvertes ? 46
  • 47. • Surtout les villes publient des info d'adresses • Places, piscines, … • Données cartographiques • Limites communales, carte 3D (Flandre) … • Beaucoup de statistiques • Population par commune, prix moyens, ... De quel type de données s'agit-il ? 47
  • 48. • Combiner avec autres données • Publier des articles • Ex: prix moyen maison/appartement par commune • Créer des sites web • Ex: https://ici.brussels/fr • Créer des apps • Ex: “Top Baby Names”: prénoms le plus populaires Que faire avec open data ? 48
  • 49. Exemple: site web Limbourg en chiffres 49
  • 50. • Différentes formats sont utilisés • CSV, MS-Excel, XML, JSON… • Différentes par région possible • Mentionner la source est parfois obligatoire, parfois pas • Souvent pas de garantie de disponibilité / mises à jour • Pas de contrat Points d’attention open data 50
  • 51. • Portail open data: • https://data.gov.be • Évènement annuel open data: • http://www.openbelgium.be • Communauté OpenKnowledge: • https://www.openknowledge.be Quelques liens autour l’open data 51