SlideShare une entreprise Scribd logo
1  sur  6
Big Data & Open Data
Master 2 ISF
PRÉSENTATION DU MODULE
Sommaire
 Qui suis-je ?
 Qu’allons nous faire ensemble
 Déroulement pas tout à fait type d’une séance
 Ce dont nous ne parlerons pas
2
Qui suis-je ?
 Dr Patrick Bury (patrick.bury@laposte.net, [ASSAS] dans le sujet svp)
 Initialement un traiteur de données scientifiques, adepte du HPC (High
Power Computing)
 A relativiser, un super Calculateur des années 90 a environ la puissance de
calcul d’un Iphone 4
 20 ans dans l’informatique, de la maintenance au développement puis à la
Data
 Actuellement Lead Data (engineer + science) dans une entreprise Data
centrée
 Un peu de R&D avec l’université de Lille 1 pour m’amuser et apprendre à
communiquer sur des sujets scientifiques avec des non scientifiques
3
Qu’allons nous faire
 Découvrir ce qu’est le Big Data (à mon point de vue)
 En découvrir les principaux outils
 Découvrir les méthodes de travail adaptées
 Jouer avec des données
 Open Data
 Définition
 Utilité
 Quelques sources de données
 RGPD
 Pas le sujet, mais … quand même
4
Déroulement pas tout à fait type d’une
séance
 Séances de 3 heures
 Environ 1h à 1h30 de cours interactif (les questions sont les bienvenues)
 ½ heure de questions diverses (en gros, relatives à ce que vous pouvez
rencontrer en entreprise), attention, les réponses ne seront pas forcément
immédiates, je n’ai pas la science infuse
 1h de travaux sur les machines à notre disposition
5
Nous ne parlerons pas de …
 Intrication forte entre les outils Big Data (l’objet de ce module)
 Et les moyens de traiter de gros volumes de données (Machine Learning,
Deep Learning)
 C’est l’objet d’un autre module pour ceux qui l‘ont choisi
6

Contenu connexe

Plus de Patrick Bury

Plus de Patrick Bury (20)

100 évaluation
100 évaluation100 évaluation
100 évaluation
 
16 graph databases
16 graph databases16 graph databases
16 graph databases
 
15 map reduce on azure
15 map reduce on azure15 map reduce on azure
15 map reduce on azure
 
11 big data aws
11 big data aws11 big data aws
11 big data aws
 
14 big data gitlab
14 big data gitlab14 big data gitlab
14 big data gitlab
 
13 big data docker
13 big data docker13 big data docker
13 big data docker
 
10 big data hadoop
10 big data hadoop10 big data hadoop
10 big data hadoop
 
08 big data dataviz
08 big data dataviz08 big data dataviz
08 big data dataviz
 
12 big data azure
12 big data azure12 big data azure
12 big data azure
 
09 big data mapreduce
09 big data mapreduce09 big data mapreduce
09 big data mapreduce
 
07 big data sgbd
07 big data sgbd07 big data sgbd
07 big data sgbd
 
06 cloud souverain
06 cloud souverain06 cloud souverain
06 cloud souverain
 
05 creation instance ovh
05 creation instance ovh05 creation instance ovh
05 creation instance ovh
 
04 big data fournisseurs
04 big data fournisseurs04 big data fournisseurs
04 big data fournisseurs
 
03 big data stockage
03 big data stockage03 big data stockage
03 big data stockage
 
03 big data échelle
03 big data échelle03 big data échelle
03 big data échelle
 
02 big data definition
02 big data definition02 big data definition
02 big data definition
 
01 open data
01 open data01 open data
01 open data
 
16 graph databases
16 graph databases16 graph databases
16 graph databases
 
15 map reduce on azure
15 map reduce on azure15 map reduce on azure
15 map reduce on azure
 

01 big data introduction

  • 1. Big Data & Open Data Master 2 ISF PRÉSENTATION DU MODULE
  • 2. Sommaire  Qui suis-je ?  Qu’allons nous faire ensemble  Déroulement pas tout à fait type d’une séance  Ce dont nous ne parlerons pas 2
  • 3. Qui suis-je ?  Dr Patrick Bury (patrick.bury@laposte.net, [ASSAS] dans le sujet svp)  Initialement un traiteur de données scientifiques, adepte du HPC (High Power Computing)  A relativiser, un super Calculateur des années 90 a environ la puissance de calcul d’un Iphone 4  20 ans dans l’informatique, de la maintenance au développement puis à la Data  Actuellement Lead Data (engineer + science) dans une entreprise Data centrée  Un peu de R&D avec l’université de Lille 1 pour m’amuser et apprendre à communiquer sur des sujets scientifiques avec des non scientifiques 3
  • 4. Qu’allons nous faire  Découvrir ce qu’est le Big Data (à mon point de vue)  En découvrir les principaux outils  Découvrir les méthodes de travail adaptées  Jouer avec des données  Open Data  Définition  Utilité  Quelques sources de données  RGPD  Pas le sujet, mais … quand même 4
  • 5. Déroulement pas tout à fait type d’une séance  Séances de 3 heures  Environ 1h à 1h30 de cours interactif (les questions sont les bienvenues)  ½ heure de questions diverses (en gros, relatives à ce que vous pouvez rencontrer en entreprise), attention, les réponses ne seront pas forcément immédiates, je n’ai pas la science infuse  1h de travaux sur les machines à notre disposition 5
  • 6. Nous ne parlerons pas de …  Intrication forte entre les outils Big Data (l’objet de ce module)  Et les moyens de traiter de gros volumes de données (Machine Learning, Deep Learning)  C’est l’objet d’un autre module pour ceux qui l‘ont choisi 6