SlideShare une entreprise Scribd logo
1  sur  19
Télécharger pour lire hors ligne
Le GTLL face au défi
du déluge des données
  Stefane Fermigier, Data Tuesday, fév. 2013
There is a tsunami of data that is crashing onto
 the beaches of the civilized world.This is a tidal
  wave of unrelated, growing data formed in bits
       and bytes, coming in an unorganized,
 uncontrolled, incoherent cacophony of foam. It's
 filled with flotsam and jetsam. It's filled with the
  sticks and bones and shells of inanimate and
animate life. None of it is easily related, none of it
   comes with any organizational methodology.
     Richard Saul Wurman, in “Information
                Architects” (1996)
Pourquoi le big data
  open source ?
Facteurs économiques




    Source: Michael Driscoll
Facteur technique
Pourquoi le big data
       open source ?
•   Expertise historique en scalabilité horizontale
    (cf. Beowulf, Google, etc.)

•   Majors de l’internet (cf. Google,Yahoo!,
    Facebook, Twitter) imprégnés de culture open
    source, et dont le business model tourne autour
    de l’accumulation des données

•   Efficience de l’open source comme modèle
    d’innovation ouverte, de développement et de
    diffusion de l’innovation
Mission du GT


“Développer l’écosystème du Libre
        en Ile-de-France”
17 Grands Groupes
                       65 PME/
                         ETI




         28 Etablissements
     de Recherche et Formation
Roadmap technologique




Distributed / Cloud   Embedded
Roadmap technologique


Dev. Tools   Middleware   Big / Open Data



 Distributed / Cloud        Embedded
Roadmap technologique
   Web 2.0 / 3.0          Enterprise Apps



Dev. Tools   Middleware     Big / Open Data



 Distributed / Cloud          Embedded
R&D collaborative depuis 5 ans


Projets: 33
Effort: 140 M€
Aide: 52 M€
3 “grands défis”

• Qualité logicielle
• “After PC”
• Déluge des données
Focus sur le Big Data
             Data Viz

           Indexation

   Traitement (MapReduce, etc.)

  Stockage (NoSQL, NewSQL)

      Collecte & injection

     Infra & sys. management
Plus d’infos




 Livre blanc disponible         Site Web:
sur www.fermigier.com     www.gt-logiciel-libre.org

Contenu connexe

Similaire à 1 fermigierdatatuesdaygtllfev2013-130228083856-phpapp02

L'émergence d'une nouvelle filière de formation : data science
L'émergence d'une nouvelle filière de formation : data scienceL'émergence d'une nouvelle filière de formation : data science
L'émergence d'une nouvelle filière de formation : data scienceKezhan SHI
 
Festival Online de la Data 2020 - La data devient l'affaire de tous
Festival Online de la Data 2020 - La data devient l'affaire de tousFestival Online de la Data 2020 - La data devient l'affaire de tous
Festival Online de la Data 2020 - La data devient l'affaire de tousAlexandra Loria
 
Besoin compétences-iconomie-et-question
Besoin compétences-iconomie-et-questionBesoin compétences-iconomie-et-question
Besoin compétences-iconomie-et-questionRené MANDEL
 
Big Data ete learning Analytics
Big Data ete learning AnalyticsBig Data ete learning Analytics
Big Data ete learning AnalyticsMokhtar Ben Henda
 
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.ioComment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.ioHervé Bourdon
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel businessMouhsine LAKHDISSI
 
Google case study
Google case studyGoogle case study
Google case studypellat
 
La data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurMicrosoft Ideas
 
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...Altares D&B
 
Gouvernance de l'information par une Offre de Services Riches (OSR) pour tran...
Gouvernance de l'information par une Offre de Services Riches (OSR) pour tran...Gouvernance de l'information par une Offre de Services Riches (OSR) pour tran...
Gouvernance de l'information par une Offre de Services Riches (OSR) pour tran...Perrein Jean-Pascal
 
AGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoirenoucher
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015IBM France Lab
 
conférence/Conferentie - Big Data - Evoliris
conférence/Conferentie -  Big Data - Evolirisconférence/Conferentie -  Big Data - Evoliris
conférence/Conferentie - Big Data - EvolirisChristina Galouzis
 
Transformation d'entreprise par la data, Covéa, Guillaume Lemele - Chaire ESS...
Transformation d'entreprise par la data, Covéa, Guillaume Lemele - Chaire ESS...Transformation d'entreprise par la data, Covéa, Guillaume Lemele - Chaire ESS...
Transformation d'entreprise par la data, Covéa, Guillaume Lemele - Chaire ESS...Voir jpperrein Jean-Pascal Perrein
 
La plateforme OpenData 3.0 pour libérer et valoriser les données
La plateforme OpenData 3.0 pour libérer et valoriser les données  La plateforme OpenData 3.0 pour libérer et valoriser les données
La plateforme OpenData 3.0 pour libérer et valoriser les données Excelerate Systems
 
Enjeux de la donnee 21 novembre18
Enjeux de la donnee 21 novembre18Enjeux de la donnee 21 novembre18
Enjeux de la donnee 21 novembre18Laetitia Lycke
 
Introduction seminaire groupe flowline
Introduction seminaire groupe flowlineIntroduction seminaire groupe flowline
Introduction seminaire groupe flowlinepimp uncle
 
Introduction au BigData.pdf
Introduction au BigData.pdfIntroduction au BigData.pdf
Introduction au BigData.pdfZkSadrati
 
Introduction au BigData.pdf
Introduction au BigData.pdfIntroduction au BigData.pdf
Introduction au BigData.pdfZkSadrati
 

Similaire à 1 fermigierdatatuesdaygtllfev2013-130228083856-phpapp02 (20)

L'émergence d'une nouvelle filière de formation : data science
L'émergence d'une nouvelle filière de formation : data scienceL'émergence d'une nouvelle filière de formation : data science
L'émergence d'une nouvelle filière de formation : data science
 
Festival Online de la Data 2020 - La data devient l'affaire de tous
Festival Online de la Data 2020 - La data devient l'affaire de tousFestival Online de la Data 2020 - La data devient l'affaire de tous
Festival Online de la Data 2020 - La data devient l'affaire de tous
 
Besoin compétences-iconomie-et-question
Besoin compétences-iconomie-et-questionBesoin compétences-iconomie-et-question
Besoin compétences-iconomie-et-question
 
Big Data ete learning Analytics
Big Data ete learning AnalyticsBig Data ete learning Analytics
Big Data ete learning Analytics
 
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.ioComment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io
Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
Google case study
Google case studyGoogle case study
Google case study
 
Parcours Big Data @ Cetic (6 mai 2014)
Parcours Big Data @ Cetic (6 mai 2014)Parcours Big Data @ Cetic (6 mai 2014)
Parcours Big Data @ Cetic (6 mai 2014)
 
La data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeur
 
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
 
Gouvernance de l'information par une Offre de Services Riches (OSR) pour tran...
Gouvernance de l'information par une Offre de Services Riches (OSR) pour tran...Gouvernance de l'information par une Offre de Services Riches (OSR) pour tran...
Gouvernance de l'information par une Offre de Services Riches (OSR) pour tran...
 
AGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoire
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
 
conférence/Conferentie - Big Data - Evoliris
conférence/Conferentie -  Big Data - Evolirisconférence/Conferentie -  Big Data - Evoliris
conférence/Conferentie - Big Data - Evoliris
 
Transformation d'entreprise par la data, Covéa, Guillaume Lemele - Chaire ESS...
Transformation d'entreprise par la data, Covéa, Guillaume Lemele - Chaire ESS...Transformation d'entreprise par la data, Covéa, Guillaume Lemele - Chaire ESS...
Transformation d'entreprise par la data, Covéa, Guillaume Lemele - Chaire ESS...
 
La plateforme OpenData 3.0 pour libérer et valoriser les données
La plateforme OpenData 3.0 pour libérer et valoriser les données  La plateforme OpenData 3.0 pour libérer et valoriser les données
La plateforme OpenData 3.0 pour libérer et valoriser les données
 
Enjeux de la donnee 21 novembre18
Enjeux de la donnee 21 novembre18Enjeux de la donnee 21 novembre18
Enjeux de la donnee 21 novembre18
 
Introduction seminaire groupe flowline
Introduction seminaire groupe flowlineIntroduction seminaire groupe flowline
Introduction seminaire groupe flowline
 
Introduction au BigData.pdf
Introduction au BigData.pdfIntroduction au BigData.pdf
Introduction au BigData.pdf
 
Introduction au BigData.pdf
Introduction au BigData.pdfIntroduction au BigData.pdf
Introduction au BigData.pdf
 

Plus de gtll_systematic

Open source-professionnel
Open source-professionnelOpen source-professionnel
Open source-professionnelgtll_systematic
 
Obeo buiness model editeur réduit (1) (1)
Obeo buiness model editeur   réduit (1) (1)Obeo buiness model editeur   réduit (1) (1)
Obeo buiness model editeur réduit (1) (1)gtll_systematic
 
Business model integrateur_open_source
Business model integrateur_open_sourceBusiness model integrateur_open_source
Business model integrateur_open_sourcegtll_systematic
 
Retour d’expérience sur le business model d’un intégrateur os
Retour d’expérience sur le business model d’un intégrateur osRetour d’expérience sur le business model d’un intégrateur os
Retour d’expérience sur le business model d’un intégrateur osgtll_systematic
 
Wjgtll 8 gaël blondelle
Wjgtll 8 gaël blondelleWjgtll 8 gaël blondelle
Wjgtll 8 gaël blondellegtll_systematic
 
Wjgtll 7 romain berrendonner
Wjgtll 7 romain berrendonnerWjgtll 7 romain berrendonner
Wjgtll 7 romain berrendonnergtll_systematic
 
Wjgtll 5 magali fitzgibbon
Wjgtll 5 magali fitzgibbonWjgtll 5 magali fitzgibbon
Wjgtll 5 magali fitzgibbongtll_systematic
 
Wjgtll 3 roberto di cosmo
Wjgtll 3 roberto di cosmoWjgtll 3 roberto di cosmo
Wjgtll 3 roberto di cosmogtll_systematic
 
Wjgtll 1 philippe carré
Wjgtll 1 philippe carréWjgtll 1 philippe carré
Wjgtll 1 philippe carrégtll_systematic
 
7 baldeck-omd-datatuesday-130228102458-phpapp01
7 baldeck-omd-datatuesday-130228102458-phpapp017 baldeck-omd-datatuesday-130228102458-phpapp01
7 baldeck-omd-datatuesday-130228102458-phpapp01gtll_systematic
 
6 grisel-scikit-learn-introduction-130228102221-phpapp02
6 grisel-scikit-learn-introduction-130228102221-phpapp026 grisel-scikit-learn-introduction-130228102221-phpapp02
6 grisel-scikit-learn-introduction-130228102221-phpapp02gtll_systematic
 
4 picavet-datatuesdayvincentpicavet-130228100952-phpapp02
4 picavet-datatuesdayvincentpicavet-130228100952-phpapp024 picavet-datatuesdayvincentpicavet-130228100952-phpapp02
4 picavet-datatuesdayvincentpicavet-130228100952-phpapp02gtll_systematic
 
2 clairmont-ecosystemopensourcebigdata-130228095712-phpapp02
2 clairmont-ecosystemopensourcebigdata-130228095712-phpapp022 clairmont-ecosystemopensourcebigdata-130228095712-phpapp02
2 clairmont-ecosystemopensourcebigdata-130228095712-phpapp02gtll_systematic
 

Plus de gtll_systematic (18)

Open source-professionnel
Open source-professionnelOpen source-professionnel
Open source-professionnel
 
Obeo buiness model editeur réduit (1) (1)
Obeo buiness model editeur   réduit (1) (1)Obeo buiness model editeur   réduit (1) (1)
Obeo buiness model editeur réduit (1) (1)
 
Gtll modeleco-2013-c
Gtll modeleco-2013-cGtll modeleco-2013-c
Gtll modeleco-2013-c
 
Business model integrateur_open_source
Business model integrateur_open_sourceBusiness model integrateur_open_source
Business model integrateur_open_source
 
Retour d’expérience sur le business model d’un intégrateur os
Retour d’expérience sur le business model d’un intégrateur osRetour d’expérience sur le business model d’un intégrateur os
Retour d’expérience sur le business model d’un intégrateur os
 
Wjgtll 8 gaël blondelle
Wjgtll 8 gaël blondelleWjgtll 8 gaël blondelle
Wjgtll 8 gaël blondelle
 
Wjgtll 7 romain berrendonner
Wjgtll 7 romain berrendonnerWjgtll 7 romain berrendonner
Wjgtll 7 romain berrendonner
 
Wjgtll 6 sylvain steer
Wjgtll 6 sylvain steerWjgtll 6 sylvain steer
Wjgtll 6 sylvain steer
 
Wjgtll 5 magali fitzgibbon
Wjgtll 5 magali fitzgibbonWjgtll 5 magali fitzgibbon
Wjgtll 5 magali fitzgibbon
 
Wjgtll 4 benjamin jean
Wjgtll 4 benjamin jeanWjgtll 4 benjamin jean
Wjgtll 4 benjamin jean
 
Wjgtll 3 roberto di cosmo
Wjgtll 3 roberto di cosmoWjgtll 3 roberto di cosmo
Wjgtll 3 roberto di cosmo
 
Wjgtll 2 pierre ficheux
Wjgtll 2 pierre ficheuxWjgtll 2 pierre ficheux
Wjgtll 2 pierre ficheux
 
Wjgtll 1 philippe carré
Wjgtll 1 philippe carréWjgtll 1 philippe carré
Wjgtll 1 philippe carré
 
7 baldeck-omd-datatuesday-130228102458-phpapp01
7 baldeck-omd-datatuesday-130228102458-phpapp017 baldeck-omd-datatuesday-130228102458-phpapp01
7 baldeck-omd-datatuesday-130228102458-phpapp01
 
6 grisel-scikit-learn-introduction-130228102221-phpapp02
6 grisel-scikit-learn-introduction-130228102221-phpapp026 grisel-scikit-learn-introduction-130228102221-phpapp02
6 grisel-scikit-learn-introduction-130228102221-phpapp02
 
4 picavet-datatuesdayvincentpicavet-130228100952-phpapp02
4 picavet-datatuesdayvincentpicavet-130228100952-phpapp024 picavet-datatuesdayvincentpicavet-130228100952-phpapp02
4 picavet-datatuesdayvincentpicavet-130228100952-phpapp02
 
2 clairmont-ecosystemopensourcebigdata-130228095712-phpapp02
2 clairmont-ecosystemopensourcebigdata-130228095712-phpapp022 clairmont-ecosystemopensourcebigdata-130228095712-phpapp02
2 clairmont-ecosystemopensourcebigdata-130228095712-phpapp02
 
Guide open-source
Guide open-source Guide open-source
Guide open-source
 

1 fermigierdatatuesdaygtllfev2013-130228083856-phpapp02

  • 1. Le GTLL face au défi du déluge des données Stefane Fermigier, Data Tuesday, fév. 2013
  • 2. There is a tsunami of data that is crashing onto the beaches of the civilized world.This is a tidal wave of unrelated, growing data formed in bits and bytes, coming in an unorganized, uncontrolled, incoherent cacophony of foam. It's filled with flotsam and jetsam. It's filled with the sticks and bones and shells of inanimate and animate life. None of it is easily related, none of it comes with any organizational methodology. Richard Saul Wurman, in “Information Architects” (1996)
  • 3. Pourquoi le big data open source ?
  • 4. Facteurs économiques Source: Michael Driscoll
  • 6.
  • 7. Pourquoi le big data open source ? • Expertise historique en scalabilité horizontale (cf. Beowulf, Google, etc.) • Majors de l’internet (cf. Google,Yahoo!, Facebook, Twitter) imprégnés de culture open source, et dont le business model tourne autour de l’accumulation des données • Efficience de l’open source comme modèle d’innovation ouverte, de développement et de diffusion de l’innovation
  • 8.
  • 9.
  • 10. Mission du GT “Développer l’écosystème du Libre en Ile-de-France”
  • 11. 17 Grands Groupes 65 PME/ ETI 28 Etablissements de Recherche et Formation
  • 13. Roadmap technologique Dev. Tools Middleware Big / Open Data Distributed / Cloud Embedded
  • 14. Roadmap technologique Web 2.0 / 3.0 Enterprise Apps Dev. Tools Middleware Big / Open Data Distributed / Cloud Embedded
  • 15. R&D collaborative depuis 5 ans Projets: 33 Effort: 140 M€ Aide: 52 M€
  • 16. 3 “grands défis” • Qualité logicielle • “After PC” • Déluge des données
  • 17. Focus sur le Big Data Data Viz Indexation Traitement (MapReduce, etc.) Stockage (NoSQL, NewSQL) Collecte & injection Infra & sys. management
  • 18.
  • 19. Plus d’infos Livre blanc disponible Site Web: sur www.fermigier.com www.gt-logiciel-libre.org