Le GTLL face au défi
du déluge des données
  Stefane Fermigier, Data Tuesday, fév. 2013
There is a tsunami of data that is crashing onto
 the beaches of the civilized world.This is a tidal
  wave of unrelated, growing data formed in bits
       and bytes, coming in an unorganized,
 uncontrolled, incoherent cacophony of foam. It's
 filled with flotsam and jetsam. It's filled with the
  sticks and bones and shells of inanimate and
animate life. None of it is easily related, none of it
   comes with any organizational methodology.
     Richard Saul Wurman, in “Information
                Architects” (1996)
Pourquoi le big data
  open source ?
Facteurs économiques




    Source: Michael Driscoll
Facteur technique
Pourquoi le big data
       open source ?
•   Expertise historique en scalabilité horizontale
    (cf. Beowulf, Google, etc.)

•   Majors de l’internet (cf. Google,Yahoo!,
    Facebook, Twitter) imprégnés de culture open
    source, et dont le business model tourne autour
    de l’accumulation des données

•   Efficience de l’open source comme modèle
    d’innovation ouverte, de développement et de
    diffusion de l’innovation
Mission du GT


“Développer l’écosystème du Libre
        en Ile-de-France”
17 Grands Groupes
                       65 PME/
                         ETI




         28 Etablissements
     de Recherche et Formation
Roadmap technologique




Distributed / Cloud   Embedded
Roadmap technologique


Dev. Tools   Middleware   Big / Open Data



 Distributed / Cloud        Embedded
Roadmap technologique
   Web 2.0 / 3.0          Enterprise Apps



Dev. Tools   Middleware     Big / Open Data



 Distributed / Cloud          Embedded
R&D collaborative depuis 5 ans


Projets: 33
Effort: 140 M€
Aide: 52 M€
3 “grands défis”

• Qualité logicielle
• “After PC”
• Déluge des données
Focus sur le Big Data
             Data Viz

           Indexation

   Traitement (MapReduce, etc.)

  Stockage (NoSQL, NewSQL)

      Collecte & injection

     Infra & sys. management
Plus d’infos




 Livre blanc disponible         Site Web:
sur www.fermigier.com     www.gt-logiciel-libre.org

Pourquoi le big data open source ?

  • 1.
    Le GTLL faceau défi du déluge des données Stefane Fermigier, Data Tuesday, fév. 2013
  • 2.
    There is atsunami of data that is crashing onto the beaches of the civilized world.This is a tidal wave of unrelated, growing data formed in bits and bytes, coming in an unorganized, uncontrolled, incoherent cacophony of foam. It's filled with flotsam and jetsam. It's filled with the sticks and bones and shells of inanimate and animate life. None of it is easily related, none of it comes with any organizational methodology. Richard Saul Wurman, in “Information Architects” (1996)
  • 3.
    Pourquoi le bigdata open source ?
  • 4.
    Facteurs économiques Source: Michael Driscoll
  • 5.
  • 7.
    Pourquoi le bigdata open source ? • Expertise historique en scalabilité horizontale (cf. Beowulf, Google, etc.) • Majors de l’internet (cf. Google,Yahoo!, Facebook, Twitter) imprégnés de culture open source, et dont le business model tourne autour de l’accumulation des données • Efficience de l’open source comme modèle d’innovation ouverte, de développement et de diffusion de l’innovation
  • 10.
    Mission du GT “Développerl’écosystème du Libre en Ile-de-France”
  • 11.
    17 Grands Groupes 65 PME/ ETI 28 Etablissements de Recherche et Formation
  • 12.
  • 13.
    Roadmap technologique Dev. Tools Middleware Big / Open Data Distributed / Cloud Embedded
  • 14.
    Roadmap technologique Web 2.0 / 3.0 Enterprise Apps Dev. Tools Middleware Big / Open Data Distributed / Cloud Embedded
  • 15.
    R&D collaborative depuis5 ans Projets: 33 Effort: 140 M€ Aide: 52 M€
  • 16.
    3 “grands défis” •Qualité logicielle • “After PC” • Déluge des données
  • 17.
    Focus sur leBig Data Data Viz Indexation Traitement (MapReduce, etc.) Stockage (NoSQL, NewSQL) Collecte & injection Infra & sys. management
  • 19.
    Plus d’infos Livreblanc disponible Site Web: sur www.fermigier.com www.gt-logiciel-libre.org