Pourquoi le big data open source ?

Le GTLL face au déﬁ
du déluge des données
Stefane Fermigier, Data Tuesday, fév. 2013

There is a tsunami of data that is crashing onto
the beaches of the civilized world.This is a tidal
wave of unrelated, growing data formed in bits
and bytes, coming in an unorganized,
uncontrolled, incoherent cacophony of foam. It's
filled with flotsam and jetsam. It's filled with the
sticks and bones and shells of inanimate and
animate life. None of it is easily related, none of it
comes with any organizational methodology.
Richard Saul Wurman, in “Information
Architects” (1996)

Pourquoi le big data
open source ?

Facteurs économiques

Source: Michael Driscoll

Pourquoi le big data
open source ?
• Expertise historique en scalabilité horizontale
(cf. Beowulf, Google, etc.)

• Majors de l’internet (cf. Google,Yahoo!,
Facebook, Twitter) imprégnés de culture open
source, et dont le business model tourne autour
de l’accumulation des données

• Efﬁcience de l’open source comme modèle
d’innovation ouverte, de développement et de
diffusion de l’innovation

Mission du GT

“Développer l’écosystème du Libre
en Ile-de-France”

17 Grands Groupes
65 PME/
ETI

28 Etablissements
de Recherche et Formation

Roadmap technologique

Distributed / Cloud Embedded


Dev. Tools Middleware Big / Open Data


Web 2.0 / 3.0 Enterprise Apps

Dev. Tools Middleware Big / Open Data


R&D collaborative depuis 5 ans

Projets: 33
Effort: 140 M€
Aide: 52 M€

3 “grands déﬁs”

• Qualité logicielle
• “After PC”
• Déluge des données

Focus sur le Big Data
Data Viz

Indexation

Traitement (MapReduce, etc.)

Stockage (NoSQL, NewSQL)

Collecte & injection

Infra & sys. management

Plus d’infos

Livre blanc disponible Site Web:
sur www.fermigier.com www.gt-logiciel-libre.org

Pourquoi le big data open source ?

Contenu connexe

En vedette

Similaire à Pourquoi le big data open source ?

Plus de Stefane Fermigier

Pourquoi le big data open source ?