SlideShare une entreprise Scribd logo
1  sur  53
Télécharger pour lire hors ligne
Big Data, Big machines, Big
Science : vers une société sans
sujet et sans causalité ?
Fidelia Ibekwe-SanJuan
1. Big Data
Just how big is BIG??
Just how big is BIG??
En 2011: 1,8 zetta-octets de données
numériques disponibles
Just how big is BIG??
Just how big is BIG??
Les 4 ‘V’ du Big Data
http://www.datasciencecentral.com/profiles/blogs/data-veracity
Bref retour terminologique
Big Data
Linked Data
Open Data
Vers BOLD (Big Open Linked Data)
2.
Big machines
Big Science ?
- Jim Gray, Microsoft Corporation, 2007
Big Data : 4ème paradigme scientifique ?
- Jim Gray on eScience, The Fourth Paradigm, Microsoft Corporation, 2009
La science du 21ème siècle n’est
plus “science as usual”
 e-Science
 Architecture de grille informatique en réseau
 Collaboration à l’échelle mondiale
 Génération et traitement de données massives
 Outils sophistiqués d’exploration des données
« e-Science n’est pas une nouvelle discipline scientifique à
proprement parler : e-Science est un raccourci pour désigner
l’ensemble d’outils et de technologies nécessaires pour soutenir une
science dans un environnement collaboratif et réseauté.
L’infrastructure de e-Science a pour but de permettre aux
scientifiques de faire leurs recherches, plus vite et mieux. » - Jessie
Hey (2006)
Accélérateur de particles : The Large
Hadron Collider
• Construit par 10 000 scientifiques
• De plus de 100 pays
• Questions
les lois basiques qui gouvernent les
interactions et les forces entre objets
élémentaires ?
la structure profonde du temps et de
l’espace ?
l’intersection de la mécanique
quantique et la théorie de la relativité
générale ?
150 millions de senseurs qui délivrent des données 40 million de fois per seconde.
150 millions de péta-octets de données par an ou 500 exa-octets par jour
500 quintillions (5×1020) octets par jour, soit près de 200 fois plus que toutes les
sources de données combinées au monde - http://en.wikipedia.org/wiki/Big_data
Astronomie Sloan Digital Sky Survey (SDSS)
• Début 2000
• Données récoltées : 200 GB par nuit, soit 140 téra-octets depuis le début
• Large Synoptic Survey Telescope (2016) devrait acquérir ce volume de
données tous les 5 jours
Astronomie Sloan Digital Sky Survey (SDSS)
http://www.ascensionnow.co.uk/is-the-universe-a-fractal.html
Le Big Data et Big Science
dans les Humanités (SHS)
  Défi : « Que feriez-vous avec un million de livres ou un
million de pages de journaux ou de photographies ? »
étant donné que vous ne pouvez pas les lire même si
vous deviez y passer toute une vie ?
  « investiguer comment des techniques informatiques
peuvent être appliquées au “big data” afin de changer la
nature des recherches en SHS »
http://www.diggingintodata.org/
3. Les paradoxes du Big Data
#1
L’industrialisation de la personnalisation
Le Big Data permet de faire du
très “small”
Quand le
rentre en politique
Présidentielle américaine de 2012
vs
Orca
Narwhal
"The real innovation in 2012 is that we
had world-class technologists inside a
campaign’’
- Reed (Obama chief Tech)
Big Data permet de faire de la personnalisation extrême :
“Les très grandes données vous permettent d’être très fin. Elles vous
permettent de faire des interventions très précises et ciblées. (...)
Vous voulez que votre équipe d’analyse des données soit capable de
dire aux militants : “Appelez ces numéros, frappez sur ces portes,
aller dans ces quartiers.” Le militant n’a pas besoin de savoir
pourquoi; ils ont juste besoin de savoir qu’ils frappent sur les bonnes
portes.”
Alexis C. Madrigal, When the Nerds Go Marching In, The Atlantic, 16
nov. 2012.
La présidentielle américaine 2012
#2
L’ère de la “gouvernementalité
algorithmique’’
Rouvroy et Thomas Berns (2013)
Vers une gouvernance sans gouvernés
"   Big Data or Big Brother?
http://www.ted.com/talks/eli_pariser_beware_online_filter_bubbles.html
« Beware of filter bubbles! »
- Eli Pariser
#3
Vers des savoirs immanents aux
données, sans causalité et sans sujets
connaissants ?
« un nouveau rapport au savoir, qui donne “l’impression d’avoir
abandonné un petit peu les ambitions de la rationalité moderne, qui
visait à comprendre les phénomènes en les reliant à leur cause, au
profit d’une rationalité post-moderne, qui est fondée sur une logique
purement statistique, donc sur la découverte de corrélations entre
des données recueillies dans des contextes extrêmement divers,
hétérogènes les uns aux autres, et qui sont reliés entre eux par
aucun lien de causalité (...) C’est l’abandon du « savoir causal, la
dévaluation de l’expérience sensible elle-même au profit du calcul.»
Rouvroy, Du rôle prédictif des données à la gouvernementalité
algorithmique, 16/12/2010.
http://www.internetactu.net/2010/12/16/du-role-predictif-des-donnees-a-la-
gouvernementalite-algorithmique/
« la donnée brute est un oxymore et une mauvaise idée. Au
contraire, les données doivent être cuisinées avec
beaucoup de soin» - Jeffrey Bowker (2005)
 les données sont toujours insérées dans un contexte qu’il
faut comprendre pour identifier les limites et les biais
 des jeux de données sociales manquent de profondeur et
de contexte
#4
Vers des connaissances scientifiques
infalsifiables ?
Science avant 21ème siècle
Science du 21ème siècle: une
science expérimentale et “ad-
hoc”
#5
La fin des théories scientifiques ?
-  Problème de sur-ajustement important (over-fitting)
-  L’exigence de la reproductibilité conduit à la simplification
-  de réalités complexes et multidimensionnelles
Mais c’est ignorer la dimension physique et
sociale des savoirs scientifiques.
« Je peux encoder une belle simulation sur mon écran dans
laquelle il n’y a aucune théorie de la gravité, mais si je tente
de conduire ma voiture au-delà du bord d’une falaise,
l’empirisme va mordre mon derrière dans ma chute.’’ - John
Wilbanks (2009)
« Si l’idéal de l'apprentissage automatique est de
réussir le test de Turing, c'est-à-dire qu’on n’arrive
plus à faire la différence entre le comportement
d’une machine et d’un humain, alors la science a
perdu ». - Christophe Prieur (2014)
Dominique Boullier, Christophe Prieur, Milad Doueihi, in Atelier Data science ?
Colloque pour les 30 ans de la revue : Paris INHA 8 au 10 janvier 2014
http://revue-reseaux.univ-paris-est.fr/fr/actualites-colloque-pour-les-30-ans-de-la-revue-reseaux/
document-1775.html
La science a besoin de théories !
#6
Le mythe des algorithmes
infallibles
Illusions algorithmiques
 Problème de BIAIS
 Données collectées représentent-elles le
phénomène mesuré ?
 Ex. analyse des tweets durant l’ouragan Sandy
(octobre 2012) sur la côte est américaine
« Des biais cachés du Big Data »
- Kate Crawford (2012)
 Problème de SIGNAL
 “La carte n’est pas le territoire” Alfred Korzybski
(1956)
 Même les cartes ne sont pas neutres, elles peuvent
être partisanes !
« Des biais cachés du Big Data »
- Kate Crawford
 Problème d’ECHELLE
- Vision panoramique d’un phénomène
-  Il y a des illusions de perspective
- Manque de profondeur
“Travailler avec le big data, c’est voir le
monde à 30 000m d’altitude.”
« Des biais cachés du Big Data »
- Kate Crawford
 Problème d’ECHELLE
« Des biais cachés du Big Data »
- Kate Crawford
Un vieux problème qui
oppose sciences physiques
et sciences sociales depuis
le 19ème siècle
- Gabriel Tarde, criminologiste.
 Problème d’ECHELLE
« Des biais cachés du Big Data »
- Kate Crawford
“C’est toujours la même erreur qui se fait jour :
celle de croire que, pour voir peu à peu apparaître
la régularité, l’ordre, la marche logique, dans les
faits sociaux, il faut sortir de leur détail,
essentiellement irrégulier, et s’élever très haut
jusqu’à embrasser d’une vue panoramique de
vastes ensembles » - Gabriel Tarde, Les lois sociales,
1898 »
 Problème d’ECHELLE : en langage
Latour…
« Des biais cachés du Big Data »
“To be a good sociologist one should refuse to go up, to take
a larger view, to compile huge vistas! Look down, you
sociologists. Be even more blind, even more narrow, even
more down to earth, even more myopic »
http://bruno-latour.fr/sites/default/files/82-TARDE-JOYCE-SOCIAL-
GB.pdf (p. 9) »
  Nécessité de demander le “pourquoi” ou le
“comment” et non seulement le “combien”.
 Le deuil de l’exhaustivité
 Le deuil de la représentativité
 Le deuil de l’objectivité
« 3 Deuils du Big Data »
- Dominique Bouiller (2014)
 Attention au data fundamentalism
 Attention au data mythology
 Conjuguer Big Data et Small Data
 Conjuguer la science du Big data et méthodes
qualtiatives traditionnelles en sciences sociales
 Tiny data can be cute!
Des illusions algorithmiques
- Kate Crawford
« J’ai vu le 4ème paradigme,
et c’est nous ! »
- John Wilbanks (2009)
Merci de votre attention !
Des alternatifs ?
Infant science
Kid science
http://old.richarddawkins.net/articles/646693-17-year-old-girl-builds-artificial-brain-to-detect-
breast-cancer
Citizen Science
http://www.galaxyzoo.org/
We are trying something new! Come help us understand a very specific
type of galaxy and experience science from start to end. Take part
Citizen Science
Universit of Cornel Lab of Ornithology
- http://ebird.org/content/ebird/
Citizen Science
www.tela-botanica.org
Créer et diffuser des biens communs au service de la connaissance et
de la protection de l’environnement
Crowdsourcing culturel
Flickr Commons : espace de co-construction d’artefacts culturels
numériques entre musées, bibliothèques & archives et le public

Contenu connexe

Tendances

Comment le numérique transforme les lectures des adolescents ?
Comment le numérique transforme les lectures des adolescents ?Comment le numérique transforme les lectures des adolescents ?
Comment le numérique transforme les lectures des adolescents ?
olivier
 
IA et Big Data : mythes et réalité
IA et Big Data : mythes et réalitéIA et Big Data : mythes et réalité
IA et Big Data : mythes et réalité
Faurie Christophe
 

Tendances (20)

Profil ertzscheid - copie
Profil ertzscheid - copieProfil ertzscheid - copie
Profil ertzscheid - copie
 
Index independant du web ertzscheid
Index independant du web ertzscheidIndex independant du web ertzscheid
Index independant du web ertzscheid
 
Fif 85-ertzscheid
Fif 85-ertzscheidFif 85-ertzscheid
Fif 85-ertzscheid
 
Comment le numérique transforme les lectures des adolescents ?
Comment le numérique transforme les lectures des adolescents ?Comment le numérique transforme les lectures des adolescents ?
Comment le numérique transforme les lectures des adolescents ?
 
Internet et le web
Internet et le webInternet et le web
Internet et le web
 
IA et Big Data : mythes et réalité
IA et Big Data : mythes et réalitéIA et Big Data : mythes et réalité
IA et Big Data : mythes et réalité
 
Histoire web-oe
Histoire web-oeHistoire web-oe
Histoire web-oe
 
La technoscience au coeur du projet de notre société future !
La technoscience au coeur du projet de notre société future !La technoscience au coeur du projet de notre société future !
La technoscience au coeur du projet de notre société future !
 
Wikipédia : former ou interdire ?
Wikipédia : former ou interdire ?Wikipédia : former ou interdire ?
Wikipédia : former ou interdire ?
 
Éducation et révolutions - TacTIC
Éducation et révolutions - TacTICÉducation et révolutions - TacTIC
Éducation et révolutions - TacTIC
 
Antonio A. CASILLI -- Web et privacy : Sur le prétendu renoncement à la vie p...
Antonio A. CASILLI -- Web et privacy : Sur le prétendu renoncement à la vie p...Antonio A. CASILLI -- Web et privacy : Sur le prétendu renoncement à la vie p...
Antonio A. CASILLI -- Web et privacy : Sur le prétendu renoncement à la vie p...
 
Antonio CASILLI - Le rôle des visualisations de données dans la recherche sur...
Antonio CASILLI - Le rôle des visualisations de données dans la recherche sur...Antonio CASILLI - Le rôle des visualisations de données dans la recherche sur...
Antonio CASILLI - Le rôle des visualisations de données dans la recherche sur...
 
Jérôme Denis - Avant le déluge : le travail invisible des données
Jérôme Denis - Avant le déluge : le travail invisible des donnéesJérôme Denis - Avant le déluge : le travail invisible des données
Jérôme Denis - Avant le déluge : le travail invisible des données
 
Tres haut debit
Tres haut debit Tres haut debit
Tres haut debit
 
001 information design
001   information design001   information design
001 information design
 
Synthèse du 1er Workshop MesInfos - 4 scénarios des données personnelles part...
Synthèse du 1er Workshop MesInfos - 4 scénarios des données personnelles part...Synthèse du 1er Workshop MesInfos - 4 scénarios des données personnelles part...
Synthèse du 1er Workshop MesInfos - 4 scénarios des données personnelles part...
 
Éducation et numérique : quelques étapes
Éducation et numérique : quelques étapesÉducation et numérique : quelques étapes
Éducation et numérique : quelques étapes
 
Cahier de veille intelligence artificielle
Cahier de veille intelligence artificielleCahier de veille intelligence artificielle
Cahier de veille intelligence artificielle
 
En quoi internet change-t-il le travail collaboratif ?
En quoi internet change-t-il le travail collaboratif ? En quoi internet change-t-il le travail collaboratif ?
En quoi internet change-t-il le travail collaboratif ?
 
Qu'est-ce que le digital labor
Qu'est-ce que le digital laborQu'est-ce que le digital labor
Qu'est-ce que le digital labor
 

En vedette

Nouvelle grille label Naturellement Bassin 2013
Nouvelle grille label Naturellement Bassin  2013Nouvelle grille label Naturellement Bassin  2013
Nouvelle grille label Naturellement Bassin 2013
Aline INIZAN PAYEN
 
Administración
AdministraciónAdministración
Administración
54464761
 
Tant de joyaux au fil de l'eau
Tant de joyaux au fil de l'eauTant de joyaux au fil de l'eau
Tant de joyaux au fil de l'eau
edelcroix
 
3673 (preventivas y proteccion)
3673 (preventivas y proteccion) 3673 (preventivas y proteccion)
3673 (preventivas y proteccion)
Prosaludocupacional
 
Sustentación proyecto 4
Sustentación proyecto 4Sustentación proyecto 4
Sustentación proyecto 4
000Mariana000
 

En vedette (20)

Nouvelle grille label Naturellement Bassin 2013
Nouvelle grille label Naturellement Bassin  2013Nouvelle grille label Naturellement Bassin  2013
Nouvelle grille label Naturellement Bassin 2013
 
Sfsic17 magaly bigey
Sfsic17 magaly bigeySfsic17 magaly bigey
Sfsic17 magaly bigey
 
Caso Viral Analgésico
Caso Viral AnalgésicoCaso Viral Analgésico
Caso Viral Analgésico
 
Administración
AdministraciónAdministración
Administración
 
Presentacion
PresentacionPresentacion
Presentacion
 
Unit 5 pqt
Unit 5 pqtUnit 5 pqt
Unit 5 pqt
 
Tant de joyaux au fil de l'eau
Tant de joyaux au fil de l'eauTant de joyaux au fil de l'eau
Tant de joyaux au fil de l'eau
 
Pmi 2008 2009
Pmi 2008 2009Pmi 2008 2009
Pmi 2008 2009
 
Hundimiento del prestige
Hundimiento del prestigeHundimiento del prestige
Hundimiento del prestige
 
Coltan3
Coltan3Coltan3
Coltan3
 
Présentation wifi sécurisé
Présentation wifi sécuriséPrésentation wifi sécurisé
Présentation wifi sécurisé
 
Extrait du Game Design Document
Extrait du Game Design DocumentExtrait du Game Design Document
Extrait du Game Design Document
 
3673 (preventivas y proteccion)
3673 (preventivas y proteccion) 3673 (preventivas y proteccion)
3673 (preventivas y proteccion)
 
Resolución de ejercicios en programación
Resolución de ejercicios en programación Resolución de ejercicios en programación
Resolución de ejercicios en programación
 
Rt de syd
Rt de sydRt de syd
Rt de syd
 
Guide des activités 2013 2014 web
Guide des activités 2013 2014 webGuide des activités 2013 2014 web
Guide des activités 2013 2014 web
 
2011 04-13 leccionjuveniles
2011 04-13 leccionjuveniles2011 04-13 leccionjuveniles
2011 04-13 leccionjuveniles
 
Mi Presentacion
Mi PresentacionMi Presentacion
Mi Presentacion
 
Sustentación proyecto 4
Sustentación proyecto 4Sustentación proyecto 4
Sustentación proyecto 4
 
Rencontres des médiateurs 2013
Rencontres des médiateurs 2013Rencontres des médiateurs 2013
Rencontres des médiateurs 2013
 

Similaire à Sfsic14 140605-ibekwe-san juan-big science

Boissaye-Marine-M2MAG-mémoire
Boissaye-Marine-M2MAG-mémoireBoissaye-Marine-M2MAG-mémoire
Boissaye-Marine-M2MAG-mémoire
Marine Boissaye
 
Lere-de-lIA_Opportunites-et-defis_Fondation-IDEA-asbl_VD.pdf
Lere-de-lIA_Opportunites-et-defis_Fondation-IDEA-asbl_VD.pdfLere-de-lIA_Opportunites-et-defis_Fondation-IDEA-asbl_VD.pdf
Lere-de-lIA_Opportunites-et-defis_Fondation-IDEA-asbl_VD.pdf
Paperjam_redaction
 

Similaire à Sfsic14 140605-ibekwe-san juan-big science (20)

4. Algorithmes
4. Algorithmes4. Algorithmes
4. Algorithmes
 
Big data vs small data
Big data vs small dataBig data vs small data
Big data vs small data
 
Miettes de données - Keynote BDA 2015
Miettes de données - Keynote BDA 2015Miettes de données - Keynote BDA 2015
Miettes de données - Keynote BDA 2015
 
CGT-digital-week.pptx
CGT-digital-week.pptxCGT-digital-week.pptx
CGT-digital-week.pptx
 
Boissaye-Marine-M2MAG-mémoire
Boissaye-Marine-M2MAG-mémoireBoissaye-Marine-M2MAG-mémoire
Boissaye-Marine-M2MAG-mémoire
 
Gestion des donnees personnelles.
Gestion des donnees personnelles.Gestion des donnees personnelles.
Gestion des donnees personnelles.
 
6- Pratiques informationnelles et analyse des traces numériques : de la repré...
6- Pratiques informationnelles et analyse des traces numériques : de la repré...6- Pratiques informationnelles et analyse des traces numériques : de la repré...
6- Pratiques informationnelles et analyse des traces numériques : de la repré...
 
La création et partage de savoirs à l’ère du numérique. Réflexions épistémolo...
La création et partage de savoirs à l’ère du numérique. Réflexions épistémolo...La création et partage de savoirs à l’ère du numérique. Réflexions épistémolo...
La création et partage de savoirs à l’ère du numérique. Réflexions épistémolo...
 
Livre blanc - Open Data : Quels enjeux et opportunités pour l'entreprise ?
Livre blanc - Open Data : Quels enjeux et opportunités pour l'entreprise ?Livre blanc - Open Data : Quels enjeux et opportunités pour l'entreprise ?
Livre blanc - Open Data : Quels enjeux et opportunités pour l'entreprise ?
 
Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...
Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...
Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...
 
Open Data - Rencontre Bi-départementale des EPN 26-07
Open Data - Rencontre Bi-départementale des EPN 26-07Open Data - Rencontre Bi-départementale des EPN 26-07
Open Data - Rencontre Bi-départementale des EPN 26-07
 
Propos sur les Big Data.pdf
Propos sur les Big Data.pdfPropos sur les Big Data.pdf
Propos sur les Big Data.pdf
 
1340774899 cahier anr-4-intelligence-artificielle
1340774899 cahier anr-4-intelligence-artificielle1340774899 cahier anr-4-intelligence-artificielle
1340774899 cahier anr-4-intelligence-artificielle
 
Les Big Data, pistes de réflexions historiques, éthiques et épistémologiques ...
Les Big Data, pistes de réflexions historiques, éthiques et épistémologiques ...Les Big Data, pistes de réflexions historiques, éthiques et épistémologiques ...
Les Big Data, pistes de réflexions historiques, éthiques et épistémologiques ...
 
Lere-de-lIA_Opportunites-et-defis_Fondation-IDEA-asbl_VD.pdf
Lere-de-lIA_Opportunites-et-defis_Fondation-IDEA-asbl_VD.pdfLere-de-lIA_Opportunites-et-defis_Fondation-IDEA-asbl_VD.pdf
Lere-de-lIA_Opportunites-et-defis_Fondation-IDEA-asbl_VD.pdf
 
Thomas Renault Captain Economics - Preface livre blanc twitter conte par 50 ...
Thomas Renault Captain Economics -  Preface livre blanc twitter conte par 50 ...Thomas Renault Captain Economics -  Preface livre blanc twitter conte par 50 ...
Thomas Renault Captain Economics - Preface livre blanc twitter conte par 50 ...
 
La Netscouade presque en direct de SXSW 2014
La Netscouade presque en direct de SXSW 2014La Netscouade presque en direct de SXSW 2014
La Netscouade presque en direct de SXSW 2014
 
Livre blanc - Datavisualisation 10h11 - Mars 2015
Livre blanc - Datavisualisation 10h11 - Mars 2015Livre blanc - Datavisualisation 10h11 - Mars 2015
Livre blanc - Datavisualisation 10h11 - Mars 2015
 
Oeinria
OeinriaOeinria
Oeinria
 
Confidentialité des données michel béra
Confidentialité des données   michel béraConfidentialité des données   michel béra
Confidentialité des données michel béra
 

Plus de SFSIC Association

Revues francophones en sic - sfsic 2015
Revues francophones en sic -  sfsic 2015Revues francophones en sic -  sfsic 2015
Revues francophones en sic - sfsic 2015
SFSIC Association
 

Plus de SFSIC Association (20)

Lettre inforcom1 sfsic 1978
Lettre inforcom1   sfsic 1978Lettre inforcom1   sfsic 1978
Lettre inforcom1 sfsic 1978
 
Revues francophones en sic - sfsic 2015
Revues francophones en sic -  sfsic 2015Revues francophones en sic -  sfsic 2015
Revues francophones en sic - sfsic 2015
 
Sfsic14 140606-khezami
Sfsic14 140606-khezamiSfsic14 140606-khezami
Sfsic14 140606-khezami
 
Sfsic14 140605-bourret
Sfsic14 140605-bourretSfsic14 140605-bourret
Sfsic14 140605-bourret
 
Sfsic14 140605-desmoulins cansell
Sfsic14 140605-desmoulins cansellSfsic14 140605-desmoulins cansell
Sfsic14 140605-desmoulins cansell
 
Sfsic14 140605-kogan
Sfsic14 140605-koganSfsic14 140605-kogan
Sfsic14 140605-kogan
 
Sfscic2014 nathalie tingry
Sfscic2014  nathalie tingrySfscic2014  nathalie tingry
Sfscic2014 nathalie tingry
 
Sfsic14 140605-dou goarin
Sfsic14 140605-dou goarinSfsic14 140605-dou goarin
Sfsic14 140605-dou goarin
 
Sfsic14 140604 Chagnoux Desse
Sfsic14 140604 Chagnoux DesseSfsic14 140604 Chagnoux Desse
Sfsic14 140604 Chagnoux Desse
 
Sfsic14 140604-hanna
Sfsic14 140604-hannaSfsic14 140604-hanna
Sfsic14 140604-hanna
 
Sfsic14 140604-louessard cottier
Sfsic14 140604-louessard cottierSfsic14 140604-louessard cottier
Sfsic14 140604-louessard cottier
 
Sfsic14-140605-Lavaud
Sfsic14-140605-LavaudSfsic14-140605-Lavaud
Sfsic14-140605-Lavaud
 
Sfsic14 140604-chagnoux
Sfsic14 140604-chagnouxSfsic14 140604-chagnoux
Sfsic14 140604-chagnoux
 
Sfsic14 140604-louessard
Sfsic14 140604-louessardSfsic14 140604-louessard
Sfsic14 140604-louessard
 
Sfsic14 140604-hanna
Sfsic14 140604-hannaSfsic14 140604-hanna
Sfsic14 140604-hanna
 
Sfsic14 140604-galibert peirot-boutaud
Sfsic14 140604-galibert peirot-boutaudSfsic14 140604-galibert peirot-boutaud
Sfsic14 140604-galibert peirot-boutaud
 
Sfsic14 140604-cailleau
Sfsic14 140604-cailleauSfsic14 140604-cailleau
Sfsic14 140604-cailleau
 
Sfsic14 140604-hachour szoniecky
Sfsic14 140604-hachour szonieckySfsic14 140604-hachour szoniecky
Sfsic14 140604-hachour szoniecky
 
Sfsic14 040614-badillo
Sfsic14 040614-badilloSfsic14 040614-badillo
Sfsic14 040614-badillo
 
Sfsic14 140604-carbou
Sfsic14 140604-carbouSfsic14 140604-carbou
Sfsic14 140604-carbou
 

Dernier

Dernier (12)

Les débuts de la collection "Le livre de poche"
Les débuts de la collection "Le livre de poche"Les débuts de la collection "Le livre de poche"
Les débuts de la collection "Le livre de poche"
 
rapport de stage gros oeuvre_compressed.pdf
rapport de stage gros oeuvre_compressed.pdfrapport de stage gros oeuvre_compressed.pdf
rapport de stage gros oeuvre_compressed.pdf
 
Quitter la nuit. pptx
Quitter          la        nuit.    pptxQuitter          la        nuit.    pptx
Quitter la nuit. pptx
 
PowerPoint-de-Soutenance-de-TFE-infirmier.pdf
PowerPoint-de-Soutenance-de-TFE-infirmier.pdfPowerPoint-de-Soutenance-de-TFE-infirmier.pdf
PowerPoint-de-Soutenance-de-TFE-infirmier.pdf
 
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
 
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
 
Quitter la nuit. pptx
Quitter        la             nuit.   pptxQuitter        la             nuit.   pptx
Quitter la nuit. pptx
 
Webinaire Technologia | DAX : nouvelles fonctions
Webinaire Technologia | DAX : nouvelles fonctionsWebinaire Technologia | DAX : nouvelles fonctions
Webinaire Technologia | DAX : nouvelles fonctions
 
Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...
Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...
Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...
 
Traitement des eaux usées par lagunage a macrophytes.pptx
Traitement des eaux usées par lagunage a macrophytes.pptxTraitement des eaux usées par lagunage a macrophytes.pptx
Traitement des eaux usées par lagunage a macrophytes.pptx
 
Formation IAT pour sonelgaz chlef algérie.ppt
Formation IAT pour sonelgaz chlef algérie.pptFormation IAT pour sonelgaz chlef algérie.ppt
Formation IAT pour sonelgaz chlef algérie.ppt
 
Système National de Santé au- Maroc-(2017)."pdf"
Système National de Santé au- Maroc-(2017)."pdf"Système National de Santé au- Maroc-(2017)."pdf"
Système National de Santé au- Maroc-(2017)."pdf"
 

Sfsic14 140605-ibekwe-san juan-big science

  • 1. Big Data, Big machines, Big Science : vers une société sans sujet et sans causalité ? Fidelia Ibekwe-SanJuan
  • 3. Just how big is BIG??
  • 4. Just how big is BIG?? En 2011: 1,8 zetta-octets de données numériques disponibles
  • 5. Just how big is BIG??
  • 6. Just how big is BIG??
  • 7. Les 4 ‘V’ du Big Data http://www.datasciencecentral.com/profiles/blogs/data-veracity
  • 8. Bref retour terminologique Big Data Linked Data Open Data Vers BOLD (Big Open Linked Data)
  • 10. - Jim Gray, Microsoft Corporation, 2007 Big Data : 4ème paradigme scientifique ?
  • 11. - Jim Gray on eScience, The Fourth Paradigm, Microsoft Corporation, 2009
  • 12. La science du 21ème siècle n’est plus “science as usual”
  • 13.  e-Science  Architecture de grille informatique en réseau  Collaboration à l’échelle mondiale  Génération et traitement de données massives  Outils sophistiqués d’exploration des données « e-Science n’est pas une nouvelle discipline scientifique à proprement parler : e-Science est un raccourci pour désigner l’ensemble d’outils et de technologies nécessaires pour soutenir une science dans un environnement collaboratif et réseauté. L’infrastructure de e-Science a pour but de permettre aux scientifiques de faire leurs recherches, plus vite et mieux. » - Jessie Hey (2006)
  • 14. Accélérateur de particles : The Large Hadron Collider • Construit par 10 000 scientifiques • De plus de 100 pays • Questions les lois basiques qui gouvernent les interactions et les forces entre objets élémentaires ? la structure profonde du temps et de l’espace ? l’intersection de la mécanique quantique et la théorie de la relativité générale ? 150 millions de senseurs qui délivrent des données 40 million de fois per seconde. 150 millions de péta-octets de données par an ou 500 exa-octets par jour 500 quintillions (5×1020) octets par jour, soit près de 200 fois plus que toutes les sources de données combinées au monde - http://en.wikipedia.org/wiki/Big_data
  • 15. Astronomie Sloan Digital Sky Survey (SDSS) • Début 2000 • Données récoltées : 200 GB par nuit, soit 140 téra-octets depuis le début • Large Synoptic Survey Telescope (2016) devrait acquérir ce volume de données tous les 5 jours
  • 16. Astronomie Sloan Digital Sky Survey (SDSS) http://www.ascensionnow.co.uk/is-the-universe-a-fractal.html
  • 17. Le Big Data et Big Science dans les Humanités (SHS)
  • 18.   Défi : « Que feriez-vous avec un million de livres ou un million de pages de journaux ou de photographies ? » étant donné que vous ne pouvez pas les lire même si vous deviez y passer toute une vie ?   « investiguer comment des techniques informatiques peuvent être appliquées au “big data” afin de changer la nature des recherches en SHS » http://www.diggingintodata.org/
  • 19. 3. Les paradoxes du Big Data
  • 20. #1 L’industrialisation de la personnalisation Le Big Data permet de faire du très “small”
  • 21. Quand le rentre en politique
  • 22. Présidentielle américaine de 2012 vs Orca Narwhal "The real innovation in 2012 is that we had world-class technologists inside a campaign’’ - Reed (Obama chief Tech)
  • 23. Big Data permet de faire de la personnalisation extrême : “Les très grandes données vous permettent d’être très fin. Elles vous permettent de faire des interventions très précises et ciblées. (...) Vous voulez que votre équipe d’analyse des données soit capable de dire aux militants : “Appelez ces numéros, frappez sur ces portes, aller dans ces quartiers.” Le militant n’a pas besoin de savoir pourquoi; ils ont juste besoin de savoir qu’ils frappent sur les bonnes portes.” Alexis C. Madrigal, When the Nerds Go Marching In, The Atlantic, 16 nov. 2012. La présidentielle américaine 2012
  • 24. #2 L’ère de la “gouvernementalité algorithmique’’ Rouvroy et Thomas Berns (2013) Vers une gouvernance sans gouvernés
  • 25. "   Big Data or Big Brother?
  • 27. #3 Vers des savoirs immanents aux données, sans causalité et sans sujets connaissants ?
  • 28. « un nouveau rapport au savoir, qui donne “l’impression d’avoir abandonné un petit peu les ambitions de la rationalité moderne, qui visait à comprendre les phénomènes en les reliant à leur cause, au profit d’une rationalité post-moderne, qui est fondée sur une logique purement statistique, donc sur la découverte de corrélations entre des données recueillies dans des contextes extrêmement divers, hétérogènes les uns aux autres, et qui sont reliés entre eux par aucun lien de causalité (...) C’est l’abandon du « savoir causal, la dévaluation de l’expérience sensible elle-même au profit du calcul.» Rouvroy, Du rôle prédictif des données à la gouvernementalité algorithmique, 16/12/2010. http://www.internetactu.net/2010/12/16/du-role-predictif-des-donnees-a-la- gouvernementalite-algorithmique/
  • 29. « la donnée brute est un oxymore et une mauvaise idée. Au contraire, les données doivent être cuisinées avec beaucoup de soin» - Jeffrey Bowker (2005)  les données sont toujours insérées dans un contexte qu’il faut comprendre pour identifier les limites et les biais  des jeux de données sociales manquent de profondeur et de contexte
  • 30. #4 Vers des connaissances scientifiques infalsifiables ?
  • 32. Science du 21ème siècle: une science expérimentale et “ad- hoc”
  • 33. #5 La fin des théories scientifiques ? -  Problème de sur-ajustement important (over-fitting) -  L’exigence de la reproductibilité conduit à la simplification -  de réalités complexes et multidimensionnelles
  • 34. Mais c’est ignorer la dimension physique et sociale des savoirs scientifiques. « Je peux encoder une belle simulation sur mon écran dans laquelle il n’y a aucune théorie de la gravité, mais si je tente de conduire ma voiture au-delà du bord d’une falaise, l’empirisme va mordre mon derrière dans ma chute.’’ - John Wilbanks (2009)
  • 35. « Si l’idéal de l'apprentissage automatique est de réussir le test de Turing, c'est-à-dire qu’on n’arrive plus à faire la différence entre le comportement d’une machine et d’un humain, alors la science a perdu ». - Christophe Prieur (2014) Dominique Boullier, Christophe Prieur, Milad Doueihi, in Atelier Data science ? Colloque pour les 30 ans de la revue : Paris INHA 8 au 10 janvier 2014 http://revue-reseaux.univ-paris-est.fr/fr/actualites-colloque-pour-les-30-ans-de-la-revue-reseaux/ document-1775.html La science a besoin de théories !
  • 36. #6 Le mythe des algorithmes infallibles Illusions algorithmiques
  • 37.  Problème de BIAIS  Données collectées représentent-elles le phénomène mesuré ?  Ex. analyse des tweets durant l’ouragan Sandy (octobre 2012) sur la côte est américaine « Des biais cachés du Big Data » - Kate Crawford (2012)
  • 38.  Problème de SIGNAL  “La carte n’est pas le territoire” Alfred Korzybski (1956)  Même les cartes ne sont pas neutres, elles peuvent être partisanes ! « Des biais cachés du Big Data » - Kate Crawford
  • 39.  Problème d’ECHELLE - Vision panoramique d’un phénomène -  Il y a des illusions de perspective - Manque de profondeur “Travailler avec le big data, c’est voir le monde à 30 000m d’altitude.” « Des biais cachés du Big Data » - Kate Crawford
  • 40.  Problème d’ECHELLE « Des biais cachés du Big Data » - Kate Crawford Un vieux problème qui oppose sciences physiques et sciences sociales depuis le 19ème siècle - Gabriel Tarde, criminologiste.
  • 41.  Problème d’ECHELLE « Des biais cachés du Big Data » - Kate Crawford “C’est toujours la même erreur qui se fait jour : celle de croire que, pour voir peu à peu apparaître la régularité, l’ordre, la marche logique, dans les faits sociaux, il faut sortir de leur détail, essentiellement irrégulier, et s’élever très haut jusqu’à embrasser d’une vue panoramique de vastes ensembles » - Gabriel Tarde, Les lois sociales, 1898 »
  • 42.  Problème d’ECHELLE : en langage Latour… « Des biais cachés du Big Data » “To be a good sociologist one should refuse to go up, to take a larger view, to compile huge vistas! Look down, you sociologists. Be even more blind, even more narrow, even more down to earth, even more myopic » http://bruno-latour.fr/sites/default/files/82-TARDE-JOYCE-SOCIAL- GB.pdf (p. 9) »   Nécessité de demander le “pourquoi” ou le “comment” et non seulement le “combien”.
  • 43.  Le deuil de l’exhaustivité  Le deuil de la représentativité  Le deuil de l’objectivité « 3 Deuils du Big Data » - Dominique Bouiller (2014)
  • 44.  Attention au data fundamentalism  Attention au data mythology  Conjuguer Big Data et Small Data  Conjuguer la science du Big data et méthodes qualtiatives traditionnelles en sciences sociales  Tiny data can be cute! Des illusions algorithmiques - Kate Crawford
  • 45. « J’ai vu le 4ème paradigme, et c’est nous ! » - John Wilbanks (2009)
  • 46. Merci de votre attention !
  • 50. Citizen Science http://www.galaxyzoo.org/ We are trying something new! Come help us understand a very specific type of galaxy and experience science from start to end. Take part
  • 51. Citizen Science Universit of Cornel Lab of Ornithology - http://ebird.org/content/ebird/
  • 52. Citizen Science www.tela-botanica.org Créer et diffuser des biens communs au service de la connaissance et de la protection de l’environnement
  • 53. Crowdsourcing culturel Flickr Commons : espace de co-construction d’artefacts culturels numériques entre musées, bibliothèques & archives et le public