SlideShare une entreprise Scribd logo
One Index To Rule Them All
De Paul Otlet à l’internet des objets.
Ertzscheid Olivier. www.Affordance.info. Université de Nantes. Novembre 2017.
1
Préambule.
Le web a à peine plus de 25 ans.
• Aucun média n’a jamais permis de toucher autant de monde en
même temps, aussi régulièrement. Aucun média n’a jamais connu
autant de changements structurels en si peu de temps
• En moins de 25 ans le web a changé 3 fois de nature et d’objet.
• Il a changé (au moins) 3 fois d’index. 2
Le web est AVANT TOUT une histoire d’index.
A nous de faire en sorte qu’il ne devienne pas, APRÈS TOUT, une forme de mise à l’index.
• LES INDEX INCONNUS.
– Index des objets => ? … ?
– Index du génome => ? … ?
– Index des … émotions ? (web / informatique affective)
• LES INDEX CONNUS.
– Index des produits => Amazon (1994)
– Index des adresses (URL) => Yahoo! (1995)
– Index des documents => Google (1998)
– Index des profils => Facebook (2004)
3
One ring Index To Rule Them All
• Des index sur les informations et les connaissances que NOUS avons
produites. Des index bâtis sur des algorithmes que NOUS avons entraînés.
A l’aide de données que NOUS leur avons confiées. #DigitalLabor
• Ce sont les commerçants qui ont construit l’index d’Amazon :
– Index des produits => Amazon (1994)
• Ce sont les internautes qui ont construit l’index de Google et « formé »
son algorithme
– Index des documents => Google (1998)
• Ce sont les internautes qui ont fait Facebook (données servitude
volontaire)
– Index des profils => Facebook (2004)
4
On a donc plusieurs « problèmes paradoxaux ».
« Si c’est gratuit c’est vous le produit »
Si vous ne trouvez pas la solution c’est parce que c’est souvent vous le problème.
• Problème 1 : Des GAFAM / NATU / BATX que tout le monde commence à raison à trouver
effrayants et qui ne cachent pas leur ambition de réguler l’ensemble de la sphère commerciale
mais aussi publique, régalienne, politique.
• Problème 2 : Des données / pages / profils / contenus publics (ou qui pourraient rapidement le
redevenir) mais qui sont captés et - paradoxalement - rendus publics uniquement par des services
/ acteurs privés
• Problème 3 : Ces acteurs, autour de leurs index, ont fini par « propriétariser » des ressources et
des individus qui avaient vocation à rester en dehors de toute appropriation, de toute
« enclosure ». Et ils ont organisé leur mise en concurrence et des formes inédites de spéculation
(sur la langue et le vocabulaire => cf F. Kaplan et le capitalisme linguistique)
• Effet paradoxal : ces acteurs privés n’essaient même plus de garder leurs algos secrets et les
mettent en Open Source (la chaîne de valeur s’étant déplacée des algorithmes aux données*) mais
les acteurs publics ou associatifs n’arrivent pas à « passer à l’échelle ».
Résultat =>
5
* http://affordance.typepad.com//mon_weblog/2016/05/nationaliser-code-republique-algorithmique.html)
Ceux qui veulent / peuvent changer la donne ont un très gros problème de
Scalabilité / Montée en charge / Passage à l’échelle.
6
Scalabilité / Montée en charge / Passage à l’échelle.
7
ALGORITHMIQUES
Prévisibilité
Transparence
Robustesse
Bostrom et Yudowsky, 2011, « The Ethics of Artificial Intelligence » : « Les algorithmes de plus en plus complexes de prise de décision sont à la
fois souhaitables et inévitables, tant qu'ils restent transparents à l'inspection, prévisibles pour ceux qu'ils gouvernent, et robustes contre toute
manipulation. »
No-Go Zones Algorithmiques
8
On fait
quoi ?
9
On réinvente
le rêve d’Otlet
10
Réinventer le rêve d’Otlet
• Il était : « l’homme qui voulait classer le monde ».
– Nous avons des sociétés commerciales qui y sont parvenues ; mais sur les bases d’un capitalisme linguistique
dont la version triviale consiste à dire que la langue, que les mots ont une valeur marchande qui l’emporte sur
leur sens et a pour seule vocation de permettre la mise en concurrence de ressources et d’individus et à s’enrichir
de la spéculation qu’ils organisent et contrôlent.
• Il pensait que le document, que la documentation avait un rôle déterminant à jouer dans la
pacification du monde.
– Nous avons des sociétés qui dessinent le projet politique fasciste de nouveaux « sous-hommes » sans documents
(http://affordance.typepad.com/mon_weblog/2017/02/undocumented-men.html) face à de nouveaux « sur-
hommes » sur-documentés.
11
Source de l’image : http://globalnation.inquirer.net/119385/undocumented-california-youth-can-get-health-care-but-many-dont-know-it
On fait
comment ?
12
On crée un index
in-dé-pen-dant.
• C’est quoi l’idée ? Recréer les conditions d’une concurrence algorithmique saine.
• Pas de concurrence car impossible (trop coûteux) pour « petits acteurs industriels » de maintenir un index complet et à
jour du web (sauf pour Google et Microsoft) => Monopole => TINA (There Is No Alternative) => En attendant Godot un
Google Killer qui ne viendra pas.
• Pour recréer les conditions d’une concurrence il faut, pour le web, un index indépendant, qui réponde à 3 conditions :
– être ouvert et accessible à tout le monde.
– à des conditions équitables (= Accès à l’index gratuit + accès payant à l’API sauf pour projets « non-profit »).
– l’accès doit être « complet » (on doit accéder au texte intégral, pas simplement à une « vue » du document). Il ne
doit pas y avoir de « limites » à l’extraction de documents.
• Lewandowski : « an ideology free-ranking algorithm is not possible and would also not be desirable. (…) We should
trive for diversity achieved through multiple ranking algorithms competing against one another. »
13
« Why we need an independant index of the web »
https://arxiv.org/abs/1405.2212 Mai 2014.
Pourquoi ce n’est pas si compliqué que ça ?
(et pourquoi c’est urgent aussi …)
• TECHNIQUEMENT
• Parce que toutes technos du web sont dans le domaine public depuis le 30 Avril 1993.
• Parce qu’en plus la plupart des algos et des technos d’IA portées par les GAFAM sont aussi en Open
Source.
• CÔTÉ CONTENUS
• Parce que plusieurs pièces du puzzle n’attendent que d’être rassemblées : Hathi Trust (copie
suffisamment significative de la base de donnée Google Books), fondation Internet Archive, Common
Crawl, Dépôt légal du Web, Gallica / BnF, INA, Archives Ouvertes, WorldCat … + ressources propres (des
archives et des bases de données de chaque titre de presse nationale, de PQR, de chaque bibliothèque,
de chaque université, de chaque entreprise, etc).
• SOCIOLOGIQUEMENT ET POLITIQUEMENT
• Parce que les gens sont (presque) prêts. Ils ont en tout cas conscience du problème.
• COMMERCIALEMENT
• Parce qu’une offre alternative existe (Qwant, CHATONS, Framasoft, Degooglisons, DuckDuckGo) et a
besoin de passer à l’échelle
• OUI MAIS ÇA VA COÛTER CHER …
• Oui. Mais on a l’argent. Et ça vaut le coup non ?
• Et puis …
14
15
Paul Otlet n’est pas vraiment arrivé à réaliser son rêve
mais il nous a laissé ça :
• « Les buts de la documentation consistent à
pouvoir offrir sur tout ordre de fait et de
connaissance, des informations documentées :
1. universelles quant à leur objet
2. sûres et vraies
3. complètes,
4. rapides,
5. à jour
6. faciles à obtenir
7. réunies d’avance et prêtes à être communiquées,
8. mises à la disposition du plus grand nombre ».
16
Si nous n’arrivons pas à réaliser le rêve d’Otlet
• Nous aurons des informations uniquement
1. universelles quant à leur objet
2. sûres et vraies
3. complètes,
4. rapides,
5. à jour
6. faciles à obtenir
7. réunies d’avance et prêtes à être communiquées,
8. mises à la disposition du plus grand nombre
• Nous aurons donc raté l’essentiel.
17
Et c’est déjà très problématique.
18• https://www.theguardian.com/commentisfree/2016/dec/11/google-frames-shapes-and-distorts-how-we-see-world
On est passé du problème du jaguar (comment choisir un sens plutôt qu’un
autre) au problème de l’holocauste (comment savoir ce qui a du sens).
Les algorithmes n’y arriveront pas seuls. Et il ne faut pas laisser ces enjeux aux
seules mains des GAFA.
Il nous faut un index indépendant du web. Envisagé comme un commun de la
connaissance à part entière.
Index des documents Index des profils Index indépendant ;-)
19Merci de votre attention
Moralité ?

Contenu connexe

Tendances

Podcast cult-num-1-2-3
Podcast cult-num-1-2-3Podcast cult-num-1-2-3
Podcast cult-num-1-2-3
olivier
 
Digital Intelligence : pour une éthique algorithmique ?
Digital Intelligence : pour une éthique algorithmique ?Digital Intelligence : pour une éthique algorithmique ?
Digital Intelligence : pour une éthique algorithmique ?
olivier
 
Monde selon Zuckerberg
Monde selon ZuckerbergMonde selon Zuckerberg
Monde selon Zuckerberg
olivier
 
memoire-ina-atelier-depotlegal-web
memoire-ina-atelier-depotlegal-webmemoire-ina-atelier-depotlegal-web
memoire-ina-atelier-depotlegal-web
olivier
 
Abf clermont-oe
Abf clermont-oeAbf clermont-oe
Abf clermont-oe
olivier
 
Objets-connectes
Objets-connectesObjets-connectes
Objets-connectes
olivier
 
Fadben ertzscheid-olivier
Fadben ertzscheid-olivierFadben ertzscheid-olivier
Fadben ertzscheid-olivier
olivier
 
Forum medias-ertzscheid
Forum medias-ertzscheidForum medias-ertzscheid
Forum medias-ertzscheid
olivier
 
Editorialisation
EditorialisationEditorialisation
Editorialisation
olivier
 
Fif 85-ertzscheid
Fif 85-ertzscheidFif 85-ertzscheid
Fif 85-ertzscheid
olivier
 
Montaigu web-ouvert-def
Montaigu web-ouvert-defMontaigu web-ouvert-def
Montaigu web-ouvert-def
olivier
 
Attac-appetit-geants
Attac-appetit-geantsAttac-appetit-geants
Attac-appetit-geants
olivier
 
Ertzscheid Ehess
Ertzscheid EhessErtzscheid Ehess
Ertzscheid Ehess
olivier
 
Profil ertzscheid - copie
Profil ertzscheid - copieProfil ertzscheid - copie
Profil ertzscheid - copie
olivier
 
Reseaux sociaux-et-entreprise-def-oe
Reseaux sociaux-et-entreprise-def-oeReseaux sociaux-et-entreprise-def-oe
Reseaux sociaux-et-entreprise-def-oe
olivier
 
appetit-geants-ertzscheid
appetit-geants-ertzscheidappetit-geants-ertzscheid
appetit-geants-ertzscheid
olivier
 
Wikipédia : former ou interdire ?
Wikipédia : former ou interdire ?Wikipédia : former ou interdire ?
Wikipédia : former ou interdire ?
olivier
 
Les bibliotheques numeriques
Les bibliotheques numeriquesLes bibliotheques numeriques
Les bibliotheques numeriques
olivier
 
Gestion des donnees personnelles.
Gestion des donnees personnelles.Gestion des donnees personnelles.
Gestion des donnees personnelles.
olivier
 
FakeNews
FakeNewsFakeNews
FakeNews
olivier
 

Tendances (20)

Podcast cult-num-1-2-3
Podcast cult-num-1-2-3Podcast cult-num-1-2-3
Podcast cult-num-1-2-3
 
Digital Intelligence : pour une éthique algorithmique ?
Digital Intelligence : pour une éthique algorithmique ?Digital Intelligence : pour une éthique algorithmique ?
Digital Intelligence : pour une éthique algorithmique ?
 
Monde selon Zuckerberg
Monde selon ZuckerbergMonde selon Zuckerberg
Monde selon Zuckerberg
 
memoire-ina-atelier-depotlegal-web
memoire-ina-atelier-depotlegal-webmemoire-ina-atelier-depotlegal-web
memoire-ina-atelier-depotlegal-web
 
Abf clermont-oe
Abf clermont-oeAbf clermont-oe
Abf clermont-oe
 
Objets-connectes
Objets-connectesObjets-connectes
Objets-connectes
 
Fadben ertzscheid-olivier
Fadben ertzscheid-olivierFadben ertzscheid-olivier
Fadben ertzscheid-olivier
 
Forum medias-ertzscheid
Forum medias-ertzscheidForum medias-ertzscheid
Forum medias-ertzscheid
 
Editorialisation
EditorialisationEditorialisation
Editorialisation
 
Fif 85-ertzscheid
Fif 85-ertzscheidFif 85-ertzscheid
Fif 85-ertzscheid
 
Montaigu web-ouvert-def
Montaigu web-ouvert-defMontaigu web-ouvert-def
Montaigu web-ouvert-def
 
Attac-appetit-geants
Attac-appetit-geantsAttac-appetit-geants
Attac-appetit-geants
 
Ertzscheid Ehess
Ertzscheid EhessErtzscheid Ehess
Ertzscheid Ehess
 
Profil ertzscheid - copie
Profil ertzscheid - copieProfil ertzscheid - copie
Profil ertzscheid - copie
 
Reseaux sociaux-et-entreprise-def-oe
Reseaux sociaux-et-entreprise-def-oeReseaux sociaux-et-entreprise-def-oe
Reseaux sociaux-et-entreprise-def-oe
 
appetit-geants-ertzscheid
appetit-geants-ertzscheidappetit-geants-ertzscheid
appetit-geants-ertzscheid
 
Wikipédia : former ou interdire ?
Wikipédia : former ou interdire ?Wikipédia : former ou interdire ?
Wikipédia : former ou interdire ?
 
Les bibliotheques numeriques
Les bibliotheques numeriquesLes bibliotheques numeriques
Les bibliotheques numeriques
 
Gestion des donnees personnelles.
Gestion des donnees personnelles.Gestion des donnees personnelles.
Gestion des donnees personnelles.
 
FakeNews
FakeNewsFakeNews
FakeNews
 

En vedette

Identite numerique
Identite numeriqueIdentite numerique
Identite numerique
olivier
 
Indexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masseIndexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masseolivier
 
Identité numérique et e réputation
Identité numérique et e réputationIdentité numérique et e réputation
Identité numérique et e réputation
Université de Nantes - IUT La Roche/Yon
 
Internet et réseaux sociaux : mode d'emploi
Internet et réseaux sociaux : mode d'emploiInternet et réseaux sociaux : mode d'emploi
Internet et réseaux sociaux : mode d'emploi
olivier
 
blogs-scientifiques
blogs-scientifiquesblogs-scientifiques
blogs-scientifiques
olivier
 
l'avenir des collections : la bibliothèque comme mème
l'avenir des collections : la bibliothèque comme mèmel'avenir des collections : la bibliothèque comme mème
l'avenir des collections : la bibliothèque comme mème
olivier
 
identitenumeriqueacademique
identitenumeriqueacademiqueidentitenumeriqueacademique
identitenumeriqueacademique
olivier
 
Elpenor
ElpenorElpenor
Elpenor
olivier
 
Histoire et réforme de l’orthographe
Histoire et réforme de l’orthographeHistoire et réforme de l’orthographe
Histoire et réforme de l’orthographe
olivier
 
Rennes-archive-ertzscheid
Rennes-archive-ertzscheidRennes-archive-ertzscheid
Rennes-archive-ertzscheid
olivier
 
Editorialisation algorithmique
Editorialisation algorithmiqueEditorialisation algorithmique
Editorialisation algorithmique
olivier
 
Pecha kucha-ertzscheid
Pecha kucha-ertzscheidPecha kucha-ertzscheid
Pecha kucha-ertzscheidolivier
 
Digital Detox
Digital DetoxDigital Detox
Digital Detox
olivier
 
Identite-numerique-reseaux-sociaux
Identite-numerique-reseaux-sociauxIdentite-numerique-reseaux-sociaux
Identite-numerique-reseaux-sociaux
olivier
 
Veille rennes-def-oe
Veille rennes-def-oeVeille rennes-def-oe
Veille rennes-def-oe
olivier
 
La médiation à l'heure du numérique
La médiation à l'heure du numériqueLa médiation à l'heure du numérique
La médiation à l'heure du numérique
olivier
 
Jounee numerique
Jounee numeriqueJounee numerique
Jounee numerique
olivier
 

En vedette (17)

Identite numerique
Identite numeriqueIdentite numerique
Identite numerique
 
Indexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masseIndexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masse
 
Identité numérique et e réputation
Identité numérique et e réputationIdentité numérique et e réputation
Identité numérique et e réputation
 
Internet et réseaux sociaux : mode d'emploi
Internet et réseaux sociaux : mode d'emploiInternet et réseaux sociaux : mode d'emploi
Internet et réseaux sociaux : mode d'emploi
 
blogs-scientifiques
blogs-scientifiquesblogs-scientifiques
blogs-scientifiques
 
l'avenir des collections : la bibliothèque comme mème
l'avenir des collections : la bibliothèque comme mèmel'avenir des collections : la bibliothèque comme mème
l'avenir des collections : la bibliothèque comme mème
 
identitenumeriqueacademique
identitenumeriqueacademiqueidentitenumeriqueacademique
identitenumeriqueacademique
 
Elpenor
ElpenorElpenor
Elpenor
 
Histoire et réforme de l’orthographe
Histoire et réforme de l’orthographeHistoire et réforme de l’orthographe
Histoire et réforme de l’orthographe
 
Rennes-archive-ertzscheid
Rennes-archive-ertzscheidRennes-archive-ertzscheid
Rennes-archive-ertzscheid
 
Editorialisation algorithmique
Editorialisation algorithmiqueEditorialisation algorithmique
Editorialisation algorithmique
 
Pecha kucha-ertzscheid
Pecha kucha-ertzscheidPecha kucha-ertzscheid
Pecha kucha-ertzscheid
 
Digital Detox
Digital DetoxDigital Detox
Digital Detox
 
Identite-numerique-reseaux-sociaux
Identite-numerique-reseaux-sociauxIdentite-numerique-reseaux-sociaux
Identite-numerique-reseaux-sociaux
 
Veille rennes-def-oe
Veille rennes-def-oeVeille rennes-def-oe
Veille rennes-def-oe
 
La médiation à l'heure du numérique
La médiation à l'heure du numériqueLa médiation à l'heure du numérique
La médiation à l'heure du numérique
 
Jounee numerique
Jounee numeriqueJounee numerique
Jounee numerique
 

Similaire à Index independant du web ertzscheid

Urfist bordeaux-moteurs
Urfist bordeaux-moteursUrfist bordeaux-moteurs
Urfist bordeaux-moteurs
olivier
 
Oeinria
OeinriaOeinria
Oeinria
olivier
 
CGT-digital-week.pptx
CGT-digital-week.pptxCGT-digital-week.pptx
CGT-digital-week.pptx
olivier
 
Accés et production d'information (by Fil Numérique Roanne)
Accés et production d'information (by Fil Numérique Roanne)Accés et production d'information (by Fil Numérique Roanne)
Accés et production d'information (by Fil Numérique Roanne)
Coraia
 
Movilab en 2020
Movilab en 2020Movilab en 2020
Movilab en 2020
Yoann Duriaux
 
Logiciels libres - Concepts et intérêts pour les chercheurs
Logiciels libres - Concepts et intérêts pour les chercheursLogiciels libres - Concepts et intérêts pour les chercheurs
Logiciels libres - Concepts et intérêts pour les chercheurspyg
 
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"Charles Ruelle
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
Philippe METAYER
 
Coex12 - Je l'ai trouvé sur internet
Coex12 - Je l'ai trouvé sur internetCoex12 - Je l'ai trouvé sur internet
Coex12 - Je l'ai trouvé sur internet
Guillaume-Nicolas Meyer
 
Open data, biens communs et bibliothèques : perspectives et prospective
Open data, biens communs et bibliothèques : perspectives et prospectiveOpen data, biens communs et bibliothèques : perspectives et prospective
Open data, biens communs et bibliothèques : perspectives et prospective
Silvère Mercier
 
Le renseignement humain augmenté
Le renseignement humain augmentéLe renseignement humain augmenté
Le renseignement humain augmenté
Terry ZIMMER
 
Le_libre_conference_iutnc_oct_2014
Le_libre_conference_iutnc_oct_2014Le_libre_conference_iutnc_oct_2014
Le_libre_conference_iutnc_oct_2014
EricVion
 
Formation documentation movilab
Formation documentation movilabFormation documentation movilab
Formation documentation movilab
Yoann Duriaux
 
Atelier juriconnexion 2009
Atelier juriconnexion 2009Atelier juriconnexion 2009
Atelier juriconnexion 2009
Geemik
 
Plateformes collaboratives et sociales d'entreprise
Plateformes collaboratives et sociales d'entreprisePlateformes collaboratives et sociales d'entreprise
Plateformes collaboratives et sociales d'entreprise
Cecil Dijoux
 
Design, données personnelles et vie privée
Design, données personnelles et vie privéeDesign, données personnelles et vie privée
Design, données personnelles et vie privée
Sylvia Fredriksson
 
Fork les gouvernements
Fork les gouvernementsFork les gouvernements
Fork les gouvernements
Audrey Tang
 
Ibrain
IbrainIbrain

Similaire à Index independant du web ertzscheid (20)

Urfist bordeaux-moteurs
Urfist bordeaux-moteursUrfist bordeaux-moteurs
Urfist bordeaux-moteurs
 
Oeinria
OeinriaOeinria
Oeinria
 
CGT-digital-week.pptx
CGT-digital-week.pptxCGT-digital-week.pptx
CGT-digital-week.pptx
 
Accés et production d'information (by Fil Numérique Roanne)
Accés et production d'information (by Fil Numérique Roanne)Accés et production d'information (by Fil Numérique Roanne)
Accés et production d'information (by Fil Numérique Roanne)
 
Movilab en 2020
Movilab en 2020Movilab en 2020
Movilab en 2020
 
Logiciels libres - Concepts et intérêts pour les chercheurs
Logiciels libres - Concepts et intérêts pour les chercheursLogiciels libres - Concepts et intérêts pour les chercheurs
Logiciels libres - Concepts et intérêts pour les chercheurs
 
9 louis montagne af83
9 louis montagne af839 louis montagne af83
9 louis montagne af83
 
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
 
Coex12 - Je l'ai trouvé sur internet
Coex12 - Je l'ai trouvé sur internetCoex12 - Je l'ai trouvé sur internet
Coex12 - Je l'ai trouvé sur internet
 
Open data, biens communs et bibliothèques : perspectives et prospective
Open data, biens communs et bibliothèques : perspectives et prospectiveOpen data, biens communs et bibliothèques : perspectives et prospective
Open data, biens communs et bibliothèques : perspectives et prospective
 
Conference efb 190112
Conference efb 190112Conference efb 190112
Conference efb 190112
 
Le renseignement humain augmenté
Le renseignement humain augmentéLe renseignement humain augmenté
Le renseignement humain augmenté
 
Le_libre_conference_iutnc_oct_2014
Le_libre_conference_iutnc_oct_2014Le_libre_conference_iutnc_oct_2014
Le_libre_conference_iutnc_oct_2014
 
Formation documentation movilab
Formation documentation movilabFormation documentation movilab
Formation documentation movilab
 
Atelier juriconnexion 2009
Atelier juriconnexion 2009Atelier juriconnexion 2009
Atelier juriconnexion 2009
 
Plateformes collaboratives et sociales d'entreprise
Plateformes collaboratives et sociales d'entreprisePlateformes collaboratives et sociales d'entreprise
Plateformes collaboratives et sociales d'entreprise
 
Design, données personnelles et vie privée
Design, données personnelles et vie privéeDesign, données personnelles et vie privée
Design, données personnelles et vie privée
 
Fork les gouvernements
Fork les gouvernementsFork les gouvernements
Fork les gouvernements
 
Ibrain
IbrainIbrain
Ibrain
 

Plus de olivier

IA bien qui IA le dernier. Les effets sociétaux des IA génératives.
IA bien qui IA le dernier. Les effets sociétaux des IA génératives.IA bien qui IA le dernier. Les effets sociétaux des IA génératives.
IA bien qui IA le dernier. Les effets sociétaux des IA génératives.
olivier
 
programme-iut-collectif.pdf
programme-iut-collectif.pdfprogramme-iut-collectif.pdf
programme-iut-collectif.pdf
olivier
 
libre-educatif-olivier-ertzscheid.pptx
libre-educatif-olivier-ertzscheid.pptxlibre-educatif-olivier-ertzscheid.pptx
libre-educatif-olivier-ertzscheid.pptx
olivier
 
Bruire-2
Bruire-2Bruire-2
Bruire-2
olivier
 
communiquer-reseaux-sociaux.pptx
communiquer-reseaux-sociaux.pptxcommuniquer-reseaux-sociaux.pptx
communiquer-reseaux-sociaux.pptx
olivier
 
Le web a la carte
Le web a la carteLe web a la carte
Le web a la carte
olivier
 
education-reseaux-sociaux
education-reseaux-sociauxeducation-reseaux-sociaux
education-reseaux-sociaux
olivier
 
Revue Bruire
Revue BruireRevue Bruire
Revue Bruire
olivier
 
Fenetre sur-cours
Fenetre sur-coursFenetre sur-cours
Fenetre sur-cours
olivier
 
Le Monde selon Zuckerberg selon ses lecteur.trices
Le Monde selon Zuckerberg selon ses lecteur.tricesLe Monde selon Zuckerberg selon ses lecteur.trices
Le Monde selon Zuckerberg selon ses lecteur.trices
olivier
 
Google Books Milestones
Google Books MilestonesGoogle Books Milestones
Google Books Milestones
olivier
 
Communication-reseaux-sociaux
Communication-reseaux-sociauxCommunication-reseaux-sociaux
Communication-reseaux-sociaux
olivier
 
Obsolescence-programmee
Obsolescence-programmeeObsolescence-programmee
Obsolescence-programmee
olivier
 
Presidentielle-google-suggest
Presidentielle-google-suggestPresidentielle-google-suggest
Presidentielle-google-suggest
olivier
 
Lutter contre la haine
Lutter contre la haineLutter contre la haine
Lutter contre la haine
olivier
 
Gazette 5 - Samedi et Dimanche. Festival international du film 2016
Gazette 5 - Samedi et Dimanche. Festival international du film 2016Gazette 5 - Samedi et Dimanche. Festival international du film 2016
Gazette 5 - Samedi et Dimanche. Festival international du film 2016
olivier
 

Plus de olivier (16)

IA bien qui IA le dernier. Les effets sociétaux des IA génératives.
IA bien qui IA le dernier. Les effets sociétaux des IA génératives.IA bien qui IA le dernier. Les effets sociétaux des IA génératives.
IA bien qui IA le dernier. Les effets sociétaux des IA génératives.
 
programme-iut-collectif.pdf
programme-iut-collectif.pdfprogramme-iut-collectif.pdf
programme-iut-collectif.pdf
 
libre-educatif-olivier-ertzscheid.pptx
libre-educatif-olivier-ertzscheid.pptxlibre-educatif-olivier-ertzscheid.pptx
libre-educatif-olivier-ertzscheid.pptx
 
Bruire-2
Bruire-2Bruire-2
Bruire-2
 
communiquer-reseaux-sociaux.pptx
communiquer-reseaux-sociaux.pptxcommuniquer-reseaux-sociaux.pptx
communiquer-reseaux-sociaux.pptx
 
Le web a la carte
Le web a la carteLe web a la carte
Le web a la carte
 
education-reseaux-sociaux
education-reseaux-sociauxeducation-reseaux-sociaux
education-reseaux-sociaux
 
Revue Bruire
Revue BruireRevue Bruire
Revue Bruire
 
Fenetre sur-cours
Fenetre sur-coursFenetre sur-cours
Fenetre sur-cours
 
Le Monde selon Zuckerberg selon ses lecteur.trices
Le Monde selon Zuckerberg selon ses lecteur.tricesLe Monde selon Zuckerberg selon ses lecteur.trices
Le Monde selon Zuckerberg selon ses lecteur.trices
 
Google Books Milestones
Google Books MilestonesGoogle Books Milestones
Google Books Milestones
 
Communication-reseaux-sociaux
Communication-reseaux-sociauxCommunication-reseaux-sociaux
Communication-reseaux-sociaux
 
Obsolescence-programmee
Obsolescence-programmeeObsolescence-programmee
Obsolescence-programmee
 
Presidentielle-google-suggest
Presidentielle-google-suggestPresidentielle-google-suggest
Presidentielle-google-suggest
 
Lutter contre la haine
Lutter contre la haineLutter contre la haine
Lutter contre la haine
 
Gazette 5 - Samedi et Dimanche. Festival international du film 2016
Gazette 5 - Samedi et Dimanche. Festival international du film 2016Gazette 5 - Samedi et Dimanche. Festival international du film 2016
Gazette 5 - Samedi et Dimanche. Festival international du film 2016
 

Dernier

Veille Audocdi 90 - mois de juin 2024.pdf
Veille Audocdi 90 - mois de juin 2024.pdfVeille Audocdi 90 - mois de juin 2024.pdf
Veille Audocdi 90 - mois de juin 2024.pdf
frizzole
 
Bibliothèque de L'Union - Bilan de l'année 2023
Bibliothèque de L'Union - Bilan de l'année 2023Bibliothèque de L'Union - Bilan de l'année 2023
Bibliothèque de L'Union - Bilan de l'année 2023
Bibliothèque de L'Union
 
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
M2i Formation
 
Textes de famille concernant les guerres V2.pdf
Textes de famille concernant les guerres V2.pdfTextes de famille concernant les guerres V2.pdf
Textes de famille concernant les guerres V2.pdf
Michel Bruley
 
Iris van Herpen. pptx
Iris         van        Herpen.      pptxIris         van        Herpen.      pptx
Iris van Herpen. pptx
Txaruka
 
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
BenotGeorges3
 
Iris van Herpen. pptx
Iris         van         Herpen.      pptxIris         van         Herpen.      pptx
Iris van Herpen. pptx
Txaruka
 

Dernier (7)

Veille Audocdi 90 - mois de juin 2024.pdf
Veille Audocdi 90 - mois de juin 2024.pdfVeille Audocdi 90 - mois de juin 2024.pdf
Veille Audocdi 90 - mois de juin 2024.pdf
 
Bibliothèque de L'Union - Bilan de l'année 2023
Bibliothèque de L'Union - Bilan de l'année 2023Bibliothèque de L'Union - Bilan de l'année 2023
Bibliothèque de L'Union - Bilan de l'année 2023
 
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
 
Textes de famille concernant les guerres V2.pdf
Textes de famille concernant les guerres V2.pdfTextes de famille concernant les guerres V2.pdf
Textes de famille concernant les guerres V2.pdf
 
Iris van Herpen. pptx
Iris         van        Herpen.      pptxIris         van        Herpen.      pptx
Iris van Herpen. pptx
 
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
 
Iris van Herpen. pptx
Iris         van         Herpen.      pptxIris         van         Herpen.      pptx
Iris van Herpen. pptx
 

Index independant du web ertzscheid

  • 1. One Index To Rule Them All De Paul Otlet à l’internet des objets. Ertzscheid Olivier. www.Affordance.info. Université de Nantes. Novembre 2017. 1
  • 2. Préambule. Le web a à peine plus de 25 ans. • Aucun média n’a jamais permis de toucher autant de monde en même temps, aussi régulièrement. Aucun média n’a jamais connu autant de changements structurels en si peu de temps • En moins de 25 ans le web a changé 3 fois de nature et d’objet. • Il a changé (au moins) 3 fois d’index. 2
  • 3. Le web est AVANT TOUT une histoire d’index. A nous de faire en sorte qu’il ne devienne pas, APRÈS TOUT, une forme de mise à l’index. • LES INDEX INCONNUS. – Index des objets => ? … ? – Index du génome => ? … ? – Index des … émotions ? (web / informatique affective) • LES INDEX CONNUS. – Index des produits => Amazon (1994) – Index des adresses (URL) => Yahoo! (1995) – Index des documents => Google (1998) – Index des profils => Facebook (2004) 3
  • 4. One ring Index To Rule Them All • Des index sur les informations et les connaissances que NOUS avons produites. Des index bâtis sur des algorithmes que NOUS avons entraînés. A l’aide de données que NOUS leur avons confiées. #DigitalLabor • Ce sont les commerçants qui ont construit l’index d’Amazon : – Index des produits => Amazon (1994) • Ce sont les internautes qui ont construit l’index de Google et « formé » son algorithme – Index des documents => Google (1998) • Ce sont les internautes qui ont fait Facebook (données servitude volontaire) – Index des profils => Facebook (2004) 4
  • 5. On a donc plusieurs « problèmes paradoxaux ». « Si c’est gratuit c’est vous le produit » Si vous ne trouvez pas la solution c’est parce que c’est souvent vous le problème. • Problème 1 : Des GAFAM / NATU / BATX que tout le monde commence à raison à trouver effrayants et qui ne cachent pas leur ambition de réguler l’ensemble de la sphère commerciale mais aussi publique, régalienne, politique. • Problème 2 : Des données / pages / profils / contenus publics (ou qui pourraient rapidement le redevenir) mais qui sont captés et - paradoxalement - rendus publics uniquement par des services / acteurs privés • Problème 3 : Ces acteurs, autour de leurs index, ont fini par « propriétariser » des ressources et des individus qui avaient vocation à rester en dehors de toute appropriation, de toute « enclosure ». Et ils ont organisé leur mise en concurrence et des formes inédites de spéculation (sur la langue et le vocabulaire => cf F. Kaplan et le capitalisme linguistique) • Effet paradoxal : ces acteurs privés n’essaient même plus de garder leurs algos secrets et les mettent en Open Source (la chaîne de valeur s’étant déplacée des algorithmes aux données*) mais les acteurs publics ou associatifs n’arrivent pas à « passer à l’échelle ». Résultat => 5 * http://affordance.typepad.com//mon_weblog/2016/05/nationaliser-code-republique-algorithmique.html)
  • 6. Ceux qui veulent / peuvent changer la donne ont un très gros problème de Scalabilité / Montée en charge / Passage à l’échelle. 6
  • 7. Scalabilité / Montée en charge / Passage à l’échelle. 7
  • 8. ALGORITHMIQUES Prévisibilité Transparence Robustesse Bostrom et Yudowsky, 2011, « The Ethics of Artificial Intelligence » : « Les algorithmes de plus en plus complexes de prise de décision sont à la fois souhaitables et inévitables, tant qu'ils restent transparents à l'inspection, prévisibles pour ceux qu'ils gouvernent, et robustes contre toute manipulation. » No-Go Zones Algorithmiques 8
  • 10. On réinvente le rêve d’Otlet 10
  • 11. Réinventer le rêve d’Otlet • Il était : « l’homme qui voulait classer le monde ». – Nous avons des sociétés commerciales qui y sont parvenues ; mais sur les bases d’un capitalisme linguistique dont la version triviale consiste à dire que la langue, que les mots ont une valeur marchande qui l’emporte sur leur sens et a pour seule vocation de permettre la mise en concurrence de ressources et d’individus et à s’enrichir de la spéculation qu’ils organisent et contrôlent. • Il pensait que le document, que la documentation avait un rôle déterminant à jouer dans la pacification du monde. – Nous avons des sociétés qui dessinent le projet politique fasciste de nouveaux « sous-hommes » sans documents (http://affordance.typepad.com/mon_weblog/2017/02/undocumented-men.html) face à de nouveaux « sur- hommes » sur-documentés. 11 Source de l’image : http://globalnation.inquirer.net/119385/undocumented-california-youth-can-get-health-care-but-many-dont-know-it
  • 13. On crée un index in-dé-pen-dant. • C’est quoi l’idée ? Recréer les conditions d’une concurrence algorithmique saine. • Pas de concurrence car impossible (trop coûteux) pour « petits acteurs industriels » de maintenir un index complet et à jour du web (sauf pour Google et Microsoft) => Monopole => TINA (There Is No Alternative) => En attendant Godot un Google Killer qui ne viendra pas. • Pour recréer les conditions d’une concurrence il faut, pour le web, un index indépendant, qui réponde à 3 conditions : – être ouvert et accessible à tout le monde. – à des conditions équitables (= Accès à l’index gratuit + accès payant à l’API sauf pour projets « non-profit »). – l’accès doit être « complet » (on doit accéder au texte intégral, pas simplement à une « vue » du document). Il ne doit pas y avoir de « limites » à l’extraction de documents. • Lewandowski : « an ideology free-ranking algorithm is not possible and would also not be desirable. (…) We should trive for diversity achieved through multiple ranking algorithms competing against one another. » 13 « Why we need an independant index of the web » https://arxiv.org/abs/1405.2212 Mai 2014.
  • 14. Pourquoi ce n’est pas si compliqué que ça ? (et pourquoi c’est urgent aussi …) • TECHNIQUEMENT • Parce que toutes technos du web sont dans le domaine public depuis le 30 Avril 1993. • Parce qu’en plus la plupart des algos et des technos d’IA portées par les GAFAM sont aussi en Open Source. • CÔTÉ CONTENUS • Parce que plusieurs pièces du puzzle n’attendent que d’être rassemblées : Hathi Trust (copie suffisamment significative de la base de donnée Google Books), fondation Internet Archive, Common Crawl, Dépôt légal du Web, Gallica / BnF, INA, Archives Ouvertes, WorldCat … + ressources propres (des archives et des bases de données de chaque titre de presse nationale, de PQR, de chaque bibliothèque, de chaque université, de chaque entreprise, etc). • SOCIOLOGIQUEMENT ET POLITIQUEMENT • Parce que les gens sont (presque) prêts. Ils ont en tout cas conscience du problème. • COMMERCIALEMENT • Parce qu’une offre alternative existe (Qwant, CHATONS, Framasoft, Degooglisons, DuckDuckGo) et a besoin de passer à l’échelle • OUI MAIS ÇA VA COÛTER CHER … • Oui. Mais on a l’argent. Et ça vaut le coup non ? • Et puis … 14
  • 15. 15
  • 16. Paul Otlet n’est pas vraiment arrivé à réaliser son rêve mais il nous a laissé ça : • « Les buts de la documentation consistent à pouvoir offrir sur tout ordre de fait et de connaissance, des informations documentées : 1. universelles quant à leur objet 2. sûres et vraies 3. complètes, 4. rapides, 5. à jour 6. faciles à obtenir 7. réunies d’avance et prêtes à être communiquées, 8. mises à la disposition du plus grand nombre ». 16
  • 17. Si nous n’arrivons pas à réaliser le rêve d’Otlet • Nous aurons des informations uniquement 1. universelles quant à leur objet 2. sûres et vraies 3. complètes, 4. rapides, 5. à jour 6. faciles à obtenir 7. réunies d’avance et prêtes à être communiquées, 8. mises à la disposition du plus grand nombre • Nous aurons donc raté l’essentiel. 17
  • 18. Et c’est déjà très problématique. 18• https://www.theguardian.com/commentisfree/2016/dec/11/google-frames-shapes-and-distorts-how-we-see-world On est passé du problème du jaguar (comment choisir un sens plutôt qu’un autre) au problème de l’holocauste (comment savoir ce qui a du sens). Les algorithmes n’y arriveront pas seuls. Et il ne faut pas laisser ces enjeux aux seules mains des GAFA. Il nous faut un index indépendant du web. Envisagé comme un commun de la connaissance à part entière.
  • 19. Index des documents Index des profils Index indépendant ;-) 19Merci de votre attention Moralité ?