SlideShare une entreprise Scribd logo
"Dans l'esprit du Pagerank :
regards croisés sur les algorithmes"
#CafeLecture - Atelier de lecture transdisciplinaire - Learning Centre SophiaTech
Fabien Gandon (Directeur de recherche, Wimmics (Inria-I3S))
« Dans l'esprit du Pagerank
Une enquête sur l'algorithme de Google »
Dominique Cardon, Réseaux 2013/1 (n° 177), p. 63-95. DOI 10.3917/res.177.0063
« A quoi rêvent les algorithmes
Nos vies à l'heure des big data »
Dominique Cardon, 01/10/2015, Coédition Seuil-La République des idées
+
L’article dans ses grandes lignes
(I) Principes & Origines du PageRank en Sociométrie et Scientométrie
• Citation = Vote → Lien = Vote
• Métriques sur les formes relationnelles du social
(centralité propre, proba stationnaire) Ax=x
• « Google Juice » ou « jus de liens » pour un vote pondéré
• Hypothèse d’extériorité, de neutralité et d’honnêteté
L’article dans ses grandes lignes
(II) Paradoxe: évidement omniprésent mais nécessairement ignoré
• Agrégation organique d’une « sagesse des foules »
• Séparation (fantasmée) des algorithmes: PageRank & Adwords
• « Faites comme si on n’était pas là » / « Nous sommes incontournables »
• SEO, bombing, fermes de liens, génération de textes, etc.
• Aucune action éditoriale directe/ Ajustements des algorithmes (!!!)
L’article dans ses grandes lignes
(III) Limites: autorité/popularité, autres graphes (sociaux), ininterprétable
vous-êtes ici [livre]
Google est créateur de Web
Tisse des liens, de la toile et ajoute des pages (résultats de recherche)
Plus on est visible, plus on est lié
Sur le Web l’analyse modifie l’objet
Pas uniquement structurel
• « Anchor texts » utilisés dans l’indexation
• Knowledge graphs : retour du contenu structuré, contrôlé (édité)
• Liens, nœuds et réseaux de plus en plus typés
analyse des recherches
intégrer les retours des utilisateurs
Click = Vote
https://www.google.fr/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&uact=8&ved=0ahUKEwj4-
4bNhLbMAhUGAcAKHZNTC_AQFggcMAA&url=http%3A%2F%2Ffabien.info%2F&usg=AFQjCNHkapoAUI7E0Zt
CeS36ZuMo1DPyyg&sig2=_t7Zc1mRalqL8RLFc4mxCw
Google observe le Web et les surfeurs
indirections systématiques
« Vote » : Lien = Vote
• Différences de pratiques entre communautés
• Incomparabilité des pratiques entres domaines, cultures, communautés
• Question de l’uniformisation des traitements de « Lien-Vote »
• Changements dans l’intentionnalité du lien
• Très explicite au début (1990) lorsqu’il est manuel et spontané
• Très différent avec son automatisation (suggestion, génération, liage, triche, etc.)
• Différence d’intention explicite :
Vote-Lien // Signal != trace ex. I like != Click // Data-Sublata [Latour]
• Vote d’un échantillon biaisé, non représentatif
• Web = "seulement" 3 milliards de d’utilisateurs et pas n’import lesquels
• Les « traces et signaux » ne capturent que les connectés
les autres ne laissent pas de traces et donc ne sont pas comptés
• Limite de représentativité
Sources :Internet World Stats et Google Transparency Report - 2013
Boris Beaude et Ogier Maitre - Chôros - EPFL
Boris Beaude et Ogier Maitre - L'ubiquité fracturée - 2014
« La donnée brute n’existe pas » [Livre]
elle a un contexte, modèle, format, précision, etc.
• La donnée est le nouveau pétrole
• Relativité de la valeur
(pas de cours de la donnée)
• Pas extraite en pleine mer
(elle appartient souvent à quelqu’un)
• Pas une ressource naturelle
(obtenue artificiellement)
• Infiniment renouvelable
(copie = instruction de base)
• L’absence de modèle n’améliore pas forcément les biais
(implicites, incontrôlés, etc.)
Statistique vs. Exact
algorithmes à cœur ouvert
Pagerank / h-Index: importer principes et critiques
• La « recherche d’information » / « recherche scientifique »
• Interprétations difficiles / erronées des métriques
(c.f. « Les dérives de l’évaluation de la recherche » Y. Gingras)
• Domination arbitraire d’une métrique, d’un classement, etc.
Il faut, varier les métriques & documenter leur interprétation,
leur principe et leurs limites.
intermédiarité proximité propre degré harmonique Katz
(source: Wikipedia)
(PageRank)
Tension entre adhésion et manipulation
Besoin de comprendre pour interpréter, légitimer, faire confiance, … utiliser
vs. Possibilité offerte de manipuler, biaiser, détourner,… rendre inutilisable
• Asymétrie de l’information:
• Manque de compréhension, conscience, etc. [Livre]
ex. agriculteurs, « tracteurs numériques »
& constructeur propriétaire données
// « les données » vs. « les obtenues »
ou « data » vs. « sublata » [B. Latour]
• Suprématie de ceux qui peuvent créer, attirer,
provoquer du lien (href, like, #tag)
// campagnes de com., jeux concours, etc.
// les riches deviennent plus riches
• Absence d’alternatives
• Limite de l’approche CNIL
« un fichier= un usage fixé » // Gilles Babinet
“people who use Mac
computers spend as much
as 30% more on hotels”
surveiller la surveillance
• « Diffusion d’une culture statistique »…
une culture du numérique
• Documenter les algorithmes:
• entrées, sources, capteurs, etc.
• modèles, formats, représentations, etc.
• algo & paramétrage, méthodes, traitements, etc.
• pilotes, collecteurs, commanditaires, programmeurs, etc.
• sorties, forme, destinataires, réutilisations, etc.
• objectifs visés ( principe)
• Audit des algorithmes, expertises de contrôle, responsabilité.
• CCNum & Conseil d’Etat
obligation de loyauté des plateformes envers les utilisateurs. [Livre]
• Vers une conception individualisée de la vie privée et non une définition
uniforme [Livre]
Potentiel imprévisible de la donnée
une autre raison de connaitre l’objectif
• Do You Smile with Your Nose? Stylistic Variation in Twitter Emoticons
Tyler Schnoebelen, WWW2015
• Feutres sous les meubles = conducteur prudent
// objectif d’optimisation (assurances)  objectif de solidarité (mutualités)
:-) :)
lire ou ne pas lire…
les termes et conditions des applications
32 241 words18 301 words15 352 words 36 275 words19 972 words11 195 words
http://conversation.which.co.uk/technology/length-of-website-terms-and-conditions/
< < < < <
… documenter l’objectif mais de façon accessible
limites de l’observable
Dérives parfois invisibles
• Encourager des comportements individuels non voulus
• Perceptibles: addiction vs. publicité ciblée, endoctrinement vs. bulle de filtrage, etc.
• « faut-il proposer des cigarettes à un fumeur qui veut arrêter de fumer? » [Livre]
• Imperceptibles: recommandation de livres vs. Bibliothérapie
• Renforcer des structures sociales non souhaitées
• Discrimination (ex. société raciste et offres d’emploi [Livre][Latanya Sweeney])
• Inégalités, Hiérarchies, etc. le tout invisible
• Un sous-système et non un système isolé
• L’hypothèse de l’isolé ne tient pas
• Autres boucles de rétroaction (ex. médias classiques)
A court terme nous risquons moins la suprématie d’une IA qu’une amplification
aveugle des biais sociaux ou un renforcement irréfléchi des comportements
individuels par une gouvernementalité algorithmique aveugle.
Gouvernementalité algorithmique
Antoinette Rouvroy
• l’abandon d’« échelle », d’« étalon », de hiérarchie, au profit
d’une normativité immanente et évolutive en temps réel
• double statistique du monde qui semble faire table rase
des anciennes hiérarchies
• l’évitement des confrontations avec les individus ;
occasions de subjectivation raréfiées.
« Une pensée du devenir et des processus d’individuation par la relation réclame
nécessairement du « disparate » - une hétérogénéité des ordres de grandeur, une
multiplicité des régimes d’existence - que la gouvernementalité algorithmique ne
cesse précisément d’étouffer en clôturant le réel (numérisé) sur lui-même »
« Le probable préempte le possible » [Livre]
• En nous réduisant à nos traces on nous réduit à un passé visible et surtout…
on nous coupe d’un futur possible.
• Suprématie de l’observable vs.
besoin de réintégrer la projection, le modèle.
« La carte et le paysage »
• Impact sociétal du déploiement d’un algorithme sur le Web
• Dimension éthique, morale, etc.
• Se doter d’un projet social, politique, moral, etc.
au-delà du PageRank
• Google et tant d’autres…
PageRank, EdgeRank,…
• Multiplication des graphes sur le Web
(liens de pages, réseaux sociaux,
données liées, workflows, logs, etc.)
• Besoin d’autres formes d’intelligences
au-delà du raisonnement logique, de l’apprentissage statistique, etc.
• In fine, un appel à la transdisciplinarité.
#uca

Contenu connexe

Similaire à Dans l'esprit du Pagerank: regards croisés sur les algorithmes,

Identité et réseaux socionumériques : lien social et formes d'expression de soi
Identité et réseaux socionumériques : lien social et formes d'expression de soiIdentité et réseaux socionumériques : lien social et formes d'expression de soi
Identité et réseaux socionumériques : lien social et formes d'expression de soiAlexandre Coutant
 
Antonio CASILLI - Régimes de production des visualisations de données
Antonio CASILLI - Régimes de production des visualisations de donnéesAntonio CASILLI - Régimes de production des visualisations de données
Antonio CASILLI - Régimes de production des visualisations de donnéesBodyspacesociety Blog
 
Traces numériques, identités, personnalités
Traces numériques, identités, personnalitésTraces numériques, identités, personnalités
Traces numériques, identités, personnalitésYannick Prié
 
2009 Conference Information Access & Search
2009 Conference Information Access & Search2009 Conference Information Access & Search
2009 Conference Information Access & SearchSocial Computing
 
Introduction à l'exploration du Web
Introduction à l'exploration du WebIntroduction à l'exploration du Web
Introduction à l'exploration du WebSébastien
 
Amar Lakel - Patrimonialisation numérique et avenir digital du document.
Amar Lakel - Patrimonialisation numérique et avenir digital du document.Amar Lakel - Patrimonialisation numérique et avenir digital du document.
Amar Lakel - Patrimonialisation numérique et avenir digital du document.Amar LAKEL, PhD
 
La Veille en E-Réputation et Community Management [1/3] : Les fondamentaux
La Veille en E-Réputation et Community Management [1/3] : Les fondamentauxLa Veille en E-Réputation et Community Management [1/3] : Les fondamentaux
La Veille en E-Réputation et Community Management [1/3] : Les fondamentauxGrégoire Arnould
 
Intelligence collective 1.0
Intelligence collective 1.0Intelligence collective 1.0
Intelligence collective 1.0Antoine Taly
 
Identité numérique et e reputation
Identité numérique et e reputationIdentité numérique et e reputation
Identité numérique et e reputationClément Dussarps
 
Les usages des reseaux sociaux arifor
Les usages des reseaux sociaux ariforLes usages des reseaux sociaux arifor
Les usages des reseaux sociaux ariforFrédéric Haeuw
 
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...olivier
 
Cersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsCersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsolivier
 
Réseaux sociaux et recherche d'information
Réseaux sociaux et recherche d'informationRéseaux sociaux et recherche d'information
Réseaux sociaux et recherche d'informationFFFOD
 
Présence numérique : habitus et pratiques savantes
Présence numérique : habitus et pratiques savantesPrésence numérique : habitus et pratiques savantes
Présence numérique : habitus et pratiques savantesLouise Merzeau
 
Sites de réseautage social, un petit monde où la confiance est aveugle
Sites de réseautage social, un petit monde où la confiance est aveugleSites de réseautage social, un petit monde où la confiance est aveugle
Sites de réseautage social, un petit monde où la confiance est aveugleISACA Chapitre de Québec
 
CGT-digital-week.pptx
CGT-digital-week.pptxCGT-digital-week.pptx
CGT-digital-week.pptxolivier
 

Similaire à Dans l'esprit du Pagerank: regards croisés sur les algorithmes, (20)

Identité et réseaux socionumériques : lien social et formes d'expression de soi
Identité et réseaux socionumériques : lien social et formes d'expression de soiIdentité et réseaux socionumériques : lien social et formes d'expression de soi
Identité et réseaux socionumériques : lien social et formes d'expression de soi
 
Antonio CASILLI - Régimes de production des visualisations de données
Antonio CASILLI - Régimes de production des visualisations de donnéesAntonio CASILLI - Régimes de production des visualisations de données
Antonio CASILLI - Régimes de production des visualisations de données
 
Traces numériques, identités, personnalités
Traces numériques, identités, personnalitésTraces numériques, identités, personnalités
Traces numériques, identités, personnalités
 
2009 Conference Information Access & Search
2009 Conference Information Access & Search2009 Conference Information Access & Search
2009 Conference Information Access & Search
 
Conférence big data
Conférence big dataConférence big data
Conférence big data
 
Introduction à l'exploration du Web
Introduction à l'exploration du WebIntroduction à l'exploration du Web
Introduction à l'exploration du Web
 
Amar Lakel - Patrimonialisation numérique et avenir digital du document.
Amar Lakel - Patrimonialisation numérique et avenir digital du document.Amar Lakel - Patrimonialisation numérique et avenir digital du document.
Amar Lakel - Patrimonialisation numérique et avenir digital du document.
 
SRI
SRISRI
SRI
 
La Veille en E-Réputation et Community Management [1/3] : Les fondamentaux
La Veille en E-Réputation et Community Management [1/3] : Les fondamentauxLa Veille en E-Réputation et Community Management [1/3] : Les fondamentaux
La Veille en E-Réputation et Community Management [1/3] : Les fondamentaux
 
Intelligence collective 1.0
Intelligence collective 1.0Intelligence collective 1.0
Intelligence collective 1.0
 
Veille et curation
Veille et curationVeille et curation
Veille et curation
 
Identité numérique et e reputation
Identité numérique et e reputationIdentité numérique et e reputation
Identité numérique et e reputation
 
Les usages des reseaux sociaux arifor
Les usages des reseaux sociaux ariforLes usages des reseaux sociaux arifor
Les usages des reseaux sociaux arifor
 
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
 
Cersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsCersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutions
 
Réseaux sociaux et recherche d'information
Réseaux sociaux et recherche d'informationRéseaux sociaux et recherche d'information
Réseaux sociaux et recherche d'information
 
Présence numérique : habitus et pratiques savantes
Présence numérique : habitus et pratiques savantesPrésence numérique : habitus et pratiques savantes
Présence numérique : habitus et pratiques savantes
 
Archilab 2013
Archilab 2013Archilab 2013
Archilab 2013
 
Sites de réseautage social, un petit monde où la confiance est aveugle
Sites de réseautage social, un petit monde où la confiance est aveugleSites de réseautage social, un petit monde où la confiance est aveugle
Sites de réseautage social, un petit monde où la confiance est aveugle
 
CGT-digital-week.pptx
CGT-digital-week.pptxCGT-digital-week.pptx
CGT-digital-week.pptx
 

Plus de Fabien Gandon

Walking Our Way to the Web
Walking Our Way to the WebWalking Our Way to the Web
Walking Our Way to the WebFabien Gandon
 
a shift in our research focus: from knowledge acquisition to knowledge augmen...
a shift in our research focus: from knowledge acquisition to knowledge augmen...a shift in our research focus: from knowledge acquisition to knowledge augmen...
a shift in our research focus: from knowledge acquisition to knowledge augmen...Fabien Gandon
 
Evaluation d’explications pour la prédiction de liens dans les graphes de con...
Evaluation d’explications pour la prédiction de liens dans les graphes de con...Evaluation d’explications pour la prédiction de liens dans les graphes de con...
Evaluation d’explications pour la prédiction de liens dans les graphes de con...Fabien Gandon
 
A Never-Ending Project for Humanity Called “the Web”
A Never-Ending Project for Humanity Called “the Web”A Never-Ending Project for Humanity Called “the Web”
A Never-Ending Project for Humanity Called “the Web”Fabien Gandon
 
Wimmics Overview 2021
Wimmics Overview 2021Wimmics Overview 2021
Wimmics Overview 2021Fabien Gandon
 
CovidOnTheWeb : covid19 linked data published on the Web
CovidOnTheWeb : covid19 linked data published on the WebCovidOnTheWeb : covid19 linked data published on the Web
CovidOnTheWeb : covid19 linked data published on the WebFabien Gandon
 
Web open standards for linked data and knowledge graphs as enablers of EU dig...
Web open standards for linked data and knowledge graphs as enablers of EU dig...Web open standards for linked data and knowledge graphs as enablers of EU dig...
Web open standards for linked data and knowledge graphs as enablers of EU dig...Fabien Gandon
 
from linked data & knowledge graphs to linked intelligence & intelligence graphs
from linked data & knowledge graphs to linked intelligence & intelligence graphsfrom linked data & knowledge graphs to linked intelligence & intelligence graphs
from linked data & knowledge graphs to linked intelligence & intelligence graphsFabien Gandon
 
The Web We Mix - benevolent AIs for a resilient web
The Web We Mix - benevolent AIs for a resilient webThe Web We Mix - benevolent AIs for a resilient web
The Web We Mix - benevolent AIs for a resilient webFabien Gandon
 
Overview of the Research in Wimmics 2018
Overview of the Research in Wimmics 2018Overview of the Research in Wimmics 2018
Overview of the Research in Wimmics 2018Fabien Gandon
 
Web science AI and IA
Web science AI and IAWeb science AI and IA
Web science AI and IAFabien Gandon
 
Normative Requirements as Linked Data
Normative Requirements as Linked DataNormative Requirements as Linked Data
Normative Requirements as Linked DataFabien Gandon
 
Wimmics Research Team Overview 2017
Wimmics Research Team Overview 2017Wimmics Research Team Overview 2017
Wimmics Research Team Overview 2017Fabien Gandon
 
On the many graphs of the Web and the interest of adding their missing links.
On the many graphs of the Web and the interest of adding their missing links. On the many graphs of the Web and the interest of adding their missing links.
On the many graphs of the Web and the interest of adding their missing links. Fabien Gandon
 
One Web of pages, One Web of peoples, One Web of Services, One Web of Data, O...
One Web of pages, One Web of peoples, One Web of Services, One Web of Data, O...One Web of pages, One Web of peoples, One Web of Services, One Web of Data, O...
One Web of pages, One Web of peoples, One Web of Services, One Web of Data, O...Fabien Gandon
 
How to supervise your supervisor?
How to supervise your supervisor?How to supervise your supervisor?
How to supervise your supervisor?Fabien Gandon
 
Wimmics Research Team 2015 Activity Report
Wimmics Research Team 2015 Activity ReportWimmics Research Team 2015 Activity Report
Wimmics Research Team 2015 Activity ReportFabien Gandon
 
Retours sur le MOOC "Web Sémantique et Web de données"
Retours sur le MOOC "Web Sémantique et Web de données"Retours sur le MOOC "Web Sémantique et Web de données"
Retours sur le MOOC "Web Sémantique et Web de données"Fabien Gandon
 
Emotions in Argumentation: an Empirical Evaluation @ IJCAI 2015
Emotions in Argumentation: an Empirical Evaluation @ IJCAI 2015Emotions in Argumentation: an Empirical Evaluation @ IJCAI 2015
Emotions in Argumentation: an Empirical Evaluation @ IJCAI 2015Fabien Gandon
 
ESWC 2015 Closing and "General Chair's minute of Madness"
ESWC 2015 Closing and "General Chair's minute of Madness"ESWC 2015 Closing and "General Chair's minute of Madness"
ESWC 2015 Closing and "General Chair's minute of Madness"Fabien Gandon
 

Plus de Fabien Gandon (20)

Walking Our Way to the Web
Walking Our Way to the WebWalking Our Way to the Web
Walking Our Way to the Web
 
a shift in our research focus: from knowledge acquisition to knowledge augmen...
a shift in our research focus: from knowledge acquisition to knowledge augmen...a shift in our research focus: from knowledge acquisition to knowledge augmen...
a shift in our research focus: from knowledge acquisition to knowledge augmen...
 
Evaluation d’explications pour la prédiction de liens dans les graphes de con...
Evaluation d’explications pour la prédiction de liens dans les graphes de con...Evaluation d’explications pour la prédiction de liens dans les graphes de con...
Evaluation d’explications pour la prédiction de liens dans les graphes de con...
 
A Never-Ending Project for Humanity Called “the Web”
A Never-Ending Project for Humanity Called “the Web”A Never-Ending Project for Humanity Called “the Web”
A Never-Ending Project for Humanity Called “the Web”
 
Wimmics Overview 2021
Wimmics Overview 2021Wimmics Overview 2021
Wimmics Overview 2021
 
CovidOnTheWeb : covid19 linked data published on the Web
CovidOnTheWeb : covid19 linked data published on the WebCovidOnTheWeb : covid19 linked data published on the Web
CovidOnTheWeb : covid19 linked data published on the Web
 
Web open standards for linked data and knowledge graphs as enablers of EU dig...
Web open standards for linked data and knowledge graphs as enablers of EU dig...Web open standards for linked data and knowledge graphs as enablers of EU dig...
Web open standards for linked data and knowledge graphs as enablers of EU dig...
 
from linked data & knowledge graphs to linked intelligence & intelligence graphs
from linked data & knowledge graphs to linked intelligence & intelligence graphsfrom linked data & knowledge graphs to linked intelligence & intelligence graphs
from linked data & knowledge graphs to linked intelligence & intelligence graphs
 
The Web We Mix - benevolent AIs for a resilient web
The Web We Mix - benevolent AIs for a resilient webThe Web We Mix - benevolent AIs for a resilient web
The Web We Mix - benevolent AIs for a resilient web
 
Overview of the Research in Wimmics 2018
Overview of the Research in Wimmics 2018Overview of the Research in Wimmics 2018
Overview of the Research in Wimmics 2018
 
Web science AI and IA
Web science AI and IAWeb science AI and IA
Web science AI and IA
 
Normative Requirements as Linked Data
Normative Requirements as Linked DataNormative Requirements as Linked Data
Normative Requirements as Linked Data
 
Wimmics Research Team Overview 2017
Wimmics Research Team Overview 2017Wimmics Research Team Overview 2017
Wimmics Research Team Overview 2017
 
On the many graphs of the Web and the interest of adding their missing links.
On the many graphs of the Web and the interest of adding their missing links. On the many graphs of the Web and the interest of adding their missing links.
On the many graphs of the Web and the interest of adding their missing links.
 
One Web of pages, One Web of peoples, One Web of Services, One Web of Data, O...
One Web of pages, One Web of peoples, One Web of Services, One Web of Data, O...One Web of pages, One Web of peoples, One Web of Services, One Web of Data, O...
One Web of pages, One Web of peoples, One Web of Services, One Web of Data, O...
 
How to supervise your supervisor?
How to supervise your supervisor?How to supervise your supervisor?
How to supervise your supervisor?
 
Wimmics Research Team 2015 Activity Report
Wimmics Research Team 2015 Activity ReportWimmics Research Team 2015 Activity Report
Wimmics Research Team 2015 Activity Report
 
Retours sur le MOOC "Web Sémantique et Web de données"
Retours sur le MOOC "Web Sémantique et Web de données"Retours sur le MOOC "Web Sémantique et Web de données"
Retours sur le MOOC "Web Sémantique et Web de données"
 
Emotions in Argumentation: an Empirical Evaluation @ IJCAI 2015
Emotions in Argumentation: an Empirical Evaluation @ IJCAI 2015Emotions in Argumentation: an Empirical Evaluation @ IJCAI 2015
Emotions in Argumentation: an Empirical Evaluation @ IJCAI 2015
 
ESWC 2015 Closing and "General Chair's minute of Madness"
ESWC 2015 Closing and "General Chair's minute of Madness"ESWC 2015 Closing and "General Chair's minute of Madness"
ESWC 2015 Closing and "General Chair's minute of Madness"
 

Dans l'esprit du Pagerank: regards croisés sur les algorithmes,

  • 1. "Dans l'esprit du Pagerank : regards croisés sur les algorithmes" #CafeLecture - Atelier de lecture transdisciplinaire - Learning Centre SophiaTech Fabien Gandon (Directeur de recherche, Wimmics (Inria-I3S))
  • 2. « Dans l'esprit du Pagerank Une enquête sur l'algorithme de Google » Dominique Cardon, Réseaux 2013/1 (n° 177), p. 63-95. DOI 10.3917/res.177.0063 « A quoi rêvent les algorithmes Nos vies à l'heure des big data » Dominique Cardon, 01/10/2015, Coédition Seuil-La République des idées +
  • 3. L’article dans ses grandes lignes (I) Principes & Origines du PageRank en Sociométrie et Scientométrie • Citation = Vote → Lien = Vote • Métriques sur les formes relationnelles du social (centralité propre, proba stationnaire) Ax=x • « Google Juice » ou « jus de liens » pour un vote pondéré • Hypothèse d’extériorité, de neutralité et d’honnêteté
  • 4. L’article dans ses grandes lignes (II) Paradoxe: évidement omniprésent mais nécessairement ignoré • Agrégation organique d’une « sagesse des foules » • Séparation (fantasmée) des algorithmes: PageRank & Adwords • « Faites comme si on n’était pas là » / « Nous sommes incontournables » • SEO, bombing, fermes de liens, génération de textes, etc. • Aucune action éditoriale directe/ Ajustements des algorithmes (!!!)
  • 5. L’article dans ses grandes lignes (III) Limites: autorité/popularité, autres graphes (sociaux), ininterprétable
  • 6.
  • 8. Google est créateur de Web Tisse des liens, de la toile et ajoute des pages (résultats de recherche) Plus on est visible, plus on est lié Sur le Web l’analyse modifie l’objet
  • 9. Pas uniquement structurel • « Anchor texts » utilisés dans l’indexation • Knowledge graphs : retour du contenu structuré, contrôlé (édité) • Liens, nœuds et réseaux de plus en plus typés
  • 10. analyse des recherches intégrer les retours des utilisateurs
  • 12. Google observe le Web et les surfeurs indirections systématiques
  • 13.
  • 14. « Vote » : Lien = Vote • Différences de pratiques entre communautés • Incomparabilité des pratiques entres domaines, cultures, communautés • Question de l’uniformisation des traitements de « Lien-Vote » • Changements dans l’intentionnalité du lien • Très explicite au début (1990) lorsqu’il est manuel et spontané • Très différent avec son automatisation (suggestion, génération, liage, triche, etc.) • Différence d’intention explicite : Vote-Lien // Signal != trace ex. I like != Click // Data-Sublata [Latour] • Vote d’un échantillon biaisé, non représentatif • Web = "seulement" 3 milliards de d’utilisateurs et pas n’import lesquels • Les « traces et signaux » ne capturent que les connectés les autres ne laissent pas de traces et donc ne sont pas comptés • Limite de représentativité
  • 15. Sources :Internet World Stats et Google Transparency Report - 2013 Boris Beaude et Ogier Maitre - Chôros - EPFL Boris Beaude et Ogier Maitre - L'ubiquité fracturée - 2014
  • 16. « La donnée brute n’existe pas » [Livre] elle a un contexte, modèle, format, précision, etc. • La donnée est le nouveau pétrole • Relativité de la valeur (pas de cours de la donnée) • Pas extraite en pleine mer (elle appartient souvent à quelqu’un) • Pas une ressource naturelle (obtenue artificiellement) • Infiniment renouvelable (copie = instruction de base) • L’absence de modèle n’améliore pas forcément les biais (implicites, incontrôlés, etc.)
  • 19. Pagerank / h-Index: importer principes et critiques • La « recherche d’information » / « recherche scientifique » • Interprétations difficiles / erronées des métriques (c.f. « Les dérives de l’évaluation de la recherche » Y. Gingras) • Domination arbitraire d’une métrique, d’un classement, etc. Il faut, varier les métriques & documenter leur interprétation, leur principe et leurs limites. intermédiarité proximité propre degré harmonique Katz (source: Wikipedia) (PageRank)
  • 20. Tension entre adhésion et manipulation Besoin de comprendre pour interpréter, légitimer, faire confiance, … utiliser vs. Possibilité offerte de manipuler, biaiser, détourner,… rendre inutilisable • Asymétrie de l’information: • Manque de compréhension, conscience, etc. [Livre] ex. agriculteurs, « tracteurs numériques » & constructeur propriétaire données // « les données » vs. « les obtenues » ou « data » vs. « sublata » [B. Latour] • Suprématie de ceux qui peuvent créer, attirer, provoquer du lien (href, like, #tag) // campagnes de com., jeux concours, etc. // les riches deviennent plus riches • Absence d’alternatives • Limite de l’approche CNIL « un fichier= un usage fixé » // Gilles Babinet
  • 21. “people who use Mac computers spend as much as 30% more on hotels”
  • 22. surveiller la surveillance • « Diffusion d’une culture statistique »… une culture du numérique • Documenter les algorithmes: • entrées, sources, capteurs, etc. • modèles, formats, représentations, etc. • algo & paramétrage, méthodes, traitements, etc. • pilotes, collecteurs, commanditaires, programmeurs, etc. • sorties, forme, destinataires, réutilisations, etc. • objectifs visés ( principe) • Audit des algorithmes, expertises de contrôle, responsabilité. • CCNum & Conseil d’Etat obligation de loyauté des plateformes envers les utilisateurs. [Livre] • Vers une conception individualisée de la vie privée et non une définition uniforme [Livre]
  • 23. Potentiel imprévisible de la donnée une autre raison de connaitre l’objectif • Do You Smile with Your Nose? Stylistic Variation in Twitter Emoticons Tyler Schnoebelen, WWW2015 • Feutres sous les meubles = conducteur prudent // objectif d’optimisation (assurances)  objectif de solidarité (mutualités) :-) :)
  • 24. lire ou ne pas lire… les termes et conditions des applications 32 241 words18 301 words15 352 words 36 275 words19 972 words11 195 words http://conversation.which.co.uk/technology/length-of-website-terms-and-conditions/ < < < < < … documenter l’objectif mais de façon accessible
  • 26. Dérives parfois invisibles • Encourager des comportements individuels non voulus • Perceptibles: addiction vs. publicité ciblée, endoctrinement vs. bulle de filtrage, etc. • « faut-il proposer des cigarettes à un fumeur qui veut arrêter de fumer? » [Livre] • Imperceptibles: recommandation de livres vs. Bibliothérapie • Renforcer des structures sociales non souhaitées • Discrimination (ex. société raciste et offres d’emploi [Livre][Latanya Sweeney]) • Inégalités, Hiérarchies, etc. le tout invisible • Un sous-système et non un système isolé • L’hypothèse de l’isolé ne tient pas • Autres boucles de rétroaction (ex. médias classiques) A court terme nous risquons moins la suprématie d’une IA qu’une amplification aveugle des biais sociaux ou un renforcement irréfléchi des comportements individuels par une gouvernementalité algorithmique aveugle.
  • 27. Gouvernementalité algorithmique Antoinette Rouvroy • l’abandon d’« échelle », d’« étalon », de hiérarchie, au profit d’une normativité immanente et évolutive en temps réel • double statistique du monde qui semble faire table rase des anciennes hiérarchies • l’évitement des confrontations avec les individus ; occasions de subjectivation raréfiées. « Une pensée du devenir et des processus d’individuation par la relation réclame nécessairement du « disparate » - une hétérogénéité des ordres de grandeur, une multiplicité des régimes d’existence - que la gouvernementalité algorithmique ne cesse précisément d’étouffer en clôturant le réel (numérisé) sur lui-même »
  • 28. « Le probable préempte le possible » [Livre] • En nous réduisant à nos traces on nous réduit à un passé visible et surtout… on nous coupe d’un futur possible. • Suprématie de l’observable vs. besoin de réintégrer la projection, le modèle. « La carte et le paysage » • Impact sociétal du déploiement d’un algorithme sur le Web • Dimension éthique, morale, etc. • Se doter d’un projet social, politique, moral, etc.
  • 29. au-delà du PageRank • Google et tant d’autres… PageRank, EdgeRank,… • Multiplication des graphes sur le Web (liens de pages, réseaux sociaux, données liées, workflows, logs, etc.) • Besoin d’autres formes d’intelligences au-delà du raisonnement logique, de l’apprentissage statistique, etc. • In fine, un appel à la transdisciplinarité. #uca