SlideShare une entreprise Scribd logo
1  sur  68
Télécharger pour lire hors ligne
Introduction au
capitalisme linguistique
Frédéric Kaplan

frederic.kaplan@ep!.ch
twitter: @frederickaplan
... et à la nouvelle
créolisation
Frédéric Kaplan

frederic.kaplan@ep!.ch
twitter: @frederickaplan
i"yi i Ë f i|= :'=lz"t
                                                                                     i
                  ËË;te â
                  ë iË , ËË.rËË
                     i€ËâË
                  .P . - -
                              7EÊ
                           ËËËËË
                             -.:
                         ==.8=?
                                     -- o'a
                                       à3;:
                                              9ll
                                g ;âÈ u . Ë Ê Ë ig
                                    =
                                                       xYAii
                                                          ÎE
                  .iiË s:;! F
                     H                u Ë
                                 Ë;-gE-r=EEi
                                   e
                              iEgËËË
                  35ËËËËËËËËËEË     r*
                                 *ËjËj1ËA                                êo iÉU . E IE6 s Ë É É s€! e!ZE ôr' ùËÊ
                                                                              E ; IËO
                                                                         F                              É
                                                                               gË:;
                                                                         l=i"ËË r
                                                                             âËi*
          a)                                                         - â:EiË +i€;
                                                                           i:=ËiË;
          )
          F)
          Èil
                                                                     i eË Ë
                                                                        ËËËË
                                                                     r , i ËÉ = â ; " t 4 ; , î : â
    .-'rt I-ù
    Xù |
              |
                                                                     i çË
                                                                        Ë;ËË::
                                                                        Ëgg9€
    tsl                                                              a Ëi ÊËË
                                                                         | v EË ; h Ë ç F s
  rsl                                                                    E €!
                                                                         €H p
                                                                         ='53
                                                                                  É
                                                                                   : s r ç Ë2 F . i = â a
                                                                                   ÈF.:Ë!Ë'Ë!sài
                                                                                   *x;-uçgFE;i9
                                                                                   3 ^ a = ; . éo o - E5 : o
                                                                         ; iËsÉtâËr;
                                                                         >V?
          .S       rr)
                   fr         p
                               a
                                 $-..{
                               o o
                                                                         {ËâËiÈËÈ
                                                                             Ë
                                                                         Ë È ËE : s Ë q Ë ï s *
                                                                         3 . 4Ë    ! à Ëk É g s 3 ;
                                                                                       ô    E
                                                                                   i l y E 5 6 3 EÉ 3
 GE'
,:e.I

          i       F
                   a
                   r1
                               t4
                               i-l
                               FI
                                          a
                                          tnl                   z


                                                                         : i Ê
                                                                         a É Ë f ieÉ ÉEË E : il ;
                                                                         ;+E E
                                                                         93Fg

                                                                              Ë
                                                                               Ê

                                                                                         y âiÈ
                                                                         â+ Hb- .9: ;ÈâE i i ' : = - e t -
                   z                                            (
                                                                J
                   '-.1
                               a                  C)
                                                                0,
   s
    È'l
    È
   .$

                   (n
                   tl

                               C)
                             r-l
                             'IJ
                                          E
                                              I

                                                               X
                                                               9
                                                               É
                                                               {l
                                                                            =il
                                                                         ËËËËg
                                                                             E
                                                              o
                                                                          tËiË
                   F
                                                                           ;Ëî
                                                                         ËËË:
                                                               .t{
                                                                            ËË
                                                  (-
                                                                             Ë
    t!
    z                                             -
    o                          (-                              IL
                  U            È{    C)
   "l I                        d ,-{                           {
                                                               À
    :
                  F-.1
                  rt)          'rê   d
                             c
                               J
    :
    o
    z                                                                 :zZz11;
L’histoire de Google tient en
deux algorithmes :
l’un l’a rendu populaire,
l’autre l’a rendu riche.
1
  l’algorithme qui a
rendu Google célèbre
Altavista - 1996
Google - 1998
PageRank

Une intuition sur ce qui fait la
légitimité d’une source
d’information et la nature
pragmatique du lien hypertexte.
PageRank

La valeur PageRank d’une page
est liée au nombre de pages qui la
citent et à leur propre valeur
PageRank.
Le PageRank est la probabilité
stationnaire d'une chaîne de Markov.
Beaucoup de “start-ups”
proposant une valeur
d’usage mais pas de valeur
d’échange ne résistèrent pas
à l’éclatement de la “Bulle
Internet”.
Google a eu une meilleure idée
que de simplement vendre de
la publicité et a su transformer
le capital linguistique qu’elle
accumulait en un service
créant de la valeur.
2
 l’algorithme qui a
rendu Google riche
Un algorithme qui organise
automatiquement la
spéculation autour des mots a
permis de créer le premier
marché linguistique mondial.
Le marché linguistique existait
déjà avant Google.

Il était possible depuis
longtemps d’acheter certains
mots (Trademarks)
> cf. C.Fauré commentant Lombardo sur l’origine antique des Trademarks
> http://www.christian-faure.net/2012/01/22/les-savoirs-de-lecriture-en-grece-
ancienne-3-marchands-transactions-economiques-ecritures/
L’algorithme de Google a
élargi et en partie libéralisé ce
marché.
1
    4
2
    5
3
    6

    7
    8
    9

    10
tous les mots peuvent donner
         lieu à des enchères ...
L’algorithme classe
automatiquement les
annonces selon un calcul
en quatre étapes.
1. Enchère sur un mot clé (E)

Une entreprise choisit un mot ou une
expression, par exemple “vacances”
et le prix maximum qu’elle serait prête
à payer en cas de clic.
Google propose une estimation du montant de l’enchère à proposer pour avoir de
bonnes chances d’être dans la première page des résultats proposés.

Les acheteurs de mots peuvent aussi cibler leur publicité à des dates ou des lieux
spéci"ques.
2. Calcul du score de qualité de la
publicité (Q)

Google donne un score à la publicité sur
une échelle de un à dix.
Ce score dépend essentiellement de la pertinence du texte de la publicité par rapport à la
requête de l’utilisateur, de la qualité de la page vers laquelle la publicité pointe (qualité de
son contenu et rapidité de chargement) et du nombre de clics moyen sur la publicité. En
gros, ce score mesure à quel point la publicité “fonctionne”.

C’est un point essentiel car Google ne gagne de l’argent que si les internautes choisissent
e#ectivement de cliquer sur le lien proposé par la publicité.

L’algorithme exact qui produit le score de qualité de la publicité reste secret et
modi!able à loisir par Google.
3. Calcul du rang (R)

Le Rang est l’Enchère multipliée par le
Score. Une publicité ayant un bon score
peut ainsi compenser une enchère plus
faible et arriver devant.

R=E*Q
4. Calcul du prix à payer en cas de
clic (P)

Le prix que paye une entreprise 1 si un
internaute clique sur sa publicité n’est
pas le prix de l’enchère mais le prix de
l’enchère 2 juste en dessous de sa
propre enchère modulé par la qualité
relative entre cette deuxième enchère
et celle de l’entreprise.
Tout tient dans la formule : P1 = E2 * (Q2 / Q1) où P1 est le prix payé par l’entreprise, E2
est l’enchère la plus haute en dessous de l’enchère de l'entreprise 1, Q1 la qualité de
l’enchère 1, Q2 la qualité de l’enchère 2.
Ce jeu d’enchères est recalculé pour
chaque requête de chaque utilisateur
— des millions de fois par seconde
Cet algorithme génère des
dizaines de milliards de
dollars par an.
10,584 milliards de dollars pour le seul
quatrième trimestre 2011
40                               milliards / an
Quelques éléments de comparaison :

Budget de Bibliothèque Nationale de France : 226 millions d’euros / an
Chi#re d’a#aire de Renault en 2011 : 42 millions
...
Le marché linguistique ainsi créé par Google
est déjà global et multilingue.

La “Bourse des mots” qui lui est associée
donne une indication relativement juste des
grands mouvements sémantiques
mondiaux.
ski           or




sun screen   world cup
Google a réussi à étendre le
domaine du capitalisme à la
langue elle-même, à
organiser la vente de
“mots” à l’échelle planétaire.
L’ensemble de ses autres
projets et innovations
technologiques peuvent être
analysés à travers ce prisme.
Quand Google corrige à la volée un
mot que vous avez mal
orthographié, il ne fait pas que
vous rendre service :
il transforme un matériau sans
valeur en une ressource
économique directement rentable.
Quand Google prolonge une
phrase que vous avez commencée
à taper dans la case de recherche,
il vous ramène dans le domaine de
la langue qu’il exploite, vous invite
à emprunter le chemin statistique
tracé par les autres internautes.
Parfois la statistique
l’emporte sur
l’orthographe.
Les technologies du capitalisme linguistique
poussent à la régularisation de la langue.

Plus nous ferons appel aux prothèses
linguistiques, laissant les algorithmes
corriger et prolonger nos propos, plus cette
régularisation sera e$cace.
Nous nous exprimons chaque jour un peu plus au travers
d’une des interfaces de Google ; pas simplement lorsque
nous faisons une recherche, mais aussi quand

- nous écrivons un courrier électronique avec GMail
- un article avec Google Docs
- nous signalons une information sur le réseau social Google+,
- et même oralement, à travers les interfaces de
reconnaissance vocale que Google intègre à ses applications
mobiles.
Nous sommes déjà des millions
chaque jour à écrire et à parler
par le biais de Google.
C’est pourquoi le modèle statistique
multilingue que Google a$ne en
permanence et vers lequel il tente de
ramener chaque requête est bien plus à
jour que le dictionnaire publié annuellement
par nos académiciens.
Google suit les mouvements
de la langue minute par
minute, car il a le premier
découvert en elle un minerai
d’une richesse extraordinaire,
et s’est doté des moyens
nécessaires pour l’exploiter.
la langue vivante




    la langue
   statistique
   exploitable
commercialement
L’extension du domaine commercial de la
langue est permise par deux dynamiques

(1) La régularisation de la langue par la
médiation des prothèses linguistiques

(2) La multiplication et la banalisation des
prothèses linguistiques
La découverte de ce territoire du
capitalisme jusqu’ici ignoré ouvre un
nouveau champ de bataille économique.

Google béné"cie certes d’une avance
importante, mais des rivaux, ayant compris
les règles de cette nouvelle compétition,
"niront par se pro"ler.
Nous quittons une économie de
l’attention pour entrer dans une
économie de l’expression.
L’enjeu n’est plus tant de capter les regards, que d’être un
médiateur de la parole et l’écrit.

Les gagnants seront ceux qui auront pu développer des
relations linguistiques intimes et durables avec un grand
nombre d’utilisateurs, pour modéliser et in!échir la langue,
créer un marché linguistique contrôlé et organiser la
spéculation sur les mots.
Une conséquence essentielle


La langue va se
transformer.
Comment ?
Pas simplement en se
régularisant ...
Le “Flash Crash” du 6 mai 2010 a fait prendre
conscience de l’omniprésence des algorithmes
dans la "nance.
Dès que les systèmes culturels
proposent des fonctions
précises à optimiser, les
algorithmes deviennent des
alternatives pertinentes à
l’action humaine.
Dès que le nombre d’actions
décidées par des algorithmes
devient signi"catif par rapport
aux actions humaines, la forme
des systèmes culturels
changent profondément.
Comme pour le domaine de la
"nance, les algorithmes sont
devenus des acteurs majeurs
du capitalisme linguistique.
Principe général

Toute prothèse linguistique peut
être utilisée par un “bot” plutôt
qu’un humain.
Il nous fait donc désormais distinguer deux
types de ressources linguistiques:

(a) les ressources primaires produites par des
humains (conversations orales ou écrites,
contenus de livres scannés, etc.)

(b) les ressources secondaires produites par
des machines en général à partir des
ressources primaires (traduction automatique,
articles écrits par des algorithmes, spam). 
Malheureusement, sans connaître l’origine
d’une production, il n’est souvent pas aisé de
distinguer entre ressources primaires ou
secondaires. Un humain peut dans certains
cas faire la di#érence, mais il est di$cile de
construire des algorithmes  pour faire
automatiquement cette distinction.
Les acteurs du capitalisme linguistique doivent
modéliser la langue le plus parfaitement
possible. C’est leur capital.

Google voit les ressources secondaires
comme un danger, une pollution pour ses
modèles.
La modi"cation de la syntaxe dans des
chaînes de traduction automatique illustre un
certain de type de pollution.
  “La qualité se dégrade petit à petit au fur et à mesure
  quand on applique des algorithmes de traduction
  automatique”

  “Quality degrades gradually as and when we measure
  applies algorithms to machine translation”

  “Calidad degrada gradualmente a medida y cuando la
  medida se aplica algoritmos de traducción automática”

  “Qualité se dégrade progressivement au fur et à mesure est
  appliquée algorithmes de traduction automatique”
Un nombre croissant de textes sont
maintenant directement produits par des
machines

Un lecteur averti peut souvent détecter la mécanique sous-
jacente et deviner parfois que ces textes ne sont pas écrits
par des humains.

Leur composition syntaxique et surtout leur positionnement
pragmatique sonnent parfois faux, re!étant les biais de
l’algorithme qui les compose.
Ces textes sont optimisés pour l’univers
linguistique qu’ils investissent
Le même contenu peut donner lieu à di#érentes formes :
Articles longs ou courts, chroniques sportives, tweets,
message vocal.

Il peut être exprimé en optimisant son e$cacité pour les
moteurs de recherche (SEO) : choix de mots particuliers, de
tournures statistiques optimales.

Comme en !nance, les algorithmes sont sans doute
meilleurs que les hommes pour produire des stratégies
optimales dans le milieu économique du capitalisme
linguistique.
Les algorithmes qui archivent inlassablement
le web ne font pas facilement la di#érence
entre ces ressources linguistiques dégradées
et les ressources primaires.

Au fur et à mesure que la quantité de
ressources secondaires devient signi"cative
par rapport aux ressources primaires, les
modèles statistiques peuvent se modi"er pour
intégrer le vocabulaire, les formulations et
les tournures des algorithmes.
Ce sont ces tournures qui
risquent de nous être
proposées sous la forme de
suggestions ou de corrections. 
Pour lutter contre cette “pollution” croissante,
Google a modi"é en 2011 son service Google
Translate.

Google a remplacé son service créateur de ressources
secondaires en un service de traduction “on demand” qui
garde toujours le texte original de la traduction, pour s’en
servir pour la recherche et pour potentiellement améliorer
progressivement la traduction proposée au fur et à mesure que
les algorithmes de traduction progressent. 

cf. Kirti Vashee / Analysis of the Shutdown Announcements of the Google Translate API
Cela ne su$ra pas.

Il faut maintenant compter avec l’écriture des
machines et tous les hybrides de ce nouvel
ordre linguistique.
Sur les 30 meilleurs
éditeurs de Wikipedia,
les 2/3 sont des bots
> R.Stuart Geiger, “The Lives of Bots.” in Wikipedia: A Critical Point of View. 2011
> http://en.wikipedia.org/wiki/Wikipedia:List_of_Wikipedians_by_number_of_recent_edits
D’ici deux ans, une proportion
signi"cative des messages sur
les réseaux sociaux seront
peut-être produits par des
bots.

> Hwang, Pearce and Nanis (2012) Socialbots: voices from the fronts interactions Volume 19
Issue 2, March + April 2012
Ainsi, textes humains et algorithmiques se
mêlent pour proposer une nouvelle forme
d’écriture.

Et c’est cette nouvelle écriture que d’autres
algorithmes analysent pour ensuite structurer
nos propres productions linguistiques.
Avec le capitalisme
linguistique, la langue elle-
même se transforme pour
intégrer les biais linguistiques
des machines et les
contraintes de l’économie
linguistique planétaire.
Nous assistons peut-être une
nouvelle phase de
“grammatisation” de la
langue, une nouvelle
rétroaction de la technologie
et de l’économie sur la langue
naturelle.
Dans un temps intermédiaire
apparait quelque chose
comme une lingua franca, un
pidgin ou un créole, dont la
syntaxe et le vocabulaire sont
liés aux capacités linguistiques
des machines et aux valeurs
marchandes des mots.
C’est ce phénomène inédit
que j’appelle la nouvelle
créolisation.
frederic.kaplan@ep!.ch
twitter:@frederickaplan
http://fkaplan.com
http://craft.ep!.ch




http://bookapp.com

Contenu connexe

En vedette (20)

737 sexo en el coche (nin)
737 sexo en el coche (nin)737 sexo en el coche (nin)
737 sexo en el coche (nin)
 
Humanos 15
Humanos 15Humanos 15
Humanos 15
 
Qué es la web 20
Qué es la web 20Qué es la web 20
Qué es la web 20
 
Presentación 3
Presentación 3Presentación 3
Presentación 3
 
Momentos de verdad (orientacion al servicio)[1]
Momentos de verdad (orientacion al servicio)[1]Momentos de verdad (orientacion al servicio)[1]
Momentos de verdad (orientacion al servicio)[1]
 
Preparaciones de base[1]
Preparaciones de base[1]Preparaciones de base[1]
Preparaciones de base[1]
 
te quiero mucho!!!!
te quiero mucho!!!!te quiero mucho!!!!
te quiero mucho!!!!
 
Les CMS pour blogguer
Les CMS pour blogguerLes CMS pour blogguer
Les CMS pour blogguer
 
Estadistica final
Estadistica finalEstadistica final
Estadistica final
 
Itaca
ItacaItaca
Itaca
 
Web 2.0 para la docencia
Web 2.0 para la docenciaWeb 2.0 para la docencia
Web 2.0 para la docencia
 
Presentación1
Presentación1Presentación1
Presentación1
 
Portraits
PortraitsPortraits
Portraits
 
La guajira
La guajiraLa guajira
La guajira
 
Documentos tecnicos y cientificos
Documentos tecnicos y cientificosDocumentos tecnicos y cientificos
Documentos tecnicos y cientificos
 
Access
AccessAccess
Access
 
Slideshare
SlideshareSlideshare
Slideshare
 
Reflexión. trabajo final
Reflexión. trabajo finalReflexión. trabajo final
Reflexión. trabajo final
 
Grup 1: Les potes de les aus
Grup 1: Les potes de les aus Grup 1: Les potes de les aus
Grup 1: Les potes de les aus
 
Unité 2
Unité 2Unité 2
Unité 2
 

Plus de Frederic Kaplan

Les technologies absorbantes
Les technologies absorbantesLes technologies absorbantes
Les technologies absorbantesFrederic Kaplan
 
L'historien et l'algorithme : Présentation aux Entretiens du Nouveau Monde In...
L'historien et l'algorithme : Présentation aux Entretiens du Nouveau Monde In...L'historien et l'algorithme : Présentation aux Entretiens du Nouveau Monde In...
L'historien et l'algorithme : Présentation aux Entretiens du Nouveau Monde In...Frederic Kaplan
 
DH101 2013/2014 course 10 - 3d printing, Javascript data visualization
DH101 2013/2014 course 10 - 3d printing, Javascript data visualization DH101 2013/2014 course 10 - 3d printing, Javascript data visualization
DH101 2013/2014 course 10 - 3d printing, Javascript data visualization Frederic Kaplan
 
DH101 2013/2014 course 9 - Crowdsourcing, crowdfunding, Wikipedia, Open Stree...
DH101 2013/2014 course 9 - Crowdsourcing, crowdfunding, Wikipedia, Open Stree...DH101 2013/2014 course 9 - Crowdsourcing, crowdfunding, Wikipedia, Open Stree...
DH101 2013/2014 course 9 - Crowdsourcing, crowdfunding, Wikipedia, Open Stree...Frederic Kaplan
 
DH101 2013/2014 course 8 - Historical Geographical Information Systems (HGIS)...
DH101 2013/2014 course 8 - Historical Geographical Information Systems (HGIS)...DH101 2013/2014 course 8 - Historical Geographical Information Systems (HGIS)...
DH101 2013/2014 course 8 - Historical Geographical Information Systems (HGIS)...Frederic Kaplan
 
DH101 2013/2014 Projects
DH101 2013/2014 ProjectsDH101 2013/2014 Projects
DH101 2013/2014 ProjectsFrederic Kaplan
 
DH101 2013/2014 course 7 - OCR, Printed text recognition, Handwriting recogni...
DH101 2013/2014 course 7 - OCR, Printed text recognition, Handwriting recogni...DH101 2013/2014 course 7 - OCR, Printed text recognition, Handwriting recogni...
DH101 2013/2014 course 7 - OCR, Printed text recognition, Handwriting recogni...Frederic Kaplan
 
DH101 2013/2014 course 6 - Semantic coding, RDF, CIDOC-CRM
DH101 2013/2014 course 6 - Semantic coding, RDF, CIDOC-CRMDH101 2013/2014 course 6 - Semantic coding, RDF, CIDOC-CRM
DH101 2013/2014 course 6 - Semantic coding, RDF, CIDOC-CRMFrederic Kaplan
 
DH101 2013/2014 course 5 - Project on Venice / Datafication / Regulated repre...
DH101 2013/2014 course 5 - Project on Venice / Datafication / Regulated repre...DH101 2013/2014 course 5 - Project on Venice / Datafication / Regulated repre...
DH101 2013/2014 course 5 - Project on Venice / Datafication / Regulated repre...Frederic Kaplan
 
DH101 2013/2014 course 4 - Digitization techniques 2D and 3D
DH101 2013/2014 course 4 - Digitization techniques 2D and 3D DH101 2013/2014 course 4 - Digitization techniques 2D and 3D
DH101 2013/2014 course 4 - Digitization techniques 2D and 3D Frederic Kaplan
 
3d scanning for digital heritage
3d scanning for digital heritage3d scanning for digital heritage
3d scanning for digital heritageFrederic Kaplan
 
Franziska Frey 2 / DHV13
Franziska Frey 2 / DHV13Franziska Frey 2 / DHV13
Franziska Frey 2 / DHV13Frederic Kaplan
 
Franziska Frey 1 / DHV13
Franziska Frey 1 / DHV13Franziska Frey 1 / DHV13
Franziska Frey 1 / DHV13Frederic Kaplan
 
Color and appearance information in 3d models
Color and appearance information in 3d modelsColor and appearance information in 3d models
Color and appearance information in 3d modelsFrederic Kaplan
 
Digital Humanities Venice Fall School: Introduction
Digital Humanities Venice Fall School: IntroductionDigital Humanities Venice Fall School: Introduction
Digital Humanities Venice Fall School: IntroductionFrederic Kaplan
 

Plus de Frederic Kaplan (20)

Les technologies absorbantes
Les technologies absorbantesLes technologies absorbantes
Les technologies absorbantes
 
La langue comme capital
La langue comme capitalLa langue comme capital
La langue comme capital
 
L'historien et l'algorithme : Présentation aux Entretiens du Nouveau Monde In...
L'historien et l'algorithme : Présentation aux Entretiens du Nouveau Monde In...L'historien et l'algorithme : Présentation aux Entretiens du Nouveau Monde In...
L'historien et l'algorithme : Présentation aux Entretiens du Nouveau Monde In...
 
DH101 2013/2014 course 10 - 3d printing, Javascript data visualization
DH101 2013/2014 course 10 - 3d printing, Javascript data visualization DH101 2013/2014 course 10 - 3d printing, Javascript data visualization
DH101 2013/2014 course 10 - 3d printing, Javascript data visualization
 
DH101 2013/2014 course 9 - Crowdsourcing, crowdfunding, Wikipedia, Open Stree...
DH101 2013/2014 course 9 - Crowdsourcing, crowdfunding, Wikipedia, Open Stree...DH101 2013/2014 course 9 - Crowdsourcing, crowdfunding, Wikipedia, Open Stree...
DH101 2013/2014 course 9 - Crowdsourcing, crowdfunding, Wikipedia, Open Stree...
 
DH101 2013/2014 course 8 - Historical Geographical Information Systems (HGIS)...
DH101 2013/2014 course 8 - Historical Geographical Information Systems (HGIS)...DH101 2013/2014 course 8 - Historical Geographical Information Systems (HGIS)...
DH101 2013/2014 course 8 - Historical Geographical Information Systems (HGIS)...
 
DH101 2013/2014 Projects
DH101 2013/2014 ProjectsDH101 2013/2014 Projects
DH101 2013/2014 Projects
 
DH101 2013/2014 course 7 - OCR, Printed text recognition, Handwriting recogni...
DH101 2013/2014 course 7 - OCR, Printed text recognition, Handwriting recogni...DH101 2013/2014 course 7 - OCR, Printed text recognition, Handwriting recogni...
DH101 2013/2014 course 7 - OCR, Printed text recognition, Handwriting recogni...
 
DH101 2013/2014 course 6 - Semantic coding, RDF, CIDOC-CRM
DH101 2013/2014 course 6 - Semantic coding, RDF, CIDOC-CRMDH101 2013/2014 course 6 - Semantic coding, RDF, CIDOC-CRM
DH101 2013/2014 course 6 - Semantic coding, RDF, CIDOC-CRM
 
DH101 2013/2014 course 5 - Project on Venice / Datafication / Regulated repre...
DH101 2013/2014 course 5 - Project on Venice / Datafication / Regulated repre...DH101 2013/2014 course 5 - Project on Venice / Datafication / Regulated repre...
DH101 2013/2014 course 5 - Project on Venice / Datafication / Regulated repre...
 
DH101 2013/2014 course 4 - Digitization techniques 2D and 3D
DH101 2013/2014 course 4 - Digitization techniques 2D and 3D DH101 2013/2014 course 4 - Digitization techniques 2D and 3D
DH101 2013/2014 course 4 - Digitization techniques 2D and 3D
 
3d scanning for digital heritage
3d scanning for digital heritage3d scanning for digital heritage
3d scanning for digital heritage
 
3d scanning pipeline
3d scanning pipeline3d scanning pipeline
3d scanning pipeline
 
Franziska Frey 2 / DHV13
Franziska Frey 2 / DHV13Franziska Frey 2 / DHV13
Franziska Frey 2 / DHV13
 
Franziska Frey 1 / DHV13
Franziska Frey 1 / DHV13Franziska Frey 1 / DHV13
Franziska Frey 1 / DHV13
 
3d scanning techniques
3d scanning techniques3d scanning techniques
3d scanning techniques
 
Color and appearance information in 3d models
Color and appearance information in 3d modelsColor and appearance information in 3d models
Color and appearance information in 3d models
 
3d from images
3d from images3d from images
3d from images
 
Pellegrini small
Pellegrini smallPellegrini small
Pellegrini small
 
Digital Humanities Venice Fall School: Introduction
Digital Humanities Venice Fall School: IntroductionDigital Humanities Venice Fall School: Introduction
Digital Humanities Venice Fall School: Introduction
 

Introduction au capitalisme linguistique

  • 1. Introduction au capitalisme linguistique Frédéric Kaplan frederic.kaplan@ep!.ch twitter: @frederickaplan
  • 2. ... et à la nouvelle créolisation Frédéric Kaplan frederic.kaplan@ep!.ch twitter: @frederickaplan
  • 3. i"yi i Ë f i|= :'=lz"t i ËË;te â ë iË , ËË.rËË i€ËâË .P . - - 7EÊ ËËËËË -.: ==.8=? -- o'a à3;: 9ll g ;âÈ u . Ë Ê Ë ig = xYAii ÎE .iiË s:;! F H u Ë Ë;-gE-r=EEi e iEgËËË 35ËËËËËËËËËEË r* *ËjËj1ËA êo iÉU . E IE6 s Ë É É s€! e!ZE ôr' ùËÊ E ; IËO F É gË:; l=i"ËË r âËi* a) - â:EiË +i€; i:=ËiË; ) F) Èil i eË Ë ËËËË r , i ËÉ = â ; " t 4 ; , î : â .-'rt I-ù Xù | | i çË Ë;ËË:: Ëgg9€ tsl a Ëi ÊËË | v EË ; h Ë ç F s rsl E €! €H p ='53 É : s r ç Ë2 F . i = â a ÈF.:Ë!Ë'Ë!sài *x;-uçgFE;i9 3 ^ a = ; . éo o - E5 : o ; iËsÉtâËr; >V? .S rr) fr p a $-..{ o o {ËâËiÈËÈ Ë Ë È ËE : s Ë q Ë ï s * 3 . 4Ë ! à Ëk É g s 3 ; ô E i l y E 5 6 3 EÉ 3 GE' ,:e.I i F a r1 t4 i-l FI a tnl z : i Ê a É Ë f ieÉ ÉEË E : il ; ;+E E 93Fg Ë Ê y âiÈ â+ Hb- .9: ;ÈâE i i ' : = - e t - z ( J '-.1 a C) 0, s È'l È .$ (n tl C) r-l 'IJ E I X 9 É {l =il ËËËËg E o tËiË F ;Ëî ËËË: .t{ ËË (- Ë t! z - o (- IL U È{ C) "l I d ,-{ { À : F-.1 rt) 'rê d c J : o z :zZz11;
  • 4. L’histoire de Google tient en deux algorithmes : l’un l’a rendu populaire, l’autre l’a rendu riche.
  • 5. 1 l’algorithme qui a rendu Google célèbre
  • 8. PageRank Une intuition sur ce qui fait la légitimité d’une source d’information et la nature pragmatique du lien hypertexte.
  • 9. PageRank La valeur PageRank d’une page est liée au nombre de pages qui la citent et à leur propre valeur PageRank.
  • 10. Le PageRank est la probabilité stationnaire d'une chaîne de Markov.
  • 11. Beaucoup de “start-ups” proposant une valeur d’usage mais pas de valeur d’échange ne résistèrent pas à l’éclatement de la “Bulle Internet”.
  • 12. Google a eu une meilleure idée que de simplement vendre de la publicité et a su transformer le capital linguistique qu’elle accumulait en un service créant de la valeur.
  • 13. 2 l’algorithme qui a rendu Google riche
  • 14. Un algorithme qui organise automatiquement la spéculation autour des mots a permis de créer le premier marché linguistique mondial.
  • 15. Le marché linguistique existait déjà avant Google. Il était possible depuis longtemps d’acheter certains mots (Trademarks) > cf. C.Fauré commentant Lombardo sur l’origine antique des Trademarks > http://www.christian-faure.net/2012/01/22/les-savoirs-de-lecriture-en-grece- ancienne-3-marchands-transactions-economiques-ecritures/
  • 16. L’algorithme de Google a élargi et en partie libéralisé ce marché.
  • 17. 1 4 2 5 3 6 7 8 9 10
  • 18. tous les mots peuvent donner lieu à des enchères ...
  • 19. L’algorithme classe automatiquement les annonces selon un calcul en quatre étapes.
  • 20. 1. Enchère sur un mot clé (E) Une entreprise choisit un mot ou une expression, par exemple “vacances” et le prix maximum qu’elle serait prête à payer en cas de clic. Google propose une estimation du montant de l’enchère à proposer pour avoir de bonnes chances d’être dans la première page des résultats proposés. Les acheteurs de mots peuvent aussi cibler leur publicité à des dates ou des lieux spéci"ques.
  • 21. 2. Calcul du score de qualité de la publicité (Q) Google donne un score à la publicité sur une échelle de un à dix. Ce score dépend essentiellement de la pertinence du texte de la publicité par rapport à la requête de l’utilisateur, de la qualité de la page vers laquelle la publicité pointe (qualité de son contenu et rapidité de chargement) et du nombre de clics moyen sur la publicité. En gros, ce score mesure à quel point la publicité “fonctionne”. C’est un point essentiel car Google ne gagne de l’argent que si les internautes choisissent e#ectivement de cliquer sur le lien proposé par la publicité. L’algorithme exact qui produit le score de qualité de la publicité reste secret et modi!able à loisir par Google.
  • 22. 3. Calcul du rang (R) Le Rang est l’Enchère multipliée par le Score. Une publicité ayant un bon score peut ainsi compenser une enchère plus faible et arriver devant. R=E*Q
  • 23. 4. Calcul du prix à payer en cas de clic (P) Le prix que paye une entreprise 1 si un internaute clique sur sa publicité n’est pas le prix de l’enchère mais le prix de l’enchère 2 juste en dessous de sa propre enchère modulé par la qualité relative entre cette deuxième enchère et celle de l’entreprise. Tout tient dans la formule : P1 = E2 * (Q2 / Q1) où P1 est le prix payé par l’entreprise, E2 est l’enchère la plus haute en dessous de l’enchère de l'entreprise 1, Q1 la qualité de l’enchère 1, Q2 la qualité de l’enchère 2.
  • 24. Ce jeu d’enchères est recalculé pour chaque requête de chaque utilisateur — des millions de fois par seconde
  • 25. Cet algorithme génère des dizaines de milliards de dollars par an. 10,584 milliards de dollars pour le seul quatrième trimestre 2011
  • 26. 40 milliards / an Quelques éléments de comparaison : Budget de Bibliothèque Nationale de France : 226 millions d’euros / an Chi#re d’a#aire de Renault en 2011 : 42 millions ...
  • 27. Le marché linguistique ainsi créé par Google est déjà global et multilingue. La “Bourse des mots” qui lui est associée donne une indication relativement juste des grands mouvements sémantiques mondiaux.
  • 28. ski or sun screen world cup
  • 29. Google a réussi à étendre le domaine du capitalisme à la langue elle-même, à organiser la vente de “mots” à l’échelle planétaire.
  • 30. L’ensemble de ses autres projets et innovations technologiques peuvent être analysés à travers ce prisme.
  • 31.
  • 32. Quand Google corrige à la volée un mot que vous avez mal orthographié, il ne fait pas que vous rendre service : il transforme un matériau sans valeur en une ressource économique directement rentable.
  • 33. Quand Google prolonge une phrase que vous avez commencée à taper dans la case de recherche, il vous ramène dans le domaine de la langue qu’il exploite, vous invite à emprunter le chemin statistique tracé par les autres internautes.
  • 34. Parfois la statistique l’emporte sur l’orthographe.
  • 35. Les technologies du capitalisme linguistique poussent à la régularisation de la langue. Plus nous ferons appel aux prothèses linguistiques, laissant les algorithmes corriger et prolonger nos propos, plus cette régularisation sera e$cace.
  • 36. Nous nous exprimons chaque jour un peu plus au travers d’une des interfaces de Google ; pas simplement lorsque nous faisons une recherche, mais aussi quand - nous écrivons un courrier électronique avec GMail - un article avec Google Docs - nous signalons une information sur le réseau social Google+, - et même oralement, à travers les interfaces de reconnaissance vocale que Google intègre à ses applications mobiles.
  • 37. Nous sommes déjà des millions chaque jour à écrire et à parler par le biais de Google. C’est pourquoi le modèle statistique multilingue que Google a$ne en permanence et vers lequel il tente de ramener chaque requête est bien plus à jour que le dictionnaire publié annuellement par nos académiciens.
  • 38. Google suit les mouvements de la langue minute par minute, car il a le premier découvert en elle un minerai d’une richesse extraordinaire, et s’est doté des moyens nécessaires pour l’exploiter.
  • 39. la langue vivante la langue statistique exploitable commercialement
  • 40. L’extension du domaine commercial de la langue est permise par deux dynamiques (1) La régularisation de la langue par la médiation des prothèses linguistiques (2) La multiplication et la banalisation des prothèses linguistiques
  • 41. La découverte de ce territoire du capitalisme jusqu’ici ignoré ouvre un nouveau champ de bataille économique. Google béné"cie certes d’une avance importante, mais des rivaux, ayant compris les règles de cette nouvelle compétition, "niront par se pro"ler.
  • 42. Nous quittons une économie de l’attention pour entrer dans une économie de l’expression. L’enjeu n’est plus tant de capter les regards, que d’être un médiateur de la parole et l’écrit. Les gagnants seront ceux qui auront pu développer des relations linguistiques intimes et durables avec un grand nombre d’utilisateurs, pour modéliser et in!échir la langue, créer un marché linguistique contrôlé et organiser la spéculation sur les mots.
  • 43. Une conséquence essentielle La langue va se transformer.
  • 45. Pas simplement en se régularisant ...
  • 46. Le “Flash Crash” du 6 mai 2010 a fait prendre conscience de l’omniprésence des algorithmes dans la "nance.
  • 47. Dès que les systèmes culturels proposent des fonctions précises à optimiser, les algorithmes deviennent des alternatives pertinentes à l’action humaine.
  • 48. Dès que le nombre d’actions décidées par des algorithmes devient signi"catif par rapport aux actions humaines, la forme des systèmes culturels changent profondément.
  • 49. Comme pour le domaine de la "nance, les algorithmes sont devenus des acteurs majeurs du capitalisme linguistique.
  • 50. Principe général Toute prothèse linguistique peut être utilisée par un “bot” plutôt qu’un humain.
  • 51. Il nous fait donc désormais distinguer deux types de ressources linguistiques: (a) les ressources primaires produites par des humains (conversations orales ou écrites, contenus de livres scannés, etc.) (b) les ressources secondaires produites par des machines en général à partir des ressources primaires (traduction automatique, articles écrits par des algorithmes, spam). 
  • 52. Malheureusement, sans connaître l’origine d’une production, il n’est souvent pas aisé de distinguer entre ressources primaires ou secondaires. Un humain peut dans certains cas faire la di#érence, mais il est di$cile de construire des algorithmes  pour faire automatiquement cette distinction.
  • 53. Les acteurs du capitalisme linguistique doivent modéliser la langue le plus parfaitement possible. C’est leur capital. Google voit les ressources secondaires comme un danger, une pollution pour ses modèles.
  • 54. La modi"cation de la syntaxe dans des chaînes de traduction automatique illustre un certain de type de pollution. “La qualité se dégrade petit à petit au fur et à mesure quand on applique des algorithmes de traduction automatique” “Quality degrades gradually as and when we measure applies algorithms to machine translation” “Calidad degrada gradualmente a medida y cuando la medida se aplica algoritmos de traducción automática” “Qualité se dégrade progressivement au fur et à mesure est appliquée algorithmes de traduction automatique”
  • 55. Un nombre croissant de textes sont maintenant directement produits par des machines Un lecteur averti peut souvent détecter la mécanique sous- jacente et deviner parfois que ces textes ne sont pas écrits par des humains. Leur composition syntaxique et surtout leur positionnement pragmatique sonnent parfois faux, re!étant les biais de l’algorithme qui les compose.
  • 56. Ces textes sont optimisés pour l’univers linguistique qu’ils investissent Le même contenu peut donner lieu à di#érentes formes : Articles longs ou courts, chroniques sportives, tweets, message vocal. Il peut être exprimé en optimisant son e$cacité pour les moteurs de recherche (SEO) : choix de mots particuliers, de tournures statistiques optimales. Comme en !nance, les algorithmes sont sans doute meilleurs que les hommes pour produire des stratégies optimales dans le milieu économique du capitalisme linguistique.
  • 57. Les algorithmes qui archivent inlassablement le web ne font pas facilement la di#érence entre ces ressources linguistiques dégradées et les ressources primaires. Au fur et à mesure que la quantité de ressources secondaires devient signi"cative par rapport aux ressources primaires, les modèles statistiques peuvent se modi"er pour intégrer le vocabulaire, les formulations et les tournures des algorithmes.
  • 58. Ce sont ces tournures qui risquent de nous être proposées sous la forme de suggestions ou de corrections. 
  • 59. Pour lutter contre cette “pollution” croissante, Google a modi"é en 2011 son service Google Translate. Google a remplacé son service créateur de ressources secondaires en un service de traduction “on demand” qui garde toujours le texte original de la traduction, pour s’en servir pour la recherche et pour potentiellement améliorer progressivement la traduction proposée au fur et à mesure que les algorithmes de traduction progressent.  cf. Kirti Vashee / Analysis of the Shutdown Announcements of the Google Translate API
  • 60. Cela ne su$ra pas. Il faut maintenant compter avec l’écriture des machines et tous les hybrides de ce nouvel ordre linguistique.
  • 61. Sur les 30 meilleurs éditeurs de Wikipedia, les 2/3 sont des bots > R.Stuart Geiger, “The Lives of Bots.” in Wikipedia: A Critical Point of View. 2011 > http://en.wikipedia.org/wiki/Wikipedia:List_of_Wikipedians_by_number_of_recent_edits
  • 62. D’ici deux ans, une proportion signi"cative des messages sur les réseaux sociaux seront peut-être produits par des bots. > Hwang, Pearce and Nanis (2012) Socialbots: voices from the fronts interactions Volume 19 Issue 2, March + April 2012
  • 63. Ainsi, textes humains et algorithmiques se mêlent pour proposer une nouvelle forme d’écriture. Et c’est cette nouvelle écriture que d’autres algorithmes analysent pour ensuite structurer nos propres productions linguistiques.
  • 64. Avec le capitalisme linguistique, la langue elle- même se transforme pour intégrer les biais linguistiques des machines et les contraintes de l’économie linguistique planétaire.
  • 65. Nous assistons peut-être une nouvelle phase de “grammatisation” de la langue, une nouvelle rétroaction de la technologie et de l’économie sur la langue naturelle.
  • 66. Dans un temps intermédiaire apparait quelque chose comme une lingua franca, un pidgin ou un créole, dont la syntaxe et le vocabulaire sont liés aux capacités linguistiques des machines et aux valeurs marchandes des mots.
  • 67. C’est ce phénomène inédit que j’appelle la nouvelle créolisation.