Gestion linguistique dans Wikip´dia
                               e

             Julien Fayolle

          Wikim´dia France
               e
       julien.fayolle@wikimedia.fr
         http://www.wikimedia.fr
Wikip´dia
     e
   « Encyclop´die ;
             e
   « Ouverte ` tous, ´crite collaborativement (Web 2.0) ;
             a       e

   « Neutralit´ de point de vue ;
              e
   « Licence libre.


  Á Participation de tout le monde ` la cr´ation d’un corpus ency-
                                     a      e
  clop´dique (quasiment tout le monde sait quelque chose).
      e
  Á Tout le monde est le relecteur de l’autre.
  Á Processus continu de correction, de remise en cause, d’ajustement
  et de pr´sentation du savoir.
          e



  mars 2009 : 14 M de visiteurs uniques, 9e site en France
  (m´diam´trie).
    e    e
Acteurs


     Wikimedia Foundation, Inc.
     (WMF)
       © h´berge les sites, pas
            e
     ´diteur.
     e

     Wikip´dia et ses
           e
     contributeurs b´n´voles ;
                    e e
       © mod´ration a
                e
     posteriori ;
       © auto-gestion.

     Wikim´dia France.
           e
       © promotion des projets,
     connaissance libre.
Multilinguisme


  ª Disponible en 266 langues.
  ª Degr´s divers de maturit´ (nombre de locuteurs, date de
          e                 e
  cr´ation).
    e
      en : 2 889 962 ;
      de : 907 851 ;
      fr : 807 347, ;
      ja : 588 518 ;
      es : 475 384 ;
      zh : 254 123 ;
      ar : 99 662 ;
      lg (ganda, luganda) : 33.
Versions linguistiques
Acc`s aux versions linguistiques
   e

  ¬ soit www.wikipedia.org, sans langue pr´d´finie
                                          e e

  ¬ soit les versions linguistiques xx.wikipedia.org

  ¬ xx est le code ISO-639 de la langue.

  ¬ Sur chaque article : liens interwiki : permettent de passer `
                                                                a
  l’article « ´quivalent » sur une autre version linguistique.
              e


  Pas de d´termination automatique de la langue.
            e
  Flexibilit´, mais il faut connaˆ le code langue (port´e mondiale,
            e                    ıtre                  e
  pas uniquement langues dominantes).


  Langue du contenu et de l’interface a priori diff´rentes. La langue
                                                       e
  de l’interface (logiciel) est sp´cifi´e par l’utilisateur.
                                  e e
Cr´ation de version linguistique
  e

    1   pt et pt-br (br´silien) ;
                       e
    2   sib´rien (ru-sib) ;
           e
    3   klingon (tlh) ;
    4   lobjan (jbo), esperanto (eo), volap¨k (vo), interlingua (ia, ie) ;
                                           u
    5   latin (la) ;
    6   Conditions : avoir une communaut´ potentielle suffisante
                                        e
        (3-5 personnes) ;
    7   Coordination et d´cision de cr´ation d’une Wikip´dia sur
                           e             e                 e
        meta, (plateforme d’organisation meta-linguistique, pas
        seulement les questions linguistiques) ;
    8   L’ouverture technique d’une version (la cr´ation d’une url,
                                                  e
        base MySQL, MediaWiki) est faite par un technicien de la
        WMF.
Version linguistiques


      D´bats politiques et linguistiques sur moldave/roumain,
        e
      serbe (sr)/croate (hr)/serbo-croate (sh)/mac´donien (mk).
                                                     e
      Arabe litt´ral (ar), masri (arz), shami (levantin), khalidji,
                 e
      furati (Iraq), darija (Maghreb) ;
      Variantes d’alphabet :
      © sr : ћирилица et latinica ;
      © ku : latˆ ı et erebˆ ;
                ınˆ        ı
      © zh-sg, zh-hk, zh-cn, zh-tw, zh-hans, zh-hant ;
      © az : articles en alphabet latin, interface en latin + arabe ;
      Simple English (simple). Texto ? Fran¸ais facile ?
                                           c
      Risque de morcellement : utilit´ de l’alsacien (als), du breton
                                     e
      (br), du walon (wa), du haut-normand (nrm), arpitan
      (francoproven¸al, frp), flamand occidental (vls).
                    c
Cr´ation de contenu
  e


  Les versions linguistiques sont ind´pendantes les unes des autres.
                                      e
  Il n’y a pas de traduction automatique d`s que des ajouts sont
                                            e
  effectu´s sur une version. Les articles sont cr´´s dans des versions `
          e                                     ee                     a
  des dates et avec des contenus a priori diff´rents, selon l’int´rˆt des
                                              e                 ee
  contributeurs de la version linguistique.

  Les b´n´voles ont d´fini plusieurs strat´gies lors de la cr´ation d’un
        e e            e                   e                e
  article : traduction d’un article pr´existant dans une autre version
                                      e
  linguistique, cr´ation ex nihilo, m´lange des deux : difficile de
                  e                   e
  faire une traduction exacte quand on connaˆ le sujet, plus facile de
                                               ıt
  se servir du plan d’un article d´j` ´crit.
                                  eae

  Hi´rarchie de wikip´dias (pour la traduction) : anglais, langues
    e                e
  mondiales (langues de diffusion), langues r´gionales (pas langue
                                             e
  maternelle ou de diffusion), versions symboliques.
Traduction
   ½ Centralisation des bonnes pratiques, demande d’aide, de
     relecture de traduction (sur chaque grosse version
     linguistique).
      http://fr.wikipedia.org/wiki/Projet:Traduction

   ½ Organisation : comment signaler une demande de traduction,
     une traduction en cours, une demande de relecture, ´valuation
                                                          e
     de la qualit´ de la relecture, comment cr´diter une traduction
                 e                            e
     (droit d’auteur).

   ½ Contributeurs int´ress´s par organiser la th´matique, d’autres
                       e    e                     e
     par suivre le processus, d’autres font leurs traductions sans
     passer par ces ´tapes.
                     e

   ½ Les contributeurs identifient les langues qu’ils peuvent
     traduire ou vers lesquelles ils peuvent traduire.

  Traduction automatique : Google Translator Toolkit. Outil tr`s
                                                              e
  int´ressant. Est-ce que ¸a sera utilis´ par la communaut´ ?
     e                    c             e                 e
Travail collaboratif


  ¶ Traduire en « plusieurs couches » :
      ª traduction grossi`re (mot ` mot, pas de recul ou de
                         e        a
  connaissance sp´cifique du traducteur, m´connaissance des termes
                 e                       e
  techniques ou du domaine),
      ª raffinements successifs.
      ª La source originale n’est qu’` un clic via les liens interwikis.
                                     a

  ¶ Coordination centralis´e ou non (i.e., entre individus :
                          e
  communaut´ d’utilisateurs).
            e

  ¶ Parfois plus facile d’am´liorer une traduction incr´mentalement,
                            e                          e
  parfois il faut recommencer tout le paragraphe.
Place du fran¸ais
             c



  http://fr.wikipedia.org

   ´ Rencontre des francophones (France, Belgique, Suisse,
     Qu´bec, Afrique, expatri´s) ;
       e                     e

   ´ Chicon/endive (pol´mique de nommage) ;
                       e

   ´ Pas de demande de s´cession, pas de grosse tension ;
                        e

   ´ 3e encyclop´die par le nombre d’article.
                e
Commons


  È Probl´matique historique : redondance des m´dias (photos,
          e                                       e
    cartes, sch´mas, vid´os, sons tous sous licence libre) ;
               e        e

  È commons.wikimedia.org centralise ces m´dias (h´berg´ par
                                          e       e    e
    WMF) ;

  È Plus de 4 millions de documents (2009).

  È Un seul site, une seule URL, mais utilisateurs de langues
    diff´rentes.
       e

  È L’utilisateur sp´cifie sa langue (param`tre). Par d´faut,
                    e                     e           e
    anglais.
Translatewiki


  Le logiciel derri`re Wikip´dia s’appelle MediaWiki (CMS sous
                   e        e
  licence libre).

  Il est possible d’avoir l’interface en polonais sur la wikip´dia en
                                                              e
  fran¸ais. Mais seulement l’interface, le contenu reste en fran¸ais.
       c                                                          c

  L’ouverture d’une version linguistique est li´e ` l’adaptation des
                                               e a
  messages du logiciel par les utilisateurs et par cons´quent `
                                                       e       a
  internationaliser MediaWiki.

  Le site translatewiki.net centralise l’internationalisation du
  logiciel.

  D´veloppement de MediaWiki ”en anglais”, commentaire en
   e
  anglais. Communaut´ sur mediawiki.org.
                    e

Fdi

  • 1.
    Gestion linguistique dansWikip´dia e Julien Fayolle Wikim´dia France e julien.fayolle@wikimedia.fr http://www.wikimedia.fr
  • 2.
    Wikip´dia e « Encyclop´die ; e « Ouverte ` tous, ´crite collaborativement (Web 2.0) ; a e « Neutralit´ de point de vue ; e « Licence libre. Á Participation de tout le monde ` la cr´ation d’un corpus ency- a e clop´dique (quasiment tout le monde sait quelque chose). e Á Tout le monde est le relecteur de l’autre. Á Processus continu de correction, de remise en cause, d’ajustement et de pr´sentation du savoir. e mars 2009 : 14 M de visiteurs uniques, 9e site en France (m´diam´trie). e e
  • 3.
    Acteurs Wikimedia Foundation, Inc. (WMF) © h´berge les sites, pas e ´diteur. e Wikip´dia et ses e contributeurs b´n´voles ; e e © mod´ration a e posteriori ; © auto-gestion. Wikim´dia France. e © promotion des projets, connaissance libre.
  • 4.
    Multilinguisme ªDisponible en 266 langues. ª Degr´s divers de maturit´ (nombre de locuteurs, date de e e cr´ation). e en : 2 889 962 ; de : 907 851 ; fr : 807 347, ; ja : 588 518 ; es : 475 384 ; zh : 254 123 ; ar : 99 662 ; lg (ganda, luganda) : 33.
  • 5.
  • 6.
    Acc`s aux versionslinguistiques e ¬ soit www.wikipedia.org, sans langue pr´d´finie e e ¬ soit les versions linguistiques xx.wikipedia.org ¬ xx est le code ISO-639 de la langue. ¬ Sur chaque article : liens interwiki : permettent de passer ` a l’article « ´quivalent » sur une autre version linguistique. e Pas de d´termination automatique de la langue. e Flexibilit´, mais il faut connaˆ le code langue (port´e mondiale, e ıtre e pas uniquement langues dominantes). Langue du contenu et de l’interface a priori diff´rentes. La langue e de l’interface (logiciel) est sp´cifi´e par l’utilisateur. e e
  • 7.
    Cr´ation de versionlinguistique e 1 pt et pt-br (br´silien) ; e 2 sib´rien (ru-sib) ; e 3 klingon (tlh) ; 4 lobjan (jbo), esperanto (eo), volap¨k (vo), interlingua (ia, ie) ; u 5 latin (la) ; 6 Conditions : avoir une communaut´ potentielle suffisante e (3-5 personnes) ; 7 Coordination et d´cision de cr´ation d’une Wikip´dia sur e e e meta, (plateforme d’organisation meta-linguistique, pas seulement les questions linguistiques) ; 8 L’ouverture technique d’une version (la cr´ation d’une url, e base MySQL, MediaWiki) est faite par un technicien de la WMF.
  • 8.
    Version linguistiques D´bats politiques et linguistiques sur moldave/roumain, e serbe (sr)/croate (hr)/serbo-croate (sh)/mac´donien (mk). e Arabe litt´ral (ar), masri (arz), shami (levantin), khalidji, e furati (Iraq), darija (Maghreb) ; Variantes d’alphabet : © sr : ћирилица et latinica ; © ku : latˆ ı et erebˆ ; ınˆ ı © zh-sg, zh-hk, zh-cn, zh-tw, zh-hans, zh-hant ; © az : articles en alphabet latin, interface en latin + arabe ; Simple English (simple). Texto ? Fran¸ais facile ? c Risque de morcellement : utilit´ de l’alsacien (als), du breton e (br), du walon (wa), du haut-normand (nrm), arpitan (francoproven¸al, frp), flamand occidental (vls). c
  • 9.
    Cr´ation de contenu e Les versions linguistiques sont ind´pendantes les unes des autres. e Il n’y a pas de traduction automatique d`s que des ajouts sont e effectu´s sur une version. Les articles sont cr´´s dans des versions ` e ee a des dates et avec des contenus a priori diff´rents, selon l’int´rˆt des e ee contributeurs de la version linguistique. Les b´n´voles ont d´fini plusieurs strat´gies lors de la cr´ation d’un e e e e e article : traduction d’un article pr´existant dans une autre version e linguistique, cr´ation ex nihilo, m´lange des deux : difficile de e e faire une traduction exacte quand on connaˆ le sujet, plus facile de ıt se servir du plan d’un article d´j` ´crit. eae Hi´rarchie de wikip´dias (pour la traduction) : anglais, langues e e mondiales (langues de diffusion), langues r´gionales (pas langue e maternelle ou de diffusion), versions symboliques.
  • 10.
    Traduction ½ Centralisation des bonnes pratiques, demande d’aide, de relecture de traduction (sur chaque grosse version linguistique). http://fr.wikipedia.org/wiki/Projet:Traduction ½ Organisation : comment signaler une demande de traduction, une traduction en cours, une demande de relecture, ´valuation e de la qualit´ de la relecture, comment cr´diter une traduction e e (droit d’auteur). ½ Contributeurs int´ress´s par organiser la th´matique, d’autres e e e par suivre le processus, d’autres font leurs traductions sans passer par ces ´tapes. e ½ Les contributeurs identifient les langues qu’ils peuvent traduire ou vers lesquelles ils peuvent traduire. Traduction automatique : Google Translator Toolkit. Outil tr`s e int´ressant. Est-ce que ¸a sera utilis´ par la communaut´ ? e c e e
  • 11.
    Travail collaboratif ¶ Traduire en « plusieurs couches » : ª traduction grossi`re (mot ` mot, pas de recul ou de e a connaissance sp´cifique du traducteur, m´connaissance des termes e e techniques ou du domaine), ª raffinements successifs. ª La source originale n’est qu’` un clic via les liens interwikis. a ¶ Coordination centralis´e ou non (i.e., entre individus : e communaut´ d’utilisateurs). e ¶ Parfois plus facile d’am´liorer une traduction incr´mentalement, e e parfois il faut recommencer tout le paragraphe.
  • 12.
    Place du fran¸ais c http://fr.wikipedia.org ´ Rencontre des francophones (France, Belgique, Suisse, Qu´bec, Afrique, expatri´s) ; e e ´ Chicon/endive (pol´mique de nommage) ; e ´ Pas de demande de s´cession, pas de grosse tension ; e ´ 3e encyclop´die par le nombre d’article. e
  • 13.
    Commons ÈProbl´matique historique : redondance des m´dias (photos, e e cartes, sch´mas, vid´os, sons tous sous licence libre) ; e e È commons.wikimedia.org centralise ces m´dias (h´berg´ par e e e WMF) ; È Plus de 4 millions de documents (2009). È Un seul site, une seule URL, mais utilisateurs de langues diff´rentes. e È L’utilisateur sp´cifie sa langue (param`tre). Par d´faut, e e e anglais.
  • 14.
    Translatewiki Lelogiciel derri`re Wikip´dia s’appelle MediaWiki (CMS sous e e licence libre). Il est possible d’avoir l’interface en polonais sur la wikip´dia en e fran¸ais. Mais seulement l’interface, le contenu reste en fran¸ais. c c L’ouverture d’une version linguistique est li´e ` l’adaptation des e a messages du logiciel par les utilisateurs et par cons´quent ` e a internationaliser MediaWiki. Le site translatewiki.net centralise l’internationalisation du logiciel. D´veloppement de MediaWiki ”en anglais”, commentaire en e anglais. Communaut´ sur mediawiki.org. e