SlideShare une entreprise Scribd logo
1  sur  56
Télécharger pour lire hors ligne
JADT 2010 - 11/06/2010
                  Rome


Utilisation de la visualisation
       en nuage arboré
   pour l'analyse littéraire
               Delphine Amstutz
  (CELLF – Université Paris-Sorbonne Paris 4 / CNRS)
               Philippe Gambette
      (LIRMM – Université Montpellier 2 / CNRS)
Plan

• Le nuage arboré : occurrence + cooccurrence
• Des couleurs pour guider la lecture
• Processus de construction
• Implémentations
• Emplois du nuage arboré
• Illustration sur Cinna et Othon
• Perspectives
Plan

• Le nuage arboré : occurrence + cooccurrence
• Des couleurs pour guider la lecture
• Processus de construction
• Implémentations
• Emplois du nuage arboré
• Illustration sur Cinna et Othon
• Perspectives
Nuage arboré, une information double




 hiérarchie
 des mots
 occurrences

                                                  hiérarchie
                                               des concepts
                     cooccurrences

                                SplitsTree : Huson 1998,
construit avec                     Huson & Bryant 2006
                         TreeCloud en Python, license GPL
                       disponible sur http://www.treecloud.fr
Nuages de tags

• Construits depuis un ensemble de tags
• Taille de police liée à la fréquence




                                         Ce qui est habituellement cité comme
                                              le premier nuage de tags, dans
                                                   Microserfs de D. Coupland,
                                                 HarperCollins, Toronto, 1995
Nuages de mots

• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle
• Donnent un bon aperçu d'un texte




                                                                  Nuages Wordle des mots les plus utilisés
                                                                   début 2009 dans les blogs des Top 100
                                                                            politique et high-tech de Wikio
                                     http://aixtal.blogspot.com/2009/04/web-de-quoi-parlent-les-blogs.html

         Extrait d'un nuage des mots des titres
          des 800 articles présentés à ce jour
                          aux conférences JADT
http://www.ledonline.it/ledonline/jadt-2010.html
Extraire l'information sémantique d'un texte
• analyse arborée                       Brunet (Hyperbase)
• graphe de coocurrence                 Brunet (Hyperbase)
• graphe sémantique                Grimmer (Wordmapper)
• lexicogramme récursif                     Martinez (Coocs)
• désambiguïsation lexicale               Véronis (Hyperlex)
• réseau Phrasenet            Viegas et al. (IBM Many Eyes)
• projection géodésique                      Viprey (Astartex)
Extraire l'information sémantique d'un texte
• analyse arborée                       Brunet (Hyperbase)
• graphe de coocurrence                 Brunet (Hyperbase)
• graphe sémantique                Grimmer (Wordmapper)
• lexicogramme récursif                     Martinez (Coocs)
• désambiguïsation lexicale               Véronis (Hyperlex)
• réseau Phrasenet            Viegas et al. (IBM Many Eyes)
• projection géodésique                      Viprey (Astartex)




                                    Brunet, Les séquences (suite),
                                                        JADT'08
Extraire l'information sémantique d'un texte
• analyse arborée                       Brunet (Hyperbase)
• graphe de coocurrence                 Brunet (Hyperbase)
• graphe sémantique                Grimmer (Wordmapper)
• lexicogramme récursif                     Martinez (Coocs)
• désambiguïsation lexicale               Véronis (Hyperlex)
• réseau Phrasenet            Viegas et al. (IBM Many Eyes)
• projection géodésique                      Viprey (Astartex)




                                    Mayaffre, Quand travail, famille,
                                      et patrie cooccurrent dans le
                                                discours de Nicolas
                                                  Sarkozy, JADT'08
Extraire l'information sémantique d'un texte
• analyse arborée                       Brunet (Hyperbase)
• graphe de coocurrence                 Brunet (Hyperbase)
• graphe sémantique                Grimmer (Wordmapper)
• lexicogramme récursif                     Martinez (Coocs)
• désambiguïsation lexicale               Véronis (Hyperlex)
• réseau Phrasenet            Viegas et al. (IBM Many Eyes)
• projection géodésique                      Viprey (Astartex)




                                                   Peyrat-Guillard,
                                             Analyse du discours
                                          syndical sur l’entreprise,
                                                           JADT'08
Extraire l'information sémantique d'un texte
• analyse arborée                       Brunet (Hyperbase)
• graphe de coocurrence                 Brunet (Hyperbase)
• graphe sémantique                Grimmer (Wordmapper)
• lexicogramme récursif                     Martinez (Coocs)
• désambiguïsation lexicale               Véronis (Hyperlex)
• réseau Phrasenet            Viegas et al. (IBM Many Eyes)
• projection géodésique                      Viprey (Astartex)




                                                Leblanc, Martinez
                                         L'analyse contrastive des
                                         réseaux de cooccurrence
                                                      JADT 2006.
Extraire l'information sémantique d'un texte
• analyse arborée                       Brunet (Hyperbase)
• graphe de coocurrence                 Brunet (Hyperbase)
• graphe sémantique                Grimmer (Wordmapper)
• lexicogramme récursif                     Martinez (Coocs)
• désambiguïsation lexicale               Véronis (Hyperlex)
• réseau Phrasenet            Viegas et al. (IBM Many Eyes)
• projection géodésique                      Viprey (Astartex)




                                         Désambiguïsation du mot
                                                       “barrage”.

                                                Véronis, HyperLex:
                                            Lexical Cartography for
                                        Information Retrieval, 2004
Extraire l'information sémantique d'un texte
• analyse arborée                                                    Brunet (Hyperbase)
• graphe de coocurrence                                              Brunet (Hyperbase)
• graphe sémantique                                             Grimmer (Wordmapper)
• lexicogramme récursif                                                  Martinez (Coocs)
• désambiguïsation lexicale                                            Véronis (Hyperlex)
• réseau Phrasenet                                         Viegas et al. (IBM Many Eyes)
• projection géodésique                                                   Viprey (Astartex)




                                                                      Visualisation PhraseNet de
                                                                              paroles des Beatles
                                                                      créé avec Many Eyes (IBM)
                                                                            http://many-eyes.com




http://visualthinkmap.ning.com/photo/phrasenet_beatles-many-eyes
Extraire l'information sémantique d'un texte
• analyse arborée                       Brunet (Hyperbase)
• graphe de coocurrence                 Brunet (Hyperbase)
• graphe sémantique                Grimmer (Wordmapper)
• lexicogramme récursif                     Martinez (Coocs)
• désambiguïsation lexicale               Véronis (Hyperlex)
• réseau Phrasenet            Viegas et al. (IBM Many Eyes)
• projection géodésique                      Viprey (Astartex)




                                                      Barry, Viprey,
                                            Approche comparative
                                         des résultats d'exploration
                                             textuelle des discours
                                          de deux leaders africains
                                                     Keita et Touré,
                                                           JADT'08
Plan

• Le nuage arboré : occurrence + cooccurrence
• Des couleurs pour guider la lecture
• Processus de construction
• Implémentations
• Emplois du nuage arboré
• Illustration sur Cinna et Othon
• Perspectives
Des couleurs pour guider la lecture

• coloration selon les fréquences

• coloration chronologique

• coloration de la dispersion

• coloration ciblée sur un mot

• coloration grammaticale
Des couleurs pour guider la lecture

• coloration selon les fréquences

• coloration chronologique

• coloration de la dispersion

• coloration ciblée sur un mot

• coloration grammaticale


       Nuage arboré des mots
        apparaissant 5 fois ou
          plus dans cet article
       JADT, distance Liddell,
          fenêtre de 20 mots,
             coloration Yahoo
Des couleurs pour guider la lecture
                                    rouge :
                                    début de l'article
• coloration selon les fréquences   bleu :
                                    fin de l'article
• coloration chronologique

• coloration de la dispersion

• coloration ciblée sur un mot

• coloration grammaticale


       Nuage arboré des mots
        apparaissant 5 fois ou
           plus dans cet article
       JADT, distance Liddell,
           fenêtre de 20 mots,
      coloration chronologique
Des couleurs pour guider la lecture
                                      rouge :
                                      peu dispersé
• coloration selon les fréquences     bleu :
                                      dispersé
• coloration chronologique

• coloration de la dispersion

• coloration ciblée sur un mot

• coloration grammaticale


       Nuage arboré des mots
        apparaissant 5 fois ou
          plus dans cet article
       JADT, distance Liddell,
          fenêtre de 20 mots,
         coloration dispersion
Des couleurs pour guider la lecture
                                    rouge :
                                    cooccurrents de
• coloration selon les fréquences   “cooccurrence”

• coloration chronologique

• coloration de la dispersion

• coloration ciblée sur un mot

• coloration grammaticale


       Nuage arboré des mots
         apparaissant 5 fois ou
           plus dans cet article
       JADT, distance Liddell,
            fenêtre de 20 mots,
           coloration ciblée sur
        le mot “cooccurrence”
Des couleurs pour guider la lecture
                                      noms
                                      adjectifs
• coloration selon les fréquences     verbes
                                      noms propres
• coloration chronologique

• coloration de la dispersion

• coloration ciblée sur un mot

• coloration grammaticale


         Nuage arboré des mots
           apparaissant 5 fois ou
              plus dans cet article
          JADT, distance Liddell,
              fenêtre de 20 mots,
coloration personnalisée, à partir
     d'un étiquetage TreeTagger
Plan

• Le nuage arboré : occurrence + cooccurrence
• Des couleurs pour guider la lecture
• Processus de construction
• Implémentations
• Emplois du nuage arboré
• Illustration sur Cinna et Othon
• Perspectives
Processus de construction
       Import/export
       Concordance d'un mot, lemmatisation
                ou remplacements divers...           Texte


                                       Suppression des mots vides


                                               Sélection des mots


                                      Recherche des cooccurrences


                                        Calcul des cooccurrences


                                             Construction de l'arbre


                                                Tailles des mots


                                               Couleurs des mots


                                         Dessin du nuage arboré
Processus de construction
       Import/export                                                   Proposé dans TreeCloud
       Concordance d'un mot, lemmatisation
                ou remplacements divers...           Texte


                                       Suppression des mots vides      antidico anglais, français


                                                                       n mots les plus fréquents, mots
           Mots significatifs                  Sélection des mots      apparaissant plus de n fois, ou
                                                                       liste personnalisée

                                                                       Fenêtre de cooccurrence paramétrée
                 Liste de mots        Recherche des cooccurrences      par taille et pas de glissement, ou
                 et occurrences                                        caractère séparateur


                  Matrice CSV           Calcul des cooccurrences       12 formules de cooccurrence



        Méthodes UPGMA, NJ                   Construction de l'arbre   Appel transparent à SplitsTree



                                                Tailles des mots       Fréquences ou valeurs personnalisées

           Mots significatifs
                                                                       Fréquences, chronologie, dispersion,
                                               Couleurs des mots       ciblées sur la cooccurrence d'un
                                                                       mot, ou valeurs personnalisées


        Export à divers formats          Dessin du nuage arboré        Appel à SplitsTree ou Dendroscope
Construction – les cooccurrences
De nombreuses formules de distance sémantique utilisent la
cooccurrence.
 Texte
 fenêtre
 glissante S Pas de
             glissement s
 largeur w

 matrices de cooccurrence                matrice de dissimilarité
 O11, O12, O21, O22                      sémantique
                                         chi squared, mutual
                                         information, liddel, dice,
                                         jaccard, gmean, hyperlex,
                                         minimum sensitivity, odds
                                         ratio, zscore, log likelihood,
                                         poisson-stirling...

                            Evert, Statistics of words cooccurrences, thèse, 2005
                                     Gambette, User manual for TreeCloud, 2009
Plan

• Le nuage arboré : occurrence + cooccurrence
• Des couleurs pour guider la lecture
• Processus de construction
• Implémentations
• Emplois du nuage arboré
• Illustration sur Cinna et Othon
• Perspectives
Implémentations
Logiciel libre TreeCloud (Python/Delphi) + SplitsTree (Java)




 www.treecloud.org                    www.splitstree.org
Implémentations
Logiciel libre TreeCloud (Python/Delphi) + SplitsTree (Java)
Interface web
                 www.treecloud.org
                Interface basée sur le logiciel
                libre NuageArboré de Jean-
                Charles Bontemps, en C,
                CGI/Python, et JavaScript.

                http://sourceforge.net/projects/
                nuagearbor/
Interface web
                www.treecloud.org
Plan

• Le nuage arboré : occurrence + cooccurrence
• Des couleurs pour guider la lecture
• Processus de construction
• Implémentations
• Emplois du nuage arboré
• Illustration sur Cinna et Othon
• Perspectives
Emplois du nuage arboré

 • susciter, formaliser et étayer des hypothèses de travail

 • comparer des textes selon leur représentation arborée

 • hiérarchiser l'utilisation d'autres outils textométriques

 • représenter les résultats de l'analyse
Plan

• Le nuage arboré : occurrence + cooccurrence
• Des couleurs pour guider la lecture
• Processus de construction
• Implémentations
• Emplois du nuage arboré
• Illustration sur Cinna et Othon
• Perspectives
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




    Spécificités d'emploi de
    « Rome », « liberté » et
         « empire » chez les
 différents personnages de
        Cinna dans Lexico3.
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




 Nuage arboré des 50 mots les plus fréquents des paroles d'Auguste dans Cinna
Illustration sur Cinna et Othon




 Nuage arboré des 50 mots les plus fréquents des paroles d'Auguste dans Cinna
Illustration sur Cinna et Othon




 Carte des sections Lexico3 et contextes de « amis » dans les paroles d'Auguste
 dans Cinna.
 1. Voilà, mes chers amis, ce qui me met en peine.
 2. Quoi ! mes plus chers amis ! quoi ! Cinna ! quoi ! Maxime !
 3. Reprenez le pouvoir que vous m'avez commis, Si donnant des sujets il ôte les amis
 4. Soyons amis, Cinna, c'est moi qui t'en convie
 5. Il nous a trahis tous ; mais ce qu'il a commis Vous conserve innocents, et me rend mes amis.
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




Nuage arboré des 30 mots les plus fréquents de la pièce Othon, coloré à gauche
par rapport aux cooccurrences avec « Othon », à droite par rapport à celles avec
« Galba »
Illustration sur Cinna et Othon




Nuage arboré des 30 mots les plus fréquents de la pièce Othon, coloré à gauche
par rapport aux cooccurrences avec « Othon », à droite par rapport à celles avec
« Galba »
Illustration sur Cinna et Othon




Nuage arboré des 30 mots les plus fréquents de la pièce Othon, coloré à gauche
par rapport aux cooccurrences avec « Othon », à droite par rapport à celles avec
« Galba »
Illustration sur Cinna et Othon




Nuages arborés des mots spécifiques de Cinna et Othon, dimensionnés et colorés
d'après leur spécificité calculée dans Lexico3.
Illustration sur Cinna et Othon




mots spécifiques de
Cinna et Othon d'après
Lexico3
                                      Cinna                Othon
Lieu du pouvoir et objet de la        Rome (« liberté »)   Empire (« trône »)
confrontation entre les personnages
Souverain en place                    tyran                Empereur
Membres du corps politique            amis                 maîtres / seigneurs

Moyens au service de la cause         gloire               amour matrimonial (« amour »,
politique                                                  « hymen », « choix »)
Caractérisation de la pièce           Pièce de FONDATION   Pièce de SUCCESSION DYNASTIQUE
Illustration sur Cinna et Othon




mots spécifiques de
Cinna et Othon d'après
Lexico3
                                      Cinna                Othon
Lieu du pouvoir et objet de la        Rome (« liberté »)   Empire (« trône »)
confrontation entre les personnages
Souverain en place                    tyran                Empereur
Membres du corps politique            amis                 maîtres / seigneurs

Moyens au service de la cause         gloire               amour matrimonial (« amour »,
politique                                                  « hymen », « choix »)
Caractérisation de la pièce           Pièce de FONDATION   Pièce de SUCCESSION DYNASTIQUE
Illustration sur Cinna et Othon




mots spécifiques de
Cinna et Othon d'après
Lexico3
                                      Cinna                Othon
Lieu du pouvoir et objet de la        Rome (« liberté »)   Empire (« trône »)
confrontation entre les personnages
Souverain en place                    tyran                Empereur
Membres du corps politique            amis                 maîtres / seigneurs

Moyens au service de la cause         gloire               amour matrimonial (« amour »,
politique                                                  « hymen », « choix »)
Caractérisation de la pièce           Pièce de FONDATION   Pièce de SUCCESSION DYNASTIQUE
Plan

• Le nuage arboré : occurrence + cooccurrence
• Des couleurs pour guider la lecture
• Processus de construction
• Implémentations
• Emplois du nuage arboré
• Illustration sur Cinna et Othon
• Perspectives
Perspectives

 • intégration de la visualisation en nuages arborés
     • dans les outils de textométrie existants
     • par des interfaces d'import/export adaptées
     • pour faciliter le retour au texte

 • amélioration des méthodes de construction
    • transformée de Farris pour le calcul des distances
    • algorithme de Luong pour le calcul de l'arbre




                                     http://www.treecloud.org
Question

 Limites sur la taille du corpus pour utiliser TreeCloud ?




 30 secondes pour la construction du nuage arboré de
 l'ensemble des discours de campagne de Barack Obama
 (>300 000 mots)

Contenu connexe

Plus de Philippe Gambette

Quadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau kQuadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau kPhilippe Gambette
 
Géolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesGéolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesPhilippe Gambette
 
Reconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesReconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesPhilippe Gambette
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksPhilippe Gambette
 
Estimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarEstimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarPhilippe Gambette
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsPhilippe Gambette
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Philippe Gambette
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloudPhilippe Gambette
 

Plus de Philippe Gambette (8)

Quadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau kQuadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau k
 
Géolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesGéolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactives
 
Reconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesReconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiques
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic Networks
 
Estimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarEstimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues Carambar
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphs
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloud
 

Dernier

Présentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxPrésentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxpopzair
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.Franck Apolis
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...M2i Formation
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film françaisTxaruka
 
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptxSAID MASHATE
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptssusercbaa22
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne FontaineTxaruka
 
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdfMICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdfssuser40e112
 
Grammaire pour les élèves de la 6ème.doc
Grammaire pour les élèves de la  6ème.docGrammaire pour les élèves de la  6ème.doc
Grammaire pour les élèves de la 6ème.docKarimKhrifech
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptxTxaruka
 
Cours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxCours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxlamourfrantz
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprisesMajdaKtiri2
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...Faga1939
 
Formation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipFormation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipM2i Formation
 
présentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurprésentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurdinaelchaine
 
systeme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertsysteme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertChristianMbip
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxssusercbaa22
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 

Dernier (20)

Présentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxPrésentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptx
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdfMICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
 
Pâques de Sainte Marie-Euphrasie Pelletier
Pâques de Sainte Marie-Euphrasie PelletierPâques de Sainte Marie-Euphrasie Pelletier
Pâques de Sainte Marie-Euphrasie Pelletier
 
Grammaire pour les élèves de la 6ème.doc
Grammaire pour les élèves de la  6ème.docGrammaire pour les élèves de la  6ème.doc
Grammaire pour les élèves de la 6ème.doc
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptx
 
Cours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxCours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptx
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
 
Formation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipFormation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadership
 
présentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurprésentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteur
 
systeme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertsysteme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expert
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 

Utilisation de la visualisation en nuage arboré pour l'analyse littéraire

  • 1. JADT 2010 - 11/06/2010 Rome Utilisation de la visualisation en nuage arboré pour l'analyse littéraire Delphine Amstutz (CELLF – Université Paris-Sorbonne Paris 4 / CNRS) Philippe Gambette (LIRMM – Université Montpellier 2 / CNRS)
  • 2. Plan • Le nuage arboré : occurrence + cooccurrence • Des couleurs pour guider la lecture • Processus de construction • Implémentations • Emplois du nuage arboré • Illustration sur Cinna et Othon • Perspectives
  • 3. Plan • Le nuage arboré : occurrence + cooccurrence • Des couleurs pour guider la lecture • Processus de construction • Implémentations • Emplois du nuage arboré • Illustration sur Cinna et Othon • Perspectives
  • 4. Nuage arboré, une information double hiérarchie des mots occurrences hiérarchie des concepts cooccurrences SplitsTree : Huson 1998, construit avec Huson & Bryant 2006 TreeCloud en Python, license GPL disponible sur http://www.treecloud.fr
  • 5. Nuages de tags • Construits depuis un ensemble de tags • Taille de police liée à la fréquence Ce qui est habituellement cité comme le premier nuage de tags, dans Microserfs de D. Coupland, HarperCollins, Toronto, 1995
  • 6. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle • Donnent un bon aperçu d'un texte Nuages Wordle des mots les plus utilisés début 2009 dans les blogs des Top 100 politique et high-tech de Wikio http://aixtal.blogspot.com/2009/04/web-de-quoi-parlent-les-blogs.html Extrait d'un nuage des mots des titres des 800 articles présentés à ce jour aux conférences JADT http://www.ledonline.it/ledonline/jadt-2010.html
  • 7. Extraire l'information sémantique d'un texte • analyse arborée Brunet (Hyperbase) • graphe de coocurrence Brunet (Hyperbase) • graphe sémantique Grimmer (Wordmapper) • lexicogramme récursif Martinez (Coocs) • désambiguïsation lexicale Véronis (Hyperlex) • réseau Phrasenet Viegas et al. (IBM Many Eyes) • projection géodésique Viprey (Astartex)
  • 8. Extraire l'information sémantique d'un texte • analyse arborée Brunet (Hyperbase) • graphe de coocurrence Brunet (Hyperbase) • graphe sémantique Grimmer (Wordmapper) • lexicogramme récursif Martinez (Coocs) • désambiguïsation lexicale Véronis (Hyperlex) • réseau Phrasenet Viegas et al. (IBM Many Eyes) • projection géodésique Viprey (Astartex) Brunet, Les séquences (suite), JADT'08
  • 9. Extraire l'information sémantique d'un texte • analyse arborée Brunet (Hyperbase) • graphe de coocurrence Brunet (Hyperbase) • graphe sémantique Grimmer (Wordmapper) • lexicogramme récursif Martinez (Coocs) • désambiguïsation lexicale Véronis (Hyperlex) • réseau Phrasenet Viegas et al. (IBM Many Eyes) • projection géodésique Viprey (Astartex) Mayaffre, Quand travail, famille, et patrie cooccurrent dans le discours de Nicolas Sarkozy, JADT'08
  • 10. Extraire l'information sémantique d'un texte • analyse arborée Brunet (Hyperbase) • graphe de coocurrence Brunet (Hyperbase) • graphe sémantique Grimmer (Wordmapper) • lexicogramme récursif Martinez (Coocs) • désambiguïsation lexicale Véronis (Hyperlex) • réseau Phrasenet Viegas et al. (IBM Many Eyes) • projection géodésique Viprey (Astartex) Peyrat-Guillard, Analyse du discours syndical sur l’entreprise, JADT'08
  • 11. Extraire l'information sémantique d'un texte • analyse arborée Brunet (Hyperbase) • graphe de coocurrence Brunet (Hyperbase) • graphe sémantique Grimmer (Wordmapper) • lexicogramme récursif Martinez (Coocs) • désambiguïsation lexicale Véronis (Hyperlex) • réseau Phrasenet Viegas et al. (IBM Many Eyes) • projection géodésique Viprey (Astartex) Leblanc, Martinez L'analyse contrastive des réseaux de cooccurrence JADT 2006.
  • 12. Extraire l'information sémantique d'un texte • analyse arborée Brunet (Hyperbase) • graphe de coocurrence Brunet (Hyperbase) • graphe sémantique Grimmer (Wordmapper) • lexicogramme récursif Martinez (Coocs) • désambiguïsation lexicale Véronis (Hyperlex) • réseau Phrasenet Viegas et al. (IBM Many Eyes) • projection géodésique Viprey (Astartex) Désambiguïsation du mot “barrage”. Véronis, HyperLex: Lexical Cartography for Information Retrieval, 2004
  • 13. Extraire l'information sémantique d'un texte • analyse arborée Brunet (Hyperbase) • graphe de coocurrence Brunet (Hyperbase) • graphe sémantique Grimmer (Wordmapper) • lexicogramme récursif Martinez (Coocs) • désambiguïsation lexicale Véronis (Hyperlex) • réseau Phrasenet Viegas et al. (IBM Many Eyes) • projection géodésique Viprey (Astartex) Visualisation PhraseNet de paroles des Beatles créé avec Many Eyes (IBM) http://many-eyes.com http://visualthinkmap.ning.com/photo/phrasenet_beatles-many-eyes
  • 14. Extraire l'information sémantique d'un texte • analyse arborée Brunet (Hyperbase) • graphe de coocurrence Brunet (Hyperbase) • graphe sémantique Grimmer (Wordmapper) • lexicogramme récursif Martinez (Coocs) • désambiguïsation lexicale Véronis (Hyperlex) • réseau Phrasenet Viegas et al. (IBM Many Eyes) • projection géodésique Viprey (Astartex) Barry, Viprey, Approche comparative des résultats d'exploration textuelle des discours de deux leaders africains Keita et Touré, JADT'08
  • 15. Plan • Le nuage arboré : occurrence + cooccurrence • Des couleurs pour guider la lecture • Processus de construction • Implémentations • Emplois du nuage arboré • Illustration sur Cinna et Othon • Perspectives
  • 16. Des couleurs pour guider la lecture • coloration selon les fréquences • coloration chronologique • coloration de la dispersion • coloration ciblée sur un mot • coloration grammaticale
  • 17. Des couleurs pour guider la lecture • coloration selon les fréquences • coloration chronologique • coloration de la dispersion • coloration ciblée sur un mot • coloration grammaticale Nuage arboré des mots apparaissant 5 fois ou plus dans cet article JADT, distance Liddell, fenêtre de 20 mots, coloration Yahoo
  • 18. Des couleurs pour guider la lecture rouge : début de l'article • coloration selon les fréquences bleu : fin de l'article • coloration chronologique • coloration de la dispersion • coloration ciblée sur un mot • coloration grammaticale Nuage arboré des mots apparaissant 5 fois ou plus dans cet article JADT, distance Liddell, fenêtre de 20 mots, coloration chronologique
  • 19. Des couleurs pour guider la lecture rouge : peu dispersé • coloration selon les fréquences bleu : dispersé • coloration chronologique • coloration de la dispersion • coloration ciblée sur un mot • coloration grammaticale Nuage arboré des mots apparaissant 5 fois ou plus dans cet article JADT, distance Liddell, fenêtre de 20 mots, coloration dispersion
  • 20. Des couleurs pour guider la lecture rouge : cooccurrents de • coloration selon les fréquences “cooccurrence” • coloration chronologique • coloration de la dispersion • coloration ciblée sur un mot • coloration grammaticale Nuage arboré des mots apparaissant 5 fois ou plus dans cet article JADT, distance Liddell, fenêtre de 20 mots, coloration ciblée sur le mot “cooccurrence”
  • 21. Des couleurs pour guider la lecture noms adjectifs • coloration selon les fréquences verbes noms propres • coloration chronologique • coloration de la dispersion • coloration ciblée sur un mot • coloration grammaticale Nuage arboré des mots apparaissant 5 fois ou plus dans cet article JADT, distance Liddell, fenêtre de 20 mots, coloration personnalisée, à partir d'un étiquetage TreeTagger
  • 22. Plan • Le nuage arboré : occurrence + cooccurrence • Des couleurs pour guider la lecture • Processus de construction • Implémentations • Emplois du nuage arboré • Illustration sur Cinna et Othon • Perspectives
  • 23. Processus de construction Import/export Concordance d'un mot, lemmatisation ou remplacements divers... Texte Suppression des mots vides Sélection des mots Recherche des cooccurrences Calcul des cooccurrences Construction de l'arbre Tailles des mots Couleurs des mots Dessin du nuage arboré
  • 24. Processus de construction Import/export Proposé dans TreeCloud Concordance d'un mot, lemmatisation ou remplacements divers... Texte Suppression des mots vides antidico anglais, français n mots les plus fréquents, mots Mots significatifs Sélection des mots apparaissant plus de n fois, ou liste personnalisée Fenêtre de cooccurrence paramétrée Liste de mots Recherche des cooccurrences par taille et pas de glissement, ou et occurrences caractère séparateur Matrice CSV Calcul des cooccurrences 12 formules de cooccurrence Méthodes UPGMA, NJ Construction de l'arbre Appel transparent à SplitsTree Tailles des mots Fréquences ou valeurs personnalisées Mots significatifs Fréquences, chronologie, dispersion, Couleurs des mots ciblées sur la cooccurrence d'un mot, ou valeurs personnalisées Export à divers formats Dessin du nuage arboré Appel à SplitsTree ou Dendroscope
  • 25. Construction – les cooccurrences De nombreuses formules de distance sémantique utilisent la cooccurrence. Texte fenêtre glissante S Pas de glissement s largeur w matrices de cooccurrence matrice de dissimilarité O11, O12, O21, O22 sémantique chi squared, mutual information, liddel, dice, jaccard, gmean, hyperlex, minimum sensitivity, odds ratio, zscore, log likelihood, poisson-stirling... Evert, Statistics of words cooccurrences, thèse, 2005 Gambette, User manual for TreeCloud, 2009
  • 26. Plan • Le nuage arboré : occurrence + cooccurrence • Des couleurs pour guider la lecture • Processus de construction • Implémentations • Emplois du nuage arboré • Illustration sur Cinna et Othon • Perspectives
  • 27. Implémentations Logiciel libre TreeCloud (Python/Delphi) + SplitsTree (Java) www.treecloud.org www.splitstree.org
  • 28. Implémentations Logiciel libre TreeCloud (Python/Delphi) + SplitsTree (Java)
  • 29. Interface web www.treecloud.org Interface basée sur le logiciel libre NuageArboré de Jean- Charles Bontemps, en C, CGI/Python, et JavaScript. http://sourceforge.net/projects/ nuagearbor/
  • 30. Interface web www.treecloud.org
  • 31. Plan • Le nuage arboré : occurrence + cooccurrence • Des couleurs pour guider la lecture • Processus de construction • Implémentations • Emplois du nuage arboré • Illustration sur Cinna et Othon • Perspectives
  • 32. Emplois du nuage arboré • susciter, formaliser et étayer des hypothèses de travail • comparer des textes selon leur représentation arborée • hiérarchiser l'utilisation d'autres outils textométriques • représenter les résultats de l'analyse
  • 33. Plan • Le nuage arboré : occurrence + cooccurrence • Des couleurs pour guider la lecture • Processus de construction • Implémentations • Emplois du nuage arboré • Illustration sur Cinna et Othon • Perspectives
  • 34. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 35. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 36. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 37. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 38. Illustration sur Cinna et Othon Spécificités d'emploi de « Rome », « liberté » et « empire » chez les différents personnages de Cinna dans Lexico3.
  • 39. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 40. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 41. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 42. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 43. Illustration sur Cinna et Othon Nuage arboré des 50 mots les plus fréquents des paroles d'Auguste dans Cinna
  • 44. Illustration sur Cinna et Othon Nuage arboré des 50 mots les plus fréquents des paroles d'Auguste dans Cinna
  • 45. Illustration sur Cinna et Othon Carte des sections Lexico3 et contextes de « amis » dans les paroles d'Auguste dans Cinna. 1. Voilà, mes chers amis, ce qui me met en peine. 2. Quoi ! mes plus chers amis ! quoi ! Cinna ! quoi ! Maxime ! 3. Reprenez le pouvoir que vous m'avez commis, Si donnant des sujets il ôte les amis 4. Soyons amis, Cinna, c'est moi qui t'en convie 5. Il nous a trahis tous ; mais ce qu'il a commis Vous conserve innocents, et me rend mes amis.
  • 46. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 47. Illustration sur Cinna et Othon Nuage arboré des 30 mots les plus fréquents de la pièce Othon, coloré à gauche par rapport aux cooccurrences avec « Othon », à droite par rapport à celles avec « Galba »
  • 48. Illustration sur Cinna et Othon Nuage arboré des 30 mots les plus fréquents de la pièce Othon, coloré à gauche par rapport aux cooccurrences avec « Othon », à droite par rapport à celles avec « Galba »
  • 49. Illustration sur Cinna et Othon Nuage arboré des 30 mots les plus fréquents de la pièce Othon, coloré à gauche par rapport aux cooccurrences avec « Othon », à droite par rapport à celles avec « Galba »
  • 50. Illustration sur Cinna et Othon Nuages arborés des mots spécifiques de Cinna et Othon, dimensionnés et colorés d'après leur spécificité calculée dans Lexico3.
  • 51. Illustration sur Cinna et Othon mots spécifiques de Cinna et Othon d'après Lexico3 Cinna Othon Lieu du pouvoir et objet de la Rome (« liberté ») Empire (« trône ») confrontation entre les personnages Souverain en place tyran Empereur Membres du corps politique amis maîtres / seigneurs Moyens au service de la cause gloire amour matrimonial (« amour », politique « hymen », « choix ») Caractérisation de la pièce Pièce de FONDATION Pièce de SUCCESSION DYNASTIQUE
  • 52. Illustration sur Cinna et Othon mots spécifiques de Cinna et Othon d'après Lexico3 Cinna Othon Lieu du pouvoir et objet de la Rome (« liberté ») Empire (« trône ») confrontation entre les personnages Souverain en place tyran Empereur Membres du corps politique amis maîtres / seigneurs Moyens au service de la cause gloire amour matrimonial (« amour », politique « hymen », « choix ») Caractérisation de la pièce Pièce de FONDATION Pièce de SUCCESSION DYNASTIQUE
  • 53. Illustration sur Cinna et Othon mots spécifiques de Cinna et Othon d'après Lexico3 Cinna Othon Lieu du pouvoir et objet de la Rome (« liberté ») Empire (« trône ») confrontation entre les personnages Souverain en place tyran Empereur Membres du corps politique amis maîtres / seigneurs Moyens au service de la cause gloire amour matrimonial (« amour », politique « hymen », « choix ») Caractérisation de la pièce Pièce de FONDATION Pièce de SUCCESSION DYNASTIQUE
  • 54. Plan • Le nuage arboré : occurrence + cooccurrence • Des couleurs pour guider la lecture • Processus de construction • Implémentations • Emplois du nuage arboré • Illustration sur Cinna et Othon • Perspectives
  • 55. Perspectives • intégration de la visualisation en nuages arborés • dans les outils de textométrie existants • par des interfaces d'import/export adaptées • pour faciliter le retour au texte • amélioration des méthodes de construction • transformée de Farris pour le calcul des distances • algorithme de Luong pour le calcul de l'arbre http://www.treecloud.org
  • 56. Question Limites sur la taille du corpus pour utiliser TreeCloud ? 30 secondes pour la construction du nuage arboré de l'ensemble des discours de campagne de Barack Obama (>300 000 mots)