SlideShare une entreprise Scribd logo
1  sur  42
Télécharger pour lire hors ligne
Journée OSIDMESH
    Montpellier – 23/10/2009


Analyses de textes avec
 TreeCloud et Lexico3

      Philippe Gambette
Plan

• Nuages de mots
• Nuages améliorés
• Analyses plus fines
Plan

• Nuages de mots
• Nuages améliorés
• Analyses plus fines
Nuages de mots

• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle
• Donnent un bon aperçu d'un texte




                                                  Nuages Wordle des mots les plus utilisés
                                                   début 2009 dans les blogs des Top 100
                                                            politique et high-tech de Wikio
                     http://aixtal.blogspot.com/2009/04/web-de-quoi-parlent-les-blogs.html
Nuages de mots

• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle
• Donnent un bon aperçu d'un texte
Nuages de mots

• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle
• Donnent un bon aperçu d'un texte




GoogleImage(obama inaugural address wordle)
Nuages de mots
• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle




GoogleImage(obama inaugural address wordle)
Nuages de mots
• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle




GoogleImage(obama inaugural address wordle)
Plan

• Nuages de mots
• Nuages améliorés
• Analyses plus fines
Nuages de mots améliorés

Ajouter de l'information extraite du texte :
• pâleur pour exprimer la désuétude dans Amazon
• tags partagés en rouge dans del.icio.us
• regrouper les tags cooccurrents sur la même ligne
                        Hassan-Montero & Herrero-Solana, InScit'06
• optimiser l'espace vide et la proximité sémantique
                                         Kaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrence
       Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
Nuages de tags/mots améliorés

Ajouter de l'information extraite du texte :
• pâleur pour exprimer la désuétude dans Amazon
• tags partagés en rouge dans del.icio.us
• regrouper les tags cooccurrents sur la même ligne
                        Hassan-Montero & Herrero-Solana, InScit'06
• optimiser l'espace vide et la proximité sémantique
                                         Kaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrence
       Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
Nuages de tags/mots améliorés

Ajouter de l'information extraite du texte :
• pâleur pour exprimer la désuétude dans Amazon
• tags partagés en rouge dans del.icio.us
• regrouper les tags cooccurrents sur la même ligne
                        Hassan-Montero & Herrero-Solana, InScit'06
• optimiser l'espace vide et la proximité sémantique
                                         Kaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrence
       Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
Nuages de tags/mots améliorés

Ajouter de l'information extraite du texte :
• pâleur pour exprimer la désuétude dans Amazon
• tags partagés en rouge dans del.icio.us
• regrouper les tags cooccurrents sur la même ligne
                        Hassan-Montero & Herrero-Solana, InScit'06
• optimiser l'espace vide et la proximité sémantique
                                         Kaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrence
       Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
Nuages de tags/mots améliorés

Ajouter de l'information extraite du texte :
• pâleur pour exprimer la désuétude dans Amazon
• tags partagés en rouge dans del.icio.us
• regrouper les tags cooccurrents sur la même ligne
                        Hassan-Montero & Herrero-Solana, InScit'06
• optimiser l'espace vide et la proximité sémantique
                                         Kaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrence
       Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                            Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                Véronis (Hyperlex)
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                    Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                 Véronis (Hyperlex)


                                              Mayaffre, Quand travail, famille,
                                                et patrie cooccurrent dans le
                                                          discours de Nicolas
                                                            Sarkozy, JADT'08
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                  Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                Véronis (Hyperlex)




                                              Brunet, Les séquences (suite),
                                                                  JADT'08
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                  Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                Véronis (Hyperlex)


                                                              Barry, Viprey,
                                                    Approche comparative
                                                 des résultats d'exploration
                                                     textuelle des discours
                                                  de deux leaders africains
                                                             Keita et Touré,
                                                                   JADT'08
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                 Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                Véronis (Hyperlex)




                                                           Peyrat-Guillard,
                                                     Analyse du discours
                                                  syndical sur l’entreprise,
                                                                   JADT'08
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                                    Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                                              Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
                       Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                                   Véronis (Hyperlex)


                                                                    Visualisation PhraseNet de
                                                                            paroles des Beatles
                                                                    créé avec Many Eyes (IBM)
                                                                          http://many-eyes.com




http://visualthinkmap.ning.com/photo/phrasenet_beatles-many-eyes
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                 Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                Véronis (Hyperlex)




                                                 Désambiguïsation du mot
                                                               “barrage”.

                                                        Véronis, HyperLex:
                                                    Lexical Cartography for
                                                Information Retrieval, 2004
Nuage de tags + arbre = nuage arboré




                            SplitsTree : Huson 1998,
                               Huson & Bryant 2006
Construit avec
TreeCloud et                 TreeCloud en Python, license GPL
                           disponible sur http://www.treecloud.fr
Nuage arboré des discours d'Obama

couleur : chronologie
ancien
récent




Les 150 mots les plus fréquents dans   Construit avec
les discours de campagne d'Obama,      TreeCloud et
winsize=30, distance=oddsratio,
color=chronology, NJ-tree.
Plan

• Nuages de mots
• Nuages améliorés
• Analyses plus fines
Analyses textuelles fines

Lexico 3
• Laboratoire SYLED-CLA2T de Paris 3 Sorbonne Nouvelle
• Logiciel pour PC sous Windows
• Version d'évaluation gratuite
• Analyses fines, retour au texte




                                    http://www.cavi.univ-paris3.fr/Ilpga/ilpga/tal/lexicoWWW/
Analyses textuelles fines

Lexico 3
• Laboratoire SYLED-CLA2T de Paris 3 Sorbonne Nouvelle
• Logiciel pour PC sous Windows
• Version d'évaluation gratuite
• Analyses fines, retour au texte
• Démo sur les avis cinéma de Monique Pantel




                                                   http://monique.pantel.free.fr
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines




                  glisser-déposer
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines




                            sélection puis
                            clic sur Spécifs
Analyses textuelles fines
Analyses textuelles fines




                            retour au texte

Contenu connexe

En vedette

Les outils de data visualisation
Les outils de data visualisationLes outils de data visualisation
Les outils de data visualisationUNITEC
 
Base de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvreBase de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvreMICHRAFY MUSTAFA
 
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"Petit Web
 
NoSQL Databases: Why, what and when
NoSQL Databases: Why, what and whenNoSQL Databases: Why, what and when
NoSQL Databases: Why, what and whenLorenzo Alberton
 
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...Serge Courrier
 
Dataviz : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...
Dataviz  : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...Dataviz  : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...
Dataviz : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...Serge Courrier
 
DeciLogic exemple d'application Web de geolocalisation
DeciLogic exemple d'application Web de geolocalisationDeciLogic exemple d'application Web de geolocalisation
DeciLogic exemple d'application Web de geolocalisationEric Mauvais
 
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"ConféR3nce "Géolocalisation Sociale et Marketing Mobile"
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"Sophie Gironi
 
Outils de veille - catalogue
Outils de veille - catalogueOutils de veille - catalogue
Outils de veille - catalogueRaphaël Rey
 

En vedette (10)

Les outils de data visualisation
Les outils de data visualisationLes outils de data visualisation
Les outils de data visualisation
 
Base de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvreBase de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvre
 
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"
 
NoSQL Databases: Why, what and when
NoSQL Databases: Why, what and whenNoSQL Databases: Why, what and when
NoSQL Databases: Why, what and when
 
La datavisualisation
La datavisualisationLa datavisualisation
La datavisualisation
 
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...
 
Dataviz : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...
Dataviz  : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...Dataviz  : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...
Dataviz : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...
 
DeciLogic exemple d'application Web de geolocalisation
DeciLogic exemple d'application Web de geolocalisationDeciLogic exemple d'application Web de geolocalisation
DeciLogic exemple d'application Web de geolocalisation
 
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"ConféR3nce "Géolocalisation Sociale et Marketing Mobile"
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"
 
Outils de veille - catalogue
Outils de veille - catalogueOutils de veille - catalogue
Outils de veille - catalogue
 

Plus de Philippe Gambette

Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudNuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudPhilippe Gambette
 
Practical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstructionPractical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstructionPhilippe Gambette
 
Méthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesMéthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesPhilippe Gambette
 
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Philippe Gambette
 
Reconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesReconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesPhilippe Gambette
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksPhilippe Gambette
 
Estimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarEstimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarPhilippe Gambette
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsPhilippe Gambette
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Philippe Gambette
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloudPhilippe Gambette
 

Plus de Philippe Gambette (10)

Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudNuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
 
Practical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstructionPractical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstruction
 
Méthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesMéthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiques
 
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
 
Reconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesReconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiques
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic Networks
 
Estimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarEstimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues Carambar
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphs
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloud
 

Dernier

A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.Franck Apolis
 
MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptssusercbaa22
 
Cours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxCours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxlamourfrantz
 
Formation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipFormation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipM2i Formation
 
Présentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxPrésentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxpopzair
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...Faga1939
 
Guide Final de rédaction de mémoire de fin d'étude
Guide Final de rédaction de mémoire de fin d'étudeGuide Final de rédaction de mémoire de fin d'étude
Guide Final de rédaction de mémoire de fin d'étudeBenamraneMarwa
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxssusercbaa22
 
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptxSAID MASHATE
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne FontaineTxaruka
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptxTxaruka
 
systeme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertsysteme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertChristianMbip
 
presentation l'interactionnisme symbolique finale.pptx
presentation l'interactionnisme symbolique  finale.pptxpresentation l'interactionnisme symbolique  finale.pptx
presentation l'interactionnisme symbolique finale.pptxMalikaIdseaid1
 

Dernier (15)

Pâques de Sainte Marie-Euphrasie Pelletier
Pâques de Sainte Marie-Euphrasie PelletierPâques de Sainte Marie-Euphrasie Pelletier
Pâques de Sainte Marie-Euphrasie Pelletier
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.
 
MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.ppt
 
Cours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxCours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptx
 
Formation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipFormation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadership
 
Présentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxPrésentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptx
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
 
Guide Final de rédaction de mémoire de fin d'étude
Guide Final de rédaction de mémoire de fin d'étudeGuide Final de rédaction de mémoire de fin d'étude
Guide Final de rédaction de mémoire de fin d'étude
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
 
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptx
 
systeme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertsysteme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expert
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
presentation l'interactionnisme symbolique finale.pptx
presentation l'interactionnisme symbolique  finale.pptxpresentation l'interactionnisme symbolique  finale.pptx
presentation l'interactionnisme symbolique finale.pptx
 

Analyse de textes avec TreeCloud et Lexico3

  • 1. Journée OSIDMESH Montpellier – 23/10/2009 Analyses de textes avec TreeCloud et Lexico3 Philippe Gambette
  • 2. Plan • Nuages de mots • Nuages améliorés • Analyses plus fines
  • 3. Plan • Nuages de mots • Nuages améliorés • Analyses plus fines
  • 4. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle • Donnent un bon aperçu d'un texte Nuages Wordle des mots les plus utilisés début 2009 dans les blogs des Top 100 politique et high-tech de Wikio http://aixtal.blogspot.com/2009/04/web-de-quoi-parlent-les-blogs.html
  • 5. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle • Donnent un bon aperçu d'un texte
  • 6. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle • Donnent un bon aperçu d'un texte GoogleImage(obama inaugural address wordle)
  • 7. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle GoogleImage(obama inaugural address wordle)
  • 8. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle GoogleImage(obama inaugural address wordle)
  • 9. Plan • Nuages de mots • Nuages améliorés • Analyses plus fines
  • 10. Nuages de mots améliorés Ajouter de l'information extraite du texte : • pâleur pour exprimer la désuétude dans Amazon • tags partagés en rouge dans del.icio.us • regrouper les tags cooccurrents sur la même ligne Hassan-Montero & Herrero-Solana, InScit'06 • optimiser l'espace vide et la proximité sémantique Kaser & Lemire, WWW'07 • “topigraphy”: placement 2D d'après la cooccurrence Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
  • 11. Nuages de tags/mots améliorés Ajouter de l'information extraite du texte : • pâleur pour exprimer la désuétude dans Amazon • tags partagés en rouge dans del.icio.us • regrouper les tags cooccurrents sur la même ligne Hassan-Montero & Herrero-Solana, InScit'06 • optimiser l'espace vide et la proximité sémantique Kaser & Lemire, WWW'07 • “topigraphy”: placement 2D d'après la cooccurrence Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
  • 12. Nuages de tags/mots améliorés Ajouter de l'information extraite du texte : • pâleur pour exprimer la désuétude dans Amazon • tags partagés en rouge dans del.icio.us • regrouper les tags cooccurrents sur la même ligne Hassan-Montero & Herrero-Solana, InScit'06 • optimiser l'espace vide et la proximité sémantique Kaser & Lemire, WWW'07 • “topigraphy”: placement 2D d'après la cooccurrence Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
  • 13. Nuages de tags/mots améliorés Ajouter de l'information extraite du texte : • pâleur pour exprimer la désuétude dans Amazon • tags partagés en rouge dans del.icio.us • regrouper les tags cooccurrents sur la même ligne Hassan-Montero & Herrero-Solana, InScit'06 • optimiser l'espace vide et la proximité sémantique Kaser & Lemire, WWW'07 • “topigraphy”: placement 2D d'après la cooccurrence Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
  • 14. Nuages de tags/mots améliorés Ajouter de l'information extraite du texte : • pâleur pour exprimer la désuétude dans Amazon • tags partagés en rouge dans del.icio.us • regrouper les tags cooccurrents sur la même ligne Hassan-Montero & Herrero-Solana, InScit'06 • optimiser l'espace vide et la proximité sémantique Kaser & Lemire, WWW'07 • “topigraphy”: placement 2D d'après la cooccurrence Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
  • 15. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex)
  • 16. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Mayaffre, Quand travail, famille, et patrie cooccurrent dans le discours de Nicolas Sarkozy, JADT'08
  • 17. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Brunet, Les séquences (suite), JADT'08
  • 18. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Barry, Viprey, Approche comparative des résultats d'exploration textuelle des discours de deux leaders africains Keita et Touré, JADT'08
  • 19. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Peyrat-Guillard, Analyse du discours syndical sur l’entreprise, JADT'08
  • 20. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Visualisation PhraseNet de paroles des Beatles créé avec Many Eyes (IBM) http://many-eyes.com http://visualthinkmap.ning.com/photo/phrasenet_beatles-many-eyes
  • 21. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Désambiguïsation du mot “barrage”. Véronis, HyperLex: Lexical Cartography for Information Retrieval, 2004
  • 22. Nuage de tags + arbre = nuage arboré SplitsTree : Huson 1998, Huson & Bryant 2006 Construit avec TreeCloud et TreeCloud en Python, license GPL disponible sur http://www.treecloud.fr
  • 23. Nuage arboré des discours d'Obama couleur : chronologie ancien récent Les 150 mots les plus fréquents dans Construit avec les discours de campagne d'Obama, TreeCloud et winsize=30, distance=oddsratio, color=chronology, NJ-tree.
  • 24. Plan • Nuages de mots • Nuages améliorés • Analyses plus fines
  • 25. Analyses textuelles fines Lexico 3 • Laboratoire SYLED-CLA2T de Paris 3 Sorbonne Nouvelle • Logiciel pour PC sous Windows • Version d'évaluation gratuite • Analyses fines, retour au texte http://www.cavi.univ-paris3.fr/Ilpga/ilpga/tal/lexicoWWW/
  • 26. Analyses textuelles fines Lexico 3 • Laboratoire SYLED-CLA2T de Paris 3 Sorbonne Nouvelle • Logiciel pour PC sous Windows • Version d'évaluation gratuite • Analyses fines, retour au texte • Démo sur les avis cinéma de Monique Pantel http://monique.pantel.free.fr
  • 34. Analyses textuelles fines glisser-déposer
  • 40. Analyses textuelles fines sélection puis clic sur Spécifs
  • 42. Analyses textuelles fines retour au texte