Base de données graphe, Noe4j concepts et mise en oeuvreMICHRAFY MUSTAFA
Cette étude vise à présenter les concepts clés d’une base de données orientée graphe. La modélisation et la mise en œuvre des cas d’utilisation seront réalisées avec la base de données NEO4J, version 3.1.
Base de données graphe, Noe4j concepts et mise en oeuvreMICHRAFY MUSTAFA
Cette étude vise à présenter les concepts clés d’une base de données orientée graphe. La modélisation et la mise en œuvre des cas d’utilisation seront réalisées avec la base de données NEO4J, version 3.1.
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudPhilippe Gambette
24 mai 2013 - Séminaire "Réflexion sur les visualisations en sciences humaines, quels apports pour la textométrie ?" - CEDITEC (Université Paris-Est Créteil)
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesPhilippe Gambette
Soutenance de thèse le 30 novembre 2010 au LIRMM à Montpellier.
Jury :
- Guillaume Fertin & Vincent Moulton (rapporteurs)
- Alain Guénoche, Violaine Prince & Eric Tannier
- Vincent Berry & Christophe Paul (directeurs de thèse)
Utilisation de la visualisation en nuage arboré pour l'analyse littérairePhilippe Gambette
Présentation aux JADT2010 à Rome, avec Delphine Amstutz.
Pris par le temps, nous avons dû abréger les commentaires des diapos 47 à 53, ils sont insérés dans cette version web.
L'article associé se trouve à l'adresse http://hal-lirmm.ccsd.cnrs.fr/lirmm-00448436/fr/
A new visualization tool to display the words of a text (newspaper article, blog content, political speech) is presented, the tree cloud, a kind of improved tag cloud: http://www.treecloud.org.
Newsletter SPW Agriculture en province du Luxembourg du 03-06-24BenotGeorges3
Les informations et évènements agricoles en province du Luxembourg et en Wallonie susceptibles de vous intéresser et diffusés par le SPW Agriculture, Direction de la Recherche et du Développement, Service extérieur de Libramont.
https://agriculture.wallonie.be/home/recherche-developpement/acteurs-du-developpement-et-de-la-vulgarisation/les-services-exterieurs-de-la-direction-de-la-recherche-et-du-developpement/newsletters-des-services-exterieurs-de-la-vulgarisation/newsletters-du-se-de-libramont.html
Bonne lecture et bienvenue aux activités proposées.
#Agriculture #Wallonie #Newsletter #Recherche #Développement #Vulgarisation #Evènement #Information #Formation #Innovation #Législation #PAC #SPW #ServicepublicdeWallonie
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La JeunesseOscar Smith
Besoin des conseils pour les Jeunes ? Le document suivant est plein des conseils de la Vie ! C’est vraiment un document conseil de la jeunesse que tout jeune devrait consulter.
Voir version video:
➡https://youtu.be/7ED4uTW0x1I
Sur la chaine:👇
👉https://youtube.com/@kbgestiondeprojets
Aimeriez-vous donc…
-réussir quand on est jeune ?
-avoir de meilleurs conseils pour réussir jeune ?
- qu’on vous offre des conseils de la vie ?
Ce document est une ressource qui met en évidence deux obstacles qui empêchent les jeunes de mener une vie épanouie : l'inaction et le pessimisme.
1) Découvrez comment l'inaction, c'est-à-dire le fait de ne pas agir ou d'agir alors qu'on le devrait ou qu'on est censé le faire, est un obstacle à une vie épanouie ;
> Comment l'inaction affecte-t-elle l'avenir du jeune ? Que devraient plutôt faire les jeunes pour se racheter et récupérer ce qui leur appartient ? A découvrir dans le document ;
2) Le pessimisme, c'est douter de tout ! Les jeunes doutent que la génération plus âgée ne soit jamais orientée vers la bonne volonté. Les jeunes se sentent toujours mal à l'aise face à la ruse et la volonté politique de la génération plus âgée ! Cet état de doute extrême empêche les jeunes de découvrir les opportunités offertes par les politiques et les dispositifs en faveur de la jeunesse. Voulez-vous en savoir plus sur ces opportunités que la plupart des jeunes ne découvrent pas à cause de leur pessimisme ? Consultez cette ressource gratuite et profitez-en !
En rapport avec les " conseils pour les jeunes, " cette ressource peut aussi aider les internautes cherchant :
➡les conseils pratiques pour les jeunes
➡conseils pour réussir
➡jeune investisseur conseil
➡comment investir son argent quand on est jeune
➡conseils d'écriture jeunes auteurs
➡conseils pour les jeunes auteurs
➡comment aller vers les jeunes
➡conseil des jeunes citoyens
➡les conseils municipaux des jeunes
➡conseils municipaux des jeunes
➡conseil des jeunes en mairie
➡qui sont les jeunes
➡projet pour les jeunes
➡conseil des jeunes paris
➡infos pour les jeunes
➡conseils pour les jeunes
➡Quels sont les bienfaits de la jeunesse ?
➡Quels sont les 3 qualités de la jeunesse ?
➡Comment gérer les problèmes des adolescents ?
➡les conseils de jeunes
➡guide de conseils de jeunes
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudPhilippe Gambette
24 mai 2013 - Séminaire "Réflexion sur les visualisations en sciences humaines, quels apports pour la textométrie ?" - CEDITEC (Université Paris-Est Créteil)
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesPhilippe Gambette
Soutenance de thèse le 30 novembre 2010 au LIRMM à Montpellier.
Jury :
- Guillaume Fertin & Vincent Moulton (rapporteurs)
- Alain Guénoche, Violaine Prince & Eric Tannier
- Vincent Berry & Christophe Paul (directeurs de thèse)
Utilisation de la visualisation en nuage arboré pour l'analyse littérairePhilippe Gambette
Présentation aux JADT2010 à Rome, avec Delphine Amstutz.
Pris par le temps, nous avons dû abréger les commentaires des diapos 47 à 53, ils sont insérés dans cette version web.
L'article associé se trouve à l'adresse http://hal-lirmm.ccsd.cnrs.fr/lirmm-00448436/fr/
A new visualization tool to display the words of a text (newspaper article, blog content, political speech) is presented, the tree cloud, a kind of improved tag cloud: http://www.treecloud.org.
Newsletter SPW Agriculture en province du Luxembourg du 03-06-24BenotGeorges3
Les informations et évènements agricoles en province du Luxembourg et en Wallonie susceptibles de vous intéresser et diffusés par le SPW Agriculture, Direction de la Recherche et du Développement, Service extérieur de Libramont.
https://agriculture.wallonie.be/home/recherche-developpement/acteurs-du-developpement-et-de-la-vulgarisation/les-services-exterieurs-de-la-direction-de-la-recherche-et-du-developpement/newsletters-des-services-exterieurs-de-la-vulgarisation/newsletters-du-se-de-libramont.html
Bonne lecture et bienvenue aux activités proposées.
#Agriculture #Wallonie #Newsletter #Recherche #Développement #Vulgarisation #Evènement #Information #Formation #Innovation #Législation #PAC #SPW #ServicepublicdeWallonie
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La JeunesseOscar Smith
Besoin des conseils pour les Jeunes ? Le document suivant est plein des conseils de la Vie ! C’est vraiment un document conseil de la jeunesse que tout jeune devrait consulter.
Voir version video:
➡https://youtu.be/7ED4uTW0x1I
Sur la chaine:👇
👉https://youtube.com/@kbgestiondeprojets
Aimeriez-vous donc…
-réussir quand on est jeune ?
-avoir de meilleurs conseils pour réussir jeune ?
- qu’on vous offre des conseils de la vie ?
Ce document est une ressource qui met en évidence deux obstacles qui empêchent les jeunes de mener une vie épanouie : l'inaction et le pessimisme.
1) Découvrez comment l'inaction, c'est-à-dire le fait de ne pas agir ou d'agir alors qu'on le devrait ou qu'on est censé le faire, est un obstacle à une vie épanouie ;
> Comment l'inaction affecte-t-elle l'avenir du jeune ? Que devraient plutôt faire les jeunes pour se racheter et récupérer ce qui leur appartient ? A découvrir dans le document ;
2) Le pessimisme, c'est douter de tout ! Les jeunes doutent que la génération plus âgée ne soit jamais orientée vers la bonne volonté. Les jeunes se sentent toujours mal à l'aise face à la ruse et la volonté politique de la génération plus âgée ! Cet état de doute extrême empêche les jeunes de découvrir les opportunités offertes par les politiques et les dispositifs en faveur de la jeunesse. Voulez-vous en savoir plus sur ces opportunités que la plupart des jeunes ne découvrent pas à cause de leur pessimisme ? Consultez cette ressource gratuite et profitez-en !
En rapport avec les " conseils pour les jeunes, " cette ressource peut aussi aider les internautes cherchant :
➡les conseils pratiques pour les jeunes
➡conseils pour réussir
➡jeune investisseur conseil
➡comment investir son argent quand on est jeune
➡conseils d'écriture jeunes auteurs
➡conseils pour les jeunes auteurs
➡comment aller vers les jeunes
➡conseil des jeunes citoyens
➡les conseils municipaux des jeunes
➡conseils municipaux des jeunes
➡conseil des jeunes en mairie
➡qui sont les jeunes
➡projet pour les jeunes
➡conseil des jeunes paris
➡infos pour les jeunes
➡conseils pour les jeunes
➡Quels sont les bienfaits de la jeunesse ?
➡Quels sont les 3 qualités de la jeunesse ?
➡Comment gérer les problèmes des adolescents ?
➡les conseils de jeunes
➡guide de conseils de jeunes
M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...M2i Formation
Suite à l'entrée en vigueur de la « Participation Financière Obligatoire » le 2 mai dernier, les règles du jeu ont changé !
Pour les entreprises, cette révolution du dispositif est l'occasion de revoir sa stratégie de formation pour co-construire avec ses salariés un plan de formation alliant performance de l'organisation et engagement des équipes.
Au cours de ce webinar de 20 minutes, co-animé avec la Caisse des Dépôts et Consignations, découvrez tous les détails actualisés sur les dotations et les exonérations, les meilleures pratiques, et comment maximiser les avantages pour les entreprises et leurs salariés.
Au programme :
- Principe et détails de la « Participation Financière Obligatoire » entrée en vigueur
- La dotation : une opportunité à saisir pour co-construire sa stratégie de formation
- Mise en pratique : comment doter ?
- Quelles incidences pour les titulaires ?
Webinar exclusif animé à distance en coanimation avec la CDC
M2i Webinar - « Participation Financière Obligatoire » et CPF : une opportuni...
Longueur de branches et arbres de mots
1. Colloque Cooccurrence 2012
09/02/2012 - Besançon
Longueur de branches et arbres de mots
Philippe Gambette, Nuria Gala, Alexis Nasr, Alain Guénoche
LIGM LIF IML
Université Paris-Est Université Aix-Marseille CNRS
Marne-la-Vallée
2. Plan
• Analyses et nuages arborés
• Interprétation visuelle
• Formules de longueurs d'arêtes
• Protocole d'évaluation
• Résultats
• Visualisations
• Perspectives
3. Plan
• Analyses et nuages arborés
• Interprétation visuelle
• Formules de longueurs d'arêtes
• Protocole d'évaluation
• Résultats
• Visualisations
• Perspectives
4. Analyses arborées
Rapprochement des mots d'un texte selon leur degré de
cooccurrence dans le texte
Constellation du mot “nuit” dans la base EXEMPLEM
(22 romans de 11 auteurs, lemmatisés) TEMPS 2
CHAMBRE À COUCHER
L'ATMOSPHÈRE
TEMPS 1
Barthelémy & Luong, Statistique et Analyse des Données, 1986
Hyperbase Brunet, JADT'08
5. Nuage arboré, une information double
occurrences
cooccurrences
Discours inaugural de Barack Obama
construit avec
SplitsTree : Huson & Bryant, Bioinformatics, 2006
TreeCloud : Gambette & Véronis, IFCS'09
6. Plan
• Analyses et nuages arborés
• Interprétation visuelle
• Formules de longueurs d'arêtes
• Protocole d'évaluation
• Résultats
• Visualisations
• Perspectives
7. Interprétation réelle
Les distances dans l'arbre entre deux mots reflètent au mieux
le degré de cooccurrence entre ces deux mots
8. Interprétation réelle
Problème 1 :
difficiles à lire
Les distances dans l'arbre entre deux mots reflètent au mieux
le degré de cooccurrence entre ces deux mots
9. Interprétation réelle
Problème 1 : Problème 2 :
difficiles à lire peu fiables
Les distances dans l'arbre entre deux mots reflètent au mieux
le degré de cooccurrence entre ces deux mots
10. Interprétation réelle
Optimisation
globale, pas
de garanties
locales de
qualité
Problème 1 : Problème 2 :
difficiles à lire peu fiables
Les distances dans l'arbre entre deux mots reflètent au mieux
le degré de cooccurrence entre ces deux mots
12. Interprétation pratique
arbre de distances
utilisé comme
classification
Les mots d'un même sous-arbre bien séparé du reste de l'arbre
constituent une classe de mots
13. Interprétation pratique
arbre de distances
utilisé comme
classification
Les mots d'un même sous-arbre bien séparé du reste de l'arbre
constituent une classe de mots
14. Interprétation pratique
arbre de distances
utilisé comme
classification
Problème : toujours
peu lisible (longueur
des arêtes externes)
et peu fiable
Les mots d'un même sous-arbre bien séparé du reste de l'arbre
constituent une classe de mots
15. Interprétation pratique
Astuce de visualisation pour améliorer la lisibilité :
longueur unitaire des arêtes
Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre
de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
Amstutz & Gambette, JADT'10
16. Interprétation pratique
Astuce de visualisation pour améliorer la lisibilité :
longueur unitaire des arêtes, MAIS...
encore moins fiable !
retour au texte
nécessaire,
fausses pistes
Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre
de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
Amstutz & Gambette, JADT'10
17. Interprétation pratique
Problème :
Comment calculer les longueurs des arêtes de l'arbre pour une
interprétation fiable des classes ?
Arête longue = classe de mots significative (proches les uns des
autres, bien séparés du reste)
Arête courte = classe de mots peu significative
18. Plan
• Analyses et nuages arborés
• Interprétation visuelle
• Formules de longueurs d'arêtes
• Protocole d'évaluation
• Résultats
• Visualisations
• Perspectives
19. Formules de longueurs d'arêtes
Post-calcul des longueurs d'arêtes après la construction de l'arbre,
pour que :
arêtes les plus longues ↔ classes de mots les plus significatives
↔ classes de mots bien séparées
d'après la distance de cooccurrence
20. Formules de longueurs d'arêtes
Post-calcul des longueurs d'arêtes après la construction de l'arbre,
pour que :
arêtes les plus longues ↔ classes de mots les plus significatives
↔ classes de mots bien séparées
d'après la distance de cooccurrence
Formule du ratio des bons triplets (“triples”) :
Si mot1 et mot2 d'un côté de l'arête, mot3 de l'autre côté,
“bon triplet” si
distance(mot1,mot2) <
min(distance(mot1,mot3), mot1
distance(mot2,mot3))
mot3
ratio espéré proche de 1
mot2
Guénoche & Garreta, IFCS'02
21. Formules de longueurs d'arêtes
Post-calcul des longueurs d'arêtes après la construction de l'arbre,
pour que :
arêtes les plus longues ↔ classes de mots les plus significatives
↔ classes de mots bien séparées
d'après la distance de cooccurrence
Formule du ratio des distances moyennes (“distanceRatio”) :
moyenne(distances inter-classes)
moyenne(distances intra-classes)
ratio espéré supérieur à 1
Guénoche & Garreta, IFCS'02
22. Formules de longueurs d'arêtes
Post-calcul des longueurs d'arêtes après la construction de l'arbre,
pour que :
arêtes les plus longues ↔ classes de mots les plus significatives
↔ classes de mots bien séparées
d'après la distance de cooccurrence
Formule du ratio des bons quadruplets (“quartets”) :
Si mot1 et mot2 d'un côté de l'arête, mot3 et mot4 de l'autre côté,
“bon quadruplet” si mot4
distance(mot1,mot2) +
distance(mot2,mot3) < mot1
min(distance(mot1,mot3) +
distance(mot2,mot4) +, mot3
distance(mot1,mot4) +
distance(mot2,mot3))
mot2
ratio espéré proche de 1 Guénoche & Garreta, IFCS'02
23. Plan
• Analyses et nuages arborés
• Interprétation visuelle
• Formules de longueurs d'arêtes
• Protocole d'évaluation
• Résultats
• Visualisations
• Perspectives
24. Protocole d'évaluation
Post-calcul des longueurs d'arêtes après la construction de l'arbre, puis :
Vérification que les classes de mots les mieux séparées
(d'après ces longueurs) sont significatives
25. Protocole d'évaluation
Post-calcul des longueurs d'arêtes après la construction de l'arbre, puis :
Vérification que les classes de mots Partition obtenue en découpant les
les mieux séparées (d'après ces arêtes les plus longues comparée
longueurs) sont significatives avec une partition de référence
26. Protocole d'évaluation
Post-calcul des longueurs d'arêtes après la construction de l'arbre, puis :
Vérification que les classes de mots Partition obtenue en découpant les
les mieux séparées (d'après ces arêtes les plus longues comparée
longueurs) sont significatives avec une partition de référence
quelles
données ?
27. Protocole d'évaluation
Base de données Polymots
Base lexicale de familles morpho-phonologiques
20 000 mots, 2000 familles
http://polymots.lif.univ-mrs.fr Gala & Rey, TALN'08
28. Protocole d'évaluation
Base de données Polymots
Base lexicale de familles morpho-phonologiques
20 000 mots, 2000 familles
+ partitions sémantiques des familles de 20 mots
(arbre, art, boule, carte, corde, dent, dict, fil, fusée, lune,
meuble, mode, onde, paille, penser, pot, presse, tenir, terre, val).
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
29. Protocole d'évaluation
Base de données Polymots
Base lexicale de familles morpho-phonologiques
20 000 mots, 2000 familles
+ partitions sémantiques des familles de 20 mots
(arbre, art, boule, carte, corde, dent, dict, fil, fusée, lune,
meuble, mode, onde, paille, penser, pot, presse, tenir, terre, val).
Exemple pour la famille de art :
{ {artifice, artificiel, artificiellement, artificier},
{artillerie, artilleur},
{artisan, artisanal, artisanalement, artisanat},
{artiste, artistique, artistiquement, art} }
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
30. Protocole d'évaluation
Idée :
• Construire une représentation arborée des mots de la famille
• Découper les k arêtes les plus longues de l'arbre pour obtenir Pk
• La partition obtenue est-elle proche de la partition “manuelle” ?
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
31. Protocole d'évaluation
Idée :
• Construire une représentation arborée des mots de la famille
• Découper les k arêtes les plus longues de l'arbre pour obtenir Pk
• La partition obtenue est-elle proche de la partition “manuelle” ?
Distance utilisée pour le calcul de la représentation arborée ?
Distance composite entre :
• nombre d'affixes communs
• degré de cooccurrence dans
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
32. Protocole d'évaluation
Idée :
• Construire une représentation arborée des mots de la famille
• Découper les k arêtes les plus longues de l'arbre pour obtenir Pk
• La partition obtenue est-elle proche de la partition “manuelle” ?
Partition automatique :
P0 = {{artisan, artisanat,
artisanal, artisanalement,
artiste, artistique,
artistiquement, artificier,
artificiel, artifice,
artificiellement, artillerie,
artilleur, art}}
Partition manuelle : Pm = {{artificier, artifice, artificiel, artificiellement}, {artillerie, artilleur},
{artisan, artisanal, artisanalement, artisanat}, {artiste, artistique, artistiquement, art}}
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
33. Protocole d'évaluation
Idée :
• Construire une représentation arborée des mots de la famille
• Découper les k arêtes les plus longues de l'arbre pour obtenir Pk
• La partition obtenue est-elle proche de la partition “manuelle” ?
Partition automatique :
P1 = {{artisan, artisanat,
artisanal, artisanalement,
artiste, artistique,
artistiquement, artificier,
artificiel, artifice,
artificiellement},
1 {artillerie, artilleur, art}}
Partition manuelle : Pm = {{artificier, artifice, artificiel, artificiellement}, {artillerie, artilleur},
{artisan, artisanal, artisanalement, artisanat}, {artiste, artistique, artistiquement, art}}
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
34. Protocole d'évaluation
Idée :
• Construire une représentation arborée des mots de la famille
• Découper les k arêtes les plus longues de l'arbre pour obtenir Pk
• La partition obtenue est-elle proche de la partition “manuelle” ?
Partition automatique :
P2 = {{artisan, artisanat,
artisanal, artisanalement},
{artiste, artistique,
artistiquement, artificier,
2 artificiel, artifice,
artificiellement},
1 {artillerie, artilleur, art}}
Partition manuelle : Pm = {{artificier, artifice, artificiel, artificiellement}, {artillerie, artilleur},
{artisan, artisanal, artisanalement, artisanat}, {artiste, artistique, artistiquement, art}}
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
35. Protocole d'évaluation
Idée :
• Construire une représentation arborée des mots de la famille
• Découper les k arêtes les plus longues de l'arbre pour obtenir Pk
• La partition obtenue est-elle proche de la partition “manuelle” ?
Partition automatique :
P3 = {{artisan, artisanat,
artisanal, artisanalement},
{artiste, artistique,
artistiquement, artificier,
2 artificiel, artifice,
artificiellement},
1 {artillerie, artilleur},
3 {art}}
Partition manuelle : Pm = {{artificier, artifice, artificiel, artificiellement}, {artillerie, artilleur},
{artisan, artisanal, artisanalement, artisanat}, {artiste, artistique, artistiquement, art}}
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
36. Protocole d'évaluation
Idée :
• Construire une représentation arborée des mots de la famille
• Découper les k arêtes les plus longues de l'arbre pour obtenir Pk
• La partition obtenue est-elle proche de la partition “manuelle” ?
Partition automatique :
P4 = {{artisan, artisanat,
artisanal, artisanalement},
{artiste, artistique,
artistiquement},
2 {artificier, artificiel, artifice,
artificiellement},
1 {artillerie, artilleur},
4
3 {art}}
Partition manuelle : Pm = {{artificier, artifice, artificiel, artificiellement}, {artillerie, artilleur},
{artisan, artisanal, artisanalement, artisanat}, {artiste, artistique, artistiquement, art}}
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
37. Protocole d'évaluation
Idée :
• Construire une représentation arborée des mots de la famille
• Découper les k arêtes les plus longues de l'arbre pour obtenir Pk
• La partition obtenue est-elle proche de la partition “manuelle” ?
Partition automatique :
P5 = {{artisan, artisanat,
artisanal, artisanalement},
{artiste, artistique,
artistiquement},
5 2 {artificier, artificiel, artifice,
artificiellement},
1 {artillerie, artilleur},
4
3 {art}}
Partition manuelle : Pm = {{artificier, artifice, artificiel, artificiellement}, {artillerie, artilleur},
{artisan, artisanal, artisanalement, artisanat}, {artiste, artistique, artistiquement, art}}
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
38. Protocole d'évaluation
Idée :
• Construire une représentation arborée des mots de la famille
• Découper les k arêtes les plus longues de l'arbre pour obtenir Pk
• La partition obtenue est-elle proche de la partition “manuelle” ?
Partition automatique :
P6 = {{artisan, artisanat,
artisanal, artisanalement},
{artiste, artistique,
6 artistiquement},
5 2 {artificier, artificiel, artifice,
artificiellement},
1 {artillerie, artilleur},
4
3 {art}}
Partition manuelle : Pm = {{artificier, artifice, artificiel, artificiellement}, {artillerie, artilleur},
{artisan, artisanal, artisanalement, artisanat}, {artiste, artistique, artistiquement, art}}
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
39. Protocole d'évaluation
Idée :
• Construire une représentation arborée des mots de la famille
• Découper les k arêtes les plus longues de l'arbre pour obtenir Pk
• La partition obtenue est-elle proche de la partition “manuelle” ?
Partition automatique :
P7 = {{artisan, artisanat,
artisanal, artisanalement},
{artiste, artistique,
6 artistiquement},
5 2 {artificier, artificiel, artifice},
{artificiellement},
1 {artillerie, artilleur},
4 7
3 {art}}
Partition manuelle : Pm = {{artificier, artifice, artificiel, artificiellement}, {artillerie, artilleur},
{artisan, artisanal, artisanalement, artisanat}, {artiste, artistique, artistiquement, art}}
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
40. Protocole d'évaluation
Idée :
• Construire une représentation arborée des mots de la famille
• Découper les k arêtes les plus longues de l'arbre pour obtenir Pk
• La partition obtenue est-elle proche de la partition “manuelle” ?
Partition automatique :
P7 = {{artisan, artisanat,
artisanal, artisanalement},
{artiste, artistique,
6 artistiquement},
5 2 {artificier, artificiel, artifice},
{artificiellement},
1 {artillerie, artilleur},
4 7
3 {art}}
Partition manuelle : Pm = {{artificier, artifice, artificiel, artificiellement}, {artillerie, artilleur},
{artisan, artisanal, artisanalement, artisanat}, {artiste, artistique, artistiquement, art}}
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
41. Protocole d'évaluation
Idée :
• Construire une représentation arborée des mots de la famille
• Découper les k arêtes les plus longues de l'arbre pour obtenir Pk
• La partition obtenue est-elle proche de la partition “manuelle” ?
Partition automatique :
P7 = {{artisan, artisanat,
artisanal, artisanalement},
{artiste, artistique,
6 artistiquement},
5 2 {artificier, artificiel, artifice},
{artificiellement},
1 {artillerie, artilleur},
4 7
3 {art}}
Comparer les partitions !
(indice de Rand, Rand corrigé)
Partition manuelle : Pm = {{artificier, artifice, artificiel, artificiellement}, {artillerie, artilleur},
{artisan, artisanal, artisanalement, artisanat}, {artiste, artistique, artistiquement, art}}
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
42. Protocole d'évaluation
Idée :
• Construire une représentation arborée des mots de la famille
• Découper les k arêtes les plus longues de l'arbre pour obtenir Pk
• La partition obtenue est-elle proche de la partition “manuelle” ?
Partition automatique :
P7 = {{artisan, artisanat,
artisanal, artisanalement},
{artiste, artistique,
artistiquement},
{artificier, artificiel, artifice},
{artificiellement},
{artillerie, artilleur},
{art}}
Comparer les partitions !
(indice de Rand, Rand corrigé)
Partition manuelle : Pm = {{artificier, artifice, artificiel, artificiellement}, {artillerie, artilleur},
{artisan, artisanal, artisanalement, artisanat}, {artiste, artistique, artistiquement, art}}
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
43. Protocole d'évaluation
Idée :
• Construire une représentation arborée des mots de la famille
• Découper les k arêtes les plus longues de l'arbre pour obtenir Pk
• La partition obtenue est-elle proche de la partition “manuelle” ?
Partition automatique :
P7 = {{artisan, artisanat,
artisanal, artisanalement},
{artiste, artistique,
artistiquement},
{artificier, artificiel, artifice},
{artificiellement},
{artillerie, artilleur},
{art}}
rand(Pm,P7) = 0.934
aRand(Pm,P7) = 0.774
Partition manuelle : Pm = {{artificier, artifice, artificiel, artificiellement}, {artillerie, artilleur},
{artisan, artisanal, artisanalement, artisanat}, {artiste, artistique, artistiquement, art}}
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
44. Protocole d'évaluation
Idée :
• Construire une représentation arborée des mots de la famille
• Découper les k arêtes les plus longues de l'arbre pour obtenir Pk
• La partition obtenue est-elle proche de la partition “manuelle” ?
Partition automatique :
P4 = {{artisan, artisanat,
artisanal, artisanalement},
{artiste, artistique,
artistiquement},
{artificier, artificiel, artifice,
artificiellement},
{artillerie, artilleur},
{art}}
rand(Pm,P4) = 0.967
aRand(Pm,P4) = 0.894
Partition manuelle : Pm = {{artificier, artifice, artificiel, artificiellement}, {artillerie, artilleur},
{artisan, artisanal, artisanalement, artisanat}, {artiste, artistique, artistiquement, art}}
Gala, Hathout, Nasr, Rey, Seppälä, TALN'11
45. Protocole d'évaluation
ensemble de mots cooccurrence dans le TLFI
+ affixes communs
matrice de distances méthodes NJ, UPGMA
arbre
formule 1 formule 2 formule 3
triples length quartets réévaluation des
Ratio longueurs d'arêtes
arbre 1 arbre 2 arbre 3
découpage de l'arbre
par longueur d'arête
décroissante
partition manuelle partition 1 partition 2 partition 3
comparaison de la
meilleure partition
parmi P0, P1, P2...
score 1 score 2 score 3
46. Plan
• Analyses et nuages arborés
• Interprétation visuelle
• Formules de longueurs d'arêtes
• Protocole d'évaluation
• Résultats
• Visualisations
• Perspectives
47. Scores de chaque formule
triples
1,2
lengthRatio
computedLength
1
agreementPairs
quartets
0,8
0,6
0,4
0,2
0
arbre art boule carte corde dent dict fil fus lune meuble mode onde paille penser pot presse ten terre val moyenne
Score Rand de la meilleure partition trouvée automatiquement
1
triples
0,9 lengthRatio
0,8 computedLength
0,7 agreementPairs
quartets
0,6
0,5
0,4
0,3
0,2
0,1
0
arbre art boule carte corde dent dict fil fus lune meuble mode onde paille penser pot presse ten terre val moyenne
Score Rand corrigé de la meilleure partition trouvée automatiquement
48. Scores de chaque formule
triples
1,2
lengthRatio
computedLength
1
agreementPairs
quartets
0,8
0,6
0,4
0,2
0
arbre art boule carte corde dent dict fil fus lune meuble mode onde paille penser pot presse ten terre val moyenne
Score Rand de la meilleure partition trouvée automatiquement
1
triples
meilleures performances
0,9 lengthRatio par triples et lengthRatio
0,8 computedLength
0,7 agreementPairs
quartets
0,6
0,5
0,4
0,3
0,2
0,1
0
arbre art boule carte corde dent dict fil fus lune meuble mode onde paille penser pot presse ten terre val moyenne
Score Rand corrigé de la meilleure partition trouvée automatiquement
49. Scores de chaque formule
Les formules de longueur d'arête sont-elles cohérentes ?
50. Scores de chaque formule
Les formules de longueur d'arête sont-elles cohérentes ?
1
triples
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0 0,5 1 1,5 2 2,5 3
computedLength
Longueur selon la formule triples en fonction de la longueur originale de l'arête
pour l'arbre de la famille de art
51. Scores de chaque formule
Les formules de longueur d'arête sont-elles cohérentes ?
1
triples
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2 arêtes externes (trop longues)
0,1
0
0 0,5 1 1,5 2 2,5 3
computedLength
Longueur selon la formule triples en fonction de la longueur originale de l'arête
pour l'arbre de la famille de art
52. Scores de chaque formule
Les formules de longueur d'arête sont-elles cohérentes ?
1
triples classes de mots les plus fiables
0,9
0,8
0,7
0,6
0,5
0,4 classes de
0,3
mots les
moins fiables arêtes externes (trop longues)
0,2
0,1
0
0 0,5 1 1,5 2 2,5 3
computedLength
Longueur selon la formule triples en fonction de la longueur originale de l'arête
pour l'arbre de la famille de art
53. Scores de chaque formule
Les formules de longueur d'arête sont-elles cohérentes ?
1,35 coefficient de corrélation :
lengthRatio 0.865
1,3
1,25
1,2
1,15
1,1
1,05
1
0,95
0,9
0,3 0,4 0,5 0,6 0,7 0,8 0,9
triples
Longueur selon la formule lengthRatio en fonction de celle selon la formule triples
pour l'arbre de la famille de art
54. Scores de chaque formule
Les formules de longueur d'arête sont-elles cohérentes ?
1,35 coefficient de corrélation :
lengthRatio
1,3
0.865 arêtes internes
1,25 arêtes internes
généralement plus longues :
1,2
bonne lisibilité de l'arbre
1,15
1,1
1,05
1
arêtes externes
0,95
0,9
0,3 0,4 0,5 0,6 0,7 0,8 0,9
triples
Longueur selon la formule lengthRatio en fonction de celle selon la formule triples
pour l'arbre de la famille de art
55. Scores de chaque formule
Les formules de longueur d'arête sont-elles cohérentes ?
1,35 coefficient de corrélation :
lengthRatio
1,3
0.865 arêtes internes
1,25 arêtes internes
généralement plus longues :
1,2
bonne lisibilité de l'arbre
1,15
1,1
1,05
1 écart-type deux fois plus
arêtes externes grand pour triples
0,95
0.166 au lieu de 0.084
0,9
0,3 0,4 0,5 0,6 0,7 0,8 0,9
triples
Longueur selon la formule lengthRatio en fonction de celle selon la formule triples
pour l'arbre de la famille de art
56. Plan
• Analyses et nuages arborés
• Interprétation visuelle
• Formules de longueurs d'arêtes
• Protocole d'évaluation
• Résultats
• Visualisations
• Perspectives
60. Plan
• Analyses et nuages arborés
• Interprétation visuelle
• Formules de longueurs d'arêtes
• Protocole d'évaluation
• Résultats
• Visualisations
• Perspectives
61. Perspectives
• intégration des données de JeuxDeMots dans le protocole, et plus
généralement en textométrie
• réseau de plus de 200 000 mots et 1 200 000 liens pondérés
• cooccurrences dans la production spontanée de mots par rapport à
un mot cible
• cohérence avec les distances de cooccurrence calculées à partir
d'un texte ?
Lafourcade, JADT'08
• intégration de la visualisation en nuages arborés avec longueurs de
branches post-calculées :
• dans les outils de textométrie existants
• par des interfaces d'import/export adaptées
• pour faciliter le retour au texte
63. Analyses arborées
Rapprochement des mots d'un texte selon leur degré de
cooccurrence dans le texte
Constellation du mot “nuit” dans la base EXEMPLEM
(22 romans de 11 auteurs, lemmatisés) TEMPS 2
CHAMBRE À COUCHER
L'ATMOSPHÈRE
TEMPS 1
Barthelémy & Luong, Statistique et Analyse des Données, 1986
Hyperbase Brunet, JADT'08
64. Analyses arborées
Rapprochement des mots d'un texte selon leur degré de
cooccurrence dans le texte
Constellation du mot “nuit” dans la base EXEMPLEM
(22 romans de 11 auteurs, lemmatisés) TEMPS 2
CHAMBRE À COUCHER
L'ATMOSPHÈRE
TEMPS 1
Barthelémy & Luong, Statistique et Analyse des Données, 1986
Hyperbase Brunet, JADT'08
65. Ultramétriques, centre d'un arbre
arbre “sans centre” (feuilles
à gauche plus éloignées de
ce point que celles à droit)
“centre” de l'arbre