1. Des réseaux sociaux aux réseaux historiques
Nathalie Villa-Vialaneix
http://www.nathalievilla.org
nathalie.villa@univ-paris1.fr
IUT de Perpignan & SAMM, Université Paris 1
Les cafés de l’IMT, 19 Janvier 2012
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 1 / 20
2. Qu’est-ce qu’un réseau/graphe ?
Plan
1 Qu’est-ce qu’un réseau/graphe ?
2 Quelques outils de fouille de graphes
Visualisation
Charactéristiques individuelles des sommets
Recherche de “Communautés”
3 Fouille sur un grand graphe médiéval
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 2 / 20
3. Qu’est-ce qu’un réseau/graphe ?
Qu’est-ce qu’un réseau/graphe ?
Objet mathématique utilisé pour modéliser des relations entre des
entités.
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 3 / 20
4. Qu’est-ce qu’un réseau/graphe ?
Qu’est-ce qu’un réseau/graphe ?
Objet mathématique utilisé pour modéliser des relations entre des
entités.
Les entités sont appelées les nœuds ou les sommets.
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 3 / 20
5. Qu’est-ce qu’un réseau/graphe ?
Qu’est-ce qu’un réseau/graphe ?
Objet mathématique utilisé pour modéliser des relations entre des
entités.
Une relation entre deux entités est modélisée par une arête.
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 3 / 20
6. Qu’est-ce qu’un réseau/graphe ?
Exemples
Réseaux sociaux : sommets : personnes - arêtes : lien entre deux
personnes
powered by Touchgraph
TM 1 (Natty’s facebook
TM 2 network)
1
http://www.touchgraph.com
2
https://www.facebook.com
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
7. Qu’est-ce qu’un réseau/graphe ?
Exemples
Réseaux biologiques (un exemple, parmi d’autres : réseau de co-expression):
sommets : gènes - arêtes : les deux gènes fonctionnent “de la même
manière”
[Liaubet et al., 2010, Villa-Vialaneix et al., 2011]
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
8. Qu’est-ce qu’un réseau/graphe ?
Exemples
D’autres types de données relationnelles
Modéliser un large corpus de documents moyennageux
actes notariés (la plupart sont des baux à
fief) établis dans la seigneurie de Castel-
nau Montratier, entre 1250 et 1500, qui im-
pliquent des tenanciers et des seigneurs.a
a
http://graphcomp.univ-tlse2.fr
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
9. Qu’est-ce qu’un réseau/graphe ?
Exemples
D’autres types de données relationnelles
Modéliser un large corpus de documents moyennageux
• sommets : transactions et individus
(10 542 sommets)
• arêtes : un individu est directement
impliqué dans une transaction (6 455
arêtes)
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
11. Qu’est-ce qu’un réseau/graphe ?
Exemples
D’autres types de données relationnelles Réseau de consommation
sommets : 105 livres de politique américains - arêtes modélisent le fait
que le même acheteur a acheté les deux livres (sur Amazon).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
12. Qu’est-ce qu’un réseau/graphe ?
Modèles relationnels plus complexes
Les sommets peuvent être étiquetés par une information supplémentaire
qualitative
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 5 / 20
13. Qu’est-ce qu’un réseau/graphe ?
Modèles relationnels plus complexes
Les sommets peuvent être étiquetés par une information supplémentaire
qualitative
... ou numérique. [Laurent and Villa-Vialaneix, 2011]
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 5 / 20
14. Qu’est-ce qu’un réseau/graphe ?
Modèles relationnels plus complexes
Les sommets peuvent être étiquetés par une information supplémentaire
qualitative
... ou numérique. [Laurent and Villa-Vialaneix, 2011]
Arêtes peuvent être étiquetées (type de la relation) ou pondérées (force
de la relation).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 5 / 20
15. Quelques outils de fouille de graphes
Plan
1 Qu’est-ce qu’un réseau/graphe ?
2 Quelques outils de fouille de graphes
Visualisation
Charactéristiques individuelles des sommets
Recherche de “Communautés”
3 Fouille sur un grand graphe médiéval
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 6 / 20
16. Quelques outils de fouille de graphes
Dans la suite...
... on considère un graphe avec :
• des sommets {x1, . . . , xn} ;
• des arêtes ;
• des poids sur les arêtes, symétriques et positifs Wij.
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 7 / 20
17. Quelques outils de fouille de graphes Visualisation
Plan
1 Qu’est-ce qu’un réseau/graphe ?
2 Quelques outils de fouille de graphes
Visualisation
Charactéristiques individuelles des sommets
Recherche de “Communautés”
3 Fouille sur un grand graphe médiéval
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 8 / 20
18. Quelques outils de fouille de graphes Visualisation
Représenter le graphe
Problème : Comment placer les sommets sur la feuille de manière à avoir
une représentation compréhensible et esthétique du graphe ?
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 9 / 20
19. Quelques outils de fouille de graphes Visualisation
Représenter le graphe
Problème : Comment placer les sommets sur la feuille de manière à avoir
une représentation compréhensible et esthétique du graphe ?
Approche standard : algorithmes de forces (FDP) (par exemple :
[Fruchterman and Reingold, 1991])
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 9 / 20
20. Quelques outils de fouille de graphes Visualisation
Représenter le graphe
Problème : Comment placer les sommets sur la feuille de manière à avoir
une représentation compréhensible et esthétique du graphe ?
Approche standard : algorithmes de forces (FDP) (par exemple :
[Fruchterman and Reingold, 1991])
• forces attractives : similaires à des ressorts sur les arêtes
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 9 / 20
21. Quelques outils de fouille de graphes Visualisation
Représenter le graphe
Problème : Comment placer les sommets sur la feuille de manière à avoir
une représentation compréhensible et esthétique du graphe ?
Approche standard : algorithmes de forces (FDP) (par exemple :
[Fruchterman and Reingold, 1991])
• forces attractives : similaires à des ressorts sur les arêtes
• forces répulsives : similaires à des forces électriques entre les paires
de sommets
algorithme itératif jusqu’à stabilisation de la position des sommets.
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 9 / 20
22. Quelques outils de fouille de graphes Visualisation
Outils de visualisation
• package igraph1
[Csardi and Nepusz, 2006] (représentations
statiques avec divers outils pour faire de la fouille de graphes)
1
http://igraph.sourceforge.net/
2
http://gephi.org
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 10 / 20
23. Quelques outils de fouille de graphes Visualisation
Outils de visualisation
• package igraph1
[Csardi and Nepusz, 2006] (représentations
statiques avec divers outils pour faire de la fouille de graphes)
• logiciel libre Gephi2
(interactif, on peut zoomer, déplacer le
graphe à la souris...)
1
http://igraph.sourceforge.net/
2
http://gephi.org
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 10 / 20
24. Quelques outils de fouille de graphes Charactéristiques individuelles des sommets
Plan
1 Qu’est-ce qu’un réseau/graphe ?
2 Quelques outils de fouille de graphes
Visualisation
Charactéristiques individuelles des sommets
Recherche de “Communautés”
3 Fouille sur un grand graphe médiéval
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 11 / 20
25. Quelques outils de fouille de graphes Charactéristiques individuelles des sommets
Quels sont les sommets importants ?
1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les
sommets avec un fort degré sont appelés des “hubs” (mesure de
popularité).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
26. Quelques outils de fouille de graphes Charactéristiques individuelles des sommets
Quels sont les sommets importants ?
1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les
sommets avec un fort degré sont appelés des “hubs” (mesure de
popularité).
La distribution des degrés est souvent en loi de puissance dans
les réseaux réels:
1 2 5 10 20 50 100 200 500
1550500
Names
Transactions
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
27. Quelques outils de fouille de graphes Charactéristiques individuelles des sommets
Quels sont les sommets importants ?
1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les
sommets avec un fort degré sont appelés des “hubs” (mesure de
popularité).
La distribution des degrés est souvent en loi de puissance dans
les réseaux réels:
2 Centralité d’un sommet : nombre de plus courts chemins entre
toutes les paires de sommets qui passent par le sommet considéré
(sommets qui sont susceptibles de déconnecter le graphe si ils sont
retirés).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
28. Quelques outils de fouille de graphes Charactéristiques individuelles des sommets
Quels sont les sommets importants ?
1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les
sommets avec un fort degré sont appelés des “hubs” (mesure de
popularité).
La distribution des degrés est souvent en loi de puissance dans
les réseaux réels:
2 Centralité d’un sommet : nombre de plus courts chemins entre
toutes les paires de sommets qui passent par le sommet considéré
(sommets qui sont susceptibles de déconnecter le graphe si ils sont
retirés).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
29. Quelques outils de fouille de graphes Charactéristiques individuelles des sommets
Quels sont les sommets importants ?
1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les
sommets avec un fort degré sont appelés des “hubs” (mesure de
popularité).
La distribution des degrés est souvent en loi de puissance dans
les réseaux réels:
2 Centralité d’un sommet : nombre de plus courts chemins entre
toutes les paires de sommets qui passent par le sommet considéré
(sommets qui sont susceptibles de déconnecter le graphe si ils sont
retirés).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
30. Quelques outils de fouille de graphes Charactéristiques individuelles des sommets
Quels sont les sommets importants ?
1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les
sommets avec un fort degré sont appelés des “hubs” (mesure de
popularité).
La distribution des degrés est souvent en loi de puissance dans
les réseaux réels:
2 Centralité d’un sommet : nombre de plus courts chemins entre
toutes les paires de sommets qui passent par le sommet considéré
(sommets qui sont susceptibles de déconnecter le graphe si ils sont
retirés).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
31. Quelques outils de fouille de graphes Charactéristiques individuelles des sommets
Quels sont les sommets importants ?
1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les
sommets avec un fort degré sont appelés des “hubs” (mesure de
popularité).
La distribution des degrés est souvent en loi de puissance dans
les réseaux réels:
2 Centralité d’un sommet : nombre de plus courts chemins entre
toutes les paires de sommets qui passent par le sommet considéré
(sommets qui sont susceptibles de déconnecter le graphe si ils sont
retirés).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
32. Quelques outils de fouille de graphes Recherche de “Communautés”
Plan
1 Qu’est-ce qu’un réseau/graphe ?
2 Quelques outils de fouille de graphes
Visualisation
Charactéristiques individuelles des sommets
Recherche de “Communautés”
3 Fouille sur un grand graphe médiéval
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 13 / 20
33. Quelques outils de fouille de graphes Recherche de “Communautés”
Classification des sommets
But : Mettre en valeur des groupes de sommets denses et qui partagent
peu de liens avec les autres groupes.
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 14 / 20
34. Quelques outils de fouille de graphes Recherche de “Communautés”
Classification des sommets
But : Mettre en valeur des groupes de sommets denses et qui partagent
peu de liens avec les autres groupes.
⇒ Représentation simplifiée du graphe :
• communauté représentée par un symbole d’aire proportionnelle au nombre de
sommets ;
• largeur du lien entre deux classes proportionnelle à la somme des poids des arêtes.
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 14 / 20
35. Fouille sur un grand graphe médiéval
Plan
1 Qu’est-ce qu’un réseau/graphe ?
2 Quelques outils de fouille de graphes
Visualisation
Charactéristiques individuelles des sommets
Recherche de “Communautés”
3 Fouille sur un grand graphe médiéval
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 15 / 20
36. Fouille sur un grand graphe médiéval
Retour au graphe d’archives médiévales
[Rossi et al., 2012]
• 10 542 sommets : transactions ou personnes ;
• arêtes modélisent l’implication active d’une personne dans une
transaction.
⇒ Graphe biparti
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 16 / 20
37. Fouille sur un grand graphe médiéval
Caractéristiques macroscopiques
Plus grande composante connexe : 10 025 sommets : petite comparée
à un modèle aléatoire (graphe peu connecté).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 17 / 20
38. Fouille sur un grand graphe médiéval
Caractéristiques macroscopiques
Plus grande composante connexe : 10 025 sommets : petite comparée
à un modèle aléatoire (graphe peu connecté).
Pourquoi ?
Indivual
Transaction
2 groupes denses...
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 17 / 20
39. Fouille sur un grand graphe médiéval
Caractéristiques macroscopiques
Plus grande composante connexe : 10 025 sommets : petite comparée
à un modèle aléatoire (graphe peu connecté).
Pourquoi ?
2 groupes denses...
... correspondant à deux péri-
odes différentes
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 17 / 20
40. Fouille sur un grand graphe médiéval
Caractéristiques macroscopiques
Plus grande composante connexe : 10 025 sommets : petite comparée
à un modèle aléatoire (graphe peu connecté).
Pourquoi ?
Transaction dates
Density
1250 1300 1350 1400 1450 1500
0e+003e−05
all transactions
Jean Roquefeuil
Castelnaud Ratier (3rd)
Ratier (first)
2 groupes denses...
... correspondant à deux péri-
odes différentes
avant et après la guerre de
Cent ans (et la grande peste)
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 17 / 20
41. Fouille sur un grand graphe médiéval
Recherche de communautés
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 18 / 20
42. Fouille sur un grand graphe médiéval
Recherche de communautés
La visualisation aide à repérer
les personnes importantes
(exemple : Hélène de Castel-
nau)
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 18 / 20
43. Fouille sur un grand graphe médiéval
Recherche de communautés
La visualisation aide à identi-
fier des problèmes :
• Trois classes “Jean
Laperarede”
• Un lien direct suspicieux
“Jean Laperarede” &
“Ratier”
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 18 / 20
44. Fouille sur un grand graphe médiéval
Analyse globale/locale
Sommets importants : Fort degré / forte centralité. Est-ce que ce sont
les mêmes ?
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 19 / 20
45. Fouille sur un grand graphe médiéval
Analyse globale/locale
Sommets importants : Fort degré / forte centralité. Est-ce que ce sont
les mêmes ? Oui... souvent !
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 19 / 20
46. Fouille sur un grand graphe médiéval
Analyse globale/locale
Sommets importants : Fort degré / forte centralité. Est-ce que ce sont
les mêmes ? Oui... souvent !
Exceptions :
• personnes morales : Chapitre de Cahors, Église de Flaugnac ;
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 19 / 20
47. Fouille sur un grand graphe médiéval
Analyse globale/locale
Sommets importants : Fort degré / forte centralité. Est-ce que ce sont
les mêmes ? Oui... souvent !
Exceptions :
• personnes morales : Chapitre de Cahors, Église de Flaugnac ;
• erreurs de transcription : Arnaud Escairac (plus courts chemins
entre Ratier et Jean Laperarede ; durée de vie : 148 ans !!)
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 19 / 20
48. Fouille sur un grand graphe médiéval
Analyse globale/locale
Sommets importants : Fort degré / forte centralité. Est-ce que ce sont
les mêmes ? Oui... souvent !
Exceptions :
• personnes morales : Chapitre de Cahors, Église de Flaugnac ;
• erreurs de transcription : Guiral Combe (durée de vie : 52 ans)
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 19 / 20
49. Fouille sur un grand graphe médiéval
Références
Merci de votre intérêt !
Csardi, G. and Nepusz, T. (2006).
The igraph software package for complex network research.
InterJournal, Complex Systems.
Fruchterman, T. and Reingold, B. (1991).
Graph drawing by force-directed placement.
Software-Practice and Experience, 21:1129–1164.
Laurent, T. and Villa-Vialaneix, N. (2011).
Using spatial indexes for labeled network analysis.
Information, Interaction, Intelligence (i3), 11(1).
Liaubet, L., Villa-Vialaneix, N., Gamot, A., Rossi, F., Chérel, P., and SanCristobal, M. (2010).
The structure of a gene network reveals 7 biological functions underlying eQTLs in pig.
In Gesellschaft für Tierzuchtwissenschaften e. V., editor, World Congress on Genetics Applied to Livestock Production
(WCGALP), number 0147, Leipzig, Germany.
Rossi, F., Villa-Vialaneix, N., and Hautefeuille, F. (2012).
Exploration of a large database of French notarial acts with social network methods.
Submitted.
Villa-Vialaneix, N., Liaubet, L., Laurent, T., Gamot, A., Cherel, P., and Sancristobal, M. (2011).
L’analyse d’un réseau de co-expression génique met en valeur des groupes fonctionnels homogènes et des gènes importants
relatifs a un phénotype d’intérêt.
In Actes des 43èmes Journées de Statistique, Société Française de Statistique, Tunis, Tunisie.
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 20 / 20