SlideShare une entreprise Scribd logo
1  sur  49
Télécharger pour lire hors ligne
Des réseaux sociaux aux réseaux historiques
Nathalie Villa-Vialaneix
http://www.nathalievilla.org
nathalie.villa@univ-paris1.fr
IUT de Perpignan & SAMM, Université Paris 1
Les cafés de l’IMT, 19 Janvier 2012
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 1 / 20
Qu’est-ce qu’un réseau/graphe ?
Plan
1 Qu’est-ce qu’un réseau/graphe ?
2 Quelques outils de fouille de graphes
Visualisation
Charactéristiques individuelles des sommets
Recherche de “Communautés”
3 Fouille sur un grand graphe médiéval
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 2 / 20
Qu’est-ce qu’un réseau/graphe ?
Qu’est-ce qu’un réseau/graphe ?
Objet mathématique utilisé pour modéliser des relations entre des
entités.
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 3 / 20
Qu’est-ce qu’un réseau/graphe ?
Qu’est-ce qu’un réseau/graphe ?
Objet mathématique utilisé pour modéliser des relations entre des
entités.
Les entités sont appelées les nœuds ou les sommets.
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 3 / 20
Qu’est-ce qu’un réseau/graphe ?
Qu’est-ce qu’un réseau/graphe ?
Objet mathématique utilisé pour modéliser des relations entre des
entités.
Une relation entre deux entités est modélisée par une arête.
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 3 / 20
Qu’est-ce qu’un réseau/graphe ?
Exemples
Réseaux sociaux : sommets : personnes - arêtes : lien entre deux
personnes
powered by Touchgraph
TM 1 (Natty’s facebook
TM 2 network)
1
http://www.touchgraph.com
2
https://www.facebook.com
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
Qu’est-ce qu’un réseau/graphe ?
Exemples
Réseaux biologiques (un exemple, parmi d’autres : réseau de co-expression):
sommets : gènes - arêtes : les deux gènes fonctionnent “de la même
manière”
[Liaubet et al., 2010, Villa-Vialaneix et al., 2011]
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
Qu’est-ce qu’un réseau/graphe ?
Exemples
D’autres types de données relationnelles
Modéliser un large corpus de documents moyennageux
actes notariés (la plupart sont des baux à
fief) établis dans la seigneurie de Castel-
nau Montratier, entre 1250 et 1500, qui im-
pliquent des tenanciers et des seigneurs.a
a
http://graphcomp.univ-tlse2.fr
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
Qu’est-ce qu’un réseau/graphe ?
Exemples
D’autres types de données relationnelles
Modéliser un large corpus de documents moyennageux
• sommets : transactions et individus
(10 542 sommets)
• arêtes : un individu est directement
impliqué dans une transaction (6 455
arêtes)
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
Qu’est-ce qu’un réseau/graphe ?
Exemples
D’autres types de données relationnelles
Indivual
Transaction
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
Qu’est-ce qu’un réseau/graphe ?
Exemples
D’autres types de données relationnelles Réseau de consommation
sommets : 105 livres de politique américains - arêtes modélisent le fait
que le même acheteur a acheté les deux livres (sur Amazon).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
Qu’est-ce qu’un réseau/graphe ?
Modèles relationnels plus complexes
Les sommets peuvent être étiquetés par une information supplémentaire
qualitative
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 5 / 20
Qu’est-ce qu’un réseau/graphe ?
Modèles relationnels plus complexes
Les sommets peuvent être étiquetés par une information supplémentaire
qualitative
... ou numérique. [Laurent and Villa-Vialaneix, 2011]
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 5 / 20
Qu’est-ce qu’un réseau/graphe ?
Modèles relationnels plus complexes
Les sommets peuvent être étiquetés par une information supplémentaire
qualitative
... ou numérique. [Laurent and Villa-Vialaneix, 2011]
Arêtes peuvent être étiquetées (type de la relation) ou pondérées (force
de la relation).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 5 / 20
Quelques outils de fouille de graphes
Plan
1 Qu’est-ce qu’un réseau/graphe ?
2 Quelques outils de fouille de graphes
Visualisation
Charactéristiques individuelles des sommets
Recherche de “Communautés”
3 Fouille sur un grand graphe médiéval
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 6 / 20
Quelques outils de fouille de graphes
Dans la suite...
... on considère un graphe avec :
• des sommets {x1, . . . , xn} ;
• des arêtes ;
• des poids sur les arêtes, symétriques et positifs Wij.
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 7 / 20
Quelques outils de fouille de graphes Visualisation
Plan
1 Qu’est-ce qu’un réseau/graphe ?
2 Quelques outils de fouille de graphes
Visualisation
Charactéristiques individuelles des sommets
Recherche de “Communautés”
3 Fouille sur un grand graphe médiéval
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 8 / 20
Quelques outils de fouille de graphes Visualisation
Représenter le graphe
Problème : Comment placer les sommets sur la feuille de manière à avoir
une représentation compréhensible et esthétique du graphe ?
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 9 / 20
Quelques outils de fouille de graphes Visualisation
Représenter le graphe
Problème : Comment placer les sommets sur la feuille de manière à avoir
une représentation compréhensible et esthétique du graphe ?
Approche standard : algorithmes de forces (FDP) (par exemple :
[Fruchterman and Reingold, 1991])
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 9 / 20
Quelques outils de fouille de graphes Visualisation
Représenter le graphe
Problème : Comment placer les sommets sur la feuille de manière à avoir
une représentation compréhensible et esthétique du graphe ?
Approche standard : algorithmes de forces (FDP) (par exemple :
[Fruchterman and Reingold, 1991])
• forces attractives : similaires à des ressorts sur les arêtes
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 9 / 20
Quelques outils de fouille de graphes Visualisation
Représenter le graphe
Problème : Comment placer les sommets sur la feuille de manière à avoir
une représentation compréhensible et esthétique du graphe ?
Approche standard : algorithmes de forces (FDP) (par exemple :
[Fruchterman and Reingold, 1991])
• forces attractives : similaires à des ressorts sur les arêtes
• forces répulsives : similaires à des forces électriques entre les paires
de sommets
algorithme itératif jusqu’à stabilisation de la position des sommets.
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 9 / 20
Quelques outils de fouille de graphes Visualisation
Outils de visualisation
• package igraph1
[Csardi and Nepusz, 2006] (représentations
statiques avec divers outils pour faire de la fouille de graphes)
1
http://igraph.sourceforge.net/
2
http://gephi.org
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 10 / 20
Quelques outils de fouille de graphes Visualisation
Outils de visualisation
• package igraph1
[Csardi and Nepusz, 2006] (représentations
statiques avec divers outils pour faire de la fouille de graphes)
• logiciel libre Gephi2
(interactif, on peut zoomer, déplacer le
graphe à la souris...)
1
http://igraph.sourceforge.net/
2
http://gephi.org
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 10 / 20
Quelques outils de fouille de graphes Charactéristiques individuelles des sommets
Plan
1 Qu’est-ce qu’un réseau/graphe ?
2 Quelques outils de fouille de graphes
Visualisation
Charactéristiques individuelles des sommets
Recherche de “Communautés”
3 Fouille sur un grand graphe médiéval
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 11 / 20
Quelques outils de fouille de graphes Charactéristiques individuelles des sommets
Quels sont les sommets importants ?
1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les
sommets avec un fort degré sont appelés des “hubs” (mesure de
popularité).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
Quelques outils de fouille de graphes Charactéristiques individuelles des sommets
Quels sont les sommets importants ?
1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les
sommets avec un fort degré sont appelés des “hubs” (mesure de
popularité).
La distribution des degrés est souvent en loi de puissance dans
les réseaux réels:
1 2 5 10 20 50 100 200 500
1550500
Names
Transactions
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
Quelques outils de fouille de graphes Charactéristiques individuelles des sommets
Quels sont les sommets importants ?
1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les
sommets avec un fort degré sont appelés des “hubs” (mesure de
popularité).
La distribution des degrés est souvent en loi de puissance dans
les réseaux réels:
2 Centralité d’un sommet : nombre de plus courts chemins entre
toutes les paires de sommets qui passent par le sommet considéré
(sommets qui sont susceptibles de déconnecter le graphe si ils sont
retirés).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
Quelques outils de fouille de graphes Charactéristiques individuelles des sommets
Quels sont les sommets importants ?
1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les
sommets avec un fort degré sont appelés des “hubs” (mesure de
popularité).
La distribution des degrés est souvent en loi de puissance dans
les réseaux réels:
2 Centralité d’un sommet : nombre de plus courts chemins entre
toutes les paires de sommets qui passent par le sommet considéré
(sommets qui sont susceptibles de déconnecter le graphe si ils sont
retirés).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
Quelques outils de fouille de graphes Charactéristiques individuelles des sommets
Quels sont les sommets importants ?
1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les
sommets avec un fort degré sont appelés des “hubs” (mesure de
popularité).
La distribution des degrés est souvent en loi de puissance dans
les réseaux réels:
2 Centralité d’un sommet : nombre de plus courts chemins entre
toutes les paires de sommets qui passent par le sommet considéré
(sommets qui sont susceptibles de déconnecter le graphe si ils sont
retirés).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
Quelques outils de fouille de graphes Charactéristiques individuelles des sommets
Quels sont les sommets importants ?
1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les
sommets avec un fort degré sont appelés des “hubs” (mesure de
popularité).
La distribution des degrés est souvent en loi de puissance dans
les réseaux réels:
2 Centralité d’un sommet : nombre de plus courts chemins entre
toutes les paires de sommets qui passent par le sommet considéré
(sommets qui sont susceptibles de déconnecter le graphe si ils sont
retirés).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
Quelques outils de fouille de graphes Charactéristiques individuelles des sommets
Quels sont les sommets importants ?
1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les
sommets avec un fort degré sont appelés des “hubs” (mesure de
popularité).
La distribution des degrés est souvent en loi de puissance dans
les réseaux réels:
2 Centralité d’un sommet : nombre de plus courts chemins entre
toutes les paires de sommets qui passent par le sommet considéré
(sommets qui sont susceptibles de déconnecter le graphe si ils sont
retirés).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
Quelques outils de fouille de graphes Recherche de “Communautés”
Plan
1 Qu’est-ce qu’un réseau/graphe ?
2 Quelques outils de fouille de graphes
Visualisation
Charactéristiques individuelles des sommets
Recherche de “Communautés”
3 Fouille sur un grand graphe médiéval
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 13 / 20
Quelques outils de fouille de graphes Recherche de “Communautés”
Classification des sommets
But : Mettre en valeur des groupes de sommets denses et qui partagent
peu de liens avec les autres groupes.
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 14 / 20
Quelques outils de fouille de graphes Recherche de “Communautés”
Classification des sommets
But : Mettre en valeur des groupes de sommets denses et qui partagent
peu de liens avec les autres groupes.
⇒ Représentation simplifiée du graphe :
• communauté représentée par un symbole d’aire proportionnelle au nombre de
sommets ;
• largeur du lien entre deux classes proportionnelle à la somme des poids des arêtes.
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 14 / 20
Fouille sur un grand graphe médiéval
Plan
1 Qu’est-ce qu’un réseau/graphe ?
2 Quelques outils de fouille de graphes
Visualisation
Charactéristiques individuelles des sommets
Recherche de “Communautés”
3 Fouille sur un grand graphe médiéval
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 15 / 20
Fouille sur un grand graphe médiéval
Retour au graphe d’archives médiévales
[Rossi et al., 2012]
• 10 542 sommets : transactions ou personnes ;
• arêtes modélisent l’implication active d’une personne dans une
transaction.
⇒ Graphe biparti
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 16 / 20
Fouille sur un grand graphe médiéval
Caractéristiques macroscopiques
Plus grande composante connexe : 10 025 sommets : petite comparée
à un modèle aléatoire (graphe peu connecté).
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 17 / 20
Fouille sur un grand graphe médiéval
Caractéristiques macroscopiques
Plus grande composante connexe : 10 025 sommets : petite comparée
à un modèle aléatoire (graphe peu connecté).
Pourquoi ?
Indivual
Transaction
2 groupes denses...
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 17 / 20
Fouille sur un grand graphe médiéval
Caractéristiques macroscopiques
Plus grande composante connexe : 10 025 sommets : petite comparée
à un modèle aléatoire (graphe peu connecté).
Pourquoi ?
2 groupes denses...
... correspondant à deux péri-
odes différentes
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 17 / 20
Fouille sur un grand graphe médiéval
Caractéristiques macroscopiques
Plus grande composante connexe : 10 025 sommets : petite comparée
à un modèle aléatoire (graphe peu connecté).
Pourquoi ?
Transaction dates
Density
1250 1300 1350 1400 1450 1500
0e+003e−05
all transactions
Jean Roquefeuil
Castelnaud Ratier (3rd)
Ratier (first)
2 groupes denses...
... correspondant à deux péri-
odes différentes
avant et après la guerre de
Cent ans (et la grande peste)
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 17 / 20
Fouille sur un grand graphe médiéval
Recherche de communautés
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 18 / 20
Fouille sur un grand graphe médiéval
Recherche de communautés
La visualisation aide à repérer
les personnes importantes
(exemple : Hélène de Castel-
nau)
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 18 / 20
Fouille sur un grand graphe médiéval
Recherche de communautés
La visualisation aide à identi-
fier des problèmes :
• Trois classes “Jean
Laperarede”
• Un lien direct suspicieux
“Jean Laperarede” &
“Ratier”
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 18 / 20
Fouille sur un grand graphe médiéval
Analyse globale/locale
Sommets importants : Fort degré / forte centralité. Est-ce que ce sont
les mêmes ?
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 19 / 20
Fouille sur un grand graphe médiéval
Analyse globale/locale
Sommets importants : Fort degré / forte centralité. Est-ce que ce sont
les mêmes ? Oui... souvent !
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 19 / 20
Fouille sur un grand graphe médiéval
Analyse globale/locale
Sommets importants : Fort degré / forte centralité. Est-ce que ce sont
les mêmes ? Oui... souvent !
Exceptions :
• personnes morales : Chapitre de Cahors, Église de Flaugnac ;
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 19 / 20
Fouille sur un grand graphe médiéval
Analyse globale/locale
Sommets importants : Fort degré / forte centralité. Est-ce que ce sont
les mêmes ? Oui... souvent !
Exceptions :
• personnes morales : Chapitre de Cahors, Église de Flaugnac ;
• erreurs de transcription : Arnaud Escairac (plus courts chemins
entre Ratier et Jean Laperarede ; durée de vie : 148 ans !!)
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 19 / 20
Fouille sur un grand graphe médiéval
Analyse globale/locale
Sommets importants : Fort degré / forte centralité. Est-ce que ce sont
les mêmes ? Oui... souvent !
Exceptions :
• personnes morales : Chapitre de Cahors, Église de Flaugnac ;
• erreurs de transcription : Guiral Combe (durée de vie : 52 ans)
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 19 / 20
Fouille sur un grand graphe médiéval
Références
Merci de votre intérêt !
Csardi, G. and Nepusz, T. (2006).
The igraph software package for complex network research.
InterJournal, Complex Systems.
Fruchterman, T. and Reingold, B. (1991).
Graph drawing by force-directed placement.
Software-Practice and Experience, 21:1129–1164.
Laurent, T. and Villa-Vialaneix, N. (2011).
Using spatial indexes for labeled network analysis.
Information, Interaction, Intelligence (i3), 11(1).
Liaubet, L., Villa-Vialaneix, N., Gamot, A., Rossi, F., Chérel, P., and SanCristobal, M. (2010).
The structure of a gene network reveals 7 biological functions underlying eQTLs in pig.
In Gesellschaft für Tierzuchtwissenschaften e. V., editor, World Congress on Genetics Applied to Livestock Production
(WCGALP), number 0147, Leipzig, Germany.
Rossi, F., Villa-Vialaneix, N., and Hautefeuille, F. (2012).
Exploration of a large database of French notarial acts with social network methods.
Submitted.
Villa-Vialaneix, N., Liaubet, L., Laurent, T., Gamot, A., Cherel, P., and Sancristobal, M. (2011).
L’analyse d’un réseau de co-expression génique met en valeur des groupes fonctionnels homogènes et des gènes importants
relatifs a un phénotype d’intérêt.
In Actes des 43èmes Journées de Statistique, Société Française de Statistique, Tunis, Tunisie.
Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 20 / 20

Contenu connexe

Similaire à Des réseaux sociaux aux réseaux historiques

Enjeux de la donnee 21 novembre18
Enjeux de la donnee 21 novembre18Enjeux de la donnee 21 novembre18
Enjeux de la donnee 21 novembre18Laetitia Lycke
 
Combiner classification et visualisation pour l’exploration de grands réseaux
Combiner classification et visualisation pour l’exploration de grands réseauxCombiner classification et visualisation pour l’exploration de grands réseaux
Combiner classification et visualisation pour l’exploration de grands réseauxtuxette
 
Keynote open data biennales
Keynote open data biennalesKeynote open data biennales
Keynote open data biennalesThibault Mahé
 
AGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoirenoucher
 
Webinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataWebinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataGroupe EEIE
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Philippe METAYER
 
DataCités 2 : Accompagner la conception de data services urbains (Smart citi...
DataCités 2  : Accompagner la conception de data services urbains (Smart citi...DataCités 2  : Accompagner la conception de data services urbains (Smart citi...
DataCités 2 : Accompagner la conception de data services urbains (Smart citi...Gehan Kamachi
 
Dataviz & BigData :Mythes & réalités
Dataviz & BigData :Mythes & réalitésDataviz & BigData :Mythes & réalités
Dataviz & BigData :Mythes & réalitésMicrosoft
 
Conclusion du cours Exploration du Web
Conclusion du cours Exploration du WebConclusion du cours Exploration du Web
Conclusion du cours Exploration du WebSébastien
 
Combiner classification et visualisation pour l’exploration de grands réseaux
Combiner classification et visualisation pour l’exploration de grands réseauxCombiner classification et visualisation pour l’exploration de grands réseaux
Combiner classification et visualisation pour l’exploration de grands réseauxtuxette
 
CGT-digital-week.pptx
CGT-digital-week.pptxCGT-digital-week.pptx
CGT-digital-week.pptxolivier
 
Vers des data services urbains d'interet général
Vers des data services urbains d'interet généralVers des data services urbains d'interet général
Vers des data services urbains d'interet généralGehan Kamachi
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1Amal Abid
 
Social network metrics and trust based recommendation
Social network metrics and trust based recommendationSocial network metrics and trust based recommendation
Social network metrics and trust based recommendationJimmy Siméon
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4jNeo4j
 
La dataviz, outil de performance pour les entreprises ?
La dataviz, outil de performance pour les entreprises ?La dataviz, outil de performance pour les entreprises ?
La dataviz, outil de performance pour les entreprises ?Smartwords
 

Similaire à Des réseaux sociaux aux réseaux historiques (20)

Enjeux de la donnee 21 novembre18
Enjeux de la donnee 21 novembre18Enjeux de la donnee 21 novembre18
Enjeux de la donnee 21 novembre18
 
Combiner classification et visualisation pour l’exploration de grands réseaux
Combiner classification et visualisation pour l’exploration de grands réseauxCombiner classification et visualisation pour l’exploration de grands réseaux
Combiner classification et visualisation pour l’exploration de grands réseaux
 
Keynote open data biennales
Keynote open data biennalesKeynote open data biennales
Keynote open data biennales
 
AGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoire
 
Webinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataWebinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la data
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
 
Ic05complet
Ic05completIc05complet
Ic05complet
 
DataCités 2 : Accompagner la conception de data services urbains (Smart citi...
DataCités 2  : Accompagner la conception de data services urbains (Smart citi...DataCités 2  : Accompagner la conception de data services urbains (Smart citi...
DataCités 2 : Accompagner la conception de data services urbains (Smart citi...
 
Dataviz & BigData :Mythes & réalités
Dataviz & BigData :Mythes & réalitésDataviz & BigData :Mythes & réalités
Dataviz & BigData :Mythes & réalités
 
Conclusion du cours Exploration du Web
Conclusion du cours Exploration du WebConclusion du cours Exploration du Web
Conclusion du cours Exploration du Web
 
Combiner classification et visualisation pour l’exploration de grands réseaux
Combiner classification et visualisation pour l’exploration de grands réseauxCombiner classification et visualisation pour l’exploration de grands réseaux
Combiner classification et visualisation pour l’exploration de grands réseaux
 
CGT-digital-week.pptx
CGT-digital-week.pptxCGT-digital-week.pptx
CGT-digital-week.pptx
 
Vers des data services urbains d'interet général
Vers des data services urbains d'interet généralVers des data services urbains d'interet général
Vers des data services urbains d'interet général
 
IC05 cours 2
IC05 cours 2IC05 cours 2
IC05 cours 2
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Social network metrics and trust based recommendation
Social network metrics and trust based recommendationSocial network metrics and trust based recommendation
Social network metrics and trust based recommendation
 
Utc data publica1
Utc data publica1Utc data publica1
Utc data publica1
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4j
 
Smart data
Smart dataSmart data
Smart data
 
La dataviz, outil de performance pour les entreprises ?
La dataviz, outil de performance pour les entreprises ?La dataviz, outil de performance pour les entreprises ?
La dataviz, outil de performance pour les entreprises ?
 

Plus de tuxette

Racines en haut et feuilles en bas : les arbres en maths
Racines en haut et feuilles en bas : les arbres en mathsRacines en haut et feuilles en bas : les arbres en maths
Racines en haut et feuilles en bas : les arbres en mathstuxette
 
Méthodes à noyaux pour l’intégration de données hétérogènes
Méthodes à noyaux pour l’intégration de données hétérogènesMéthodes à noyaux pour l’intégration de données hétérogènes
Méthodes à noyaux pour l’intégration de données hétérogènestuxette
 
Méthodologies d'intégration de données omiques
Méthodologies d'intégration de données omiquesMéthodologies d'intégration de données omiques
Méthodologies d'intégration de données omiquestuxette
 
Projets autour de l'Hi-C
Projets autour de l'Hi-CProjets autour de l'Hi-C
Projets autour de l'Hi-Ctuxette
 
Can deep learning learn chromatin structure from sequence?
Can deep learning learn chromatin structure from sequence?Can deep learning learn chromatin structure from sequence?
Can deep learning learn chromatin structure from sequence?tuxette
 
Multi-omics data integration methods: kernel and other machine learning appro...
Multi-omics data integration methods: kernel and other machine learning appro...Multi-omics data integration methods: kernel and other machine learning appro...
Multi-omics data integration methods: kernel and other machine learning appro...tuxette
 
ASTERICS : une application pour intégrer des données omiques
ASTERICS : une application pour intégrer des données omiquesASTERICS : une application pour intégrer des données omiques
ASTERICS : une application pour intégrer des données omiquestuxette
 
Autour des projets Idefics et MetaboWean
Autour des projets Idefics et MetaboWeanAutour des projets Idefics et MetaboWean
Autour des projets Idefics et MetaboWeantuxette
 
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...tuxette
 
Apprentissage pour la biologie moléculaire et l’analyse de données omiques
Apprentissage pour la biologie moléculaire et l’analyse de données omiquesApprentissage pour la biologie moléculaire et l’analyse de données omiques
Apprentissage pour la biologie moléculaire et l’analyse de données omiquestuxette
 
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...tuxette
 
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...tuxette
 
Journal club: Validation of cluster analysis results on validation data
Journal club: Validation of cluster analysis results on validation dataJournal club: Validation of cluster analysis results on validation data
Journal club: Validation of cluster analysis results on validation datatuxette
 
Overfitting or overparametrization?
Overfitting or overparametrization?Overfitting or overparametrization?
Overfitting or overparametrization?tuxette
 
Selective inference and single-cell differential analysis
Selective inference and single-cell differential analysisSelective inference and single-cell differential analysis
Selective inference and single-cell differential analysistuxette
 
Graph Neural Network for Phenotype Prediction
Graph Neural Network for Phenotype PredictionGraph Neural Network for Phenotype Prediction
Graph Neural Network for Phenotype Predictiontuxette
 
A short and naive introduction to using network in prediction models
A short and naive introduction to using network in prediction modelsA short and naive introduction to using network in prediction models
A short and naive introduction to using network in prediction modelstuxette
 
Explanable models for time series with random forest
Explanable models for time series with random forestExplanable models for time series with random forest
Explanable models for time series with random foresttuxette
 
Présentation du projet ASTERICS
Présentation du projet ASTERICSPrésentation du projet ASTERICS
Présentation du projet ASTERICStuxette
 
Présentation du projet ASTERICS
Présentation du projet ASTERICSPrésentation du projet ASTERICS
Présentation du projet ASTERICStuxette
 

Plus de tuxette (20)

Racines en haut et feuilles en bas : les arbres en maths
Racines en haut et feuilles en bas : les arbres en mathsRacines en haut et feuilles en bas : les arbres en maths
Racines en haut et feuilles en bas : les arbres en maths
 
Méthodes à noyaux pour l’intégration de données hétérogènes
Méthodes à noyaux pour l’intégration de données hétérogènesMéthodes à noyaux pour l’intégration de données hétérogènes
Méthodes à noyaux pour l’intégration de données hétérogènes
 
Méthodologies d'intégration de données omiques
Méthodologies d'intégration de données omiquesMéthodologies d'intégration de données omiques
Méthodologies d'intégration de données omiques
 
Projets autour de l'Hi-C
Projets autour de l'Hi-CProjets autour de l'Hi-C
Projets autour de l'Hi-C
 
Can deep learning learn chromatin structure from sequence?
Can deep learning learn chromatin structure from sequence?Can deep learning learn chromatin structure from sequence?
Can deep learning learn chromatin structure from sequence?
 
Multi-omics data integration methods: kernel and other machine learning appro...
Multi-omics data integration methods: kernel and other machine learning appro...Multi-omics data integration methods: kernel and other machine learning appro...
Multi-omics data integration methods: kernel and other machine learning appro...
 
ASTERICS : une application pour intégrer des données omiques
ASTERICS : une application pour intégrer des données omiquesASTERICS : une application pour intégrer des données omiques
ASTERICS : une application pour intégrer des données omiques
 
Autour des projets Idefics et MetaboWean
Autour des projets Idefics et MetaboWeanAutour des projets Idefics et MetaboWean
Autour des projets Idefics et MetaboWean
 
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
 
Apprentissage pour la biologie moléculaire et l’analyse de données omiques
Apprentissage pour la biologie moléculaire et l’analyse de données omiquesApprentissage pour la biologie moléculaire et l’analyse de données omiques
Apprentissage pour la biologie moléculaire et l’analyse de données omiques
 
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
 
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
 
Journal club: Validation of cluster analysis results on validation data
Journal club: Validation of cluster analysis results on validation dataJournal club: Validation of cluster analysis results on validation data
Journal club: Validation of cluster analysis results on validation data
 
Overfitting or overparametrization?
Overfitting or overparametrization?Overfitting or overparametrization?
Overfitting or overparametrization?
 
Selective inference and single-cell differential analysis
Selective inference and single-cell differential analysisSelective inference and single-cell differential analysis
Selective inference and single-cell differential analysis
 
Graph Neural Network for Phenotype Prediction
Graph Neural Network for Phenotype PredictionGraph Neural Network for Phenotype Prediction
Graph Neural Network for Phenotype Prediction
 
A short and naive introduction to using network in prediction models
A short and naive introduction to using network in prediction modelsA short and naive introduction to using network in prediction models
A short and naive introduction to using network in prediction models
 
Explanable models for time series with random forest
Explanable models for time series with random forestExplanable models for time series with random forest
Explanable models for time series with random forest
 
Présentation du projet ASTERICS
Présentation du projet ASTERICSPrésentation du projet ASTERICS
Présentation du projet ASTERICS
 
Présentation du projet ASTERICS
Présentation du projet ASTERICSPrésentation du projet ASTERICS
Présentation du projet ASTERICS
 

Des réseaux sociaux aux réseaux historiques

  • 1. Des réseaux sociaux aux réseaux historiques Nathalie Villa-Vialaneix http://www.nathalievilla.org nathalie.villa@univ-paris1.fr IUT de Perpignan & SAMM, Université Paris 1 Les cafés de l’IMT, 19 Janvier 2012 Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 1 / 20
  • 2. Qu’est-ce qu’un réseau/graphe ? Plan 1 Qu’est-ce qu’un réseau/graphe ? 2 Quelques outils de fouille de graphes Visualisation Charactéristiques individuelles des sommets Recherche de “Communautés” 3 Fouille sur un grand graphe médiéval Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 2 / 20
  • 3. Qu’est-ce qu’un réseau/graphe ? Qu’est-ce qu’un réseau/graphe ? Objet mathématique utilisé pour modéliser des relations entre des entités. Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 3 / 20
  • 4. Qu’est-ce qu’un réseau/graphe ? Qu’est-ce qu’un réseau/graphe ? Objet mathématique utilisé pour modéliser des relations entre des entités. Les entités sont appelées les nœuds ou les sommets. Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 3 / 20
  • 5. Qu’est-ce qu’un réseau/graphe ? Qu’est-ce qu’un réseau/graphe ? Objet mathématique utilisé pour modéliser des relations entre des entités. Une relation entre deux entités est modélisée par une arête. Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 3 / 20
  • 6. Qu’est-ce qu’un réseau/graphe ? Exemples Réseaux sociaux : sommets : personnes - arêtes : lien entre deux personnes powered by Touchgraph TM 1 (Natty’s facebook TM 2 network) 1 http://www.touchgraph.com 2 https://www.facebook.com Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
  • 7. Qu’est-ce qu’un réseau/graphe ? Exemples Réseaux biologiques (un exemple, parmi d’autres : réseau de co-expression): sommets : gènes - arêtes : les deux gènes fonctionnent “de la même manière” [Liaubet et al., 2010, Villa-Vialaneix et al., 2011] Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
  • 8. Qu’est-ce qu’un réseau/graphe ? Exemples D’autres types de données relationnelles Modéliser un large corpus de documents moyennageux actes notariés (la plupart sont des baux à fief) établis dans la seigneurie de Castel- nau Montratier, entre 1250 et 1500, qui im- pliquent des tenanciers et des seigneurs.a a http://graphcomp.univ-tlse2.fr Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
  • 9. Qu’est-ce qu’un réseau/graphe ? Exemples D’autres types de données relationnelles Modéliser un large corpus de documents moyennageux • sommets : transactions et individus (10 542 sommets) • arêtes : un individu est directement impliqué dans une transaction (6 455 arêtes) Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
  • 10. Qu’est-ce qu’un réseau/graphe ? Exemples D’autres types de données relationnelles Indivual Transaction Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
  • 11. Qu’est-ce qu’un réseau/graphe ? Exemples D’autres types de données relationnelles Réseau de consommation sommets : 105 livres de politique américains - arêtes modélisent le fait que le même acheteur a acheté les deux livres (sur Amazon). Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 4 / 20
  • 12. Qu’est-ce qu’un réseau/graphe ? Modèles relationnels plus complexes Les sommets peuvent être étiquetés par une information supplémentaire qualitative Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 5 / 20
  • 13. Qu’est-ce qu’un réseau/graphe ? Modèles relationnels plus complexes Les sommets peuvent être étiquetés par une information supplémentaire qualitative ... ou numérique. [Laurent and Villa-Vialaneix, 2011] Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 5 / 20
  • 14. Qu’est-ce qu’un réseau/graphe ? Modèles relationnels plus complexes Les sommets peuvent être étiquetés par une information supplémentaire qualitative ... ou numérique. [Laurent and Villa-Vialaneix, 2011] Arêtes peuvent être étiquetées (type de la relation) ou pondérées (force de la relation). Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 5 / 20
  • 15. Quelques outils de fouille de graphes Plan 1 Qu’est-ce qu’un réseau/graphe ? 2 Quelques outils de fouille de graphes Visualisation Charactéristiques individuelles des sommets Recherche de “Communautés” 3 Fouille sur un grand graphe médiéval Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 6 / 20
  • 16. Quelques outils de fouille de graphes Dans la suite... ... on considère un graphe avec : • des sommets {x1, . . . , xn} ; • des arêtes ; • des poids sur les arêtes, symétriques et positifs Wij. Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 7 / 20
  • 17. Quelques outils de fouille de graphes Visualisation Plan 1 Qu’est-ce qu’un réseau/graphe ? 2 Quelques outils de fouille de graphes Visualisation Charactéristiques individuelles des sommets Recherche de “Communautés” 3 Fouille sur un grand graphe médiéval Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 8 / 20
  • 18. Quelques outils de fouille de graphes Visualisation Représenter le graphe Problème : Comment placer les sommets sur la feuille de manière à avoir une représentation compréhensible et esthétique du graphe ? Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 9 / 20
  • 19. Quelques outils de fouille de graphes Visualisation Représenter le graphe Problème : Comment placer les sommets sur la feuille de manière à avoir une représentation compréhensible et esthétique du graphe ? Approche standard : algorithmes de forces (FDP) (par exemple : [Fruchterman and Reingold, 1991]) Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 9 / 20
  • 20. Quelques outils de fouille de graphes Visualisation Représenter le graphe Problème : Comment placer les sommets sur la feuille de manière à avoir une représentation compréhensible et esthétique du graphe ? Approche standard : algorithmes de forces (FDP) (par exemple : [Fruchterman and Reingold, 1991]) • forces attractives : similaires à des ressorts sur les arêtes Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 9 / 20
  • 21. Quelques outils de fouille de graphes Visualisation Représenter le graphe Problème : Comment placer les sommets sur la feuille de manière à avoir une représentation compréhensible et esthétique du graphe ? Approche standard : algorithmes de forces (FDP) (par exemple : [Fruchterman and Reingold, 1991]) • forces attractives : similaires à des ressorts sur les arêtes • forces répulsives : similaires à des forces électriques entre les paires de sommets algorithme itératif jusqu’à stabilisation de la position des sommets. Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 9 / 20
  • 22. Quelques outils de fouille de graphes Visualisation Outils de visualisation • package igraph1 [Csardi and Nepusz, 2006] (représentations statiques avec divers outils pour faire de la fouille de graphes) 1 http://igraph.sourceforge.net/ 2 http://gephi.org Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 10 / 20
  • 23. Quelques outils de fouille de graphes Visualisation Outils de visualisation • package igraph1 [Csardi and Nepusz, 2006] (représentations statiques avec divers outils pour faire de la fouille de graphes) • logiciel libre Gephi2 (interactif, on peut zoomer, déplacer le graphe à la souris...) 1 http://igraph.sourceforge.net/ 2 http://gephi.org Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 10 / 20
  • 24. Quelques outils de fouille de graphes Charactéristiques individuelles des sommets Plan 1 Qu’est-ce qu’un réseau/graphe ? 2 Quelques outils de fouille de graphes Visualisation Charactéristiques individuelles des sommets Recherche de “Communautés” 3 Fouille sur un grand graphe médiéval Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 11 / 20
  • 25. Quelques outils de fouille de graphes Charactéristiques individuelles des sommets Quels sont les sommets importants ? 1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les sommets avec un fort degré sont appelés des “hubs” (mesure de popularité). Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
  • 26. Quelques outils de fouille de graphes Charactéristiques individuelles des sommets Quels sont les sommets importants ? 1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les sommets avec un fort degré sont appelés des “hubs” (mesure de popularité). La distribution des degrés est souvent en loi de puissance dans les réseaux réels: 1 2 5 10 20 50 100 200 500 1550500 Names Transactions Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
  • 27. Quelques outils de fouille de graphes Charactéristiques individuelles des sommets Quels sont les sommets importants ? 1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les sommets avec un fort degré sont appelés des “hubs” (mesure de popularité). La distribution des degrés est souvent en loi de puissance dans les réseaux réels: 2 Centralité d’un sommet : nombre de plus courts chemins entre toutes les paires de sommets qui passent par le sommet considéré (sommets qui sont susceptibles de déconnecter le graphe si ils sont retirés). Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
  • 28. Quelques outils de fouille de graphes Charactéristiques individuelles des sommets Quels sont les sommets importants ? 1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les sommets avec un fort degré sont appelés des “hubs” (mesure de popularité). La distribution des degrés est souvent en loi de puissance dans les réseaux réels: 2 Centralité d’un sommet : nombre de plus courts chemins entre toutes les paires de sommets qui passent par le sommet considéré (sommets qui sont susceptibles de déconnecter le graphe si ils sont retirés). Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
  • 29. Quelques outils de fouille de graphes Charactéristiques individuelles des sommets Quels sont les sommets importants ? 1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les sommets avec un fort degré sont appelés des “hubs” (mesure de popularité). La distribution des degrés est souvent en loi de puissance dans les réseaux réels: 2 Centralité d’un sommet : nombre de plus courts chemins entre toutes les paires de sommets qui passent par le sommet considéré (sommets qui sont susceptibles de déconnecter le graphe si ils sont retirés). Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
  • 30. Quelques outils de fouille de graphes Charactéristiques individuelles des sommets Quels sont les sommets importants ? 1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les sommets avec un fort degré sont appelés des “hubs” (mesure de popularité). La distribution des degrés est souvent en loi de puissance dans les réseaux réels: 2 Centralité d’un sommet : nombre de plus courts chemins entre toutes les paires de sommets qui passent par le sommet considéré (sommets qui sont susceptibles de déconnecter le graphe si ils sont retirés). Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
  • 31. Quelques outils de fouille de graphes Charactéristiques individuelles des sommets Quels sont les sommets importants ? 1 Degré d’un sommet : nombre d’arêtes reliées au sommet. Les sommets avec un fort degré sont appelés des “hubs” (mesure de popularité). La distribution des degrés est souvent en loi de puissance dans les réseaux réels: 2 Centralité d’un sommet : nombre de plus courts chemins entre toutes les paires de sommets qui passent par le sommet considéré (sommets qui sont susceptibles de déconnecter le graphe si ils sont retirés). Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 12 / 20
  • 32. Quelques outils de fouille de graphes Recherche de “Communautés” Plan 1 Qu’est-ce qu’un réseau/graphe ? 2 Quelques outils de fouille de graphes Visualisation Charactéristiques individuelles des sommets Recherche de “Communautés” 3 Fouille sur un grand graphe médiéval Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 13 / 20
  • 33. Quelques outils de fouille de graphes Recherche de “Communautés” Classification des sommets But : Mettre en valeur des groupes de sommets denses et qui partagent peu de liens avec les autres groupes. Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 14 / 20
  • 34. Quelques outils de fouille de graphes Recherche de “Communautés” Classification des sommets But : Mettre en valeur des groupes de sommets denses et qui partagent peu de liens avec les autres groupes. ⇒ Représentation simplifiée du graphe : • communauté représentée par un symbole d’aire proportionnelle au nombre de sommets ; • largeur du lien entre deux classes proportionnelle à la somme des poids des arêtes. Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 14 / 20
  • 35. Fouille sur un grand graphe médiéval Plan 1 Qu’est-ce qu’un réseau/graphe ? 2 Quelques outils de fouille de graphes Visualisation Charactéristiques individuelles des sommets Recherche de “Communautés” 3 Fouille sur un grand graphe médiéval Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 15 / 20
  • 36. Fouille sur un grand graphe médiéval Retour au graphe d’archives médiévales [Rossi et al., 2012] • 10 542 sommets : transactions ou personnes ; • arêtes modélisent l’implication active d’une personne dans une transaction. ⇒ Graphe biparti Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 16 / 20
  • 37. Fouille sur un grand graphe médiéval Caractéristiques macroscopiques Plus grande composante connexe : 10 025 sommets : petite comparée à un modèle aléatoire (graphe peu connecté). Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 17 / 20
  • 38. Fouille sur un grand graphe médiéval Caractéristiques macroscopiques Plus grande composante connexe : 10 025 sommets : petite comparée à un modèle aléatoire (graphe peu connecté). Pourquoi ? Indivual Transaction 2 groupes denses... Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 17 / 20
  • 39. Fouille sur un grand graphe médiéval Caractéristiques macroscopiques Plus grande composante connexe : 10 025 sommets : petite comparée à un modèle aléatoire (graphe peu connecté). Pourquoi ? 2 groupes denses... ... correspondant à deux péri- odes différentes Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 17 / 20
  • 40. Fouille sur un grand graphe médiéval Caractéristiques macroscopiques Plus grande composante connexe : 10 025 sommets : petite comparée à un modèle aléatoire (graphe peu connecté). Pourquoi ? Transaction dates Density 1250 1300 1350 1400 1450 1500 0e+003e−05 all transactions Jean Roquefeuil Castelnaud Ratier (3rd) Ratier (first) 2 groupes denses... ... correspondant à deux péri- odes différentes avant et après la guerre de Cent ans (et la grande peste) Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 17 / 20
  • 41. Fouille sur un grand graphe médiéval Recherche de communautés Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 18 / 20
  • 42. Fouille sur un grand graphe médiéval Recherche de communautés La visualisation aide à repérer les personnes importantes (exemple : Hélène de Castel- nau) Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 18 / 20
  • 43. Fouille sur un grand graphe médiéval Recherche de communautés La visualisation aide à identi- fier des problèmes : • Trois classes “Jean Laperarede” • Un lien direct suspicieux “Jean Laperarede” & “Ratier” Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 18 / 20
  • 44. Fouille sur un grand graphe médiéval Analyse globale/locale Sommets importants : Fort degré / forte centralité. Est-ce que ce sont les mêmes ? Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 19 / 20
  • 45. Fouille sur un grand graphe médiéval Analyse globale/locale Sommets importants : Fort degré / forte centralité. Est-ce que ce sont les mêmes ? Oui... souvent ! Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 19 / 20
  • 46. Fouille sur un grand graphe médiéval Analyse globale/locale Sommets importants : Fort degré / forte centralité. Est-ce que ce sont les mêmes ? Oui... souvent ! Exceptions : • personnes morales : Chapitre de Cahors, Église de Flaugnac ; Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 19 / 20
  • 47. Fouille sur un grand graphe médiéval Analyse globale/locale Sommets importants : Fort degré / forte centralité. Est-ce que ce sont les mêmes ? Oui... souvent ! Exceptions : • personnes morales : Chapitre de Cahors, Église de Flaugnac ; • erreurs de transcription : Arnaud Escairac (plus courts chemins entre Ratier et Jean Laperarede ; durée de vie : 148 ans !!) Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 19 / 20
  • 48. Fouille sur un grand graphe médiéval Analyse globale/locale Sommets importants : Fort degré / forte centralité. Est-ce que ce sont les mêmes ? Oui... souvent ! Exceptions : • personnes morales : Chapitre de Cahors, Église de Flaugnac ; • erreurs de transcription : Guiral Combe (durée de vie : 52 ans) Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 19 / 20
  • 49. Fouille sur un grand graphe médiéval Références Merci de votre intérêt ! Csardi, G. and Nepusz, T. (2006). The igraph software package for complex network research. InterJournal, Complex Systems. Fruchterman, T. and Reingold, B. (1991). Graph drawing by force-directed placement. Software-Practice and Experience, 21:1129–1164. Laurent, T. and Villa-Vialaneix, N. (2011). Using spatial indexes for labeled network analysis. Information, Interaction, Intelligence (i3), 11(1). Liaubet, L., Villa-Vialaneix, N., Gamot, A., Rossi, F., Chérel, P., and SanCristobal, M. (2010). The structure of a gene network reveals 7 biological functions underlying eQTLs in pig. In Gesellschaft für Tierzuchtwissenschaften e. V., editor, World Congress on Genetics Applied to Livestock Production (WCGALP), number 0147, Leipzig, Germany. Rossi, F., Villa-Vialaneix, N., and Hautefeuille, F. (2012). Exploration of a large database of French notarial acts with social network methods. Submitted. Villa-Vialaneix, N., Liaubet, L., Laurent, T., Gamot, A., Cherel, P., and Sancristobal, M. (2011). L’analyse d’un réseau de co-expression génique met en valeur des groupes fonctionnels homogènes et des gènes importants relatifs a un phénotype d’intérêt. In Actes des 43èmes Journées de Statistique, Société Française de Statistique, Tunis, Tunisie. Réseaux (Cafés de l’IMT) Nathalie Villa-Vialaneix IMT, 19/01/2012 20 / 20