Analyse empirique et modélisation de la
dynamique de la topologie de l’Internet
Sergey Kirgizov
Directrice de thèse: Cléme...
Plan
1 Introduction
2 Mesures égo-centrées
3 Modèle
4 Caractérisation de la dynamique
5 Taille du sous-graphe observable
6...
Introduction :
l’Internet, étude de la topologie de l’Internet
Carte de l’Internet // Barrett Lyon, 2003
Topologie au niveau IP
Mon ordinateur
paris.fr lip6.fr
Nœuds : ordinateurs
Liens : connections IP
4
Petite note historiquetemps
1960s — ARPANET
1980s — Internet
1993 — Dynamics of internet routing information
[Chinoy]
1997...
Étude de la topologie de l’Internet
Pas de carte officielle de l’Internet
Une carte statique ?
Mesures longues et coûteuses;...
Mesures égo-centrées :
Routes entre un moniteur et plusieurs destinations fixes
[Latapy, Magnien, Ouédraogo, 2011]
Vues ego-centrées
m
d1 d2
Carte complète
7
Vues ego-centrées
m
d1 d2
Routes entre un moniteur et des destinations
7
Vues ego-centrées
m
d1 d2
Une mesure par l’outil tracetree
[Latapy, Magnien, Ouédraogo, 2011]
7
Vues ego-centrées
m
d1 d2
Une autre mesure par l’outil tracetree
7
Vues ego-centrées
m
d1 d2
Une autre mesure par l’outil tracetree
7
Dynamique des vues ego-centrées
m
d1 d2
m
d1 d2
m
d1 d2
Temp
Mesures périodiques rapides =⇒ étude de la dynamique
8
Caractérisation de la dynamique
Mesures : M1, M2, . . . , Mi , . . .
Nombre de liens vus depuis le début : t →
i∈[0,t]
Mi
...
Causes de la dynamique observée
Causes
Load-balancing
M DL
Évolution du routage
M D
10
Load-balancing vs évolution du routage
0
20000
40000
60000
80000
100000
120000
140000
160000
180000
200000
220000
Sep Oct ...
Load-balancing vs évolution du routage
0
20000
40000
60000
80000
100000
120000
140000
160000
180000
200000
220000
Sep Oct ...
Load-balancing vs évolution du routage
0
20000
40000
60000
80000
100000
120000
140000
160000
180000
200000
220000
Sep Oct ...
Modèle :
Load-balancing + évolution du routage
Modélisation
Topologie : Graphe aléatoire (Erdős-Rényi ou configuration
model)
Un nœud aléatoire −→ moniteur
d nœuds aléato...
Load-balancing vs évolution du routage
Nombre de liens distincts vus depuis le début de la mesure
1000
2000
3000
4000
5000...
Caractérisation
de la dynamique :
la pente d’évolution
[Magnien, Medem, Kirgizov et Tarissan, 2013]
La pente
0
10000
20000
30000
40000
50000
60000
70000
Sep Oct Nov Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct
Nombredeliens...
α = f (paramètres du modèle)
nombre total de liens
0
10000
20000
30000
40000
50000
60000
70000
80000
0 500 1000 1500 2000 ...
α = f (paramètres du modèle)
nombre total de destinations
0
20000
40000
60000
80000
100000
120000
0 500 1000 1500 2000 250...
α = f (paramètres du modèle)
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
200000 400000 600000 800000 1e+06
α
m
d
500
200
100
U...
La taille du sous-graphe des plus courts chemins
cette taille augmente avec le nombre de destinations
α ∝
|sous-graphe|
|g...
Impact de la taille du sous-graphe des plus courts chemins
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
200000 400000 600000 80...
Impact de la taille du sous-graphe des plus courts chemins
0
5e-05
0.0001
0.00015
0.0002
0.00025
200000 400000 600000 8000...
Caractérisation de la dynamique
Conclusion
Erdős–Rényi : α ≈ K
Sl
m
Power-law : α ≈ K
Sl
m
Prévoir la pente sans exécuter ...
La taille du sous-graphe
des plus courts chemins :
1 moniteur, 1 destination
[Kirgizov et Magnien, soumis]
Graphes aléatoires
G(n, p) est un graphe aléatoire à n sommets. Chacune des
n(n − 1)/2 arêtes est présente avec probabilit...
Graphes aléatoires
G(n, p) est un graphe aléatoire à n sommets. Chacune des
n(n − 1)/2 arêtes est présente avec probabilit...
Graphes aléatoires
G(n, p) est un graphe aléatoire à n sommets. Chacune des
n(n − 1)/2 arêtes est présente avec probabilit...
Graphes aléatoires
G(n, p) est un graphe aléatoire à n sommets. Chacune des
n(n − 1)/2 arêtes est présente avec probabilit...
Proportion des liens qui se trouvent sur les plus courts chemins
Graphe Erdős-Rényi (n = 1000).
Proportion des liens sur l...
Taille moyenne de SPS dans des graphes aléatoires
Fixons n
p → E[S]
0.0 0.2 0.4 0.6 0.8 1.0
220406080
p
E[S]
25
Moyenne et tailles réelles de SPS
Fixons n
p → {S}
0.0 0.2 0.4 0.6 0.8 1.0
2200400
p
S
26
Moyenne et tailles réelles de SPS
Fixons n
p → {S}
0.0 0.2 0.4 0.6 0.8 1.0
2200400
p
S
???
Un “trou” ?
26
Graphe complet : Kn
p = 1
Kn
SPS(u, v) =
u v
S(u, v) = 2
27
Graphe quasi-complet : Kn − ab
p = 1 − ε
a b
Kn−2
S(u, v) =
n si {u, v} = {a, b} ,
2 sinon .
Si n > 3, alors il y a un “tr...
Taille du SPS dans des graphes aléatoires
0.0 0.2 0.4 0.6 0.8 1.0
2200400
p
S
29
Taille du SPS dans des graphes aléatoires
0.0 0.2 0.4 0.6 0.8 1.0
2200400
p
S
dist=1
dist=2
dist=3
dist=4
Y :nombre de nœu...
Taille du SPS dans des graphes aléatoires
échelle logarithmique
1e−04 1e−03 1e−02 1e−01 1e+00
25102050100500
p
S
dist=1
di...
Conclusion
Prévoir la taille du sous-graphe observable sans exécuter les
simulations coûteuses
Oscillations ont été expliq...
Dynamique réelle et
dynamique observée :
[Kirgizov, Magnien, Tarissan, Liu, 2013]
[Kirgizov et Queyroi, preprint, 2014]
α = f (∆)
0
10000
20000
30000
40000
50000
60000
70000
Sep Oct Nov Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct
Nombredelien...
α = f (∆)
0
10000
20000
30000
40000
50000
60000
70000
Nombredeliens
Date
∆1 = 1m 25s
∆2 = 2m 50s
Réalité
A → . . . → B → ....
Situation attendue
α
∆
∆m
αm
αm est la pente maximale possible
34
Autre approche. Estimation du taux de
changements
Changements X : ◦ ◦ ◦ · · ·
Observations Y : • • • · · ·
pas de changeme...
Estimateur
ˆλ = −∆−1
log
W
N
,
où
∆ – taille de l’intervalle de temps entre les observations ;
W – nombre d’intervalles sa...
λ estimée en fonction de ∆
0 2 4 6 8
0.040.060.08
∆
ˆλ
Processus de Poisson
0 2 4 6 8
0.040.060.08
∆
ˆλ
Modèle avec un gra...
λ estimée en fonction de ∆
0 50 100 150 200 250 300
0.000.020.040.060.08
∆
ˆλ
Erdős-Rényi
0 50 100 150 200 250 300
0.000.0...
Estimation de λ
Conclusion
Processus de Poisson =⇒ estimation possible
Les autres cas ouvrent des directions de la recherc...
Conclusion
Modèle de la dynamique de l’Internet
Relations entre les paramètres du modèle et les
caractéristiques de la dyn...
Perspectives
Améliorer le modèle
Etude plus approfondie de la taille du sous-graphe
observable
Appliquer les méthodes déve...
Merci beaucoup
http://kirgizov.complexnetworks.fr/
Prochain SlideShare
Chargement dans…5
×

Analyse empirique et modélisation de la dynamique de la topologie de l’Internet

231 vues

Publié le

Slided from My PhD thesis presentation.

Publié dans : Sciences
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
231
Sur SlideShare
0
Issues des intégrations
0
Intégrations
11
Actions
Partages
0
Téléchargements
2
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Analyse empirique et modélisation de la dynamique de la topologie de l’Internet

  1. 1. Analyse empirique et modélisation de la dynamique de la topologie de l’Internet Sergey Kirgizov Directrice de thèse: Clémence Magnien Complex Networks, LIP6, (UPMC, CNRS) Paris, 12 décembre 2014
  2. 2. Plan 1 Introduction 2 Mesures égo-centrées 3 Modèle 4 Caractérisation de la dynamique 5 Taille du sous-graphe observable 6 Dynamique réelle et dynamique observée 7 Conclusion et perspectives 2
  3. 3. Introduction : l’Internet, étude de la topologie de l’Internet
  4. 4. Carte de l’Internet // Barrett Lyon, 2003
  5. 5. Topologie au niveau IP Mon ordinateur paris.fr lip6.fr Nœuds : ordinateurs Liens : connections IP 4
  6. 6. Petite note historiquetemps 1960s — ARPANET 1980s — Internet 1993 — Dynamics of internet routing information [Chinoy] 1997 — Measurements and Analysis of End-to-End Internet Dynamics [Paxon] 1998 — On routes and multicast trees in the Internet [Pansiot et Grad] 2000s — de nombreux travaux sur la topologie (et la dynamique) de l’Internet à grande échelle seulement quelques œuvres considèrent l’échelle fine 5
  7. 7. Étude de la topologie de l’Internet Pas de carte officielle de l’Internet Une carte statique ? Mesures longues et coûteuses; Biais sur la structure observée. =⇒ Pas de carte fiable Étude de la dynamique ? Tous les problèmes statiques; Répéter les mesures =⇒ Pas si facile 6
  8. 8. Mesures égo-centrées : Routes entre un moniteur et plusieurs destinations fixes [Latapy, Magnien, Ouédraogo, 2011]
  9. 9. Vues ego-centrées m d1 d2 Carte complète 7
  10. 10. Vues ego-centrées m d1 d2 Routes entre un moniteur et des destinations 7
  11. 11. Vues ego-centrées m d1 d2 Une mesure par l’outil tracetree [Latapy, Magnien, Ouédraogo, 2011] 7
  12. 12. Vues ego-centrées m d1 d2 Une autre mesure par l’outil tracetree 7
  13. 13. Vues ego-centrées m d1 d2 Une autre mesure par l’outil tracetree 7
  14. 14. Dynamique des vues ego-centrées m d1 d2 m d1 d2 m d1 d2 Temp Mesures périodiques rapides =⇒ étude de la dynamique 8
  15. 15. Caractérisation de la dynamique Mesures : M1, M2, . . . , Mi , . . . Nombre de liens vus depuis le début : t → i∈[0,t] Mi # liens 0 20000 40000 60000 80000 100000 120000 140000 160000 180000 200000 220000 Sep Oct Nov Dec J an Feb Mar Apr May J un J ul Aug Sep Oct NombredeliensIP Date 1ère — 9 938 liens 2ème — 11 149 liens dernière — 207 782 3000 destinations une mesure toutes les 15 minutes pendant 1 an découverte en permanence de nouveaux liens IP à une vitesse élevée 9
  16. 16. Causes de la dynamique observée Causes Load-balancing M DL Évolution du routage M D 10
  17. 17. Load-balancing vs évolution du routage 0 20000 40000 60000 80000 100000 120000 140000 160000 180000 200000 220000 Sep Oct Nov Dec J an Feb Mar Apr May J un J ul Aug Sep Oct NombredeliensIP Date pas d'évolution du routage 11
  18. 18. Load-balancing vs évolution du routage 0 20000 40000 60000 80000 100000 120000 140000 160000 180000 200000 220000 Sep Oct Nov Dec J an Feb Mar Apr May J un J ul Aug Sep Oct NombredeliensIP Date 12
  19. 19. Load-balancing vs évolution du routage 0 20000 40000 60000 80000 100000 120000 140000 160000 180000 200000 220000 Sep Oct Nov Dec J an Feb Mar Apr May J un J ul Aug Sep Oct NombredeliensIP Date pente load-balancing dynamique structurelle + load-balancing + dynamique structurelle évolution du routage évolution du routage 13
  20. 20. Modèle : Load-balancing + évolution du routage
  21. 21. Modélisation Topologie : Graphe aléatoire (Erdős-Rényi ou configuration model) Un nœud aléatoire −→ moniteur d nœuds aléatoires −→ destinations Mesure : plus courts chemins (aléatoires) M L Evolution du routage : “échange de liens” 14
  22. 22. Load-balancing vs évolution du routage Nombre de liens distincts vus depuis le début de la mesure 1000 2000 3000 4000 5000 6000 7000 0 500 1000 1500 2000 2500 3000 Nombredeliens Nombre de passes pente load-balancing évolution du routage + load-balancing + évolution du routage 15
  23. 23. Caractérisation de la dynamique : la pente d’évolution [Magnien, Medem, Kirgizov et Tarissan, 2013]
  24. 24. La pente 0 10000 20000 30000 40000 50000 60000 70000 Sep Oct Nov Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nombredeliens Date y = α x + β α est la pente de la partie linéaire 16
  25. 25. α = f (paramètres du modèle) nombre total de liens 0 10000 20000 30000 40000 50000 60000 70000 80000 0 500 1000 1500 2000 2500 3000 #liens # rounds m = 200 000 m = 800 000 m = 1200 000 Impact du nombre total de liens Graphes Erdős–Rényi (n = 100 000, d = 100, sw = 100) 17
  26. 26. α = f (paramètres du modèle) nombre total de destinations 0 20000 40000 60000 80000 100000 120000 0 500 1000 1500 2000 2500 3000 #liens # rounds d = 500 d = 300 d = 100 Impact du nombre de destinations Graphes Erdős–Rényi (n = 100 000, m = 200 000, sw = 100) 18
  27. 27. α = f (paramètres du modèle) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 200000 400000 600000 800000 1e+06 α m d 500 200 100 Un graphe aléatoire G(n, m) avec n nœuds et m liens d nœuds comme destinations 19
  28. 28. La taille du sous-graphe des plus courts chemins cette taille augmente avec le nombre de destinations α ∝ |sous-graphe| |graphe| = Sl m 20
  29. 29. Impact de la taille du sous-graphe des plus courts chemins 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 200000 400000 600000 800000 1e+06 α m d 500 200 100 Un graphe aléatoire G(n, m) avec n nœuds et m liens d nœuds aléatoires comme destinations α ≈ K Sl m 21
  30. 30. Impact de la taille du sous-graphe des plus courts chemins 0 5e-05 0.0001 0.00015 0.0002 0.00025 200000 400000 600000 800000 1e+06 α Sl m Un graphe aléatoire G(n, m) avec n nœuds et m liens d nœuds aléatoires comme destinations α ≈ K Sl m 21
  31. 31. Caractérisation de la dynamique Conclusion Erdős–Rényi : α ≈ K Sl m Power-law : α ≈ K Sl m Prévoir la pente sans exécuter les simulations coûteuses Quelques comportements non linéaires et non-monotones Comparison aux mesures réelles Probabilité d’un changement à la place de la pente 22
  32. 32. La taille du sous-graphe des plus courts chemins : 1 moniteur, 1 destination [Kirgizov et Magnien, soumis]
  33. 33. Graphes aléatoires G(n, p) est un graphe aléatoire à n sommets. Chacune des n(n − 1)/2 arêtes est présente avec probabilité p. 1951–1952 Solomonoff et Rapoport 1959 Gilbert, Erdős et Rényi SPS : sous-graphe des plus courts chemins S : taille du sous-graphe des plus courts chemins 23
  34. 34. Graphes aléatoires G(n, p) est un graphe aléatoire à n sommets. Chacune des n(n − 1)/2 arêtes est présente avec probabilité p. 1951–1952 Solomonoff et Rapoport 1959 Gilbert, Erdős et Rényi SPS : sous-graphe des plus courts chemins S : taille du sous-graphe des plus courts chemins u v 23
  35. 35. Graphes aléatoires G(n, p) est un graphe aléatoire à n sommets. Chacune des n(n − 1)/2 arêtes est présente avec probabilité p. 1951–1952 Solomonoff et Rapoport 1959 Gilbert, Erdős et Rényi SPS : sous-graphe des plus courts chemins S : taille du sous-graphe des plus courts chemins u v 23
  36. 36. Graphes aléatoires G(n, p) est un graphe aléatoire à n sommets. Chacune des n(n − 1)/2 arêtes est présente avec probabilité p. 1951–1952 Solomonoff et Rapoport 1959 Gilbert, Erdős et Rényi SPS : sous-graphe des plus courts chemins S : taille du sous-graphe des plus courts chemins u v 23
  37. 37. Proportion des liens qui se trouvent sur les plus courts chemins Graphe Erdős-Rényi (n = 1000). Proportion des liens sur les plus courts chemins. Tous les noeuds sont les destinations. [Guillaume et Latapy, 2005] [Blondel, Guillaume, Hendrickx et Jungers, 2007] 24
  38. 38. Taille moyenne de SPS dans des graphes aléatoires Fixons n p → E[S] 0.0 0.2 0.4 0.6 0.8 1.0 220406080 p E[S] 25
  39. 39. Moyenne et tailles réelles de SPS Fixons n p → {S} 0.0 0.2 0.4 0.6 0.8 1.0 2200400 p S 26
  40. 40. Moyenne et tailles réelles de SPS Fixons n p → {S} 0.0 0.2 0.4 0.6 0.8 1.0 2200400 p S ??? Un “trou” ? 26
  41. 41. Graphe complet : Kn p = 1 Kn SPS(u, v) = u v S(u, v) = 2 27
  42. 42. Graphe quasi-complet : Kn − ab p = 1 − ε a b Kn−2 S(u, v) = n si {u, v} = {a, b} , 2 sinon . Si n > 3, alors il y a un “trou”. 0.0 0.2 0.4 0.6 0.8 1.0 2200400 p S ici 28
  43. 43. Taille du SPS dans des graphes aléatoires 0.0 0.2 0.4 0.6 0.8 1.0 2200400 p S 29
  44. 44. Taille du SPS dans des graphes aléatoires 0.0 0.2 0.4 0.6 0.8 1.0 2200400 p S dist=1 dist=2 dist=3 dist=4 Y :nombre de nœuds qui sont directement liés à la fois à u et v Y ∼ B(n − 2, p2 ) 29
  45. 45. Taille du SPS dans des graphes aléatoires échelle logarithmique 1e−04 1e−03 1e−02 1e−01 1e+00 25102050100500 p S dist=1 dist=2 dist=3 30
  46. 46. Conclusion Prévoir la taille du sous-graphe observable sans exécuter les simulations coûteuses Oscillations ont été expliquées dist(u,v) = 2 : la loi exacte dist(u,v) > 2 : une approximation de la taille attendue 31
  47. 47. Dynamique réelle et dynamique observée : [Kirgizov, Magnien, Tarissan, Liu, 2013] [Kirgizov et Queyroi, preprint, 2014]
  48. 48. α = f (∆) 0 10000 20000 30000 40000 50000 60000 70000 Sep Oct Nov Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nombredeliens Date ∆1 = 1m 25s ∆2 = 2m 50s α = f (∆), où ∆ est le délai entre les mesures α(∆1) > α(∆2) 32
  49. 49. α = f (∆) 0 10000 20000 30000 40000 50000 60000 70000 Nombredeliens Date ∆1 = 1m 25s ∆2 = 2m 50s Réalité A → . . . → B → . . . → C ∆1 A → B → C ∆2 A → C |A ∪ C| ≤ |A ∪ B ∪ C| ∆1 ≤ ∆2 ⇒ ⇒ α(∆1) ≥ α(∆2) 33
  50. 50. Situation attendue α ∆ ∆m αm αm est la pente maximale possible 34
  51. 51. Autre approche. Estimation du taux de changements Changements X : ◦ ◦ ◦ · · · Observations Y : • • • · · · pas de changement changement Question : estimer le taux des changements réels Poisson paramétré par λ λ X Y ? 35
  52. 52. Estimateur ˆλ = −∆−1 log W N , où ∆ – taille de l’intervalle de temps entre les observations ; W – nombre d’intervalles sans changement ; N – nombre total d’intervalles . E ˆλ − λ ≈ 1 2N∆ eλ∆ − 1 lim N→∞ E ˆλ = λ 36
  53. 53. λ estimée en fonction de ∆ 0 2 4 6 8 0.040.060.08 ∆ ˆλ Processus de Poisson 0 2 4 6 8 0.040.060.08 ∆ ˆλ Modèle avec un graphe sous-jacent Erdős-Rényi, SPS est mesurée à chaque round. 37
  54. 54. λ estimée en fonction de ∆ 0 50 100 150 200 250 300 0.000.020.040.060.08 ∆ ˆλ Erdős-Rényi 0 50 100 150 200 250 300 0.000.020.040.060.08 ∆ ˆλ Power-law 0 20 40 60 80 100 0.00.51.01.52.0 ∆ ˆλ Mesures réelles ˆλ pour SPT ( m d1 d2 ) et SPS ( m d1 d2 ) séquences. 38
  55. 55. Estimation de λ Conclusion Processus de Poisson =⇒ estimation possible Les autres cas ouvrent des directions de la recherche future. 39
  56. 56. Conclusion Modèle de la dynamique de l’Internet Relations entre les paramètres du modèle et les caractéristiques de la dynamique La taille du sous-graphe des plus courts chemins Estimation du taux de changements 40
  57. 57. Perspectives Améliorer le modèle Etude plus approfondie de la taille du sous-graphe observable Appliquer les méthodes développées à d’autres réseaux 41
  58. 58. Merci beaucoup http://kirgizov.complexnetworks.fr/

×