Présentation de PFE<br />Sujet: Analyse des différentes catégories d’utilisateurs d’un réseau de hotspots Wifi en appliqua...
Sommaire de la présentation.<br />21/09/2010                         Arnaud LEMPEREUR<br />2<br />
Sommaire de la présentation.<br />21/09/2010                         Arnaud LEMPEREUR<br />3<br />
I. L’environnement du stage<br />21/09/2010                         Arnaud LEMPEREUR<br />4<br /><ul><li>La ville: Chicago...
L’université: L’IIT (Illinois Institute of Technology), grande université de Chicago, très ouverte aux étrangers, et parte...
Le laboratoire: « Network Modeling and TeletrafficAnalysis » composé du Dr Chlebus et de son thésard Gautam Divgi ayant dé...
II. Présentation du sujet<br />Le point de départ, la base de données :<br />Données fournies par Azure Wireless, gros opé...
II. Présentation du sujet<br />Les paramètres qui caractérisent une session :<br />La durée de la session<br />Le trafic m...
II. Présentation du sujet<br />21/09/2010                         Arnaud LEMPEREUR<br />8<br />Petit exemple décrivant l’o...
 Chercher dans quelle mesure les caractéristiques des éléments de ces clusters correspondent à celle de chaque catégorie d...
Sommaire de la présentation.<br />21/09/2010                         Arnaud LEMPEREUR<br />9<br />
III. Introduction au clustering <br />Existence d’une panoplie très large d’algorithmes de clustering qui peuvent se class...
Sommaire de la présentation.<br />21/09/2010                         Arnaud LEMPEREUR<br />11<br />
IV. L’algorithme choisi<br />Pourquoi cet algorithme? :<br />21/09/2010                         Arnaud LEMPEREUR<br />12<b...
IV. L’algorithme choisi<br />Les étapes de l’algorithme NetCluster:<br />L’application de l’algorithme WaveCluster :<br />...
IV. L’algorithme choisi<br />La quantification :<br />21/09/2010                         Arnaud LEMPEREUR<br />14<br />Den...
IV. L’algorithme choisi<br />La wavelet transform : (procédé itératif)<br />Correspond à un filtre sur les densités de cha...
IV. L’algorithme choisi<br />21/09/2010                         Arnaud LEMPEREUR<br />16<br />
IV. L’algorithme choisi<br />La labellisation :<br />21/09/2010                         Arnaud LEMPEREUR<br />17<br />
IV. L’algorithme choisi<br />Le post-processing:<br />Définition d’un rayon maximal pour chaque dimension.<br />Chaque clu...
Sommaire de la présentation.<br />21/09/2010                         Arnaud LEMPEREUR<br />19<br />
V. L’implémentation<br />21/09/2010                         Arnaud LEMPEREUR<br />20<br />Implémentation à l’aide de :<br ...
GnuPlot pour les graphiques</li></li></ul><li>Sommaire de la présentation.<br />21/09/2010                         Arnaud ...
VI. Les résultats de l’étude<br />21/09/2010                         Arnaud LEMPEREUR<br />22<br />Représentation des clus...
VI. Les résultats de l’étude<br />21/09/2010                         Arnaud LEMPEREUR<br />23<br />Histogramme représentan...
VI. Les résultats de l’étude<br />21/09/2010                         Arnaud LEMPEREUR<br />24<br />Représentation des clus...
VI. Les résultats de l’étude<br />21/09/2010                         Arnaud LEMPEREUR<br />25<br />Représentation des clus...
VI. Les résultats de l’étude<br />21/09/2010                         Arnaud LEMPEREUR<br />26<br />Représentation des clus...
Sommaire de la présentation.<br />21/09/2010                         Arnaud LEMPEREUR<br />27<br />
Prochain SlideShare
Chargement dans…5
×

ENSEIRB - Stage 3A @IIT Chicago

1 552 vues

Publié le

Statistic study of the Azure Hotspots’ use: work on a sensitive data base and the three main dimensions of the Azure activity.

Publié dans : Technologie
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
1 552
Sur SlideShare
0
Issues des intégrations
0
Intégrations
12
Actions
Partages
0
Téléchargements
0
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

ENSEIRB - Stage 3A @IIT Chicago

  1. 1. Présentation de PFE<br />Sujet: Analyse des différentes catégories d’utilisateurs d’un réseau de hotspots Wifi en appliquant des techniques de clustering.<br />1<br />21/09/2010 Arnaud LEMPEREUR<br />Entreprise : Laboratoire Universitaire de IIT ChicagoResponsable de stage : Dr Edward CHLEBUSTuteur de stage : Mr Daniel NEGRUDate du stage : Du 15/02/2010 au 30/07/2010<br />
  2. 2. Sommaire de la présentation.<br />21/09/2010 Arnaud LEMPEREUR<br />2<br />
  3. 3. Sommaire de la présentation.<br />21/09/2010 Arnaud LEMPEREUR<br />3<br />
  4. 4. I. L’environnement du stage<br />21/09/2010 Arnaud LEMPEREUR<br />4<br /><ul><li>La ville: Chicago! Au cœur de la troisième plus grande ville des Etats-Unis, le long du lac Michigan, entouré de son métro, son Blues et sa prohibition.
  5. 5. L’université: L’IIT (Illinois Institute of Technology), grande université de Chicago, très ouverte aux étrangers, et partenaire de l’ENSEIRB.
  6. 6. Le laboratoire: « Network Modeling and TeletrafficAnalysis » composé du Dr Chlebus et de son thésard Gautam Divgi ayant déjà travaillé sur la base de données.</li></li></ul><li>Sommaire de la présentation.<br />21/09/2010 Arnaud LEMPEREUR<br />5<br />
  7. 7. II. Présentation du sujet<br />Le point de départ, la base de données :<br />Données fournies par Azure Wireless, gros opérateur de réseaux sans fil en Australie!<br />La base de données concerne l’utilisation des hotspots de Azure pendant 5 mois pour un total de 14273 sessions.<br />Différents types de comptes selon les utilisateurs :<br />« Hourlyaccount » - Compte à l’heure (1, 2, 5, 10 heures)<br />« Daily account » - Compte à la journée (1, 3, 5 jours)<br />« Monthlyaccount » - Compte au mois (téléchargement illimité dans ce type de compte)<br />21/09/2010 Arnaud LEMPEREUR<br />6<br />
  8. 8. II. Présentation du sujet<br />Les paramètres qui caractérisent une session :<br />La durée de la session<br />Le trafic montant<br />Le trafic descendant<br />Définition du clustering :<br />« Etant donné un nombre d’objets, chacun décrit par une base de mesures numériques, il s’agit de diviser le plan afin de diviser les objets en plusieurs groupes de tel manière que deux objets du même groupe soient similaire selon un critère défini. Le nombre de groupes et les caractéristiques de chaque groupes sont à déterminés. »<br />21/09/2010 Arnaud LEMPEREUR<br />7<br />
  9. 9. II. Présentation du sujet<br />21/09/2010 Arnaud LEMPEREUR<br />8<br />Petit exemple décrivant l’objectif du projet :<br /><ul><li> Déterminer des clusters dans l’espace tridimensionnel défini par les trois paramètres de session.
  10. 10. Chercher dans quelle mesure les caractéristiques des éléments de ces clusters correspondent à celle de chaque catégorie de compte. </li></ul>« Daily account »<br />
  11. 11. Sommaire de la présentation.<br />21/09/2010 Arnaud LEMPEREUR<br />9<br />
  12. 12. III. Introduction au clustering <br />Existence d’une panoplie très large d’algorithmes de clustering qui peuvent se classer selon certains critères:<br />La fonction de distance utilisée pour mesurer la proximité ou la ressemblance entre deux données (influence sur la forme des clusters).<br />La méthode de clustering peut être :<br />Agglomerative ou divisive. <br />Monothéique ou polythétique. <br />« Hard » ou « fuzzy ». <br />…<br />Existence d’algorithmes de références qu’il serait intéressant de présenter pour mieux comprendre mais le temps me manque…<br />21/09/2010 Arnaud LEMPEREUR<br />10<br />
  13. 13. Sommaire de la présentation.<br />21/09/2010 Arnaud LEMPEREUR<br />11<br />
  14. 14. IV. L’algorithme choisi<br />Pourquoi cet algorithme? :<br />21/09/2010 Arnaud LEMPEREUR<br />12<br />
  15. 15. IV. L’algorithme choisi<br />Les étapes de l’algorithme NetCluster:<br />L’application de l’algorithme WaveCluster :<br />Quantifier l’espace sous forme d’une grille et assigner les données à leurs cellules.<br />Appliquer la « wavelet transform » sur la densité des cellules de la grille.<br />Trouver les cellules connectées (clusters) et assigner à chaque donnée un label selon son cluster d’appartenance.<br />Une étape de post-processing.<br />21/09/2010 Arnaud LEMPEREUR<br />13<br />
  16. 16. IV. L’algorithme choisi<br />La quantification :<br />21/09/2010 Arnaud LEMPEREUR<br />14<br />Densité de la cellule (4,6) : 2!<br />Grillage de l’espace deux dimensions formé par labase de données avec une certaine granularité pour chaque dimension (ici 7 pour l’axe des abscisses et 6 pour celui des ordonnés)<br />
  17. 17. IV. L’algorithme choisi<br />La wavelet transform : (procédé itératif)<br />Correspond à un filtre sur les densités de chaque cellules.<br />Ce filtre s’applique ligne par ligne puis colonne par colonne (pour le cas 2 dimensions).<br />La nouvelle densité de chaque cellule prend en compte la densité des cellules voisines.<br />Le filtre choisi est le « MexicanHat ».<br />Puis on réalise l’élimination d’une densité sur deux.<br />21/09/2010 Arnaud LEMPEREUR<br />15<br />D’ = densité cellule après filtre<br />C(k) = coefficient du filtre<br />M = nbr. de coefficient du filtre<br />D = densité cellule avant filtre<br />
  18. 18. IV. L’algorithme choisi<br />21/09/2010 Arnaud LEMPEREUR<br />16<br />
  19. 19. IV. L’algorithme choisi<br />La labellisation :<br />21/09/2010 Arnaud LEMPEREUR<br />17<br />
  20. 20. IV. L’algorithme choisi<br />Le post-processing:<br />Définition d’un rayon maximal pour chaque dimension.<br />Chaque cluster qui dépasse une des tailles maximales pour une des dimensions est soumis au post-processing.<br />Par itération :<br />Détermine la cellule de plus forte densité dans le cluster.<br />Définit le nouveau cluster par les cellules comprises dans l’ellipse créée par les rayon maximaux de chaque dimension autour de la cellule de plus forte densité.<br />Procède à la même opération avec les cellules restantes.<br />21/09/2010 Arnaud LEMPEREUR<br />18<br />
  21. 21. Sommaire de la présentation.<br />21/09/2010 Arnaud LEMPEREUR<br />19<br />
  22. 22. V. L’implémentation<br />21/09/2010 Arnaud LEMPEREUR<br />20<br />Implémentation à l’aide de :<br /><ul><li>Visual C++
  23. 23. GnuPlot pour les graphiques</li></li></ul><li>Sommaire de la présentation.<br />21/09/2010 Arnaud LEMPEREUR<br />21<br />
  24. 24. VI. Les résultats de l’étude<br />21/09/2010 Arnaud LEMPEREUR<br />22<br />Représentation des clusters pour le cas 1 dimension de la durée de session<br />
  25. 25. VI. Les résultats de l’étude<br />21/09/2010 Arnaud LEMPEREUR<br />23<br />Histogramme représentant la quantité absolue d’utilisateurs dans chaque cluster pour les 3 catégories d’utilisateurs<br />
  26. 26. VI. Les résultats de l’étude<br />21/09/2010 Arnaud LEMPEREUR<br />24<br />Représentation des clusters pour le cas 1 dimension du trafic montant à l’échelle logarithmique<br />
  27. 27. VI. Les résultats de l’étude<br />21/09/2010 Arnaud LEMPEREUR<br />25<br />Représentation des clusters pour le cas 2 dimensions durée de session et trafic montant à l’échelle logarithmique<br />
  28. 28. VI. Les résultats de l’étude<br />21/09/2010 Arnaud LEMPEREUR<br />26<br />Représentation des clusters pour le cas 3 dimensions à l’échelle logarithmique<br />
  29. 29. Sommaire de la présentation.<br />21/09/2010 Arnaud LEMPEREUR<br />27<br />
  30. 30. VII. Perspectives pour le projet<br />La partie du projet sur la base de données qui m’a été confiée a été menée à bien.<br />Le thésard confronte en ce moment les résultats qu’il avait pu obtenir précédemment par d’autres méthodes avec les miens pour en conforter éventuellement certains ou découvrir d’autres spécificités.<br />Si les résultats obtenus sont probants, le projet donnera peut-être lieu à une publication.<br />21/09/2010 Arnaud LEMPEREUR<br />28<br />
  31. 31. Merci de votre attention Et Place aux questions<br />21/09/2010 Arnaud LEMPEREUR<br />29<br />

×