SlideShare une entreprise Scribd logo
1  sur  26
Télécharger pour lire hors ligne
Introduction à l'exploration du Web

     Sébastien Heymann <seb@gephi.org>
      - doctorant Lip6 ComplexNetworks -
Web mining


What the hell is this?!
Comment représentez-vous le Web ?




 Contenu, frontières, unité documentaire, sens
Comment représentez-vous le Web ?
Que font les gens
  sur le Web ?




              http://vidberg.blog.lemonde.fr/2010/06/02/ma-vie-privee-nest-pas-sur-internet/
Comment imaginez-vous votre métier ?




     De la collecte à la sélection critique
Aujourd'hui, la documentation
●   Savoir se repérer
Aujourd'hui, la documentation
●   Savoir se repérer
●   Sélectionner les bonnes informations
Aujourd'hui, la documentation
●   Savoir se repérer
●   Sélectionner les bonnes informations
●   Agréger des sources hétérogènes de façon
    rigoureuse
Aujourd'hui, la documentation
●   Savoir se repérer
●   Sélectionner les bonnes informations
●   Agréger des sources hétérogènes de façon rigoureuse
●   Manipuler, mettre en forme l'information
Aujourd'hui, la documentation
●   Savoir se repérer
●   Sélectionner les bonnes informations
●   Agréger des sources hétérogènes de façon rigoureuse
●   Manipuler, mettre en forme l'information
●   Faire sens et dire des choses pas trop fausses        !
Nouveaux besoins, nouvelles compétences,
        (re)nouveau des métiers
Compétences

coder – analyser - représenter




                 Ben Fry – Computational Information Design, 2004
Coder: acquérir
Doc, HTML




                 Flux de news




        Base de données
Coder : extraire

Parcours de fichier




                      Parcours de documents
                      structurés




    Parcours de flux de
              données
Analyser

Grandeurs, écarts



                Différences,
                singularités



  Niveaux d'ordres
Représenter

Volumétrie




                 Géographie




             Relations
Interagir
Connexions




             Occupation de
             l'espace




         Mouvement
Exemple: voir du texte
Wordle




PhaseNets
Objectifs du module
1/ Construire un corpus Web et interroger les propriétés de cet
espace « socio-technique ».
Objectifs du module
1/ Construire un corpus Web et interroger les propriétés de cet
espace « socio-technique ».


2/ Cartographier ces propriétés pour produire un discours critique
et révéler des phénomènes inattendus.
Objectifs du module
1/ Construire un corpus Web et interroger les propriétés de cet
espace « socio-technique ».


2/ Cartographier ces propriétés pour produire un discours critique
et révéler des phénomènes inattendus.


3/ Mobiliser des méthodes, outils et stratégies de représentation
pour produire une analyse pertinente.
Organisation du module
                Mon travail
             3h cours + 6h TP



                Votre travail
une exploration et analyse d'une thématique /
          communauté sur le Web
Le cours
●   1h de mise en contexte
●   1h de théorie des graphes
●   30min sur l'exploration du Web
●   30min d'ouverture
Au boulot !

Contenu connexe

Similaire à Introduction à l'exploration du Web

introduction à la gestion de projet
introduction à la gestion de projetintroduction à la gestion de projet
introduction à la gestion de projet
laureno
 
Applications du Web Sémantique
Applications du Web SémantiqueApplications du Web Sémantique
Applications du Web Sémantique
Yves Otis
 

Similaire à Introduction à l'exploration du Web (20)

Conclusion du cours Exploration du Web
Conclusion du cours Exploration du WebConclusion du cours Exploration du Web
Conclusion du cours Exploration du Web
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Tic recherche-scientifique
Tic recherche-scientifiqueTic recherche-scientifique
Tic recherche-scientifique
 
Présentation cice telos
Présentation cice   telosPrésentation cice   telos
Présentation cice telos
 
Le Web et son architecture : Pour une critique philosophique de la notion d’u...
Le Web et son architecture : Pour une critique philosophique de la notion d’u...Le Web et son architecture : Pour une critique philosophique de la notion d’u...
Le Web et son architecture : Pour une critique philosophique de la notion d’u...
 
La netnographie, quelles évolutions ?
La netnographie, quelles évolutions ? La netnographie, quelles évolutions ?
La netnographie, quelles évolutions ?
 
Créer un moteur de recherche avec des logiciels libres
Créer un moteur de recherche avec des logiciels libresCréer un moteur de recherche avec des logiciels libres
Créer un moteur de recherche avec des logiciels libres
 
introduction à la gestion de projet
introduction à la gestion de projetintroduction à la gestion de projet
introduction à la gestion de projet
 
WebCSTI Rencontres OCIM 2009
WebCSTI Rencontres OCIM 2009WebCSTI Rencontres OCIM 2009
WebCSTI Rencontres OCIM 2009
 
Introduction Gestion Projet web
Introduction Gestion Projet webIntroduction Gestion Projet web
Introduction Gestion Projet web
 
Concevoir une preuve de concept web sémantique
Concevoir une preuve de concept web sémantiqueConcevoir une preuve de concept web sémantique
Concevoir une preuve de concept web sémantique
 
Séminaire Inria IST - Référentiels et interoperabilité (2)
Séminaire Inria IST - Référentiels et interoperabilité (2)Séminaire Inria IST - Référentiels et interoperabilité (2)
Séminaire Inria IST - Référentiels et interoperabilité (2)
 
Web sémantique
Web sémantiqueWeb sémantique
Web sémantique
 
Rechercher des ressources sur Internet
Rechercher des ressources sur InternetRechercher des ressources sur Internet
Rechercher des ressources sur Internet
 
Oe Abes Mai2008
Oe Abes Mai2008Oe Abes Mai2008
Oe Abes Mai2008
 
Google Humming et Knoweldge Vault : la recherche sémantique de Google expliquée
Google Humming et Knoweldge Vault : la recherche sémantique de Google expliquéeGoogle Humming et Knoweldge Vault : la recherche sémantique de Google expliquée
Google Humming et Knoweldge Vault : la recherche sémantique de Google expliquée
 
Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019
Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019
Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019
 
Se Documenter3
Se Documenter3Se Documenter3
Se Documenter3
 
Applications du Web Sémantique
Applications du Web SémantiqueApplications du Web Sémantique
Applications du Web Sémantique
 

Plus de Sébastien

Monitoring User-System Interactions through Graph-Based Intrinsic Dynamics An...
Monitoring User-System Interactions through Graph-Based Intrinsic Dynamics An...Monitoring User-System Interactions through Graph-Based Intrinsic Dynamics An...
Monitoring User-System Interactions through Graph-Based Intrinsic Dynamics An...
Sébastien
 
Gephi short introduction
Gephi short introductionGephi short introduction
Gephi short introduction
Sébastien
 
Outskewer: Using Skewness to Spot Outliers in Samples and Time Series
Outskewer: Using Skewness to Spot Outliers in Samples and Time SeriesOutskewer: Using Skewness to Spot Outliers in Samples and Time Series
Outskewer: Using Skewness to Spot Outliers in Samples and Time Series
Sébastien
 

Plus de Sébastien (14)

PhD Defense: Analyse exploratoire de flots de liens pour la détection d'événe...
PhD Defense: Analyse exploratoire de flots de liens pour la détection d'événe...PhD Defense: Analyse exploratoire de flots de liens pour la détection d'événe...
PhD Defense: Analyse exploratoire de flots de liens pour la détection d'événe...
 
Monitoring User-System Interactions through Graph-Based Intrinsic Dynamics An...
Monitoring User-System Interactions through Graph-Based Intrinsic Dynamics An...Monitoring User-System Interactions through Graph-Based Intrinsic Dynamics An...
Monitoring User-System Interactions through Graph-Based Intrinsic Dynamics An...
 
Gephi short introduction
Gephi short introductionGephi short introduction
Gephi short introduction
 
Gephi : dynamic features
Gephi : dynamic featuresGephi : dynamic features
Gephi : dynamic features
 
Motivation in FLOSS communities
Motivation in FLOSS communitiesMotivation in FLOSS communities
Motivation in FLOSS communities
 
Outskewer: Using Skewness to Spot Outliers in Samples and Time Series
Outskewer: Using Skewness to Spot Outliers in Samples and Time SeriesOutskewer: Using Skewness to Spot Outliers in Samples and Time Series
Outskewer: Using Skewness to Spot Outliers in Samples and Time Series
 
Diseasome
DiseasomeDiseasome
Diseasome
 
IC05 cours 4
IC05 cours 4IC05 cours 4
IC05 cours 4
 
IC05 cours 3
IC05 cours 3IC05 cours 3
IC05 cours 3
 
IC05 cours 2
IC05 cours 2IC05 cours 2
IC05 cours 2
 
IC05 cours 1
IC05 cours 1IC05 cours 1
IC05 cours 1
 
IC05 2008 - Le Web, objet de science?
IC05 2008 - Le Web, objet de science?IC05 2008 - Le Web, objet de science?
IC05 2008 - Le Web, objet de science?
 
Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...
 
Tour d'horizon des personnes morales adhérentes à l'APRIL
Tour d'horizon des personnes morales adhérentes à l'APRILTour d'horizon des personnes morales adhérentes à l'APRIL
Tour d'horizon des personnes morales adhérentes à l'APRIL
 

Introduction à l'exploration du Web