SlideShare une entreprise Scribd logo
WebAtlas URFIST NICE Franck Ghitalla Département TSH Président de WebAtlas [email_address] Mathieu Jacomy Trésorier de WebAtlas Doctorant CELSA [email_address]
information geography Les agrégats de documents web 1) Principes théoriques 2) La « physis » des  objets  web 3) Expérimentations ( Web Information Systems , S.I.W.) WebAtlas
1) Principes théoriques WebAtlas
Clustering Degree =  High Distance Degree =  High Clustering Degree =  Low Distance Degree =  Low Clustering Degree =  High Distance Degree =  Low WebAtlas
Loi de puissance ( power-law ) 20% des nœuds (sites/pages) reçoivent ou attirent 80% des liens (connectivité hypertextuelle) (et inversement) Structure hiérarchique forte des nœuds dominants qui assurent au web son unité et garantissent la circulation entre nœuds secondaires En haut – distribution de la connectivité a) en random graph b) en  power-law  (Barabasi). A droite – distribution de la connectivité « entrante » sur les principaux sites francophones consacrés à la CSTI – Mathieu Jacomy, 2005. 1) Principes théoriques WebAtlas
3 propriétés des web-graphs a) de forme b) de distribution de l’ordre c) de domaines (mots, liens, acteurs) 1) Principes théoriques WebAtlas
1) Principes théoriques Distribution de la connectivité hypertexte entre sites « pour le non » au référendum sur la Constitution Européenne en 2005. Exploration dynamique du corpus via une application  Flash  – Antonin Rhomer, RTGI. WebAtlas
2) La « physis » des objets-web WebAtlas
[object Object],[object Object],[object Object],[object Object],2) La « physis » des objets relationnels Extraire et analyser des données Produire et comprendre des formes ( patterns ) WebAtlas
2) La « physis » des objets relationnels Diamètre invariance d’échelle ( scale-free network ) Chemin moyen entre chaque paire de nœuds Graphe orienté ou non-orienté (prise en compte du sens des liens) Expérience de  Barabasi et al.  en 1998 Un premier graphe comprenant 1000 sites web avait un diamètre voisin de 8.  Quel diamètre pour 10.000 et 100.000 nœuds? 80 ou 800? 11 seulement. Densité  : nob liens réels / nb liens possibles WebAtlas
2) La « physis » des objets relationnels Hubs   et  Authorities  ( les  cœurs) Tous les nœuds d’un graphe peuvent se décrire en fonction de leurs scores de  HUB  (nombre de liens sortants) et  d’AUTHORITY  (nombre de liens entrants). HUBS  (nœuds qui diffusent beaucoup de liens) AUTHORITIES  (nœuds qui reçoivent beaucoup de liens) Hubs et Authorities ont tendance à se  renforcer  mutuellement Ils forment le « cœur » des agrégats de documents web WebAtlas
2) La « physis » des objets relationnels Clusters  et composition interne Analyse en  clusters  à partir de la distribution des  liens  dans le corpus, des similarités de  contenus  (mots-clef) et/ou de la concentration de certains  acteurs  identifiés Données traitées dans le projet  SIS-Map  constituées par : 6760 expressions , modélisées sous forme de graphes relationnels (expansion du corpus à partir de 130 mots-clefs de départ à 940, puis de 940 à 7670) Un graphe associé de  26787 sites  (sélection des 10 meilleures URL pour chaque mot-clef sur 240 000 sites extraits des bases  Exalead ) 71744 relations sites-expressions WebAtlas
2) La « physis » des objets relationnels The Achilles’heel of the Internet Attachement préférentiel Chaque nouveau entrant de le système aura tendance à se relier directement aux  Hubs  et aux  Authorités Temporellement,  Hubs  et  authorities  renforcent leur pouvoir Le « talon d’Achille » du web WebAtlas
3) Expérimentations et Systèmes d’Information Web WebAtlas
Extraction des données Bases et process de traitement Indexation Calculs d’occurrences Structure de graphe Algorithmes de ranking (PageRank, HITS…) Algorithmes de clustering … Les  patterns  identifiables (logiques, statistiques, relationnels) peuvent aussi être visualisés, voire même identifiés via des visualisations de grandes masses de données web. Un Système d’Information Web dédié à l’exploration des structures du système doit pouvoir inclure  différents process de traitement des données L’extraction  des données web (mots-clefs, contenus, liens internes et/ou externes au sites…) peut être effectuée manuellement (via un bookmark par exemple), semi-automatiquement (Navicrawler, Timmy) ou automatiquement via un crawler paramétrable. Explorer le web comme univers complexe, c’est d’abord mettre en oeuvre une  ingénierie de la découverte  basée sur la conception de Systèmes d’Information Web (S.I.W.) expérimentaux. Cette ingénierie heuristique peut être conçue de façon  modulaire  (développement séparé de différents types de modules d’extraction, de traitement des données et de visualisation/identification de patterns relationnels). WebAtlas
3) Expérimentations (S.I.W.) Processus de découverte d’une structure web locale… … a partir d’un site ou d’un moteur (a), du Navicrawler (b), d’une liste d’URL (c). WebAtlas
3) Expérimentations (S.I.W.) WebAtlas
Cadres conceptuels A.-L. BARABASI  linked  -  the new science of networks , new ed. 2005. S. JONHSON - emergence: the connected lives of ants, brains, cities, and software,  2002. Théorie des graphes D. WATTS  six degrees - the science of a connected age , 2004. S. STROGATZ -  sync: the emerging science of spontaneous order , 2004. M. NEWMAN -  the structure and dynamics of networks,  2003. Web-Mining S. CHAKRABARTI  mining the web , 2002. J. KLEINBERG -  algorithm design,  2006. InfoViz B. SHNEIDERMAN -  readings in information visualization: using vision to think,  1999. Ouvrages de référence en Network Sciences WebAtlas
URFIST NICE Franck Ghitalla Département TSH Président de WebAtlas [email_address] Mathieu Jacomy Trésorier de WebAtlas Doctorant CELSA [email_address] WebAtlas

Contenu connexe

En vedette

Legislation de travail
Legislation de travail Legislation de travail
Legislation de travail Karam Kabriti
 
Les thèmes de recherche en economie
Les thèmes de recherche en economieLes thèmes de recherche en economie
Les thèmes de recherche en economie
Economiste
 
Système Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et Opérationnel
Frédéric FAURE
 
Valeur ajoutee de l'audit de performance
Valeur ajoutee de l'audit de performanceValeur ajoutee de l'audit de performance
Valeur ajoutee de l'audit de performanceicgfmconference
 
Gestion budgétaire
Gestion budgétaire Gestion budgétaire
Gestion budgétaire
hassan1488
 
Rapport de stage complet sur la planification et la gestion budgetaire d'une ...
Rapport de stage complet sur la planification et la gestion budgetaire d'une ...Rapport de stage complet sur la planification et la gestion budgetaire d'une ...
Rapport de stage complet sur la planification et la gestion budgetaire d'une ...
proviseur
 
Rx formations entreprises
Rx formations entreprisesRx formations entreprises
Rx formations entreprises
Rachid GHOFRANE
 
Droit du travail
Droit du travail Droit du travail
Droit du travail
Fatimezzahra Moun
 
Le Controle De Gestion De L’Entreprise
Le Controle De Gestion De L’EntrepriseLe Controle De Gestion De L’Entreprise
Le Controle De Gestion De L’Entreprise
claude wastiaux
 
ERP SAAS, quelle valeur ajoutée pour les comptables?
ERP SAAS, quelle valeur ajoutée pour les comptables?ERP SAAS, quelle valeur ajoutée pour les comptables?
ERP SAAS, quelle valeur ajoutée pour les comptables?
Audaxis
 
M18 gestion budgetaire -ter- tsge
M18 gestion budgetaire -ter- tsgeM18 gestion budgetaire -ter- tsge
M18 gestion budgetaire -ter- tsgebookeco
 
Culture Et Communication D’Entreprise
Culture Et Communication D’EntrepriseCulture Et Communication D’Entreprise
Culture Et Communication D’Entrepriseguestb103eb3
 
Reglementation
ReglementationReglementation
Reglementationyahsimoc
 
Maroc code travail
Maroc   code travailMaroc   code travail
Maroc code travailyahsimoc
 
Contrôle interne: l’avenir
Contrôle interne: l’avenirContrôle interne: l’avenir
Contrôle interne: l’avenir
Vriendenkring van de Administratie
 
Cours+ gestion-budgétaire
Cours+ gestion-budgétaireCours+ gestion-budgétaire
Cours+ gestion-budgétaire
ghita ghaytouta
 
Contrôle interne organisation type
Contrôle interne organisation typeContrôle interne organisation type
Contrôle interne organisation typeRACHID MABROUKI
 
Cgo porte ouverte 2010
Cgo porte ouverte 2010Cgo porte ouverte 2010
Cgo porte ouverte 2010
Louis-jean Cano
 
Gestion Comptable et Financiere Odoo V8
Gestion Comptable et Financiere Odoo V8Gestion Comptable et Financiere Odoo V8
Gestion Comptable et Financiere Odoo V8
Africa Performances
 

En vedette (20)

Legislation de travail
Legislation de travail Legislation de travail
Legislation de travail
 
Les thèmes de recherche en economie
Les thèmes de recherche en economieLes thèmes de recherche en economie
Les thèmes de recherche en economie
 
Système Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et Opérationnel
 
Valeur ajoutee de l'audit de performance
Valeur ajoutee de l'audit de performanceValeur ajoutee de l'audit de performance
Valeur ajoutee de l'audit de performance
 
Gestion budgétaire
Gestion budgétaire Gestion budgétaire
Gestion budgétaire
 
Rapport de stage complet sur la planification et la gestion budgetaire d'une ...
Rapport de stage complet sur la planification et la gestion budgetaire d'une ...Rapport de stage complet sur la planification et la gestion budgetaire d'une ...
Rapport de stage complet sur la planification et la gestion budgetaire d'une ...
 
Rx formations entreprises
Rx formations entreprisesRx formations entreprises
Rx formations entreprises
 
Droit du travail
Droit du travail Droit du travail
Droit du travail
 
Le Controle De Gestion De L’Entreprise
Le Controle De Gestion De L’EntrepriseLe Controle De Gestion De L’Entreprise
Le Controle De Gestion De L’Entreprise
 
ERP SAAS, quelle valeur ajoutée pour les comptables?
ERP SAAS, quelle valeur ajoutée pour les comptables?ERP SAAS, quelle valeur ajoutée pour les comptables?
ERP SAAS, quelle valeur ajoutée pour les comptables?
 
M18 gestion budgetaire -ter- tsge
M18 gestion budgetaire -ter- tsgeM18 gestion budgetaire -ter- tsge
M18 gestion budgetaire -ter- tsge
 
Culture Et Communication D’Entreprise
Culture Et Communication D’EntrepriseCulture Et Communication D’Entreprise
Culture Et Communication D’Entreprise
 
Reglementation
ReglementationReglementation
Reglementation
 
Maroc code travail
Maroc   code travailMaroc   code travail
Maroc code travail
 
Contrôle interne: l’avenir
Contrôle interne: l’avenirContrôle interne: l’avenir
Contrôle interne: l’avenir
 
Cours+ gestion-budgétaire
Cours+ gestion-budgétaireCours+ gestion-budgétaire
Cours+ gestion-budgétaire
 
Contrôle interne organisation type
Contrôle interne organisation typeContrôle interne organisation type
Contrôle interne organisation type
 
Cgo porte ouverte 2010
Cgo porte ouverte 2010Cgo porte ouverte 2010
Cgo porte ouverte 2010
 
Gestion Comptable et Financiere Odoo V8
Gestion Comptable et Financiere Odoo V8Gestion Comptable et Financiere Odoo V8
Gestion Comptable et Financiere Odoo V8
 
Contrôle de gestion
Contrôle de gestionContrôle de gestion
Contrôle de gestion
 

Similaire à Géographie de l'information

IC05 cours 2
IC05 cours 2IC05 cours 2
IC05 cours 2
Sébastien
 
Internet et le Web : de nouveaux espaces à cartographier ?
Internet et le Web : de nouveaux espaces à cartographier ? Internet et le Web : de nouveaux espaces à cartographier ?
Internet et le Web : de nouveaux espaces à cartographier ?
Alexandre Monnin
 
Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...
Sébastien
 
Artefacts numériques et matérialités
Artefacts numériques et matérialitésArtefacts numériques et matérialités
Artefacts numériques et matérialités
Alexandre Monnin
 
Boussole Nanotec Hv2
Boussole Nanotec Hv2Boussole Nanotec Hv2
Boussole Nanotec Hv2
L'Atelier de Cartographie
 
formation URFIST Rennes 2009
formation URFIST Rennes 2009formation URFIST Rennes 2009
formation URFIST Rennes 2009
L'Atelier de Cartographie
 
Développement d’un prototype logiciel pour l’analyse webométrique
Développement d’un prototype logiciel pour l’analyse webométriqueDéveloppement d’un prototype logiciel pour l’analyse webométrique
Développement d’un prototype logiciel pour l’analyse webométriqueRAUDIN33
 
PFE – Methode
PFE – MethodePFE – Methode
PFE – Methode
fafa007
 
Architectures ouvertes, distribuées et intelligentes de partage d’information...
Architectures ouvertes, distribuées et intelligentes de partage d’information...Architectures ouvertes, distribuées et intelligentes de partage d’information...
Architectures ouvertes, distribuées et intelligentes de partage d’information...
Mathieu d'Aquin
 
Université d’été ferney voltaire 2014 – les réseaux atelier-pajek
Université d’été ferney voltaire 2014 – les réseaux atelier-pajekUniversité d’été ferney voltaire 2014 – les réseaux atelier-pajek
Université d’été ferney voltaire 2014 – les réseaux atelier-pajek
Marion Maisonobe
 
Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
Réalisation d'un mashup de données avec DSS de Dataiku - Première partieRéalisation d'un mashup de données avec DSS de Dataiku - Première partie
Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
Gautier Poupeau
 
A Brief History of Database Management (SQL, NoSQL, NewSQL)
A Brief History of Database Management (SQL, NoSQL, NewSQL)A Brief History of Database Management (SQL, NoSQL, NewSQL)
A Brief History of Database Management (SQL, NoSQL, NewSQL)
Abdelkader OUARED
 
Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)
BorderCloud
 
Valtech - Big Data : Détails d’une mise en œuvre
Valtech - Big Data : Détails d’une mise en œuvreValtech - Big Data : Détails d’une mise en œuvre
Valtech - Big Data : Détails d’une mise en œuvre
Valtech
 
Document et structure : vers un web socio-sémantique
Document et structure : vers un web socio-sémantiqueDocument et structure : vers un web socio-sémantique
Document et structure : vers un web socio-sémantique
herve.info.unicaen.fr
 
Théorie Des Graphes
Théorie Des GraphesThéorie Des Graphes
Théorie Des Graphes
medialabSciencesPo
 
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Anne-Gaëlle Gaudion
 
Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Gilbert Paquette
 
PowerPoint sur le Web 2.0
PowerPoint sur le Web 2.0PowerPoint sur le Web 2.0
PowerPoint sur le Web 2.0guest4ca1b
 

Similaire à Géographie de l'information (20)

IC05 cours 2
IC05 cours 2IC05 cours 2
IC05 cours 2
 
Internet et le Web : de nouveaux espaces à cartographier ?
Internet et le Web : de nouveaux espaces à cartographier ? Internet et le Web : de nouveaux espaces à cartographier ?
Internet et le Web : de nouveaux espaces à cartographier ?
 
Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...
 
Artefacts numériques et matérialités
Artefacts numériques et matérialitésArtefacts numériques et matérialités
Artefacts numériques et matérialités
 
Boussole Nanotec Hv2
Boussole Nanotec Hv2Boussole Nanotec Hv2
Boussole Nanotec Hv2
 
formation URFIST Rennes 2009
formation URFIST Rennes 2009formation URFIST Rennes 2009
formation URFIST Rennes 2009
 
Développement d’un prototype logiciel pour l’analyse webométrique
Développement d’un prototype logiciel pour l’analyse webométriqueDéveloppement d’un prototype logiciel pour l’analyse webométrique
Développement d’un prototype logiciel pour l’analyse webométrique
 
PFE – Methode
PFE – MethodePFE – Methode
PFE – Methode
 
Architectures ouvertes, distribuées et intelligentes de partage d’information...
Architectures ouvertes, distribuées et intelligentes de partage d’information...Architectures ouvertes, distribuées et intelligentes de partage d’information...
Architectures ouvertes, distribuées et intelligentes de partage d’information...
 
Université d’été ferney voltaire 2014 – les réseaux atelier-pajek
Université d’été ferney voltaire 2014 – les réseaux atelier-pajekUniversité d’été ferney voltaire 2014 – les réseaux atelier-pajek
Université d’été ferney voltaire 2014 – les réseaux atelier-pajek
 
Ic05complet
Ic05completIc05complet
Ic05complet
 
Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
Réalisation d'un mashup de données avec DSS de Dataiku - Première partieRéalisation d'un mashup de données avec DSS de Dataiku - Première partie
Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
 
A Brief History of Database Management (SQL, NoSQL, NewSQL)
A Brief History of Database Management (SQL, NoSQL, NewSQL)A Brief History of Database Management (SQL, NoSQL, NewSQL)
A Brief History of Database Management (SQL, NoSQL, NewSQL)
 
Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)
 
Valtech - Big Data : Détails d’une mise en œuvre
Valtech - Big Data : Détails d’une mise en œuvreValtech - Big Data : Détails d’une mise en œuvre
Valtech - Big Data : Détails d’une mise en œuvre
 
Document et structure : vers un web socio-sémantique
Document et structure : vers un web socio-sémantiqueDocument et structure : vers un web socio-sémantique
Document et structure : vers un web socio-sémantique
 
Théorie Des Graphes
Théorie Des GraphesThéorie Des Graphes
Théorie Des Graphes
 
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
 
Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...
 
PowerPoint sur le Web 2.0
PowerPoint sur le Web 2.0PowerPoint sur le Web 2.0
PowerPoint sur le Web 2.0
 

Géographie de l'information

  • 1. WebAtlas URFIST NICE Franck Ghitalla Département TSH Président de WebAtlas [email_address] Mathieu Jacomy Trésorier de WebAtlas Doctorant CELSA [email_address]
  • 2. information geography Les agrégats de documents web 1) Principes théoriques 2) La « physis » des objets web 3) Expérimentations ( Web Information Systems , S.I.W.) WebAtlas
  • 4. Clustering Degree = High Distance Degree = High Clustering Degree = Low Distance Degree = Low Clustering Degree = High Distance Degree = Low WebAtlas
  • 5. Loi de puissance ( power-law ) 20% des nœuds (sites/pages) reçoivent ou attirent 80% des liens (connectivité hypertextuelle) (et inversement) Structure hiérarchique forte des nœuds dominants qui assurent au web son unité et garantissent la circulation entre nœuds secondaires En haut – distribution de la connectivité a) en random graph b) en power-law (Barabasi). A droite – distribution de la connectivité « entrante » sur les principaux sites francophones consacrés à la CSTI – Mathieu Jacomy, 2005. 1) Principes théoriques WebAtlas
  • 6. 3 propriétés des web-graphs a) de forme b) de distribution de l’ordre c) de domaines (mots, liens, acteurs) 1) Principes théoriques WebAtlas
  • 7. 1) Principes théoriques Distribution de la connectivité hypertexte entre sites « pour le non » au référendum sur la Constitution Européenne en 2005. Exploration dynamique du corpus via une application Flash – Antonin Rhomer, RTGI. WebAtlas
  • 8. 2) La « physis » des objets-web WebAtlas
  • 9.
  • 10. 2) La « physis » des objets relationnels Diamètre invariance d’échelle ( scale-free network ) Chemin moyen entre chaque paire de nœuds Graphe orienté ou non-orienté (prise en compte du sens des liens) Expérience de Barabasi et al. en 1998 Un premier graphe comprenant 1000 sites web avait un diamètre voisin de 8. Quel diamètre pour 10.000 et 100.000 nœuds? 80 ou 800? 11 seulement. Densité : nob liens réels / nb liens possibles WebAtlas
  • 11. 2) La « physis » des objets relationnels Hubs et Authorities ( les cœurs) Tous les nœuds d’un graphe peuvent se décrire en fonction de leurs scores de HUB (nombre de liens sortants) et d’AUTHORITY (nombre de liens entrants). HUBS (nœuds qui diffusent beaucoup de liens) AUTHORITIES (nœuds qui reçoivent beaucoup de liens) Hubs et Authorities ont tendance à se renforcer mutuellement Ils forment le « cœur » des agrégats de documents web WebAtlas
  • 12. 2) La « physis » des objets relationnels Clusters et composition interne Analyse en clusters à partir de la distribution des liens dans le corpus, des similarités de contenus (mots-clef) et/ou de la concentration de certains acteurs identifiés Données traitées dans le projet SIS-Map constituées par : 6760 expressions , modélisées sous forme de graphes relationnels (expansion du corpus à partir de 130 mots-clefs de départ à 940, puis de 940 à 7670) Un graphe associé de 26787 sites (sélection des 10 meilleures URL pour chaque mot-clef sur 240 000 sites extraits des bases Exalead ) 71744 relations sites-expressions WebAtlas
  • 13. 2) La « physis » des objets relationnels The Achilles’heel of the Internet Attachement préférentiel Chaque nouveau entrant de le système aura tendance à se relier directement aux Hubs et aux Authorités Temporellement, Hubs et authorities renforcent leur pouvoir Le « talon d’Achille » du web WebAtlas
  • 14. 3) Expérimentations et Systèmes d’Information Web WebAtlas
  • 15. Extraction des données Bases et process de traitement Indexation Calculs d’occurrences Structure de graphe Algorithmes de ranking (PageRank, HITS…) Algorithmes de clustering … Les patterns identifiables (logiques, statistiques, relationnels) peuvent aussi être visualisés, voire même identifiés via des visualisations de grandes masses de données web. Un Système d’Information Web dédié à l’exploration des structures du système doit pouvoir inclure différents process de traitement des données L’extraction des données web (mots-clefs, contenus, liens internes et/ou externes au sites…) peut être effectuée manuellement (via un bookmark par exemple), semi-automatiquement (Navicrawler, Timmy) ou automatiquement via un crawler paramétrable. Explorer le web comme univers complexe, c’est d’abord mettre en oeuvre une ingénierie de la découverte basée sur la conception de Systèmes d’Information Web (S.I.W.) expérimentaux. Cette ingénierie heuristique peut être conçue de façon modulaire (développement séparé de différents types de modules d’extraction, de traitement des données et de visualisation/identification de patterns relationnels). WebAtlas
  • 16. 3) Expérimentations (S.I.W.) Processus de découverte d’une structure web locale… … a partir d’un site ou d’un moteur (a), du Navicrawler (b), d’une liste d’URL (c). WebAtlas
  • 18. Cadres conceptuels A.-L. BARABASI linked - the new science of networks , new ed. 2005. S. JONHSON - emergence: the connected lives of ants, brains, cities, and software, 2002. Théorie des graphes D. WATTS six degrees - the science of a connected age , 2004. S. STROGATZ - sync: the emerging science of spontaneous order , 2004. M. NEWMAN - the structure and dynamics of networks, 2003. Web-Mining S. CHAKRABARTI mining the web , 2002. J. KLEINBERG - algorithm design, 2006. InfoViz B. SHNEIDERMAN - readings in information visualization: using vision to think, 1999. Ouvrages de référence en Network Sciences WebAtlas
  • 19. URFIST NICE Franck Ghitalla Département TSH Président de WebAtlas [email_address] Mathieu Jacomy Trésorier de WebAtlas Doctorant CELSA [email_address] WebAtlas