Tour d'horizon des personnes morales adhérentes à l'APRIL
Des traces d'usages aux patterns relationnels : la construction technologique des objets d'observation en NetworkSciences
1. "Des traces d'usages aux patterns relationnels : la construction technologique des objets d'observation en NetworkSciences " Guilhem Fouetillou Dir.Sc. RTGI-SAS Doctorant UTC-COSTECH Sc.Info membre fondateur de WebAtlas Franck Ghitalla M.de Conférence Sc. Info UTC-COSTECH Président de l’Association de Recherche WebAtlas Mathieu Jacomy MSH-TIC-Migrations Doctorant CELSA Sc.Info membre fondateur de WebAtlas
2.
3. Observation/recueil de données Méthodes quali-quantitatives Construction phénoménale et statistique des objets et des systèmes Aménagement des territoires numériques Activités de recherche, d’expérimentation et industrielle distribuées autour de 3 pôles successifs et complémentaires d’expertise… … pour développer des outils, des méthodes, des compétences en web-mining … pour explorer une architecture documentaire distribuée, dynamique et à-priori peu structurée … et pour construire des systèmes de médiation qui lui sont adaptés 2 3 1
4. 1 Observation/recueil de données/méthodes quali-quantitatives Réunir deux champs de compétences pour l’extraction des données Le web, un terrain d’observation/intervention à occuper par les SHS Des documents (contenu), des liens (topologie hypertexte) et, au final des acteurs et des communautés La traçabilité du social et l’univers des traces d’usage : en aussi grand nombre que dans les sciences exactes Les SHS pour le nombre et la diversité des modèles de temps, d’espaces, d’interaction… Un univers de traces numériques accessible via une ingénierie de l’investigation Niveau d'instrumentation technique et méthodologique jamais égalé en sciences sociales Nature numérique des données hautement formalisées techniquement
5. 1 Observation/recueil de données/méthodes quali-quantitatives Des projets d’investigation du web basés sur le déploiement de méthode "quali-quantitatives" pour le recueil et l'analyse des données web SHS/expertise des chercheurs Dispositifs/modules de traitement automatique Construire une ingénierie heuristique / Processus itératif de design
6. 1 Observation/recueil de données/méthodes quali-quantitatives Exemple de corpus : détection des « zones d’interaction » science/société (débats, controverses, coopération…) sur le web francophone Données constituées par : 6760 expressions , modélisées sous forme de graphes relationnels (expansion du corpus à partir de 130 mots-clefs de départ à 940, puis de 940 à 7670) Un graphe associé de 26787 sites (sélection des 10 meilleures URL pour chaque mot-clef) 71744 relations sites-expressions « Focus » thématique large : développement économique, développement durable, sciences citoyennes, énergies, transport, Nature, nourriture, chimie, nano-technologies, sciences du vivant, espace, biodiversité, nucléaire, cosmétiques… Objectif : mapping thématique d’expressions linguistiques associées
7. 1 un exemple : la phase de construction/expansion du corpus de données : phase de contrôle/sélection manuel
8. 1 un exemple : la phase de construction/expansion du corpus de données : phase d’expansion automatique
9. 1 un exemple : la phase de construction/expansion du corpus de données Expertise comme dimension qualitative du contrôle Identité comme ensemble de différences Tagage manuel, traits discriminants des objets et modèles de données, recherche de clôtures/frontières pour les corpus Traitement automatique comme dimension quantitative de l’expansion Unité et dénombrement statistique Crawl/navigation, stockage des données, séries et grandeurs Deux types (classiques ») de « collisions » méthodologiques 1) Classer les unités en types (quantitatif/qualitatif) 2) Identités partagées par plusieurs séries/grandeurs (qualitatif/quantitatif)
12. 2 Construction phénoménale et statistique des objets et des systèmes Décrire, indexer, classer des données pour extraire des patterns à la fois graphiques et statistiques / le rôle des interfaces
13. 2 Construction phénoménale et statistique des objets et des systèmes Façonner la physis des objets d’investigation (théorie des graphes) à partir de propriétés statistiques Densité Diamètre Clusters Frontières Hiérarchies « Cœur » ou centres
14. 2 Construction phénoménale et statistique des objets et des systèmes Spatialiser les données pour donner prise à l’analyse Vidéo??
15. 2 Construction phénoménale et statistique des objets et des systèmes Hiérarchies et clusters comme espaces d’investigation… Vers un Atlas thématique? Aliments et alimentation cosmétiques Poids et problèmes de poids
16. 2 Construction phénoménale et statistique des objets et des systèmes radicaux libres principes actifs cosmetiques naturels produits cosmetiques produits de soins peaux seches produits de beaute produits de soin soins du visage produits naturels anti-rides soin du visage huiles vegetales complements alimentaires anti-age institut de beaute soins du corps type de peau soins beaute cosmetiques bio
18. Aménagement des territoires numériques 3 USandUS Construction manuelle d’un corpus central Mapping en continu de l’activité des internautes Construction de sous-corpus analytiques (trends, buzz, topologies hypertextes…) Un environnement (cartographique) dédié à l’activité des internautes Mesurer les effets sociaux produits/générés par la mise à disposition du système développer des instruments inédits d'exploration en essayant de mesurer, pas à pas, et pour chacun des projets dans lesquels est engagée l'association, leurs enjeux épistémologiques et les "effets produits" de leurs usages Valider notre démarche en identifiant les types de source d’innovation en jeu : technologique mais aussi scientifique et/ou industrielle et sociétale La question de la "traçabilité du social" sur les réseaux
19. Cadres conceptuels A.-L. BARABASI linked - the new science of networks , new ed. 2005. S. JONHSON - emergence: the connected lives of ants, brains, cities, and software, 2002. Théorie des graphes D. WATTS six degrees - the science of a connected age , 2004. S. STROGATZ - sync: the emerging science of spontaneous order , 2004. M. NEWMAN - the structure and dynamics of networks, 2003. Web-Mining S. CHAKRABARTI mining the web , 2002. J. KLEINBERG - algorithm design, 2006. InfoViz B. SHNEIDERMAN - readings in information visualization: using vision to think, 1999. Ouvrages de référence en Network Sciences