SlideShare une entreprise Scribd logo
1  sur  23
Télécharger pour lire hors ligne
Serge Courrier | Novembre 2020
NodeXLBasic
Visualisationsetanalyses
deréseauxTwitter
(Respectons les auteurs !)
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 2 sur 23
SOMMAIRE
Principes de base__________________________________________________________________________________________ 3
Compatibilité avec Excel____________________________________________________________________________________ 3
Page d’accueil ____________________________________________________________________________________________ 3
Différences entre la version Basic et Pro_______________________________________________________________________ 4
Installation_______________________________________________________________________________________________ 5
Lancer NodeXL____________________________________________________________________________________________ 6
Twitter : analyse des réponses à une requête __________________________________________________________________ 7
Initier la requête ________________________________________________________________________________________ 7
Configurer la requête (et autoriser à NodeXL l’accès au compte Twitter) ___________________________________________ 8
Analyser les réponses : vision générale _____________________________________________________________________ 11
Effectuer des premiers calculs sur le graphe (avant de générer une visualisation) ___________________________________ 12
Jouer avec les métriques (avant de générer une visualisation) ___________________________________________________ 13
Préparer le graphe en remplissant automatiquement certaines caractéristiques ____________________________________ 15
Visualiser puis modifier le graphe__________________________________________________________________________ 17
Filtrer le graphe ________________________________________________________________________________________ 18
Sauvegarder le graphe___________________________________________________________________________________ 21
L’Auteur _____________________________________________________________________________ Erreur ! Signet non défini.
Serge Courrier _____________________________________________________________________ Erreur ! Signet non défini.
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 3 sur 23
Principesdebase
◼ NodeXL est un modèle (template) d’Excel qui permet d’effectuer des analyses de « réseaux »
(network analysis).
◼ Il s’agit d’analyser les « edges » (en français « arcs », « arêtes », « chemins » ou « connexions »), entre
des entités (personnes, organisations…).
◼ Ces entités sont « vertex » (encore appelé « node » en anglais et « nœud » ou « sommet » en
français).
◼ Il existe en trois versions : NodeXL Basic (gratuite, limitée), NodeXL Pro (payante), NodeXL Cloud
(payante).
CompatibilitéavecExcel
◼ NodeXL est compatible avec Excel 2010 et suivants.
Paged’accueil
◼ Page du projet : www.smrfoundation.org/nodexl/
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 4 sur 23
DifférencesentrelaversionBasicetPro
◼ https://www.nodexlgraphgallery.org/Pages/Registration.aspx
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 5 sur 23
Installation
◼ Connectez-vous sur http://nodexlgraphgallery.org/Pages/Registration.aspx
◼ Cliquez sur « Download NodeXL Basic »
◼ Remplissez le formulaire
◼ Une fois terminé, vous recevrez un lien de téléchargement par mail.
◼ Enregistrez le fichier sur votre ordinateur.
◼ Une fois téléchargé, double-cliquez sur le fichier.
◼ NodeXL s’installe.
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 6 sur 23
LancerNodeXL
◼ Il suffit de chercher « NodeXL Excel Template » et d’ouvrir le document.
◼ Le fichier (vide) s’ouvre. Notez que NodeXL dispose de son propre onglet dans Excel.
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 7 sur 23
Twitter:analysedesréponsesàunerequête
Initierlarequête
◼ Cliquer sur l’onglet « NodeXL Basic » puis sur « Import » puis sur « From Twitter Search Network ».
◼ Remarquez qu’il est également possible d’interroger également le « réseau des utilisateurs » (User’s
Network).
◼ Il est aussi possible d’accéder à d’autres plateformes comme
 Facebook (risque de ne pas marcher au vu de changements d’API depuis 2018)
 Flickr
 YouTube
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 8 sur 23
Configurerlarequête(etautoriseràNodeXLl’accèsaucompteTwitter)
◼ Dans le premier champ, posez votre question comme si vous le faisiez dans Twitter. Aussi complexe
soit-elle !
◼ ATTENTION : les caractères accentués ne sont pas bien gérés. Préférez les caractères
alphanumériques (en évitant les caractères diacritiques, donc). De toute façon, Twitter ne fait pas la
différence entre « é » et « e » ; « ç » et « c »…
◼ Pour éviter de pâtir des limitations imposées par Twitter (3200 tweets lorsque l’interrogation est liée
comme ici à une identification simple via le compte Twitter et non l’API nécessitant un compte
développeur), optez dans un premier temps pour « Basic Network ».
◼ Limitez le nombre de réponses à 500 tweets (pour ne pas compliquer l’analyse des résultats lors de ce
premier exemple).
◼ Lors de la première connexion à Twitter via NodeXL, il faudra autoriser (une fois pour toute) la mise
en relation des deux applications. Suivez la séquence suivante.
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 9 sur 23
◼ Cliquez sur « Autoriser l’application »
◼ Un code PIN vous est alors fourni. Copiez-le.
◼ Collez ensuite le code PIN dans la fenêtre d’autorisation et cliquez sur OK
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 10 sur 23
◼ NodeXL, vous préviens que pour faciliter l’import des résultats, l’habillage des textes sera désactivé.
Cliquez sur « Yes ».
◼ À la fin de la recherche (si les limites imposées par Twitter ne sont pas dépassées), vous obtiendrez
directement les données réparties dans plusieurs feuilles d’un même classeur Excel.
◼ Si les limites sont dépassées, vous devrez attendre 55 minutes avant d’obtenir le reste des réponses
disponibles (ou vous satisfaire des données déjà récoltées).
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 11 sur 23
Analyserlesréponses:visiongénérale
◼ Les deux premières colonnes de la feuille « Edges » (en français « arcs », « arêtes », « chemins » ou
« connexions ») contiennent chacune le nom d’un utilisateur Twitter désigné sous le terme « vertex »
(encore appelé « node » en anglais et « nœud » ou « sommet » en français).
◼ Un « edge » désigne donc un lien entre deux « vertex » (« vertices » pour être plus précises).
◼ « edge » et « vertex » sont deux termes continuellement utilisés en science des réseaux. A retenir !
 Le premier « vertex » est le nom d’utilisateur de l’abonné qui a émis le tweet.
 Le second est le nom de l’utilisateur retweeté ou cité dans le tweet (voir les cas particuliers ci-
dessous).
 Si le tweet n’est pas un retweet ou ne cite pas de compte, le second « nœud » est le nom
d’utilisateur de l’émetteur.
 Si le tweet cite plusieurs comptes, il y aura autant de connexions que de comptes cités dans le
Tweet.
◼ Au sein de la feuille listant les nœuds du graphe (vertices) sont regroupés les comptes Twitter ayant
émis (ou étant cités dans) un tweet répondant à notre requête.
◼ Entre autres indications, chaque compte est associé à son nombre d’abonnés.
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 12 sur 23
Effectuerdespremierscalculssurlegraphe(avantdegénérerunevisualisation)
◼ Dans l’onglet « NodeXL », cliquez sur « Graph Metrics ».
◼ Pour disposer de toutes les données calculables (quitte à ne pas toutes les utiliser) cliquer sur « Select
All » puis sur « Calculate metrix ».
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 13 sur 23
Joueraveclesmétriques(avantdegénérerunevisualisation)
◼ La feuille de calcul « Overall Metrics » s’est enrichie des détails de votre graphe.
◼ Dans le dossier Excel, la feuille de calcul « Vertices » (nœuds) a été enrichie de plusieurs colonnes.
Elles apparaissent dans la zone « Graph Metrics ».
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 14 sur 23
In-Degree:nombredeconnexionspointantversunnœud
 Il est aisé de faire apparaitre le nombre de connexions pointant vers un nœud.
 Essayons de mettre en avant les comptes les plus fréquemment cités ou retweetés.
 Il suffit pour cela de cliquer sur la petite flèche située à droite de la mention « In-Degree » et de
choisir « Trier du plus grand au plus petit ».
◼ Le résultat permet de voir rapidement les comptes les plus cités
EigenvectorCentrality:unesortedePagerankdugraphe
◼ Proche du PageRank de Google, l’Eigenvector (créé en 2008 pour évaluer le poids d’un article
scientifique) est un calcul de « centralité » qui tend à donner un « poids » à chaque nœud dans le
graphe. Il valorise les nœuds vers lesquels convergent un grand nombre de connexions (« citations »
dans le domaine scientifique), elles-mêmes issues de nœuds (publications) produisant de nombreuses
tweets (« articles dans le domaine scientifique).
◼ Vous voyez néanmoins qu’un score PageRank jouxte l’Eigenfactor.
◼ D’autres métriques sont disponibles les voici détaillées telles que définies dans ce document.
 Degree est un simple comptage du nombre de connexions pour chaque nœud. Pour les réseaux
dirigés, il est divisé in-degrees (connexions entrantes) et en out-degrees (connexions sortantes).
 Betweenness centrality révèle essentiellement l'importance de chaque nœud en tant que « pont »
entre les différentes parties du réseau.
 Closeness centrality est une mesure de la proximité moyenne de chaque nœud par rapport à tous
les autres nœuds d'un réseau. Elle met en évidence les nœuds qui se connectent aux autres par un
nombre inférieur d'arêtes.
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 15 sur 23
Préparerlegrapheenremplissantautomatiquementcertainescaractéristiques
◼ Les visualisations générées par NodeXL sont dépouillées de toute indication.
◼ Pour obtenir quelque chose de « parlant » dès la première tentative, rentrons dans le détail.
◼ Cliquez sur « Autofill Colums »
◼ Ensuite, modifiez les réglages des nœuds tels que proposés ci-dessous.
 EDGES. Grossir le lien entre deux comptes selon qu’ils se citent l’un/l’autre nous paraît une bonne
idée
 VERTICES. Après moults tergiversations, nous avons décidé que la grosseur des nœuds serait
proportionnelle au PageRank, un critère qui nous a paru on seulement intéressant mais
discriminant. L’étiquette du nœud se verra associé au nom de l’utilisateur. La couleur du nœud
traduira le nombre d’abonnés de l’utilisateur. Libre à vous, bien sûr, de tester d’autres métriques
(mais n’oubliez pas de les préciser dans la légende finale de votre graphe).
◼ Libre à vous aussi à réfléchir à d’autres choix qui vous semblent plus judicieux.
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 16 sur 23
◼ Après quelques essais (on vous fait gagner du temps… ) nous décidons d’augmenter la grosseur
des points.
◼ Réglons la valeur à « 100 ».
◼ Cliquez ensuite sur « Autofill ». Vous pourrez revenir sur des réglages si le résultat vous déplait.
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 17 sur 23
Visualiserpuismodifierlegraphe
◼ Après le choix du remplissage automatique (Autofill), votre graphe apparaît en petit dans le volet
droit de la feuille de calcul. Augmentez sa largeur en agissant sur la ligne de séparation.
◼ La visualisation se base sur un algorithme particulier : « Fruchterman-Reingo ». Pour obtenir une
meilleure représentation des communautés, l’algorithme « Harel-Korel » donne de meilleurs
résultats.
◼ Après avoir choisi l’algorithme, cliquez sur « Refresh Graph »
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 18 sur 23
◼ Le résultat est (un peu) plus clair !
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 19 sur 23
Filtrerlegraphe
◼ Pour y voir plus clair, nous allons privilégier les comptes avec le plus d’abonnés et avec le plus fort
PageRank.
◼ Cliquez sur « Dynamic filters »
◼ Nous allons tenter « d’éclairer » le graphe en retirant les comptes disposant de faibles valeurs de
« betweenness centrality ». Pour ce, nous allons augmenter très progressivement la borne gauche de
cette valeur.
◼ Le résultat est immédiat ! Mais vous pouvez bien sûr tenter d’autres réglages.
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 20 sur 23
◼ En jouant sur « Zoom », « Scale », « Graph options » et les options de « Lay Out Again », il est possible
d’améliorer le rendu du graphe.
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 21 sur 23
Sauvegarderlegraphe
◼ Un clic droit dans la zone du graphe permet d’obtenir la proposition suivante et de jouer sur la taille
finale de l’image (Image options…) puis de le sauvegarder (Save image…).
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 22 sur 23
◼ Et voici le résultat
◼ [Légende] Les utilisateurs de Twitter qui ont le plus attirés l’attention et suscités le plus de
réaction autour du hashtag #holdup, le 15 novembre 2020 entre 9h20 et 10h10 (500 tweets).
◼ N’oubliez pas de sauvegarder votre œuvre !
NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 23 sur 23
L’Auteur
SergeCourrier
Mail : s.courrier@gmail.com, secou@protonmail.com
Twitter : http://twitter.com/secou
Twitter (spécial RSS) : http://twitter.com/RSSCircus
Facebook : www.facebook.com/serge.courrier
Linkedin : http://fr.linkedin.com/in/sergecourrier
Slideshare : http://www.slideshare.net/serge.courrier
◼ Consultant, j’interviens depuis 2005 auprès d’entreprises et d’organismes publics, pour développer
leurs outils et stratégies de recherche, d’investigation, de veille, de visualisation de données, ainsi que
leurs usages avancés d’Internet et notamment des réseaux et médias sociaux.
◼ Formateur, j’enseigne depuis 1996 les stratégies de recherche, d’investigation et de veille via Internet,
ainsi que les usages et stratégies liées aux réseaux et médias sociaux, la visualisation de données, la
désinformation... Intervenant à l’École Européenne d’Intelligence Économique (EEIE), à l’association des
professionnels de l’information (ADBS) à l’école des bibliothécaires et documentalistes (EBD), j’assure
également depuis 1993 la formation des rédactions de France Télévisions.
◼ Auteur, j’ai publié un guide de 500 pages sur les outils, les usages et les méthodes de recherche via
Internet (Internet pour les journalistes, Victoire Éditions, 2004), deux guides pratiques sur la syndication
de contenu (Utiliser les fils RSS et Atom, février 2008, ADBS ; Produire des fils RSS et Atom, mars 2009,
ADBS). A collaboré à Le Web 2.0 en bibliothèque. Quels services ? Quels usages ? (Le Cercle de la
librairie, 2009)
◼ Ex-Journaliste spécialisé, j’ai traité entre 1990 et 2014 de sujets liés à Internet et à l’Intelligence
économique pour des magazines spécialisés et grand public. J’ai précédemment occupé les postes de
rédacteur en chef adjoint de Génie Industriel, Science et Vie Micro (SVM) et Micro Hebdo.

Contenu connexe

Similaire à SNA - NodeXL (2020)

la-bible-du-tcd-2.pdf
la-bible-du-tcd-2.pdfla-bible-du-tcd-2.pdf
la-bible-du-tcd-2.pdfssuser1e81bd1
 
Grid Computing
Grid ComputingGrid Computing
Grid Computingm.dubucq
 
Stream processing et SQL
Stream processing et SQLStream processing et SQL
Stream processing et SQLBruno Bonnin
 
Beautiful CSS : Structurer, documenter, maintenir
Beautiful CSS : Structurer, documenter, maintenirBeautiful CSS : Structurer, documenter, maintenir
Beautiful CSS : Structurer, documenter, maintenirYves Van Goethem
 
ASP.NET MVC, Web API & KnockoutJS
ASP.NET MVC, Web API & KnockoutJSASP.NET MVC, Web API & KnockoutJS
ASP.NET MVC, Web API & KnockoutJSRenaud Dumont
 
Twitter advanced search_tuto
Twitter advanced search_tutoTwitter advanced search_tuto
Twitter advanced search_tutoFrançoise Grave
 
Stream processing et SQL
Stream processing et SQLStream processing et SQL
Stream processing et SQLBruno Bonnin
 
Intégration des données avec Talend ETL
Intégration des données avec Talend ETLIntégration des données avec Talend ETL
Intégration des données avec Talend ETLLilia Sfaxi
 
[User Guide] 7 bonnes pratiques pour réussir vos tableaux de bord Excel avec ...
[User Guide] 7 bonnes pratiques pour réussir vos tableaux de bord Excel avec ...[User Guide] 7 bonnes pratiques pour réussir vos tableaux de bord Excel avec ...
[User Guide] 7 bonnes pratiques pour réussir vos tableaux de bord Excel avec ...AT Internet
 
Présentation Dataquitaine 2023.pdf
Présentation Dataquitaine 2023.pdfPrésentation Dataquitaine 2023.pdf
Présentation Dataquitaine 2023.pdfVIA INNO
 
Creation famille imbriquee-tremie
Creation famille imbriquee-tremieCreation famille imbriquee-tremie
Creation famille imbriquee-tremieali lemssefer
 
Guide (un tout petit peu) pratique (et totalement subjectif) du stream proces...
Guide (un tout petit peu) pratique (et totalement subjectif) du stream proces...Guide (un tout petit peu) pratique (et totalement subjectif) du stream proces...
Guide (un tout petit peu) pratique (et totalement subjectif) du stream proces...Bruno Bonnin
 
Entity_framework_db first
Entity_framework_db firstEntity_framework_db first
Entity_framework_db firstZineb ELGARRAI
 
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDBSGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDBRomain Cambien
 
SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...
SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...
SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...Jean-Pierre Riehl
 
Paris Tug - Session d'octobre
Paris Tug - Session d'octobreParis Tug - Session d'octobre
Paris Tug - Session d'octobreGeoffrey Felix
 

Similaire à SNA - NodeXL (2020) (20)

la-bible-du-tcd-2.pdf
la-bible-du-tcd-2.pdfla-bible-du-tcd-2.pdf
la-bible-du-tcd-2.pdf
 
Grid Computing
Grid ComputingGrid Computing
Grid Computing
 
41680698.pdf
41680698.pdf41680698.pdf
41680698.pdf
 
Stream processing et SQL
Stream processing et SQLStream processing et SQL
Stream processing et SQL
 
Beautiful CSS : Structurer, documenter, maintenir
Beautiful CSS : Structurer, documenter, maintenirBeautiful CSS : Structurer, documenter, maintenir
Beautiful CSS : Structurer, documenter, maintenir
 
ASP.NET MVC, Web API & KnockoutJS
ASP.NET MVC, Web API & KnockoutJSASP.NET MVC, Web API & KnockoutJS
ASP.NET MVC, Web API & KnockoutJS
 
Mathcad 15 en quelques mots
Mathcad 15 en quelques motsMathcad 15 en quelques mots
Mathcad 15 en quelques mots
 
Twitter advanced search_tuto
Twitter advanced search_tutoTwitter advanced search_tuto
Twitter advanced search_tuto
 
Stream processing et SQL
Stream processing et SQLStream processing et SQL
Stream processing et SQL
 
Intégration des données avec Talend ETL
Intégration des données avec Talend ETLIntégration des données avec Talend ETL
Intégration des données avec Talend ETL
 
Serveur node red
Serveur node redServeur node red
Serveur node red
 
[User Guide] 7 bonnes pratiques pour réussir vos tableaux de bord Excel avec ...
[User Guide] 7 bonnes pratiques pour réussir vos tableaux de bord Excel avec ...[User Guide] 7 bonnes pratiques pour réussir vos tableaux de bord Excel avec ...
[User Guide] 7 bonnes pratiques pour réussir vos tableaux de bord Excel avec ...
 
Présentation Dataquitaine 2023.pdf
Présentation Dataquitaine 2023.pdfPrésentation Dataquitaine 2023.pdf
Présentation Dataquitaine 2023.pdf
 
Creation famille imbriquee-tremie
Creation famille imbriquee-tremieCreation famille imbriquee-tremie
Creation famille imbriquee-tremie
 
cm-bd.pdf
cm-bd.pdfcm-bd.pdf
cm-bd.pdf
 
Guide (un tout petit peu) pratique (et totalement subjectif) du stream proces...
Guide (un tout petit peu) pratique (et totalement subjectif) du stream proces...Guide (un tout petit peu) pratique (et totalement subjectif) du stream proces...
Guide (un tout petit peu) pratique (et totalement subjectif) du stream proces...
 
Entity_framework_db first
Entity_framework_db firstEntity_framework_db first
Entity_framework_db first
 
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDBSGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
 
SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...
SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...
SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...
 
Paris Tug - Session d'octobre
Paris Tug - Session d'octobreParis Tug - Session d'octobre
Paris Tug - Session d'octobre
 

Plus de Groupe EEIE

Webinar EEIE #11 : Lobbying et éthique
Webinar EEIE #11 : Lobbying et éthiqueWebinar EEIE #11 : Lobbying et éthique
Webinar EEIE #11 : Lobbying et éthiqueGroupe EEIE
 
Webinar EEIE #10 : Fake News dans le monde de l'information professionnelle
Webinar EEIE #10 : Fake News dans le monde de l'information professionnelleWebinar EEIE #10 : Fake News dans le monde de l'information professionnelle
Webinar EEIE #10 : Fake News dans le monde de l'information professionnelleGroupe EEIE
 
Support de présentation EECS
Support de présentation EECSSupport de présentation EECS
Support de présentation EECSGroupe EEIE
 
Webinar EEIE #07 : Droit du Secret des Affaires
 Webinar EEIE #07 : Droit du Secret des Affaires Webinar EEIE #07 : Droit du Secret des Affaires
Webinar EEIE #07 : Droit du Secret des AffairesGroupe EEIE
 
Webinar EEIE #08 : Le RGPD
Webinar EEIE #08 : Le RGPDWebinar EEIE #08 : Le RGPD
Webinar EEIE #08 : Le RGPDGroupe EEIE
 
Webinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataWebinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataGroupe EEIE
 
Webinar EEIE #05 - Cybersécurité : Best Practices
Webinar EEIE #05 - Cybersécurité : Best PracticesWebinar EEIE #05 - Cybersécurité : Best Practices
Webinar EEIE #05 - Cybersécurité : Best PracticesGroupe EEIE
 
Webinar EEIE #03 : L'Intelligence Financière à la portée de tous
Webinar EEIE #03 :  L'Intelligence Financière à la portée de tousWebinar EEIE #03 :  L'Intelligence Financière à la portée de tous
Webinar EEIE #03 : L'Intelligence Financière à la portée de tousGroupe EEIE
 

Plus de Groupe EEIE (8)

Webinar EEIE #11 : Lobbying et éthique
Webinar EEIE #11 : Lobbying et éthiqueWebinar EEIE #11 : Lobbying et éthique
Webinar EEIE #11 : Lobbying et éthique
 
Webinar EEIE #10 : Fake News dans le monde de l'information professionnelle
Webinar EEIE #10 : Fake News dans le monde de l'information professionnelleWebinar EEIE #10 : Fake News dans le monde de l'information professionnelle
Webinar EEIE #10 : Fake News dans le monde de l'information professionnelle
 
Support de présentation EECS
Support de présentation EECSSupport de présentation EECS
Support de présentation EECS
 
Webinar EEIE #07 : Droit du Secret des Affaires
 Webinar EEIE #07 : Droit du Secret des Affaires Webinar EEIE #07 : Droit du Secret des Affaires
Webinar EEIE #07 : Droit du Secret des Affaires
 
Webinar EEIE #08 : Le RGPD
Webinar EEIE #08 : Le RGPDWebinar EEIE #08 : Le RGPD
Webinar EEIE #08 : Le RGPD
 
Webinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataWebinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la data
 
Webinar EEIE #05 - Cybersécurité : Best Practices
Webinar EEIE #05 - Cybersécurité : Best PracticesWebinar EEIE #05 - Cybersécurité : Best Practices
Webinar EEIE #05 - Cybersécurité : Best Practices
 
Webinar EEIE #03 : L'Intelligence Financière à la portée de tous
Webinar EEIE #03 :  L'Intelligence Financière à la portée de tousWebinar EEIE #03 :  L'Intelligence Financière à la portée de tous
Webinar EEIE #03 : L'Intelligence Financière à la portée de tous
 

SNA - NodeXL (2020)

  • 1. Serge Courrier | Novembre 2020 NodeXLBasic Visualisationsetanalyses deréseauxTwitter (Respectons les auteurs !)
  • 2. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 2 sur 23 SOMMAIRE Principes de base__________________________________________________________________________________________ 3 Compatibilité avec Excel____________________________________________________________________________________ 3 Page d’accueil ____________________________________________________________________________________________ 3 Différences entre la version Basic et Pro_______________________________________________________________________ 4 Installation_______________________________________________________________________________________________ 5 Lancer NodeXL____________________________________________________________________________________________ 6 Twitter : analyse des réponses à une requête __________________________________________________________________ 7 Initier la requête ________________________________________________________________________________________ 7 Configurer la requête (et autoriser à NodeXL l’accès au compte Twitter) ___________________________________________ 8 Analyser les réponses : vision générale _____________________________________________________________________ 11 Effectuer des premiers calculs sur le graphe (avant de générer une visualisation) ___________________________________ 12 Jouer avec les métriques (avant de générer une visualisation) ___________________________________________________ 13 Préparer le graphe en remplissant automatiquement certaines caractéristiques ____________________________________ 15 Visualiser puis modifier le graphe__________________________________________________________________________ 17 Filtrer le graphe ________________________________________________________________________________________ 18 Sauvegarder le graphe___________________________________________________________________________________ 21 L’Auteur _____________________________________________________________________________ Erreur ! Signet non défini. Serge Courrier _____________________________________________________________________ Erreur ! Signet non défini.
  • 3. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 3 sur 23 Principesdebase ◼ NodeXL est un modèle (template) d’Excel qui permet d’effectuer des analyses de « réseaux » (network analysis). ◼ Il s’agit d’analyser les « edges » (en français « arcs », « arêtes », « chemins » ou « connexions »), entre des entités (personnes, organisations…). ◼ Ces entités sont « vertex » (encore appelé « node » en anglais et « nœud » ou « sommet » en français). ◼ Il existe en trois versions : NodeXL Basic (gratuite, limitée), NodeXL Pro (payante), NodeXL Cloud (payante). CompatibilitéavecExcel ◼ NodeXL est compatible avec Excel 2010 et suivants. Paged’accueil ◼ Page du projet : www.smrfoundation.org/nodexl/
  • 4. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 4 sur 23 DifférencesentrelaversionBasicetPro ◼ https://www.nodexlgraphgallery.org/Pages/Registration.aspx
  • 5. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 5 sur 23 Installation ◼ Connectez-vous sur http://nodexlgraphgallery.org/Pages/Registration.aspx ◼ Cliquez sur « Download NodeXL Basic » ◼ Remplissez le formulaire ◼ Une fois terminé, vous recevrez un lien de téléchargement par mail. ◼ Enregistrez le fichier sur votre ordinateur. ◼ Une fois téléchargé, double-cliquez sur le fichier. ◼ NodeXL s’installe.
  • 6. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 6 sur 23 LancerNodeXL ◼ Il suffit de chercher « NodeXL Excel Template » et d’ouvrir le document. ◼ Le fichier (vide) s’ouvre. Notez que NodeXL dispose de son propre onglet dans Excel.
  • 7. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 7 sur 23 Twitter:analysedesréponsesàunerequête Initierlarequête ◼ Cliquer sur l’onglet « NodeXL Basic » puis sur « Import » puis sur « From Twitter Search Network ». ◼ Remarquez qu’il est également possible d’interroger également le « réseau des utilisateurs » (User’s Network). ◼ Il est aussi possible d’accéder à d’autres plateformes comme  Facebook (risque de ne pas marcher au vu de changements d’API depuis 2018)  Flickr  YouTube
  • 8. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 8 sur 23 Configurerlarequête(etautoriseràNodeXLl’accèsaucompteTwitter) ◼ Dans le premier champ, posez votre question comme si vous le faisiez dans Twitter. Aussi complexe soit-elle ! ◼ ATTENTION : les caractères accentués ne sont pas bien gérés. Préférez les caractères alphanumériques (en évitant les caractères diacritiques, donc). De toute façon, Twitter ne fait pas la différence entre « é » et « e » ; « ç » et « c »… ◼ Pour éviter de pâtir des limitations imposées par Twitter (3200 tweets lorsque l’interrogation est liée comme ici à une identification simple via le compte Twitter et non l’API nécessitant un compte développeur), optez dans un premier temps pour « Basic Network ». ◼ Limitez le nombre de réponses à 500 tweets (pour ne pas compliquer l’analyse des résultats lors de ce premier exemple). ◼ Lors de la première connexion à Twitter via NodeXL, il faudra autoriser (une fois pour toute) la mise en relation des deux applications. Suivez la séquence suivante.
  • 9. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 9 sur 23 ◼ Cliquez sur « Autoriser l’application » ◼ Un code PIN vous est alors fourni. Copiez-le. ◼ Collez ensuite le code PIN dans la fenêtre d’autorisation et cliquez sur OK
  • 10. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 10 sur 23 ◼ NodeXL, vous préviens que pour faciliter l’import des résultats, l’habillage des textes sera désactivé. Cliquez sur « Yes ». ◼ À la fin de la recherche (si les limites imposées par Twitter ne sont pas dépassées), vous obtiendrez directement les données réparties dans plusieurs feuilles d’un même classeur Excel. ◼ Si les limites sont dépassées, vous devrez attendre 55 minutes avant d’obtenir le reste des réponses disponibles (ou vous satisfaire des données déjà récoltées).
  • 11. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 11 sur 23 Analyserlesréponses:visiongénérale ◼ Les deux premières colonnes de la feuille « Edges » (en français « arcs », « arêtes », « chemins » ou « connexions ») contiennent chacune le nom d’un utilisateur Twitter désigné sous le terme « vertex » (encore appelé « node » en anglais et « nœud » ou « sommet » en français). ◼ Un « edge » désigne donc un lien entre deux « vertex » (« vertices » pour être plus précises). ◼ « edge » et « vertex » sont deux termes continuellement utilisés en science des réseaux. A retenir !  Le premier « vertex » est le nom d’utilisateur de l’abonné qui a émis le tweet.  Le second est le nom de l’utilisateur retweeté ou cité dans le tweet (voir les cas particuliers ci- dessous).  Si le tweet n’est pas un retweet ou ne cite pas de compte, le second « nœud » est le nom d’utilisateur de l’émetteur.  Si le tweet cite plusieurs comptes, il y aura autant de connexions que de comptes cités dans le Tweet. ◼ Au sein de la feuille listant les nœuds du graphe (vertices) sont regroupés les comptes Twitter ayant émis (ou étant cités dans) un tweet répondant à notre requête. ◼ Entre autres indications, chaque compte est associé à son nombre d’abonnés.
  • 12. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 12 sur 23 Effectuerdespremierscalculssurlegraphe(avantdegénérerunevisualisation) ◼ Dans l’onglet « NodeXL », cliquez sur « Graph Metrics ». ◼ Pour disposer de toutes les données calculables (quitte à ne pas toutes les utiliser) cliquer sur « Select All » puis sur « Calculate metrix ».
  • 13. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 13 sur 23 Joueraveclesmétriques(avantdegénérerunevisualisation) ◼ La feuille de calcul « Overall Metrics » s’est enrichie des détails de votre graphe. ◼ Dans le dossier Excel, la feuille de calcul « Vertices » (nœuds) a été enrichie de plusieurs colonnes. Elles apparaissent dans la zone « Graph Metrics ».
  • 14. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 14 sur 23 In-Degree:nombredeconnexionspointantversunnœud  Il est aisé de faire apparaitre le nombre de connexions pointant vers un nœud.  Essayons de mettre en avant les comptes les plus fréquemment cités ou retweetés.  Il suffit pour cela de cliquer sur la petite flèche située à droite de la mention « In-Degree » et de choisir « Trier du plus grand au plus petit ». ◼ Le résultat permet de voir rapidement les comptes les plus cités EigenvectorCentrality:unesortedePagerankdugraphe ◼ Proche du PageRank de Google, l’Eigenvector (créé en 2008 pour évaluer le poids d’un article scientifique) est un calcul de « centralité » qui tend à donner un « poids » à chaque nœud dans le graphe. Il valorise les nœuds vers lesquels convergent un grand nombre de connexions (« citations » dans le domaine scientifique), elles-mêmes issues de nœuds (publications) produisant de nombreuses tweets (« articles dans le domaine scientifique). ◼ Vous voyez néanmoins qu’un score PageRank jouxte l’Eigenfactor. ◼ D’autres métriques sont disponibles les voici détaillées telles que définies dans ce document.  Degree est un simple comptage du nombre de connexions pour chaque nœud. Pour les réseaux dirigés, il est divisé in-degrees (connexions entrantes) et en out-degrees (connexions sortantes).  Betweenness centrality révèle essentiellement l'importance de chaque nœud en tant que « pont » entre les différentes parties du réseau.  Closeness centrality est une mesure de la proximité moyenne de chaque nœud par rapport à tous les autres nœuds d'un réseau. Elle met en évidence les nœuds qui se connectent aux autres par un nombre inférieur d'arêtes.
  • 15. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 15 sur 23 Préparerlegrapheenremplissantautomatiquementcertainescaractéristiques ◼ Les visualisations générées par NodeXL sont dépouillées de toute indication. ◼ Pour obtenir quelque chose de « parlant » dès la première tentative, rentrons dans le détail. ◼ Cliquez sur « Autofill Colums » ◼ Ensuite, modifiez les réglages des nœuds tels que proposés ci-dessous.  EDGES. Grossir le lien entre deux comptes selon qu’ils se citent l’un/l’autre nous paraît une bonne idée  VERTICES. Après moults tergiversations, nous avons décidé que la grosseur des nœuds serait proportionnelle au PageRank, un critère qui nous a paru on seulement intéressant mais discriminant. L’étiquette du nœud se verra associé au nom de l’utilisateur. La couleur du nœud traduira le nombre d’abonnés de l’utilisateur. Libre à vous, bien sûr, de tester d’autres métriques (mais n’oubliez pas de les préciser dans la légende finale de votre graphe). ◼ Libre à vous aussi à réfléchir à d’autres choix qui vous semblent plus judicieux.
  • 16. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 16 sur 23 ◼ Après quelques essais (on vous fait gagner du temps… ) nous décidons d’augmenter la grosseur des points. ◼ Réglons la valeur à « 100 ». ◼ Cliquez ensuite sur « Autofill ». Vous pourrez revenir sur des réglages si le résultat vous déplait.
  • 17. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 17 sur 23 Visualiserpuismodifierlegraphe ◼ Après le choix du remplissage automatique (Autofill), votre graphe apparaît en petit dans le volet droit de la feuille de calcul. Augmentez sa largeur en agissant sur la ligne de séparation. ◼ La visualisation se base sur un algorithme particulier : « Fruchterman-Reingo ». Pour obtenir une meilleure représentation des communautés, l’algorithme « Harel-Korel » donne de meilleurs résultats. ◼ Après avoir choisi l’algorithme, cliquez sur « Refresh Graph »
  • 18. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 18 sur 23 ◼ Le résultat est (un peu) plus clair !
  • 19. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 19 sur 23 Filtrerlegraphe ◼ Pour y voir plus clair, nous allons privilégier les comptes avec le plus d’abonnés et avec le plus fort PageRank. ◼ Cliquez sur « Dynamic filters » ◼ Nous allons tenter « d’éclairer » le graphe en retirant les comptes disposant de faibles valeurs de « betweenness centrality ». Pour ce, nous allons augmenter très progressivement la borne gauche de cette valeur. ◼ Le résultat est immédiat ! Mais vous pouvez bien sûr tenter d’autres réglages.
  • 20. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 20 sur 23 ◼ En jouant sur « Zoom », « Scale », « Graph options » et les options de « Lay Out Again », il est possible d’améliorer le rendu du graphe.
  • 21. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 21 sur 23 Sauvegarderlegraphe ◼ Un clic droit dans la zone du graphe permet d’obtenir la proposition suivante et de jouer sur la taille finale de l’image (Image options…) puis de le sauvegarder (Save image…).
  • 22. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 22 sur 23 ◼ Et voici le résultat ◼ [Légende] Les utilisateurs de Twitter qui ont le plus attirés l’attention et suscités le plus de réaction autour du hashtag #holdup, le 15 novembre 2020 entre 9h20 et 10h10 (500 tweets). ◼ N’oubliez pas de sauvegarder votre œuvre !
  • 23. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 23 sur 23 L’Auteur SergeCourrier Mail : s.courrier@gmail.com, secou@protonmail.com Twitter : http://twitter.com/secou Twitter (spécial RSS) : http://twitter.com/RSSCircus Facebook : www.facebook.com/serge.courrier Linkedin : http://fr.linkedin.com/in/sergecourrier Slideshare : http://www.slideshare.net/serge.courrier ◼ Consultant, j’interviens depuis 2005 auprès d’entreprises et d’organismes publics, pour développer leurs outils et stratégies de recherche, d’investigation, de veille, de visualisation de données, ainsi que leurs usages avancés d’Internet et notamment des réseaux et médias sociaux. ◼ Formateur, j’enseigne depuis 1996 les stratégies de recherche, d’investigation et de veille via Internet, ainsi que les usages et stratégies liées aux réseaux et médias sociaux, la visualisation de données, la désinformation... Intervenant à l’École Européenne d’Intelligence Économique (EEIE), à l’association des professionnels de l’information (ADBS) à l’école des bibliothécaires et documentalistes (EBD), j’assure également depuis 1993 la formation des rédactions de France Télévisions. ◼ Auteur, j’ai publié un guide de 500 pages sur les outils, les usages et les méthodes de recherche via Internet (Internet pour les journalistes, Victoire Éditions, 2004), deux guides pratiques sur la syndication de contenu (Utiliser les fils RSS et Atom, février 2008, ADBS ; Produire des fils RSS et Atom, mars 2009, ADBS). A collaboré à Le Web 2.0 en bibliothèque. Quels services ? Quels usages ? (Le Cercle de la librairie, 2009) ◼ Ex-Journaliste spécialisé, j’ai traité entre 1990 et 2014 de sujets liés à Internet et à l’Intelligence économique pour des magazines spécialisés et grand public. J’ai précédemment occupé les postes de rédacteur en chef adjoint de Génie Industriel, Science et Vie Micro (SVM) et Micro Hebdo.