Annexe au support de présentation et au Webinar EEIE #09 : Investigations sur Twitter par Serge Courrier.
Retrouvez le replay via ce lien : https://www.eeie.fr/webinar-eeie-09-investigations-sur-twitter/
Webinar EEIE #03 : L'Intelligence Financière à la portée de tous
SNA - NodeXL (2020)
1. Serge Courrier | Novembre 2020
NodeXLBasic
Visualisationsetanalyses
deréseauxTwitter
(Respectons les auteurs !)
2. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 2 sur 23
SOMMAIRE
Principes de base__________________________________________________________________________________________ 3
Compatibilité avec Excel____________________________________________________________________________________ 3
Page d’accueil ____________________________________________________________________________________________ 3
Différences entre la version Basic et Pro_______________________________________________________________________ 4
Installation_______________________________________________________________________________________________ 5
Lancer NodeXL____________________________________________________________________________________________ 6
Twitter : analyse des réponses à une requête __________________________________________________________________ 7
Initier la requête ________________________________________________________________________________________ 7
Configurer la requête (et autoriser à NodeXL l’accès au compte Twitter) ___________________________________________ 8
Analyser les réponses : vision générale _____________________________________________________________________ 11
Effectuer des premiers calculs sur le graphe (avant de générer une visualisation) ___________________________________ 12
Jouer avec les métriques (avant de générer une visualisation) ___________________________________________________ 13
Préparer le graphe en remplissant automatiquement certaines caractéristiques ____________________________________ 15
Visualiser puis modifier le graphe__________________________________________________________________________ 17
Filtrer le graphe ________________________________________________________________________________________ 18
Sauvegarder le graphe___________________________________________________________________________________ 21
L’Auteur _____________________________________________________________________________ Erreur ! Signet non défini.
Serge Courrier _____________________________________________________________________ Erreur ! Signet non défini.
3. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 3 sur 23
Principesdebase
◼ NodeXL est un modèle (template) d’Excel qui permet d’effectuer des analyses de « réseaux »
(network analysis).
◼ Il s’agit d’analyser les « edges » (en français « arcs », « arêtes », « chemins » ou « connexions »), entre
des entités (personnes, organisations…).
◼ Ces entités sont « vertex » (encore appelé « node » en anglais et « nœud » ou « sommet » en
français).
◼ Il existe en trois versions : NodeXL Basic (gratuite, limitée), NodeXL Pro (payante), NodeXL Cloud
(payante).
CompatibilitéavecExcel
◼ NodeXL est compatible avec Excel 2010 et suivants.
Paged’accueil
◼ Page du projet : www.smrfoundation.org/nodexl/
4. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 4 sur 23
DifférencesentrelaversionBasicetPro
◼ https://www.nodexlgraphgallery.org/Pages/Registration.aspx
5. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 5 sur 23
Installation
◼ Connectez-vous sur http://nodexlgraphgallery.org/Pages/Registration.aspx
◼ Cliquez sur « Download NodeXL Basic »
◼ Remplissez le formulaire
◼ Une fois terminé, vous recevrez un lien de téléchargement par mail.
◼ Enregistrez le fichier sur votre ordinateur.
◼ Une fois téléchargé, double-cliquez sur le fichier.
◼ NodeXL s’installe.
6. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 6 sur 23
LancerNodeXL
◼ Il suffit de chercher « NodeXL Excel Template » et d’ouvrir le document.
◼ Le fichier (vide) s’ouvre. Notez que NodeXL dispose de son propre onglet dans Excel.
7. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 7 sur 23
Twitter:analysedesréponsesàunerequête
Initierlarequête
◼ Cliquer sur l’onglet « NodeXL Basic » puis sur « Import » puis sur « From Twitter Search Network ».
◼ Remarquez qu’il est également possible d’interroger également le « réseau des utilisateurs » (User’s
Network).
◼ Il est aussi possible d’accéder à d’autres plateformes comme
Facebook (risque de ne pas marcher au vu de changements d’API depuis 2018)
Flickr
YouTube
8. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 8 sur 23
Configurerlarequête(etautoriseràNodeXLl’accèsaucompteTwitter)
◼ Dans le premier champ, posez votre question comme si vous le faisiez dans Twitter. Aussi complexe
soit-elle !
◼ ATTENTION : les caractères accentués ne sont pas bien gérés. Préférez les caractères
alphanumériques (en évitant les caractères diacritiques, donc). De toute façon, Twitter ne fait pas la
différence entre « é » et « e » ; « ç » et « c »…
◼ Pour éviter de pâtir des limitations imposées par Twitter (3200 tweets lorsque l’interrogation est liée
comme ici à une identification simple via le compte Twitter et non l’API nécessitant un compte
développeur), optez dans un premier temps pour « Basic Network ».
◼ Limitez le nombre de réponses à 500 tweets (pour ne pas compliquer l’analyse des résultats lors de ce
premier exemple).
◼ Lors de la première connexion à Twitter via NodeXL, il faudra autoriser (une fois pour toute) la mise
en relation des deux applications. Suivez la séquence suivante.
9. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 9 sur 23
◼ Cliquez sur « Autoriser l’application »
◼ Un code PIN vous est alors fourni. Copiez-le.
◼ Collez ensuite le code PIN dans la fenêtre d’autorisation et cliquez sur OK
10. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 10 sur 23
◼ NodeXL, vous préviens que pour faciliter l’import des résultats, l’habillage des textes sera désactivé.
Cliquez sur « Yes ».
◼ À la fin de la recherche (si les limites imposées par Twitter ne sont pas dépassées), vous obtiendrez
directement les données réparties dans plusieurs feuilles d’un même classeur Excel.
◼ Si les limites sont dépassées, vous devrez attendre 55 minutes avant d’obtenir le reste des réponses
disponibles (ou vous satisfaire des données déjà récoltées).
11. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 11 sur 23
Analyserlesréponses:visiongénérale
◼ Les deux premières colonnes de la feuille « Edges » (en français « arcs », « arêtes », « chemins » ou
« connexions ») contiennent chacune le nom d’un utilisateur Twitter désigné sous le terme « vertex »
(encore appelé « node » en anglais et « nœud » ou « sommet » en français).
◼ Un « edge » désigne donc un lien entre deux « vertex » (« vertices » pour être plus précises).
◼ « edge » et « vertex » sont deux termes continuellement utilisés en science des réseaux. A retenir !
Le premier « vertex » est le nom d’utilisateur de l’abonné qui a émis le tweet.
Le second est le nom de l’utilisateur retweeté ou cité dans le tweet (voir les cas particuliers ci-
dessous).
Si le tweet n’est pas un retweet ou ne cite pas de compte, le second « nœud » est le nom
d’utilisateur de l’émetteur.
Si le tweet cite plusieurs comptes, il y aura autant de connexions que de comptes cités dans le
Tweet.
◼ Au sein de la feuille listant les nœuds du graphe (vertices) sont regroupés les comptes Twitter ayant
émis (ou étant cités dans) un tweet répondant à notre requête.
◼ Entre autres indications, chaque compte est associé à son nombre d’abonnés.
12. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 12 sur 23
Effectuerdespremierscalculssurlegraphe(avantdegénérerunevisualisation)
◼ Dans l’onglet « NodeXL », cliquez sur « Graph Metrics ».
◼ Pour disposer de toutes les données calculables (quitte à ne pas toutes les utiliser) cliquer sur « Select
All » puis sur « Calculate metrix ».
13. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 13 sur 23
Joueraveclesmétriques(avantdegénérerunevisualisation)
◼ La feuille de calcul « Overall Metrics » s’est enrichie des détails de votre graphe.
◼ Dans le dossier Excel, la feuille de calcul « Vertices » (nœuds) a été enrichie de plusieurs colonnes.
Elles apparaissent dans la zone « Graph Metrics ».
14. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 14 sur 23
In-Degree:nombredeconnexionspointantversunnœud
Il est aisé de faire apparaitre le nombre de connexions pointant vers un nœud.
Essayons de mettre en avant les comptes les plus fréquemment cités ou retweetés.
Il suffit pour cela de cliquer sur la petite flèche située à droite de la mention « In-Degree » et de
choisir « Trier du plus grand au plus petit ».
◼ Le résultat permet de voir rapidement les comptes les plus cités
EigenvectorCentrality:unesortedePagerankdugraphe
◼ Proche du PageRank de Google, l’Eigenvector (créé en 2008 pour évaluer le poids d’un article
scientifique) est un calcul de « centralité » qui tend à donner un « poids » à chaque nœud dans le
graphe. Il valorise les nœuds vers lesquels convergent un grand nombre de connexions (« citations »
dans le domaine scientifique), elles-mêmes issues de nœuds (publications) produisant de nombreuses
tweets (« articles dans le domaine scientifique).
◼ Vous voyez néanmoins qu’un score PageRank jouxte l’Eigenfactor.
◼ D’autres métriques sont disponibles les voici détaillées telles que définies dans ce document.
Degree est un simple comptage du nombre de connexions pour chaque nœud. Pour les réseaux
dirigés, il est divisé in-degrees (connexions entrantes) et en out-degrees (connexions sortantes).
Betweenness centrality révèle essentiellement l'importance de chaque nœud en tant que « pont »
entre les différentes parties du réseau.
Closeness centrality est une mesure de la proximité moyenne de chaque nœud par rapport à tous
les autres nœuds d'un réseau. Elle met en évidence les nœuds qui se connectent aux autres par un
nombre inférieur d'arêtes.
15. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 15 sur 23
Préparerlegrapheenremplissantautomatiquementcertainescaractéristiques
◼ Les visualisations générées par NodeXL sont dépouillées de toute indication.
◼ Pour obtenir quelque chose de « parlant » dès la première tentative, rentrons dans le détail.
◼ Cliquez sur « Autofill Colums »
◼ Ensuite, modifiez les réglages des nœuds tels que proposés ci-dessous.
EDGES. Grossir le lien entre deux comptes selon qu’ils se citent l’un/l’autre nous paraît une bonne
idée
VERTICES. Après moults tergiversations, nous avons décidé que la grosseur des nœuds serait
proportionnelle au PageRank, un critère qui nous a paru on seulement intéressant mais
discriminant. L’étiquette du nœud se verra associé au nom de l’utilisateur. La couleur du nœud
traduira le nombre d’abonnés de l’utilisateur. Libre à vous, bien sûr, de tester d’autres métriques
(mais n’oubliez pas de les préciser dans la légende finale de votre graphe).
◼ Libre à vous aussi à réfléchir à d’autres choix qui vous semblent plus judicieux.
16. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 16 sur 23
◼ Après quelques essais (on vous fait gagner du temps… ) nous décidons d’augmenter la grosseur
des points.
◼ Réglons la valeur à « 100 ».
◼ Cliquez ensuite sur « Autofill ». Vous pourrez revenir sur des réglages si le résultat vous déplait.
17. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 17 sur 23
Visualiserpuismodifierlegraphe
◼ Après le choix du remplissage automatique (Autofill), votre graphe apparaît en petit dans le volet
droit de la feuille de calcul. Augmentez sa largeur en agissant sur la ligne de séparation.
◼ La visualisation se base sur un algorithme particulier : « Fruchterman-Reingo ». Pour obtenir une
meilleure représentation des communautés, l’algorithme « Harel-Korel » donne de meilleurs
résultats.
◼ Après avoir choisi l’algorithme, cliquez sur « Refresh Graph »
18. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 18 sur 23
◼ Le résultat est (un peu) plus clair !
19. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 19 sur 23
Filtrerlegraphe
◼ Pour y voir plus clair, nous allons privilégier les comptes avec le plus d’abonnés et avec le plus fort
PageRank.
◼ Cliquez sur « Dynamic filters »
◼ Nous allons tenter « d’éclairer » le graphe en retirant les comptes disposant de faibles valeurs de
« betweenness centrality ». Pour ce, nous allons augmenter très progressivement la borne gauche de
cette valeur.
◼ Le résultat est immédiat ! Mais vous pouvez bien sûr tenter d’autres réglages.
20. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 20 sur 23
◼ En jouant sur « Zoom », « Scale », « Graph options » et les options de « Lay Out Again », il est possible
d’améliorer le rendu du graphe.
21. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 21 sur 23
Sauvegarderlegraphe
◼ Un clic droit dans la zone du graphe permet d’obtenir la proposition suivante et de jouer sur la taille
finale de l’image (Image options…) puis de le sauvegarder (Save image…).
22. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 22 sur 23
◼ Et voici le résultat
◼ [Légende] Les utilisateurs de Twitter qui ont le plus attirés l’attention et suscités le plus de
réaction autour du hashtag #holdup, le 15 novembre 2020 entre 9h20 et 10h10 (500 tweets).
◼ N’oubliez pas de sauvegarder votre œuvre !
23. NodeXL ► Serge Courrier ► CC BY-NC-ND 2.0 FR ► Novembre 2020 ► Page 23 sur 23
L’Auteur
SergeCourrier
Mail : s.courrier@gmail.com, secou@protonmail.com
Twitter : http://twitter.com/secou
Twitter (spécial RSS) : http://twitter.com/RSSCircus
Facebook : www.facebook.com/serge.courrier
Linkedin : http://fr.linkedin.com/in/sergecourrier
Slideshare : http://www.slideshare.net/serge.courrier
◼ Consultant, j’interviens depuis 2005 auprès d’entreprises et d’organismes publics, pour développer
leurs outils et stratégies de recherche, d’investigation, de veille, de visualisation de données, ainsi que
leurs usages avancés d’Internet et notamment des réseaux et médias sociaux.
◼ Formateur, j’enseigne depuis 1996 les stratégies de recherche, d’investigation et de veille via Internet,
ainsi que les usages et stratégies liées aux réseaux et médias sociaux, la visualisation de données, la
désinformation... Intervenant à l’École Européenne d’Intelligence Économique (EEIE), à l’association des
professionnels de l’information (ADBS) à l’école des bibliothécaires et documentalistes (EBD), j’assure
également depuis 1993 la formation des rédactions de France Télévisions.
◼ Auteur, j’ai publié un guide de 500 pages sur les outils, les usages et les méthodes de recherche via
Internet (Internet pour les journalistes, Victoire Éditions, 2004), deux guides pratiques sur la syndication
de contenu (Utiliser les fils RSS et Atom, février 2008, ADBS ; Produire des fils RSS et Atom, mars 2009,
ADBS). A collaboré à Le Web 2.0 en bibliothèque. Quels services ? Quels usages ? (Le Cercle de la
librairie, 2009)
◼ Ex-Journaliste spécialisé, j’ai traité entre 1990 et 2014 de sujets liés à Internet et à l’Intelligence
économique pour des magazines spécialisés et grand public. J’ai précédemment occupé les postes de
rédacteur en chef adjoint de Génie Industriel, Science et Vie Micro (SVM) et Micro Hebdo.