Après son webinaire sur les investigations à base d’images (voir Webinar EEIE #01) et celui sur les investigations sur Facebook (voir Webinar EEIE #04), Serge Courrier se penche sur Twitter. En une heure, il entend vous présenter concrètement les outils et méthodes les plus intéressantes : recherche avancée, services Web, extensions de navigateurs, logiciels PC et scripts Python.
Retrouvez le replay via ce lien : https://www.eeie.fr/webinar-eeie-09-investigations-sur-twitter/
SNA - Gephi - Twitter Streaming Importer (2020)Groupe EEIE
Annexe au support de présentation et au Webinar EEIE #09 : Investigations sur Twitter par Serge Courrier.
Retrouvez le replay via ce lien : https://www.eeie.fr/webinar-eeie-09-investigations-sur-twitter/
La surcharge cognitive d'un utilisateur due à une trop grande quantité d'information est un problème majeur des systèmes hypermédia. Les systèmes de recommandation ont été introduits pour résoudre ce problème et sont maintenant utilisés couramment pour améliorer l'expérience utilisateur sur le Web. Cet exposé présente le fonctionnement des systèmes de recommandations, les différentes approches de la littérature, et l'évaluation des recommandations. Quelques unes de mes contributions sont abordées et des perspectives du domaine concluent cette présentation.
Le Comptoir OCTO - ChatGPT : Menace ou opportunité ?OCTO Technology
Par Nicolas Cavallo (Head of Natural Language Processing @OCTO Technology)
Vous aussi, votre grand-mère vous a parlé de chatGPT ? Ce perroquet, qualifié d’approximatif, a rendu public et accessible les modèles de langages conversationnels. Rejoignez nos experts pour un échange ouvert et interactif, où nous détaillerons l’histoire et le fonctionnement de ces modèles pour appréhender au mieux les opportunités et les défis que présente ChatGPT.
Vidéo Youtube : https://www.youtube.com/watch?v=WsVOoiSeL_I&list=PLBD8R108T9T4D3mcLiDpT67f9ERg1Hm2r&index=44
Compte-rendu : https://blog.octo.com/compte-rendu-le-comptoir-octo-chatgpt/
SNA - Gephi - Twitter Streaming Importer (2020)Groupe EEIE
Annexe au support de présentation et au Webinar EEIE #09 : Investigations sur Twitter par Serge Courrier.
Retrouvez le replay via ce lien : https://www.eeie.fr/webinar-eeie-09-investigations-sur-twitter/
La surcharge cognitive d'un utilisateur due à une trop grande quantité d'information est un problème majeur des systèmes hypermédia. Les systèmes de recommandation ont été introduits pour résoudre ce problème et sont maintenant utilisés couramment pour améliorer l'expérience utilisateur sur le Web. Cet exposé présente le fonctionnement des systèmes de recommandations, les différentes approches de la littérature, et l'évaluation des recommandations. Quelques unes de mes contributions sont abordées et des perspectives du domaine concluent cette présentation.
Le Comptoir OCTO - ChatGPT : Menace ou opportunité ?OCTO Technology
Par Nicolas Cavallo (Head of Natural Language Processing @OCTO Technology)
Vous aussi, votre grand-mère vous a parlé de chatGPT ? Ce perroquet, qualifié d’approximatif, a rendu public et accessible les modèles de langages conversationnels. Rejoignez nos experts pour un échange ouvert et interactif, où nous détaillerons l’histoire et le fonctionnement de ces modèles pour appréhender au mieux les opportunités et les défis que présente ChatGPT.
Vidéo Youtube : https://www.youtube.com/watch?v=WsVOoiSeL_I&list=PLBD8R108T9T4D3mcLiDpT67f9ERg1Hm2r&index=44
Compte-rendu : https://blog.octo.com/compte-rendu-le-comptoir-octo-chatgpt/
Architecture web aujourd'hui, besoin de scalabilité des bases de données relationnelles, découverte des bases de données NoSQL et des différents types de celles-ci. La vidéo de présentation peut être consultée à l'adresse suivante : http://youtu.be/oIpjcqHyx2M
Les jointures sont un moyen en Transact-SQL pour récupérer des informations provenant de plusieurs objets distincts, qu’il s’agisse de tables, tables temporaires ou vues en utilisant si, possible, leurs clefs primaires et étrangères.
SQL Server comprend deux types de syntaxe pour respecter une compatibilité ascendante :
- Le standard ANSI SQL 89 utilisé sur les SGBD SQL Server 6.5 et 7
- Le standard ANSI SQL 92 exploité réellement à partir de la version 2000 de SQL Server
Il existe différents types de jointures, chacune répondant à des besoins précis :
- Les jointures internes,
- Les jointures externes,
- Les jointures multiples,
- L’auto-jointure.
This document provides an overview of Python for data analysis using the pandas library. It discusses key pandas concepts like Series and DataFrames for working with one-dimensional and multi-dimensional labeled data structures. It also covers common data analysis tasks in pandas such as data loading, aggregation, grouping, pivoting, filtering, handling time series data, and plotting.
Introduction à l'IoT: du capteur à la donnée_Presentation Mix-IT2015Sameh BEN FREDJ
This Presentation is an introduction to the Internet of Things where we define what is IoT, illustrate some use cases and usages and detail the different parts of an IoT eco-system. We also present some examples of DIY projects with code and tools to help you start your own IoT project !
Webinar EEIE #04 - Investigations sur FacebookGroupe EEIE
L’École Européenne d’Intelligence Économique lance son quatrième webinar avec en intervenant, Serge Courrier, consultant et formateur indépendant.
Le thème : Investigations sur Facebook.
Investigations sur Facebook : que reste-t-il ?
Après l’arrêt du Graph Search en juin dernier, les prodigieuses possibilités de recherche, voire de veille, sur Facebook se sont en partie évanouies. Mais il reste encore de multiples possibilités pour effectuer des opérations précises. Services Web, extensions pour navigateurs, logiciels, scripts… pendant ce webinar, nous ferons le tour des solutions.
Retrouvez le Replay de ce webinar à l’adresse suivante : https://www.eeie.fr/webinar-eeie-04-investigations-sur-facebook/
Modèle d'une plateforme de veille visant à automatiser la rediffusion de l'in...Serge Courrier
Cette présentation vise à détailler les avantages et inconvénients d'une plateforme de veille documentaire économique complète, depuis l'extraction jusqu'à la diffusion de l'information.
Architecture web aujourd'hui, besoin de scalabilité des bases de données relationnelles, découverte des bases de données NoSQL et des différents types de celles-ci. La vidéo de présentation peut être consultée à l'adresse suivante : http://youtu.be/oIpjcqHyx2M
Les jointures sont un moyen en Transact-SQL pour récupérer des informations provenant de plusieurs objets distincts, qu’il s’agisse de tables, tables temporaires ou vues en utilisant si, possible, leurs clefs primaires et étrangères.
SQL Server comprend deux types de syntaxe pour respecter une compatibilité ascendante :
- Le standard ANSI SQL 89 utilisé sur les SGBD SQL Server 6.5 et 7
- Le standard ANSI SQL 92 exploité réellement à partir de la version 2000 de SQL Server
Il existe différents types de jointures, chacune répondant à des besoins précis :
- Les jointures internes,
- Les jointures externes,
- Les jointures multiples,
- L’auto-jointure.
This document provides an overview of Python for data analysis using the pandas library. It discusses key pandas concepts like Series and DataFrames for working with one-dimensional and multi-dimensional labeled data structures. It also covers common data analysis tasks in pandas such as data loading, aggregation, grouping, pivoting, filtering, handling time series data, and plotting.
Introduction à l'IoT: du capteur à la donnée_Presentation Mix-IT2015Sameh BEN FREDJ
This Presentation is an introduction to the Internet of Things where we define what is IoT, illustrate some use cases and usages and detail the different parts of an IoT eco-system. We also present some examples of DIY projects with code and tools to help you start your own IoT project !
Webinar EEIE #04 - Investigations sur FacebookGroupe EEIE
L’École Européenne d’Intelligence Économique lance son quatrième webinar avec en intervenant, Serge Courrier, consultant et formateur indépendant.
Le thème : Investigations sur Facebook.
Investigations sur Facebook : que reste-t-il ?
Après l’arrêt du Graph Search en juin dernier, les prodigieuses possibilités de recherche, voire de veille, sur Facebook se sont en partie évanouies. Mais il reste encore de multiples possibilités pour effectuer des opérations précises. Services Web, extensions pour navigateurs, logiciels, scripts… pendant ce webinar, nous ferons le tour des solutions.
Retrouvez le Replay de ce webinar à l’adresse suivante : https://www.eeie.fr/webinar-eeie-04-investigations-sur-facebook/
Modèle d'une plateforme de veille visant à automatiser la rediffusion de l'in...Serge Courrier
Cette présentation vise à détailler les avantages et inconvénients d'une plateforme de veille documentaire économique complète, depuis l'extraction jusqu'à la diffusion de l'information.
Atelier Faire rayonner un évènement sur les médias sociaux et focus sur le li...Audrey Bardon
Cet atelier offre l'occasion de se familiariser avec la communication sur les réseaux sociaux pour un évènement. L’atelier propose notamment un grand focus sur l’usage de Twitter avec une initiation au livetweet.
Conférence de Tanguy Le Duff (Lead UX Designer @Mega International ; Enseignant en UX Design) sur la thématique "ChatGPT : quel impact dans le Design?" lors d'une conférence métier pour l'école IIM le 28 juillet 2023
Rebuild 2018 - Comment faire un bon Chatbot avec Microsoft Luis et Bot BuilderVincent Guigui
Découvrez les bonnes pratiques pour créer votre premier chatbot avec Luis et Bot Builder de Microsoft.
Cette session présente:
- l'état du marché actuel
- le fonctionnement du NLU (Luis)
- le fonctionnement du NLP (Bot Builder)
- les bonnes pratiques et méthodes CUX
- déroulement de l'atelier de création d'un chabot
Les sources du projet sont accessibles sur https://github.com/QuarkyUp/Microsoft-Rebuild
Session présentée à la conférence Rebuild 2018 Nantes par Thomas Le Flohic et Vincent Guigui
A savoir: OCTO organise une formation pratique de 2 jours sur la création de Chatbot
plus d'informations ici: https://www.octo.academy/fr/formation/188-chatbot-creer-son-agent-conversationnel
Découvrez le support de présentation du 11ème webinar de l'EEIE animé par Agnès Dubois Colineau, CEO d'Arcturus Group sur le thème : Lobbying et éthique.
Voici les principaux axes abordés en 1h :
- Le lobbying est un métier à part entière, méconnu
- Le lobbying a mauvaise réputation, pourquoi ?
- Le lobbying œuvre-t-il contre l’intérêt général ?
- Le lobbying est un métier de plus en plus encadré
Webinar EEIE #10 : Fake News dans le monde de l'information professionnelleGroupe EEIE
Après son webinaire sur Enquête de personnes sur le web et celui sur la Datavisualisation, faites parler la data , Véronique MESGUICH se penche cette fois-ci sur les Fake news. En une heure, elle entend vous présenter concrètement le phénomène des fake news au delà de la sphère politique. Elle touche aussi l’information professionnelle, et notamment la publication scientifique. Le webinaire présentera entre autres : des cas de “scientific misconduct” : articles scientifiques bâclés, plagiés, collusion d’intérêts avec des lobbies.
Annexe au support de présentation et au Webinar EEIE #09 : Investigations sur Twitter par Serge Courrier.
Retrouvez le replay via ce lien : https://www.eeie.fr/webinar-eeie-09-investigations-sur-twitter/
Le support de présentation de notre visioconférence du mardi 24 novembre 2020 via ClickMeeting présentant notre nouvelle formation d'Opérateur en Cybersécurité.
Webinar EEIE #07 : Droit du Secret des AffairesGroupe EEIE
Droit du Secret des affaires, pour qui, pourquoi ?
Thibault du Manoir de Juaye, avocat à la Cour, spécialisé en intelligence économique, en droit de la sécurité privée, auteur du livre de référence Le Secret des affaires (LexisNexis-2017).
Mettre en œuvre une protection du secret des affaires sur le fondement de la loi du 30 juillet 2018 permet aux entreprises d’obtenir une bien meilleure indemnisation, en cas d’appréhension frauduleuse que si elles fondaient sur le droit commun. Cette démarche de protection est très proche de celle qui existe pour les données personnelles . Pourquoi dés lors, ne pas faire d’une pierre deux coups en association les deux démarches ?
Webinar EEIE #06 : Datavisualisation, faites parler la dataGroupe EEIE
Retrouvez le support de présentation de Véronique Mesguich utilisé pour le sixième webinar de l'EEIE sur le thème de la datavisualisation.
Retrouvez le Replay de ce webinar à l’adresse suivante : https://www.eeie.fr/webinar-eeie-06-datavisualisation-faites-parler-la-data/
Webinar EEIE #05 - Cybersécurité : Best PracticesGroupe EEIE
L’École Européenne d’Intelligence Économique lance son cinquième webinar avec en intervenant, Frédéric Mouffle, Expert Cybersécurité et Directeur général associé de KER-MEUR.
Le thème : Cybersécurité : Best Practices.
Introduction :
La cybersécurité est un sujet majeur devenu stratégique pour les entreprises mais également pour les utilisateurs.
Nous verrons dans ce webinar, les principaux vecteurs d’attaques et comment s’en prémunir.
En appliquant les « best practices », vous serez a même de pouvoir éviter 95% des menaces.
Les best practices seront abordées, de la robustesse du mot de passe, au chiffrement des données en passant par une politique de sauvegarde efficace.
Retrouvez le Replay de ce webinar à l’adresse suivante : https://www.eeie.fr/webinar-eeie-05-cybersecurite-best-practices/
Webinar EEIE #03 : L'Intelligence Financière à la portée de tousGroupe EEIE
Support de présentation du Webinar EEIE #03 animé par Christophe Paillassa et diffusé le mardi 2 juillet 2019 à 17h.
Retrouvez le Replay de ce webinar à l’adresse suivante : https://www.eeie.fr/webinar-eeie-03-lintelligence-financiere-a-la-portee-de-tous/
2. Sommaire
◼ Préparer son navigateur
◼ Rechercher
◼ Outils tiers (simples) en ligne
◼ Boîtes à outils
◼ Analyse de graphes
◼ Scripts Python
◼ Logiciels (payants)
◼ Outils de veille
◼ Annexes
►Autres solutions payantes
►Requérir un accès à l’API Twitter
►Pour en savoir plus…
►Autres outils intéressants
►Quelques outils recalés
►Surplus…
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 2
3. Préparer son navigateur
3EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
4. Préparer son navigateur
Chrome & Co
◼ Gestionnaire d’extensions
►Nooboss
◼ Préserver les onglets et les
fenêtres de son navigateur entre
deux sessions
►Tab Session Manager
◼ Scroller automatiquement une
page
►Simple Autoscroll
◼ Sauvegarder proprement une page
Web au format numérique
►Save Page WE (se placer en bas de la
page) ou SingleFile
Firefox
◼ Préserver les onglets et les
fenêtres de son navigateur entre
deux sessions
►Tab Session Manager
◼ Sauvegarder vers la WayBack
Machine ou accéder à une page
archivée
►Wayback Machine
◼ Scroller automatiquement une
page
►FoxScroller
◼ Sauvegarder proprement une page
Web au format numérique
►Save Page WE (se placer en bas de la
page) ou SingleFile
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 4
6. Travailler son lexique avec soin
(non ce n’est pas si évident !)
6EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
7. Soigner le lexique
7
gilets jaunes à Toulouse
Le questionnement est simple ?
Et pourtant…
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
9. Requête résultante
9
"gilet jaune OR "gilets jaunes" OR #giletjaune OR
#giletsjaunes OR #gj toulouse OR toulousain OR toulousains
OR toulousaine OR toulousaines OR capitole OR "ville rose"
-weed –cocaine -cannabis
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
10. En résumé
1. Se mettre à la place des personnes qui rédigent les tweets
2. Lister le lexique qu’ils peuvent utiliser pour décrire ce qui
vous intéresse (et y revenir à plusieurs reprises pour
l’enrichir)
3. Ne pas oublier le féminin et le pluriel des mots, le jargon,
les sigles…
4. Ne pas oublier que les groupes nominaux sont concaténés
lorsqu’ils se retrouvent intégrés dans des hashtags
5. Être à l’affut de l’évolution des hashtags
10EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
11. Maîtriser la syntaxe de recherche
avancée
…et ses subtilités !
11EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
12. Comptes et listes
12
◼ @compte : citant ce compte
◼ from:secou : émis par @secou
◼ from:secou OR from:crid : produits par @secou ou @crid
◼ -from:secou : sauf les tweets émis par @secou
◼ to:secou : destinés à @secou
◼ filter:verified : comptes vérifiés (calicot bleu)
◼ filter:news : comptes de médias, de journalistes identifiés,
ou pointant vers de sites Web de médias
◼ -filter:news : utile pour faire émerger des tweets
« grand public »
◼ -filter:news –filter:verified
◼ list:908341978005458944 : tweets émis par des membres
de la liste (le numéro de la liste apparait dans l’URL de la
liste)
◼ filter:follows : comptes auxquels vous êtes abonné.e
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
13. Nature du tweet
13
◼ filter:replies : réponse
◼ filter:nativeretweets : retweets
◼ filter:quote : dans le commentaire d’un tweet
◼ quoted_tweet_id:1138631847783608321 : commentaires
d’un tweet dont l’ID est 1138631847783608321
(l’ID d’un tweet apparaît dans l’URL du tweet, une fois
isolé)
◼ quoted_user_id:11348282 : commentaires de tweets émis
par un compte dont l’ID est 11348282 (voir plus loin pour
savoir comment identifier l’ID d’un compte)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
14. Opérateurs orientés médias
14
◼ filter:images : fichiers images
◼ card_name:animated_gif : gif animés
◼ filter:videos : fichiers vidéos (dont partages YouTube…)
◼ filter:native_video : fichiers vidéos
(sans partages YouTube…)
◼ filter:vine : vidéos publiés via l’app Vine (abandonnée en
octobre 2016 (mais les archives sont toujours accessible)
◼ filter:periscope OR card_domain:pscp.tv OR
url:twitter.com/i/broadcasts/ : videos tournées en direct
et archivées
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
15. Opérateurs temporels
15
◼ until:2019-06-23 : jusqu’à
◼ since:2018-05-12 : depuis
◼ since:2018-05-12 until:2019-06-23 : entre deux dates
◼ Mais aussi…
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
16. Opérateurs temporels
16
◼ À la seconde près ?
◼ Vraiment ?
◼ until_time:1569483022 : jusqu’au 26 septembre 2019
à 07:30:22
◼ since_time:1569470400 : jusqu’au 26 septembre 2019
à 07:30:22
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
17. Recherche sur Twitter en précisant une heure
17
lubrizol until_time:1569470400
Heure Unix (UTC)
Epoch Converter
Requête finale :
lubrizol filter:native_video
until_time:1569470400
exclude:retweets
(classée avec l’onglet
« Récent)
Attention à s’adapter au
fuseau horaire du lieu
L’opposé de until_time: ?
since_time:
Merci à Giovanni Nazzaro pour la piste !
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
18. Localisation
18
◼ ATTENTION : La plupart des tweets ne sont plus géolocalisés !
La recherche s’effectue surtout sur les localisations
des comptes (dans la biographie)… ce qui limite de beaucoup
son intérêt !
◼ near:paris
◼ near:paris within:15km
◼ near:florida
◼ near:lebanon
◼ geocode:37.7764685,-122.4172004,10km : 10 km autour de
San Francisco
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
20. Autres opérateurs intéressants
20
◼ lang:fr OR lang:en : 47 langues disponibles ►
◼ url:cia.gov : même si l’URL twittée a été raccourcie
(bit.ly, buff.ly, ift.tt…)
◼ url:data : un élément dans l’URL
◼ filter:links : trouver des tweets pointant vers des URL
◼ 📢 : emojis et émoticons
◼ ن : recherche par caractères
(dans le tweet ou le nom de l’utilisateur)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
21. Pour en savoir plus…
◼ L’énorme recueil d’Igor Brigadir (surGitHub) : Advanced Search on Twitter
21EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
22. Travailler sur les URL
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 22
23. Travailler sur les URL
23
◼ Les éléments à ajouter à l’URL d’un compte
◼ media : https://twitter.com/realdonaldtrump/media
◼ likes : https://twitter.com/realdonaldtrump/likes
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
24. Outils tiers (simples) en ligne
Si votre OPSEC n’est pas trop stricte !
24EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
25. Trouver le Twitter ID
25EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
26. Find Twitter ID
◼ Trouve l’identifiant
d’un compte (utile
dans certains
services)
►Find Twitter ID
►TweetrID
►GetTwitterID
◼ Pour connaître le
compte derrière un
user_id :
https://twitter.com/
intent/user?user_id
=2622731
26EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
27. 3 stratégies de sourcing
à ne pas négliger
(parmi tant d’autres)
27EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
28. Stratégies de sourcing
◼ Followerwonk (Search Bios)
►Compte les plus populaires
contenant des mots
particuliers dans leur bio
►Version gratuite :
• 50 recherches par jour
• 100 réponses par page
• Pas d’export des résultats
◼ Parcourir les abonnements
d’un compte
◼ Chercher et parcourir des
listes
►site:twitter.com/*/lists/*
intitle:privacy
28
Possible recherche par
pays ou ville (si indiqué
dans le profil)
Classement par défaut :
nombre d’abonnés
décroissant.
Par « Social Authority » :
algo maison, proche de
Klout.
Usage de « | » à la place de l’opérateur booléen
« OR » et du « - » à la place du « NOT »
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
29. Analyser un compte
29EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
30. Twitonomy : une vision d’ensemble
◼ Twitonomy (analyse
statistique d’un
compte, gratuit,
nécessite la
connexion à son
compte)
►[+++] Heures et
jours d’utilisation
►[+++] Outils de
publications utilisés
►[+++] Hashtags les
plus utilisés
►[+++] Comptes les
plus retweetés, les
plus mentionnés, les
plus commentés
30
Profile
A lire : détail de la version payante (19$/mois)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
31. SparkScore de SparkToro
◼ SparkScore : évaluation
transparente de la « réputation »
d’un compte
31EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
32. Allegedly
◼ Allegedly : détecte les différents outils utilisés par un compte pour
tweeter et leur utilisation dans le temps (pendant les 15 derniers jours)
32EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
33. Spoonbill : changements dans les bios
◼ Spoonbill : suivre
l’évolution de la bio des
comptes que l’on suit et
consulter l’historique de
modification de la bio de
n’importe quel compte.
33
Par mail quotidien : tous les changements dans les bios
des personnes que vous suivez
En ligne : l’historique des changements
de bio de n’importe quel compte
https://spoonbill.io/twitter/data/OSINTtechniques/
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
34. Détecter les abonnés douteux ?
Robots ? Sock puppets ?
34EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
35. SparkScore : Fake Followers Audit
◼ SparkToro Fake Followers Audit
►Attention : l’analyse porte sur des
caractéristiques qui ne sont pas
nécessairement des marqueurs de faux
abonnés !
35EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
36. Botometer
◼ Botometer (détection de
robots)
►Attention : l’analyse porte
sur des caractéristiques qui
ne sont pas nécessairement
des marqueurs de faux
abonnés !
36EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
37. BotSlayer
◼ BotSlayer [Beta]
(Indiana University) :
outil (à héberger)
de détection de
robots
◼ Tutoriel
◼ BotSlayer-CE sur
GitHub
37
Hoaxy
BotSlayer
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
38. Indices lors d’une analyse directe d’un compte
◼ Photo de profil
►Image de stock ?
►Image générée par IA ?
◼ Nom d’utilisateur
►Plein de numéros ?
◼ Fréquence de publication
►Surhumaine ?
◼ Timing de publication
►Pas de pause pour le sommeil ?
◼ Abonnements/abonnés
►Beaucoup d’abonnements, très peu
d’abonnés ?
◼ Contenus répétitifs
►Une seule thématique
►Publié à l’identique par d’autres
comptes
38EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
A lire : If you follow me, I’ll OSINT you (Matthias Wilson, a.k.a. @mwosint, 2020),
West Papua: New Online Influence Operation Attempts to Sway Independence
Debate (Benjamin Strick, a.k.a. @BenDoBrown, 2020)
39. Lister et comparer des abonnés,
abonnements, tweets
39EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
40. TweepDiff
◼ TweepDiff
►Abonnés ou abonnements en
commun entre plusieurs comptes
• Exemple : faire émerger des
sources d’informations communes
à plusieurs acteurs d’un même
secteur.
• Exemple : faire émerger les
abonnés communs aux comptes
appartenant à une même
communauté
►Pas d’export
40EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
41. All my Tweets
◼ All My Tweets : pour un
compte quelconque
affichage rapide, sur une
seule page de (au choix) :
►ses tweets (les 3200
derniers)
►son fil d’actualité (les 800
derniers)
►ses « likes »
►ses abonnés
►ses abonnements
41EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
42. Twiangulate
◼ Twiangulate Search (nécessite
l’identification via son compte)
◼ Travaille sur deux comptes et fournit
►les abonnement communs
►les abonnés communs
►les 100 abonnés communs dont la portée
des tweets est la plus grande
◼ Sur un compte
►Les abonnés à un compte contenant
le/les mêmes mots dans leur bio
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 42
43. doesfollow
◼ Doesfollow : est-ce que tel compte est abonné à tel compte ? (nécessite la
connexion de son compte au service)
43EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
44. First Follower
◼ First Follower :
fournit le premier
abonné à un compte
(qui ne se soit pas
désabonné)
44EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
45. Mesurer les tendances
45EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
46. SMAT (Social Media Analysis Tool)
◼ SMAT : conçu par la
fondation Mozilla
►Recherche sur Twitter,
mais aussi sur Reddit,
4chan, 8kun)
►Borne temporelle large
(plusieurs années)
►Export CSV
►Très fréquemment
surchargé
◼ Fonctions
►Timeline : évolution de
l’usage d’un mot dans un
tweet pendant une
période de temps
►Hashtag : hashtags
associés à un hashtag sur
une période de temps
►Link Counter : liens
associés à un mot
►Activity : affiche les
comptes ayant le plus
utilisé ce mot sur une
période donnée
46
Exemple : holdup, RealDonalTrump (inbound graph) | Explications
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
47. Trends24
◼ Trends24 : accès aux tendances mondiales, par pays et grandes villes
47EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
48. TrendsMap
◼ TrendsMap (freemium) : tendances (hashtags, compte, mots) sur une carte
(7 jours)
48EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
49. Se pencher sur les hashtags
49EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
50. Hashtagify
◼ Hashtagify (freemium)
►Version gratuite
• Index de popularité d’un hashtag
• Hashtags associés
• Pays d’utilisation
• Evolution sur 8 semaines
• Comptes les plus influents
• Langues les plus utilisées
• Nombre de requêtes limité
50EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
51. onemilliontweetmap
◼ #onemilliontweetmap : localisation mondiale de tweets sur 24 heures contenant un mot
ou hashtag particulier (temps réel ou lors d’une période particulière). Possibilité de
comparaison entre deux tweets. Vision très partielle au vu de résultats obtenus en
novembre 2020 sur #biden #trump et #holdup.
51EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
52. Evaluer la diffusion d’une URL
52EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
53. CrowdTangle
◼ La plateforme CrowdTangle (Facebook) est connue pour sa capacité à analyser
les publications Facebook, mais propose également l’extension CrowdTangle
Link Checker pour Chrome qui fournit des statistiques de partage d’une URL
sur Twitter. Nécessite une identification sur un compte Facebook. L’export
des données au format CSV ne concerne que les interactions sur Facebook.
53EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
54. Prendre en charge images et vidéos
54EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
55. Télécharger le format original d’une photo
◼ Dans cet exemple…
►clic sur la photo
►Clic droit > « Ouvrir
l’image dans un nouvel
onglet » (Chrome) ou
« Afficher l’image »
(Firefox)
►Clic droit > Enregistrer
l’image sous
►Changer « .jfif » en
« .jpg »
55EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
56. DownAlbum
◼ DownAlbum
►Extension Chrome
permettant de récupérer
les images (et les vignettes
des vidéos) publiées par un
compte.
►Sauvegarde simple par
« Ctrl+S » en choisissant le
format « Page Web
complète ».
►Limite : ne prend que la
page affichée dans le
navigateur donc peut
nécessiter l’emploi d’une
extension de scroll
automatique.
►L’export « Photos URL », au
format texte, permet
(après nettoyage) d’obtenir
adresses et dates de
publication des images et
vidéos
►Attention, si l’image est
supprimée du compte, le
lien ne fonctionne plus,
mais identifie tout de
même le compte.
56EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
57. DownloadTwitterVideo
◼ Attention : aucune
métadonnée d’horodatage
ni de géolocalisation.
◼ FBDown
►extension Chrome
permettant de télécharger
une vidéo particulière.
Sinon, pour Firefox et
autres, coller l’adresse de
la vidéo sur le site
fbdown.net
◼ Video Downloader
Ultimate (Chrome)
◼ Video DownloadHelper
►Chrome, Firefox
◼ DownloadTwitterVideo
►Télécharge la vidéo en
fournissant l’URL du tweet.
57EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
58. Métamoteur de recherche inversée
◼ Search By Image (extension pour
Firefox, Chrome/Brave et Opera)
►Interroge ou pointe vers 21 moteurs
de recherche inversée.
►Il est possible d’ordonnancer
et d’activer/désactiver les moteurs.
58EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
59. Autres outils recherche inversée
◼ Moteurs
►Google Images
►Tineye
►Yandex Images (ru)
►Baidu Image Search (cn)
◼ Extensions pour navigateurs
►[+++] NooBox
• Extension pour Chrome/Brave
• Affiche sur une seule page les réponses de
Google Images, Yandex, Bing, Baidu,
Tineye, IQBD, SauceNao
• Impossible de désactiver certains moteurs
(Baidu, par exemple)
►[+++] InVid Verification Plugin
►RevEye Reverse Image Search
• Extension pour Chrome/Brave et Firefox
• Interroge Google, Bing, Yandex et TinEye
►Fast Image Research
• Extension pour Chrome/Brave
• Interroge Tineye et Google Image
(à préciser dans les options)
59EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
60. Moteurs de recherche inversés sur mobiles
◼ iPhone
►Reverse Image Search App
◼ Android
►Search by Image
Interroge Google Images,
Tineye, Yandex, Bing et Baidu
60
Interroge Google Images, Tineye
et Yandex
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
61. Retrouver des tweets effacés
61EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
62. Tweets effacés
◼ Politwoops : tweets
supprimés par des
personnalités politiques
dans le monde entier et
pays par pays !
►Afficher les tweets
supprimés dans certains pays
(beaucoup de filtres une fois
que l’on a cliqué sur « View
all deleted tweets » en bas
de la page)
►Recevoir un mail si des
tweets supprimés
contiennent un mot
particulier (dans le monde
entier, dans un pays
particulier, par une personne
particulière)
◼ Fallait pas supprimer
►Compte français, non limité
aux politiques.
62EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
63. Trouver des tweets effacés
◼ WayBack Machine
►https://web.archive.org/web/*/twitte
r.com/{nom d’utilisateur}
►https://web.archive.org/web/*/twitte
r.com/{nom d’utilisateur}/likes
◼ Le cache Google (ou simplement le
texte du tweet sous le lien)
►site:twitter.com/{nom
d’utilisateur}/status/*
► {requête} site:twitter.com/*/status/*
Essai avec des personnes aynt publié
récemment "deleted all my
tweets" filter:verified
◼ Etudier les réponses ou les tweets
adressés à la personne pour en
comprendre le sens, voir trouver
une copies d’écran
63EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
64. Premier tweet
64EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
65. Premier tweet
◼ First Tweet (basé sur le projet de
labnol ci-dessous) fournit le
premier tweet contenant un mot.
►Souvent surchargé
◼ Who Tweeted it First
►Lent et pas toujours efficace
65EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
67. Twlets
◼ Twlets (extension Chrome) :
export Excel des derniers tweets,
retweets et réponses d’un compte
Twitter (payant, 1000 crédits
disponibles au début).
◼ Récupération max de 3200 tweets.
◼ Pour chaque tweet est indiqué
►La date de création du tweet
►Le texte du tweet (sans l’éventuel lien
inclus)
►Son ID
►Le lien pointant vers le tweet
►Les liens pointant vers les médias
associés
►Le nombre de fois où il a été « liké »
• (jusqu’à 15 000)
►Le nombre de fois où il a été retweeté
et le nom du compte à partir duquel
un tweet à été retweeté
• (jusqu'à 3200).
67
Après installation de
l’extension, clic droit sur
l’icône puis « option » pour la
configurer.
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
69. Treeverse
◼ Treeverse : graphe de discussions (sans export possible) : Firefox, Chrome
69
Test : exemple de tweet à analyser
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
70. Boîtes à outils
70EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
71. TweetBeaver
◼ TweetBeaver (demande une connexion avec votre compte Twitter).
Présentation à l’écran ou téléchargement au format CSV.
71
200 derniers tweets
200 derniers tweets
3 200 derniers tweets 3 200 derniers tweets
90 000 comptes 5 000 comptes10 000 comptes 10 000 comptes
5 000 comptes 3 200 derniers tweets
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
72. Analyse de graphes
72EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
73. Hoaxy (1/2) : requêtes
◼ Hoaxy (bêta)
récupère les
résultats d’une
requête sur les 7
derniers jours pour
un maximum de
1000 comptes.
◼ Plus les ronds sont
grands plus le
compte a été
retweeté.
◼ Les points rouges
représentent les
comptes qui sont
certainement des
robots (évalué par
Botometer).
◼ L’export CSV ne
contient pas les
textes des tweets.
73EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
74. Hoaxy (2/2) : articles
◼ Hoaxy (bêta) permet aussi de
visualiser la diffusion des seuls
articles collectés par Hoaxy
(affirmations et fact-checks).
◼ Les points rouges
représentent les comptes qui
sont certainement des robots
(évalué par Botometer).
◼ Plus les ronds sont grands plus
le compte a été retweeté.
74EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
75. NodeXL
Modèle Excel pour Windows
(voir le tutoriel associé)
75EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
76. NodeXL (1/8)
◼ NodeXL est un
modèle Excel
(compatible
Windows à partir
d’Excel 2010).
◼ Il ajoute un onglet
à Excel.
◼ Il est capable
d’interroger le
moteur de
recherche de
Twitter ou le
réseau
d’utilisateurs.
◼ Vous devrez
connecter votre
compte Twitter à
NodeXL pour qu’il
puisse interroger
Twitter.
◼ Voir le support
dédié pour plus de
détails.
76EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
77. NodeXL (2/8)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 77
78. NodeXL (3/8)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 78
79. NodeXL (4/8)
79EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
80. NodeXL (5/8)
80EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
81. NodeXL (6/8)
81EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
82. NodeXL (7/8)
82EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
83. NodeXL (8/8)
83EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
84. Gephi et l’extension
Twitter Streaming Importer
Logiciel multiplateforme
(voir le tutoriel associé)
84EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
85. Gephi et l’extension Twitter Streaming Importer
◼ Gephi est un logiciel d’analyse et
de visualisation de réseaux
multiplateforme.
◼ Son extension Twitter Streaming
Importer nécessite d’avoir un
compte Twitter et d’obtenir des
clés d’API Twitter.
◼ Il permet de…
►collecter des tweets en temps réel, sur
le sujet que vous aurez choisi
►extraire les connexions entre les
utilisateurs mentionnés dans ces
tweets
►visualiser ces connexions dans Gephi,
ou juste exporter tous les tweets vers
Excel.
85EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
86. Scripts Python
Un grand merci à Marc Rénier et « Pangar-Ban » pour leurs éclairages…
86EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
87. Bien préparer son environnement
(sous Windows)
87EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
88. Bien préparer son environnement (sous Windows)
◼ Environnement logiciel
►Python (logiciel à installer)
►Pipenv à installer par la ligne de
commande :
• pip install --user pipenv
►Git (à installer) : pour télécharger des
dépôts GitHub
►Microsoft Visual C++ (MSVC) : a
télécharger pour faire fonctionner
certains programmes
►PyCharm : à installer pour disposer d’un
environnement d’exécution et de
programmation plus intuitif
►Bien vérifier (ou faire en sorte) que les
applications soient présentes dans le
PATH de Windows (trouvables
directement lorsque l’on tape leur nom
après avoir frappé la touche du
clavier).
◼ Organisation (suggestion)
►Créer un dossier dédié à recevoir vos
scripts à la racine de votre dossier
« utilisateur », par exemple
88
C:Users{user}ScriptsPython
PyCharm
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
89. Quelques commandes utiles
(à partir de l’invite de commande : + cmd sous Windows)
89EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
90. ◼ pipenv install nom_du_script
►Après s’être placé dans le dossier
contenant le script
►Place le script dans un
environnement virtuel
◼ pipenv run nom_du_script –h
►Fournit l’aide du programme
◼ pipenv run nom_du-script
nom_de_la_commande…
►Une fois placé dans le dossier ad
hoc, lance un programme en pipenv
et exécute commande et arguments
◼ Ctrl+C : interruption de
l’exécution d’un script
◼ git pull : mise à jour du
programme (une fois placé dans
son dossier)
Quelques commandes utiles
◼ + cmd : lance l’interface en
ligne de commande
◼ cd : pour accéder à un dossier
►cd ScriptsPythontwint
◼ cd .. : remonte dans
l’arborescence d’un dossier
◼ dir : liste le contenu d’un dossier
◼ Touche « tab » : autocomplétion
d’un nom de dossier par exemple
◼ git clone url_du_depôt_github
►Après s’être placé dans le dossier qui
contient tous vos scripts
►Récupère le code
90
A lire : What is Command Line Interface (CLI)? (W3Schools)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
91. Twint
Un couteau suisse pour scraper Twitter (quand il marche !)
91EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
92. Twint
◼ Twint (dépôt Github +
wiki) est un programme
qui ne repose pas sur
l’API Twitter.
►Très riche possibilités
d’interrogation (en ligne de
commande)
• Recherche : –s
• Utilisateurs : -u
►Possibilité d’exporter les
résultats très riches
►Nombreux
dysfonctionnement actuels
sur des requêtes complexes
►Pour accéder à des
rapports très visuels, il faut
installer et configurer
ElasticSearch et Kibana
◼ Toujours bien lire les recommandations
d’installation
◼ Une fois placé dans le dossier contenant vos
scripts)
►git clone https://github.com/twintproject/twint
◼ Création de l’environnement pipenv une
fois placé dans le dossier « twint »
►pipenv install
Dans d’autres cas, il faudra…
pipenv install requirements.txt
voire installer les packages un par un…
pipenv install nom_du-package
◼ Aide
►pipenv run twint -h
92EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
93. Exemple : followers
◼ Une fois dans le dossier « twint »
◼ Stocke dans le dossier « twint » un
fichier « secou-following.csv »
contenant tous les noms de compte
auxquels est abonné @secou
93
pipenv run twint -u secou --following -o secou-following.csv
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
94. Pour en savoir plus…
◼ Wiki Officiel (dont Basic usage et
Storing objects in an Elasticsearch
instance)
◼ Articles/tutoriels
►Mine Twitter for Targeted Information
with Twint (Null Byte, 2019)
►Twint – an OSINT Tool for Collection on
Twitter at Scale (2019)
►How to use Twint as an OSINT tool
(Privacy Globe, 2019)
►OSINT'ing at Scale (video, 2020)
◼ Utilisation avancée
►Analyzing Tweets with NLP in minutes
with Spark, Optimus and Twint
(Towards Data Science, 2019)
►Twint: Loading tweets into Kafka and
Neo4j (2019)
◼ Retex
►Using OSINT to help build the OSINT
community on Twitter (2018)
94EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
96. TwitWork : le graphe temps réel
◼ TwitWork (développé
par @atmon3r,
nécessite d’installer
NodeJS et de disposer
de clés pour l’API
Twitter)
►Permet de construire en
temps réel un graphe des
interactions autour d’un
mot ou groupe nominal,
un hashtag, un nom
d’utilisateur, mais pas, a
priori, une requête
quelconque.
►La sortie, uniquement en
jpg, est de faible
résolution et ne permet
pas de visualiser de
grands graphes
clairement.
►Une fois installé, lancer
avec « npm start »
►Exemples
• @gdarmanin
• #holdup
96EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
@gdarmanin
98. Tafferugli
◼ Tafferugli v. 0.2 (développé par s0dust,
nécessite des clés API pour Twitter).
► Il sert à filtrer, collecter et analyser les
tweets.
► Il est pensé pour faciliter l'analyse de certains
phénomènes liés aux opérations de
propagande, comme le comportement
coordonné et l'affichage automatisé.
► Les conseils d’installation visent les
environnements Ubuntu/Debian et le
conteneur Docker.
► Nécessite l’installation de graph-tool,
indisponible sur Windows, sauf sous le moteur
de virtualisation Docker.
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 98
En savoir plus : Documentation, Démo
99. Logiciels (payants)
99EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
100. Maltego
100EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
101. Maltego
◼ Maltego : logiciel très utilisé
en OSINT et criminalistique.
►Existe en version gratuite limitée :
Maltego CE (choix à effectuer
après installation)
►Dispose de ses fonctions propres
mais accepte de nombreux plugins
(transforms) gratuits ou payants.
►On définit des entités auxquelles
on applique des traitements
(transforms), ou on lance des
« machines » qui automatisent des
processus.
►Pour fonctionner avec Twitter, des
clés API Twitter sont nécessaires.
►La version CE ne peut gérer que 12
entités
►License annuelle version Pro :
1000 ou 2000 $ par utilisateur.
Renouvellement : 500 à 1000 $.
101
Pour en savoir plus : Documentation, Maltego training video for absolute beginners (2015), les vidéos de Maltego Essentials (2020)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
102. Maltego > Twitter Monitor
102
Source : Use Maltego to Monitor Twitter for Disinformation Campaigns (Null-Byte, 2018)
Choix de la « machine »
Twitter Monitor
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
103. Maltego > Twitter Monitor
103
Apparition des résultats
Saisie de la requête
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
104. Maltego > Twitter Monitor
104
Améliorer la visualisation
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
105. Maltego > Twitter Monitor
105
En zoomant, les détails apparaissent
Se repérer
dans l’espace
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
106. Maltego + Social Links
◼ SocialLinks est un package
de 700 transforms pour
Maltego principalement
dédiées à l’enquête sur les
réseaux et médias
sociaux : Facebook,
Linkedin, Instagram,
Skype, Telegram, Twitter,
VKontakte, WikiLeaks,
YouTube, etc. Il s’immisce
également dans le darkweb
◼ License : 290$/mois,
2750$/an
◼ Existe également en
version gratuite limitée :
SocialLinks CE (225
transforms et 45 entités)
◼ Liste des Transforms de
SocialLinks
106
Pour en savoir plus : Ressources (webinars, tutoriels), chaine YouTube
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
108. Visibrain
◼ Visibrain : plateforme
d’analyse et de
surveillance des
réseaux/médias
sociaux (surtout
Twitter) très orientée
e-réputation,
communication de
crise, influenceurs,
tendances.
◼ Veille temps réel
◼ Export Gephy
◼ Alertes sur des
événements
particuliers (hausse de
volume de tweets
utilisant des mots
particuliers.
108
Pour en savoir plus : Documentation, Guides
Crédit : Visibrain
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
109. Le blog Cartorezo (Guillaume Sylvestre) : retours
d’expérience d’analyses de réseaux avec Visibrain+Gephi
109
Blog Cartorezo (Guillaume Sylvestre)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
110. Outils de veille
110EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
111. TweetDeck (Twitter) : le champion du temps réel
◼ TweetDeck est un
service en ligne gratuit
appartenant à Twitter
et capable d’afficher
en temps réel le fil
d’actualité, requêtes,
listes, etc., sous forme
de colonnes
111EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
112. Inoreader : lecteur de fil RSS compatible avec Twitter
◼ Inoreader est un lecteur
de fil RSS en ligne qui
permet, dans sa version
Pro (50€/an), de suivre
jusqu’à 30 flux Twitter :
► comptes Twitter (pas
intéressant parce que vite
saturé par la limite de 30)
► recherches Twitter (aussi
complexes soient-elles)
► listes Twitter
◼ Il est possible ensuite de
filtrer les tweets
◼ Tous les tweets sont
archivés
◼ Il est possible (moyennant
finance) de relever la
limite des 30 flux.
112
URL d’une requête Twitter
Fil RSS de la requête
Tweets
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
113. Feedly : lecteur de fil RSS compatible avec Twitter
◼ Feedly est un lecteur de
fil RSS en ligne qui
permet, dans ses
versions Pro+ (144$/an)
et Business (246$/an) :
► comptes Twitter
► recherches Twitter (aussi
complexes soient-elles)
► listes Twitter
◼ Les requêtes sont gérées
directement dans Feedly
(contrairement à
Inoreader)
◼ Permet de lire l’article
lié au tweet directement
dans l’interface
◼ Permet de valoriser ou
d’exclure certains mots
dans les tweets ou les
article liés
◼ Feedly a une limite de
5000 articles par jour de
chaque source Twitter.
113EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
114. Tweet Archiver : extension Google Sheets (1/2)
◼ Tweet Archiver est une extension
pour Google Sheets
►Une seule règle d’extraction dans la
version gratuite, raffraîchie toutes les
heures
►Pour l’installer allez dans une feuille
Google Sheets vierge > Modules
Complémentaires > Télécharger des
modules complémentaires > chercher
« Tweet Archiver » > Installer
►Regardez le tutoriel
►A la première utilisation, l’extension
vous demande d’accéder à votre compte
Twitter
►Accéder à la fonction « Create rule »
(vous pouvez élaborer des requêtes
complexes dans la sone « Advanced
Rules »)
►Create Search Rule
►A partir de là, la requête reprendra
toutes les heures (mais il est possible de
la rafraichir anuellement)
►Version payante à 4,95 €/mois pour 10
requêtes ou 7,95$/mois pour 25
requêtes raffraîchies toutes les 15
minutes
114EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
115. Tweet Archiver : extension Google Sheets (2/2)
115
La feuille finale contient de nombreuses
informations pour chaque tweet.
Export possible au format Excel, CSV…
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
116. FeedBro
◼ FeedBro est un lecteur
de fil RSS gratuit sous
forme d’extension pour
navigateur (Firefox ou
Chrome).
◼ Il est capable de
s’abonner à n’importe
quelle entité sur
Twitter affichée à
l’écran :
►compte
►résultat de recherche
►liste
116EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
117. Nitter
◼ Nitter : service en
ligne générant un fil
RSS relayant les
tweets d’un compte
donné.
►Saisissez le nom
d’utilisateur (sans
« @ ») et lancez la
recherche
►Localisez le compte
dans la liste et cliquez
dessus
►Le fil RSS se trouve en
haut et à droite de la
page
117
Fil RSS
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
118. RSS Bridge : le couteau suisse qui se penche sur Twitter
◼ RSS Bridge : solution à
héberger accumulant
des « bridges », dont
un pour Twitter, qui
permet de récupérer
sous forme de fil RSS
(en fait Atom) :
► les tweets contenant
un mot, une expression
ou un hashtag
► les tweets d’un
utilisateur particulier
► les tweets d’une liste
118EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
119. EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 119
Ouf ! C’est fini !
(en fait il en reste encore… mais c’est annexe)
121. Autres solutions payantes
◼ Echosec
►Recherche et surveillance
temps réel par mots clés et
localisation de publications
Twitter, Instagram,
Foursquare, Flickr,
Wikipédia, Reddit,
VKontakte…
◼ TweetReach
►Expose la diffusion de
tweets et l’engagement
◼ Tweet Archivist
►Surveillance et archivage de
tweets.
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 121
122. Requérir un accès à l’API
Twitter
122EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
123. Obtenir un accès officiel à l’API de Twitter (1/3)
◼ Get access to the Twitter API
123
Processus gratuit, si vos
besoins sont modestes, un
peu long puisqu’il vous faut
expliquer en longueur ce que
vous voulez tirer de l’API. Au
final vous obtenez les clés de
votre accès à l’API de Twitter
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
124. Obtenir un accès officiel à l’API de Twitter (2/3)
124EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
125. Obtenir un accès officiel à l’API de Twitter (3/3)
125EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
126. Pour en savoir plus…
126EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
127. Quelques ressources Web
◼ https://www.mindmeister.com/fr/88482291/twitter-tools-directory
◼ https://www.labnol.org/internet/twitter-guide-do-everything-with-
twitter/4916/
◼ https://buffer.com/library/free-twitter-tools/
◼ https://docs.google.com/spreadsheets/d/18rtqh8EG2q1xBo2cLNyhIDuK9jrP
GwYr9DI2UncoqJQ/edit#gid=1700243466
127EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
129. Chorus Project
◼ Chorus Project
►Utilise l’API Twitter (compte développeur
à créer sur https://dev.twitter.com)
►Chorus-TCD (TweetCatcher Desktop),
gratuit sur demande
• Scraping de recherches
►Chorus-TCW (TweetCatcher Web) : usage
réservé aux universitaires
►Chorus-TV (TweetVis) : usage réservé aux
universitaires
• Timeline Explorer
• Cluster Explorer
129
Chorus-TCD
Chorus-TCW, Chorus-TV
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
130. Tweepy
◼ Tweepy est une librairie
permettant d’interagir
avec Twitter aussi bien
pour poster que pour
récupérer des
informations.
►Nécessite des clés pour
accéder à l’API Twitter
►Nécessite de coder toutes
ses propres programmes
en Python, appelant la
librairie
◼ Doc :
http://docs.tweepy.org/
en/latest/
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 130
131. TwiiterSearch2Gephi
◼ TwitterSearch2Gephi est une
application Windows CLI qui vous
permet de collecter des données
sur les réseaux sociaux et de les
convertir en un ensemble de
données CSV pouvant être utilisé
avec Gephi.
◼ Votre ordinateur doit être équipé
de .NET
◼ Actuellement, il prend en charge
►Twitter
►Reddit
►Youtube
►Domaines WWWn URL
◼ Le dossier doit se trouver à la
racine du disque C:
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 131
132. Quelques outils « recalés »
132EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
133. BotSight
◼ BotSight (Norton) est
une extension pour
navigateur qui
entend détecter les
robots Twitter à
partir d’un vingtaine
de critères.
►Inadapté à l’actuelle
interface de Twitter :
seuls les comptes cités
dans un tweet sont
détectés (pas le
compte émetteur)
►L’évaluation (ici de
Michael Lomüller) est
fantaisiste.
133
A lire : Introducing BotSight: A New Tool to Detect Bots on Twitter in Real-Time (NortonLifeLock, 2020)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
134. SocioViz
◼ SocioViz
►Recherche
ponctuelle (gratuit)
ou récurrente
(payant)
►Résultats :
• Utilisateurs les plus
actifs sur une
recherche
• Réseau de mots
• Réseau
d’utilisateurs (liens
par mentions ou
retweets, grosseur
du point en fonction
des citations ou
retweets)
• Réseau d’emoji
• Réseau de hashtags
(reliés si co-
présence)
►Limites de la
version gratuite
• 100 tweets pour
chaque requêtes
• 1 semaine de
profondeur
• Top 10 des hashtags
►Export possible
134
A lire : Tutoriel | Tutoriel avancé | Tarifs
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
135. Export Comments
◼ Export Comments… exporte les
commentaires d’un tweet
►Export Excel très propre
►Mais limité à 100 dans a version gratuite
►Les versions payantes sont chères !
135EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
136. Sleeping Time
◼ Sleeping Time analyse les 1000 derniers tweets et détermine les heures de
sommeil de son/sa propriétaire à partir des plages où il/elle tweete le
moins. Nécessite une connexion à votre compte. Ne détecte pas le fuseau
horaire !
136EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
137. SocialBearing
◼ SocialBearing : puissantes analyses de comptes, mais version gratuite très
limitée et version payante plus que chères !
137EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
138. Tinfoleak
◼ Tinfoleak (script Python nécessitant des clés pour l’API Twitter)
►Incompatible avec Python 3)
►Pas mise à jour depuis le 04/09/2018
138EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
139. Twitter Audit
◼ Twitter Audit : analyse la possibilité qu’un
compte soit faux ou de mauvaises qualité.
◼ Aucune précision sur les algorithmes
utilisés !
139EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
140. Surplus
140EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
142. Intérêts des API « Premium »
et « Entreprises »
142EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
145. Serge Courrier
◼ Formateur (depuis 1996)
► Intervenant à l’École Européenne d’Intelligence
Économique (EEIE) depuis sa création, il y enseigne
les outils et méthodologies de veille, les réseaux et
médias sociaux, la visualisation de données,
l’OSINT/SOCMINT/OSINT, etc.
► Il intervient également à l’association des
professionnels de l’information (ADBS), à l’Institut
national de l’audiovisuel (INA), à l’Ecole des
bibliothécaires et documentalistes (EBD, assure
également la formation des rédactions et
documentalistes de France Télévisions, etc.
◼ Consultant (depuis 2005)
► Il intervient auprès d’entreprises et d’organismes
publics, pour développer leurs outils et stratégies de
recherche et de veille, ainsi que leurs usages
avancés d’Internet et notamment du Web 2.0.
◼ Ex-Journaliste spécialisé
► Il a traité entre 1990 et 2014 de sujets liés à
Internet et à l’Intelligence économique pour des
magazines spécialisés et grand public. A
précédemment occupé les postes de rédacteur en
chef adjoint de Génie Industriel, Science et Vie
Micro (SVM) et Micro Hebdo.
◼ Créée en 2005, l’Ecole européenne
d’intelligence économique (EEIE) est la
seule école habilitée en France à remettre
le titre d’État de « Consultant(e) en
Intelligence Économique », enregistré au
Répertoire National des Certifications
Professionnelles (RNCP).
◼ L’école est située à Versailles.
◼ Retrouvez nos Webinars en Replay sur
notre site : www.eeie.fr/webinars/
145EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►