SlideShare une entreprise Scribd logo
Investigations
sur Twitter
Introduction aux méthodes et outils légers
EEIE } Webinar #09
19 novembre 2020 } Serge Courrier
Respectons les auteurs !
Sommaire
◼ Préparer son navigateur
◼ Rechercher
◼ Outils tiers (simples) en ligne
◼ Boîtes à outils
◼ Analyse de graphes
◼ Scripts Python
◼ Logiciels (payants)
◼ Outils de veille
◼ Annexes
►Autres solutions payantes
►Requérir un accès à l’API Twitter
►Pour en savoir plus…
►Autres outils intéressants
►Quelques outils recalés
►Surplus…
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 2
Préparer son navigateur
3EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Préparer son navigateur
Chrome & Co
◼ Gestionnaire d’extensions
►Nooboss
◼ Préserver les onglets et les
fenêtres de son navigateur entre
deux sessions
►Tab Session Manager
◼ Scroller automatiquement une
page
►Simple Autoscroll
◼ Sauvegarder proprement une page
Web au format numérique
►Save Page WE (se placer en bas de la
page) ou SingleFile
Firefox
◼ Préserver les onglets et les
fenêtres de son navigateur entre
deux sessions
►Tab Session Manager
◼ Sauvegarder vers la WayBack
Machine ou accéder à une page
archivée
►Wayback Machine
◼ Scroller automatiquement une
page
►FoxScroller
◼ Sauvegarder proprement une page
Web au format numérique
►Save Page WE (se placer en bas de la
page) ou SingleFile
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 4
Rechercher
5EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Travailler son lexique avec soin
(non ce n’est pas si évident !)
6EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Soigner le lexique
7
gilets jaunes à Toulouse
Le questionnement est simple ?
Et pourtant…
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Champs lexicaux dans Twitter
Notion 1 : gilets jaunes Notion 2 : Toulouse
"gilet jaune" Toulouse
"gilets jaunes" Toulousain
#giletjaune Toulousains
#giletsjaunes Toulousaine
#gj Toulousaines
Capitole
"ville rose"
8EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Requête résultante
9
"gilet jaune OR "gilets jaunes" OR #giletjaune OR
#giletsjaunes OR #gj toulouse OR toulousain OR toulousains
OR toulousaine OR toulousaines OR capitole OR "ville rose"
-weed –cocaine -cannabis
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
En résumé
1. Se mettre à la place des personnes qui rédigent les tweets
2. Lister le lexique qu’ils peuvent utiliser pour décrire ce qui
vous intéresse (et y revenir à plusieurs reprises pour
l’enrichir)
3. Ne pas oublier le féminin et le pluriel des mots, le jargon,
les sigles…
4. Ne pas oublier que les groupes nominaux sont concaténés
lorsqu’ils se retrouvent intégrés dans des hashtags
5. Être à l’affut de l’évolution des hashtags
10EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Maîtriser la syntaxe de recherche
avancée
…et ses subtilités !
11EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Comptes et listes
12
◼ @compte : citant ce compte
◼ from:secou : émis par @secou
◼ from:secou OR from:crid : produits par @secou ou @crid
◼ -from:secou : sauf les tweets émis par @secou
◼ to:secou : destinés à @secou
◼ filter:verified : comptes vérifiés (calicot bleu)
◼ filter:news : comptes de médias, de journalistes identifiés,
ou pointant vers de sites Web de médias
◼ -filter:news : utile pour faire émerger des tweets
« grand public »
◼ -filter:news –filter:verified
◼ list:908341978005458944 : tweets émis par des membres
de la liste (le numéro de la liste apparait dans l’URL de la
liste)
◼ filter:follows : comptes auxquels vous êtes abonné.e
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Nature du tweet
13
◼ filter:replies : réponse
◼ filter:nativeretweets : retweets
◼ filter:quote : dans le commentaire d’un tweet
◼ quoted_tweet_id:1138631847783608321 : commentaires
d’un tweet dont l’ID est 1138631847783608321
(l’ID d’un tweet apparaît dans l’URL du tweet, une fois
isolé)
◼ quoted_user_id:11348282 : commentaires de tweets émis
par un compte dont l’ID est 11348282 (voir plus loin pour
savoir comment identifier l’ID d’un compte)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Opérateurs orientés médias
14
◼ filter:images : fichiers images
◼ card_name:animated_gif : gif animés
◼ filter:videos : fichiers vidéos (dont partages YouTube…)
◼ filter:native_video : fichiers vidéos
(sans partages YouTube…)
◼ filter:vine : vidéos publiés via l’app Vine (abandonnée en
octobre 2016 (mais les archives sont toujours accessible)
◼ filter:periscope OR card_domain:pscp.tv OR
url:twitter.com/i/broadcasts/ : videos tournées en direct
et archivées
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Opérateurs temporels
15
◼ until:2019-06-23 : jusqu’à
◼ since:2018-05-12 : depuis
◼ since:2018-05-12 until:2019-06-23 : entre deux dates
◼ Mais aussi…
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Opérateurs temporels
16
◼ À la seconde près ?
◼ Vraiment ?
◼ until_time:1569483022 : jusqu’au 26 septembre 2019
à 07:30:22
◼ since_time:1569470400 : jusqu’au 26 septembre 2019
à 07:30:22
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Recherche sur Twitter en précisant une heure
17
lubrizol until_time:1569470400
Heure Unix (UTC)
Epoch Converter
Requête finale :
lubrizol filter:native_video
until_time:1569470400
exclude:retweets
(classée avec l’onglet
« Récent)
Attention à s’adapter au
fuseau horaire du lieu
L’opposé de until_time: ?
since_time:
Merci à Giovanni Nazzaro pour la piste !
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Localisation
18
◼ ATTENTION : La plupart des tweets ne sont plus géolocalisés !
La recherche s’effectue surtout sur les localisations
des comptes (dans la biographie)… ce qui limite de beaucoup
son intérêt !
◼ near:paris
◼ near:paris within:15km
◼ near:florida
◼ near:lebanon
◼ geocode:37.7764685,-122.4172004,10km : 10 km autour de
San Francisco
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Engagement
19
◼ min_retweets:25
◼ min_faves:30
◼ min_replies:100
◼ -min_retweets:25
◼ -min_faves:30
◼ -min_replies:100
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Autres opérateurs intéressants
20
◼ lang:fr OR lang:en : 47 langues disponibles ►
◼ url:cia.gov : même si l’URL twittée a été raccourcie
(bit.ly, buff.ly, ift.tt…)
◼ url:data : un élément dans l’URL
◼ filter:links : trouver des tweets pointant vers des URL
◼ 📢 : emojis et émoticons
◼ ‫ن‬ : recherche par caractères
(dans le tweet ou le nom de l’utilisateur)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Pour en savoir plus…
◼ L’énorme recueil d’Igor Brigadir (surGitHub) : Advanced Search on Twitter
21EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Travailler sur les URL
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 22
Travailler sur les URL
23
◼ Les éléments à ajouter à l’URL d’un compte
◼ media : https://twitter.com/realdonaldtrump/media
◼ likes : https://twitter.com/realdonaldtrump/likes
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Outils tiers (simples) en ligne
Si votre OPSEC n’est pas trop stricte !
24EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Trouver le Twitter ID
25EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Find Twitter ID
◼ Trouve l’identifiant
d’un compte (utile
dans certains
services)
►Find Twitter ID
►TweetrID
►GetTwitterID
◼ Pour connaître le
compte derrière un
user_id :
https://twitter.com/
intent/user?user_id
=2622731
26EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
3 stratégies de sourcing
à ne pas négliger
(parmi tant d’autres)
27EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Stratégies de sourcing
◼ Followerwonk (Search Bios)
►Compte les plus populaires
contenant des mots
particuliers dans leur bio
►Version gratuite :
• 50 recherches par jour
• 100 réponses par page
• Pas d’export des résultats
◼ Parcourir les abonnements
d’un compte
◼ Chercher et parcourir des
listes
►site:twitter.com/*/lists/*
intitle:privacy
28
Possible recherche par
pays ou ville (si indiqué
dans le profil)
Classement par défaut :
nombre d’abonnés
décroissant.
Par « Social Authority » :
algo maison, proche de
Klout.
Usage de « | » à la place de l’opérateur booléen
« OR » et du « - » à la place du « NOT »
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Analyser un compte
29EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Twitonomy : une vision d’ensemble
◼ Twitonomy (analyse
statistique d’un
compte, gratuit,
nécessite la
connexion à son
compte)
►[+++] Heures et
jours d’utilisation
►[+++] Outils de
publications utilisés
►[+++] Hashtags les
plus utilisés
►[+++] Comptes les
plus retweetés, les
plus mentionnés, les
plus commentés
30
Profile
A lire : détail de la version payante (19$/mois)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
SparkScore de SparkToro
◼ SparkScore : évaluation
transparente de la « réputation »
d’un compte
31EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Allegedly
◼ Allegedly : détecte les différents outils utilisés par un compte pour
tweeter et leur utilisation dans le temps (pendant les 15 derniers jours)
32EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Spoonbill : changements dans les bios
◼ Spoonbill : suivre
l’évolution de la bio des
comptes que l’on suit et
consulter l’historique de
modification de la bio de
n’importe quel compte.
33
Par mail quotidien : tous les changements dans les bios
des personnes que vous suivez
En ligne : l’historique des changements
de bio de n’importe quel compte
https://spoonbill.io/twitter/data/OSINTtechniques/
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Détecter les abonnés douteux ?
Robots ? Sock puppets ?
34EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
SparkScore : Fake Followers Audit
◼ SparkToro Fake Followers Audit
►Attention : l’analyse porte sur des
caractéristiques qui ne sont pas
nécessairement des marqueurs de faux
abonnés !
35EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Botometer
◼ Botometer (détection de
robots)
►Attention : l’analyse porte
sur des caractéristiques qui
ne sont pas nécessairement
des marqueurs de faux
abonnés !
36EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
BotSlayer
◼ BotSlayer [Beta]
(Indiana University) :
outil (à héberger)
de détection de
robots
◼ Tutoriel
◼ BotSlayer-CE sur
GitHub
37
Hoaxy
BotSlayer
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Indices lors d’une analyse directe d’un compte
◼ Photo de profil
►Image de stock ?
►Image générée par IA ?
◼ Nom d’utilisateur
►Plein de numéros ?
◼ Fréquence de publication
►Surhumaine ?
◼ Timing de publication
►Pas de pause pour le sommeil ?
◼ Abonnements/abonnés
►Beaucoup d’abonnements, très peu
d’abonnés ?
◼ Contenus répétitifs
►Une seule thématique
►Publié à l’identique par d’autres
comptes
38EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
A lire : If you follow me, I’ll OSINT you (Matthias Wilson, a.k.a. @mwosint, 2020),
West Papua: New Online Influence Operation Attempts to Sway Independence
Debate (Benjamin Strick, a.k.a. @BenDoBrown, 2020)
Lister et comparer des abonnés,
abonnements, tweets
39EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
TweepDiff
◼ TweepDiff
►Abonnés ou abonnements en
commun entre plusieurs comptes
• Exemple : faire émerger des
sources d’informations communes
à plusieurs acteurs d’un même
secteur.
• Exemple : faire émerger les
abonnés communs aux comptes
appartenant à une même
communauté
►Pas d’export
40EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
All my Tweets
◼ All My Tweets : pour un
compte quelconque
affichage rapide, sur une
seule page de (au choix) :
►ses tweets (les 3200
derniers)
►son fil d’actualité (les 800
derniers)
►ses « likes »
►ses abonnés
►ses abonnements
41EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Twiangulate
◼ Twiangulate Search (nécessite
l’identification via son compte)
◼ Travaille sur deux comptes et fournit
►les abonnement communs
►les abonnés communs
►les 100 abonnés communs dont la portée
des tweets est la plus grande
◼ Sur un compte
►Les abonnés à un compte contenant
le/les mêmes mots dans leur bio
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 42
doesfollow
◼ Doesfollow : est-ce que tel compte est abonné à tel compte ? (nécessite la
connexion de son compte au service)
43EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
First Follower
◼ First Follower :
fournit le premier
abonné à un compte
(qui ne se soit pas
désabonné)
44EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Mesurer les tendances
45EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
SMAT (Social Media Analysis Tool)
◼ SMAT : conçu par la
fondation Mozilla
►Recherche sur Twitter,
mais aussi sur Reddit,
4chan, 8kun)
►Borne temporelle large
(plusieurs années)
►Export CSV
►Très fréquemment
surchargé
◼ Fonctions
►Timeline : évolution de
l’usage d’un mot dans un
tweet pendant une
période de temps
►Hashtag : hashtags
associés à un hashtag sur
une période de temps
►Link Counter : liens
associés à un mot
►Activity : affiche les
comptes ayant le plus
utilisé ce mot sur une
période donnée
46
Exemple : holdup, RealDonalTrump (inbound graph) | Explications
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Trends24
◼ Trends24 : accès aux tendances mondiales, par pays et grandes villes
47EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
TrendsMap
◼ TrendsMap (freemium) : tendances (hashtags, compte, mots) sur une carte
(7 jours)
48EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Se pencher sur les hashtags
49EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Hashtagify
◼ Hashtagify (freemium)
►Version gratuite
• Index de popularité d’un hashtag
• Hashtags associés
• Pays d’utilisation
• Evolution sur 8 semaines
• Comptes les plus influents
• Langues les plus utilisées
• Nombre de requêtes limité
50EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
onemilliontweetmap
◼ #onemilliontweetmap : localisation mondiale de tweets sur 24 heures contenant un mot
ou hashtag particulier (temps réel ou lors d’une période particulière). Possibilité de
comparaison entre deux tweets. Vision très partielle au vu de résultats obtenus en
novembre 2020 sur #biden #trump et #holdup.
51EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Evaluer la diffusion d’une URL
52EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
CrowdTangle
◼ La plateforme CrowdTangle (Facebook) est connue pour sa capacité à analyser
les publications Facebook, mais propose également l’extension CrowdTangle
Link Checker pour Chrome qui fournit des statistiques de partage d’une URL
sur Twitter. Nécessite une identification sur un compte Facebook. L’export
des données au format CSV ne concerne que les interactions sur Facebook.
53EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Prendre en charge images et vidéos
54EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Télécharger le format original d’une photo
◼ Dans cet exemple…
►clic sur la photo
►Clic droit > « Ouvrir
l’image dans un nouvel
onglet » (Chrome) ou
« Afficher l’image »
(Firefox)
►Clic droit > Enregistrer
l’image sous
►Changer « .jfif » en
« .jpg »
55EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
DownAlbum
◼ DownAlbum
►Extension Chrome
permettant de récupérer
les images (et les vignettes
des vidéos) publiées par un
compte.
►Sauvegarde simple par
« Ctrl+S » en choisissant le
format « Page Web
complète ».
►Limite : ne prend que la
page affichée dans le
navigateur donc peut
nécessiter l’emploi d’une
extension de scroll
automatique.
►L’export « Photos URL », au
format texte, permet
(après nettoyage) d’obtenir
adresses et dates de
publication des images et
vidéos
►Attention, si l’image est
supprimée du compte, le
lien ne fonctionne plus,
mais identifie tout de
même le compte.
56EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
DownloadTwitterVideo
◼ Attention : aucune
métadonnée d’horodatage
ni de géolocalisation.
◼ FBDown
►extension Chrome
permettant de télécharger
une vidéo particulière.
Sinon, pour Firefox et
autres, coller l’adresse de
la vidéo sur le site
fbdown.net
◼ Video Downloader
Ultimate (Chrome)
◼ Video DownloadHelper
►Chrome, Firefox
◼ DownloadTwitterVideo
►Télécharge la vidéo en
fournissant l’URL du tweet.
57EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Métamoteur de recherche inversée
◼ Search By Image (extension pour
Firefox, Chrome/Brave et Opera)
►Interroge ou pointe vers 21 moteurs
de recherche inversée.
►Il est possible d’ordonnancer
et d’activer/désactiver les moteurs.
58EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Autres outils recherche inversée
◼ Moteurs
►Google Images
►Tineye
►Yandex Images (ru)
►Baidu Image Search (cn)
◼ Extensions pour navigateurs
►[+++] NooBox
• Extension pour Chrome/Brave
• Affiche sur une seule page les réponses de
Google Images, Yandex, Bing, Baidu,
Tineye, IQBD, SauceNao
• Impossible de désactiver certains moteurs
(Baidu, par exemple)
►[+++] InVid Verification Plugin
►RevEye Reverse Image Search
• Extension pour Chrome/Brave et Firefox
• Interroge Google, Bing, Yandex et TinEye
►Fast Image Research
• Extension pour Chrome/Brave
• Interroge Tineye et Google Image
(à préciser dans les options)
59EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Moteurs de recherche inversés sur mobiles
◼ iPhone
►Reverse Image Search App
◼ Android
►Search by Image
Interroge Google Images,
Tineye, Yandex, Bing et Baidu
60
Interroge Google Images, Tineye
et Yandex
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Retrouver des tweets effacés
61EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Tweets effacés
◼ Politwoops : tweets
supprimés par des
personnalités politiques
dans le monde entier et
pays par pays !
►Afficher les tweets
supprimés dans certains pays
(beaucoup de filtres une fois
que l’on a cliqué sur « View
all deleted tweets » en bas
de la page)
►Recevoir un mail si des
tweets supprimés
contiennent un mot
particulier (dans le monde
entier, dans un pays
particulier, par une personne
particulière)
◼ Fallait pas supprimer
►Compte français, non limité
aux politiques.
62EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Trouver des tweets effacés
◼ WayBack Machine
►https://web.archive.org/web/*/twitte
r.com/{nom d’utilisateur}
►https://web.archive.org/web/*/twitte
r.com/{nom d’utilisateur}/likes
◼ Le cache Google (ou simplement le
texte du tweet sous le lien)
►site:twitter.com/{nom
d’utilisateur}/status/*
► {requête} site:twitter.com/*/status/*
Essai avec des personnes aynt publié
récemment "deleted all my
tweets" filter:verified
◼ Etudier les réponses ou les tweets
adressés à la personne pour en
comprendre le sens, voir trouver
une copies d’écran
63EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Premier tweet
64EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Premier tweet
◼ First Tweet (basé sur le projet de
labnol ci-dessous) fournit le
premier tweet contenant un mot.
►Souvent surchargé
◼ Who Tweeted it First
►Lent et pas toujours efficace
65EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Extraction
66EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Twlets
◼ Twlets (extension Chrome) :
export Excel des derniers tweets,
retweets et réponses d’un compte
Twitter (payant, 1000 crédits
disponibles au début).
◼ Récupération max de 3200 tweets.
◼ Pour chaque tweet est indiqué
►La date de création du tweet
►Le texte du tweet (sans l’éventuel lien
inclus)
►Son ID
►Le lien pointant vers le tweet
►Les liens pointant vers les médias
associés
►Le nombre de fois où il a été « liké »
• (jusqu’à 15 000)
►Le nombre de fois où il a été retweeté
et le nom du compte à partir duquel
un tweet à été retweeté
• (jusqu'à 3200).
67
Après installation de
l’extension, clic droit sur
l’icône puis « option » pour la
configurer.
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Visualiser les discussions
68EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Treeverse
◼ Treeverse : graphe de discussions (sans export possible) : Firefox, Chrome
69
Test : exemple de tweet à analyser
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Boîtes à outils
70EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
TweetBeaver
◼ TweetBeaver (demande une connexion avec votre compte Twitter).
Présentation à l’écran ou téléchargement au format CSV.
71
200 derniers tweets
200 derniers tweets
3 200 derniers tweets 3 200 derniers tweets
90 000 comptes 5 000 comptes10 000 comptes 10 000 comptes
5 000 comptes 3 200 derniers tweets
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Analyse de graphes
72EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Hoaxy (1/2) : requêtes
◼ Hoaxy (bêta)
récupère les
résultats d’une
requête sur les 7
derniers jours pour
un maximum de
1000 comptes.
◼ Plus les ronds sont
grands plus le
compte a été
retweeté.
◼ Les points rouges
représentent les
comptes qui sont
certainement des
robots (évalué par
Botometer).
◼ L’export CSV ne
contient pas les
textes des tweets.
73EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Hoaxy (2/2) : articles
◼ Hoaxy (bêta) permet aussi de
visualiser la diffusion des seuls
articles collectés par Hoaxy
(affirmations et fact-checks).
◼ Les points rouges
représentent les comptes qui
sont certainement des robots
(évalué par Botometer).
◼ Plus les ronds sont grands plus
le compte a été retweeté.
74EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
NodeXL
Modèle Excel pour Windows
(voir le tutoriel associé)
75EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
NodeXL (1/8)
◼ NodeXL est un
modèle Excel
(compatible
Windows à partir
d’Excel 2010).
◼ Il ajoute un onglet
à Excel.
◼ Il est capable
d’interroger le
moteur de
recherche de
Twitter ou le
réseau
d’utilisateurs.
◼ Vous devrez
connecter votre
compte Twitter à
NodeXL pour qu’il
puisse interroger
Twitter.
◼ Voir le support
dédié pour plus de
détails.
76EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
NodeXL (2/8)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 77
NodeXL (3/8)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 78
NodeXL (4/8)
79EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
NodeXL (5/8)
80EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
NodeXL (6/8)
81EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
NodeXL (7/8)
82EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
NodeXL (8/8)
83EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Gephi et l’extension
Twitter Streaming Importer
Logiciel multiplateforme
(voir le tutoriel associé)
84EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Gephi et l’extension Twitter Streaming Importer
◼ Gephi est un logiciel d’analyse et
de visualisation de réseaux
multiplateforme.
◼ Son extension Twitter Streaming
Importer nécessite d’avoir un
compte Twitter et d’obtenir des
clés d’API Twitter.
◼ Il permet de…
►collecter des tweets en temps réel, sur
le sujet que vous aurez choisi
►extraire les connexions entre les
utilisateurs mentionnés dans ces
tweets
►visualiser ces connexions dans Gephi,
ou juste exporter tous les tweets vers
Excel.
85EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Scripts Python
Un grand merci à Marc Rénier et « Pangar-Ban » pour leurs éclairages…
86EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Bien préparer son environnement
(sous Windows)
87EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Bien préparer son environnement (sous Windows)
◼ Environnement logiciel
►Python (logiciel à installer)
►Pipenv à installer par la ligne de
commande :
• pip install --user pipenv
►Git (à installer) : pour télécharger des
dépôts GitHub
►Microsoft Visual C++ (MSVC) : a
télécharger pour faire fonctionner
certains programmes
►PyCharm : à installer pour disposer d’un
environnement d’exécution et de
programmation plus intuitif
►Bien vérifier (ou faire en sorte) que les
applications soient présentes dans le
PATH de Windows (trouvables
directement lorsque l’on tape leur nom
après avoir frappé la touche du
clavier).
◼ Organisation (suggestion)
►Créer un dossier dédié à recevoir vos
scripts à la racine de votre dossier
« utilisateur », par exemple
88
C:Users{user}ScriptsPython
PyCharm
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Quelques commandes utiles
(à partir de l’invite de commande : + cmd sous Windows)
89EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
◼ pipenv install nom_du_script
►Après s’être placé dans le dossier
contenant le script
►Place le script dans un
environnement virtuel
◼ pipenv run nom_du_script –h
►Fournit l’aide du programme
◼ pipenv run nom_du-script
nom_de_la_commande…
►Une fois placé dans le dossier ad
hoc, lance un programme en pipenv
et exécute commande et arguments
◼ Ctrl+C : interruption de
l’exécution d’un script
◼ git pull : mise à jour du
programme (une fois placé dans
son dossier)
Quelques commandes utiles
◼ + cmd : lance l’interface en
ligne de commande
◼ cd : pour accéder à un dossier
►cd ScriptsPythontwint
◼ cd .. : remonte dans
l’arborescence d’un dossier
◼ dir : liste le contenu d’un dossier
◼ Touche « tab » : autocomplétion
d’un nom de dossier par exemple
◼ git clone url_du_depôt_github
►Après s’être placé dans le dossier qui
contient tous vos scripts
►Récupère le code
90
A lire : What is Command Line Interface (CLI)? (W3Schools)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Twint
Un couteau suisse pour scraper Twitter (quand il marche !)
91EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Twint
◼ Twint (dépôt Github +
wiki) est un programme
qui ne repose pas sur
l’API Twitter.
►Très riche possibilités
d’interrogation (en ligne de
commande)
• Recherche : –s
• Utilisateurs : -u
►Possibilité d’exporter les
résultats très riches
►Nombreux
dysfonctionnement actuels
sur des requêtes complexes
►Pour accéder à des
rapports très visuels, il faut
installer et configurer
ElasticSearch et Kibana
◼ Toujours bien lire les recommandations
d’installation
◼ Une fois placé dans le dossier contenant vos
scripts)
►git clone https://github.com/twintproject/twint
◼ Création de l’environnement pipenv une
fois placé dans le dossier « twint »
►pipenv install
Dans d’autres cas, il faudra…
pipenv install requirements.txt
voire installer les packages un par un…
pipenv install nom_du-package
◼ Aide
►pipenv run twint -h
92EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Exemple : followers
◼ Une fois dans le dossier « twint »
◼ Stocke dans le dossier « twint » un
fichier « secou-following.csv »
contenant tous les noms de compte
auxquels est abonné @secou
93
pipenv run twint -u secou --following -o secou-following.csv
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Pour en savoir plus…
◼ Wiki Officiel (dont Basic usage et
Storing objects in an Elasticsearch
instance)
◼ Articles/tutoriels
►Mine Twitter for Targeted Information
with Twint (Null Byte, 2019)
►Twint – an OSINT Tool for Collection on
Twitter at Scale (2019)
►How to use Twint as an OSINT tool
(Privacy Globe, 2019)
►OSINT'ing at Scale (video, 2020)
◼ Utilisation avancée
►Analyzing Tweets with NLP in minutes
with Spark, Optimus and Twint
(Towards Data Science, 2019)
►Twint: Loading tweets into Kafka and
Neo4j (2019)
◼ Retex
►Using OSINT to help build the OSINT
community on Twitter (2018)
94EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
TwitWork
Le graphe temps-réel
95EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
TwitWork : le graphe temps réel
◼ TwitWork (développé
par @atmon3r,
nécessite d’installer
NodeJS et de disposer
de clés pour l’API
Twitter)
►Permet de construire en
temps réel un graphe des
interactions autour d’un
mot ou groupe nominal,
un hashtag, un nom
d’utilisateur, mais pas, a
priori, une requête
quelconque.
►La sortie, uniquement en
jpg, est de faible
résolution et ne permet
pas de visualiser de
grands graphes
clairement.
►Une fois installé, lancer
avec « npm start »
►Exemples
• @gdarmanin
• #holdup
96EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
@gdarmanin
Tafferugli
97EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Tafferugli
◼ Tafferugli v. 0.2 (développé par s0dust,
nécessite des clés API pour Twitter).
► Il sert à filtrer, collecter et analyser les
tweets.
► Il est pensé pour faciliter l'analyse de certains
phénomènes liés aux opérations de
propagande, comme le comportement
coordonné et l'affichage automatisé.
► Les conseils d’installation visent les
environnements Ubuntu/Debian et le
conteneur Docker.
► Nécessite l’installation de graph-tool,
indisponible sur Windows, sauf sous le moteur
de virtualisation Docker.
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 98
En savoir plus : Documentation, Démo
Logiciels (payants)
99EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Maltego
100EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Maltego
◼ Maltego : logiciel très utilisé
en OSINT et criminalistique.
►Existe en version gratuite limitée :
Maltego CE (choix à effectuer
après installation)
►Dispose de ses fonctions propres
mais accepte de nombreux plugins
(transforms) gratuits ou payants.
►On définit des entités auxquelles
on applique des traitements
(transforms), ou on lance des
« machines » qui automatisent des
processus.
►Pour fonctionner avec Twitter, des
clés API Twitter sont nécessaires.
►La version CE ne peut gérer que 12
entités
►License annuelle version Pro :
1000 ou 2000 $ par utilisateur.
Renouvellement : 500 à 1000 $.
101
Pour en savoir plus : Documentation, Maltego training video for absolute beginners (2015), les vidéos de Maltego Essentials (2020)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Maltego > Twitter Monitor
102
Source : Use Maltego to Monitor Twitter for Disinformation Campaigns (Null-Byte, 2018)
Choix de la « machine »
Twitter Monitor
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Maltego > Twitter Monitor
103
Apparition des résultats
Saisie de la requête
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Maltego > Twitter Monitor
104
Améliorer la visualisation
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Maltego > Twitter Monitor
105
En zoomant, les détails apparaissent
Se repérer
dans l’espace
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Maltego + Social Links
◼ SocialLinks est un package
de 700 transforms pour
Maltego principalement
dédiées à l’enquête sur les
réseaux et médias
sociaux : Facebook,
Linkedin, Instagram,
Skype, Telegram, Twitter,
VKontakte, WikiLeaks,
YouTube, etc. Il s’immisce
également dans le darkweb
◼ License : 290$/mois,
2750$/an
◼ Existe également en
version gratuite limitée :
SocialLinks CE (225
transforms et 45 entités)
◼ Liste des Transforms de
SocialLinks
106
Pour en savoir plus : Ressources (webinars, tutoriels), chaine YouTube
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Visibrain
107EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Visibrain
◼ Visibrain : plateforme
d’analyse et de
surveillance des
réseaux/médias
sociaux (surtout
Twitter) très orientée
e-réputation,
communication de
crise, influenceurs,
tendances.
◼ Veille temps réel
◼ Export Gephy
◼ Alertes sur des
événements
particuliers (hausse de
volume de tweets
utilisant des mots
particuliers.
108
Pour en savoir plus : Documentation, Guides
Crédit : Visibrain
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Le blog Cartorezo (Guillaume Sylvestre) : retours
d’expérience d’analyses de réseaux avec Visibrain+Gephi
109
Blog Cartorezo (Guillaume Sylvestre)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Outils de veille
110EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
TweetDeck (Twitter) : le champion du temps réel
◼ TweetDeck est un
service en ligne gratuit
appartenant à Twitter
et capable d’afficher
en temps réel le fil
d’actualité, requêtes,
listes, etc., sous forme
de colonnes
111EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Inoreader : lecteur de fil RSS compatible avec Twitter
◼ Inoreader est un lecteur
de fil RSS en ligne qui
permet, dans sa version
Pro (50€/an), de suivre
jusqu’à 30 flux Twitter :
► comptes Twitter (pas
intéressant parce que vite
saturé par la limite de 30)
► recherches Twitter (aussi
complexes soient-elles)
► listes Twitter
◼ Il est possible ensuite de
filtrer les tweets
◼ Tous les tweets sont
archivés
◼ Il est possible (moyennant
finance) de relever la
limite des 30 flux.
112
URL d’une requête Twitter
Fil RSS de la requête
Tweets
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Feedly : lecteur de fil RSS compatible avec Twitter
◼ Feedly est un lecteur de
fil RSS en ligne qui
permet, dans ses
versions Pro+ (144$/an)
et Business (246$/an) :
► comptes Twitter
► recherches Twitter (aussi
complexes soient-elles)
► listes Twitter
◼ Les requêtes sont gérées
directement dans Feedly
(contrairement à
Inoreader)
◼ Permet de lire l’article
lié au tweet directement
dans l’interface
◼ Permet de valoriser ou
d’exclure certains mots
dans les tweets ou les
article liés
◼ Feedly a une limite de
5000 articles par jour de
chaque source Twitter.
113EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Tweet Archiver : extension Google Sheets (1/2)
◼ Tweet Archiver est une extension
pour Google Sheets
►Une seule règle d’extraction dans la
version gratuite, raffraîchie toutes les
heures
►Pour l’installer allez dans une feuille
Google Sheets vierge > Modules
Complémentaires > Télécharger des
modules complémentaires > chercher
« Tweet Archiver » > Installer
►Regardez le tutoriel
►A la première utilisation, l’extension
vous demande d’accéder à votre compte
Twitter
►Accéder à la fonction « Create rule »
(vous pouvez élaborer des requêtes
complexes dans la sone « Advanced
Rules »)
►Create Search Rule
►A partir de là, la requête reprendra
toutes les heures (mais il est possible de
la rafraichir anuellement)
►Version payante à 4,95 €/mois pour 10
requêtes ou 7,95$/mois pour 25
requêtes raffraîchies toutes les 15
minutes
114EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Tweet Archiver : extension Google Sheets (2/2)
115
La feuille finale contient de nombreuses
informations pour chaque tweet.
Export possible au format Excel, CSV…
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
FeedBro
◼ FeedBro est un lecteur
de fil RSS gratuit sous
forme d’extension pour
navigateur (Firefox ou
Chrome).
◼ Il est capable de
s’abonner à n’importe
quelle entité sur
Twitter affichée à
l’écran :
►compte
►résultat de recherche
►liste
116EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Nitter
◼ Nitter : service en
ligne générant un fil
RSS relayant les
tweets d’un compte
donné.
►Saisissez le nom
d’utilisateur (sans
« @ ») et lancez la
recherche
►Localisez le compte
dans la liste et cliquez
dessus
►Le fil RSS se trouve en
haut et à droite de la
page
117
Fil RSS
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
RSS Bridge : le couteau suisse qui se penche sur Twitter
◼ RSS Bridge : solution à
héberger accumulant
des « bridges », dont
un pour Twitter, qui
permet de récupérer
sous forme de fil RSS
(en fait Atom) :
► les tweets contenant
un mot, une expression
ou un hashtag
► les tweets d’un
utilisateur particulier
► les tweets d’une liste
118EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 119
Ouf ! C’est fini !
(en fait il en reste encore… mais c’est annexe)
Autres solutions payantes
120EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Autres solutions payantes
◼ Echosec
►Recherche et surveillance
temps réel par mots clés et
localisation de publications
Twitter, Instagram,
Foursquare, Flickr,
Wikipédia, Reddit,
VKontakte…
◼ TweetReach
►Expose la diffusion de
tweets et l’engagement
◼ Tweet Archivist
►Surveillance et archivage de
tweets.
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 121
Requérir un accès à l’API
Twitter
122EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Obtenir un accès officiel à l’API de Twitter (1/3)
◼ Get access to the Twitter API
123
Processus gratuit, si vos
besoins sont modestes, un
peu long puisqu’il vous faut
expliquer en longueur ce que
vous voulez tirer de l’API. Au
final vous obtenez les clés de
votre accès à l’API de Twitter
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Obtenir un accès officiel à l’API de Twitter (2/3)
124EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Obtenir un accès officiel à l’API de Twitter (3/3)
125EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Pour en savoir plus…
126EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Quelques ressources Web
◼ https://www.mindmeister.com/fr/88482291/twitter-tools-directory
◼ https://www.labnol.org/internet/twitter-guide-do-everything-with-
twitter/4916/
◼ https://buffer.com/library/free-twitter-tools/
◼ https://docs.google.com/spreadsheets/d/18rtqh8EG2q1xBo2cLNyhIDuK9jrP
GwYr9DI2UncoqJQ/edit#gid=1700243466
127EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Autres outils intéressants
128EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Chorus Project
◼ Chorus Project
►Utilise l’API Twitter (compte développeur
à créer sur https://dev.twitter.com)
►Chorus-TCD (TweetCatcher Desktop),
gratuit sur demande
• Scraping de recherches
►Chorus-TCW (TweetCatcher Web) : usage
réservé aux universitaires
►Chorus-TV (TweetVis) : usage réservé aux
universitaires
• Timeline Explorer
• Cluster Explorer
129
Chorus-TCD
Chorus-TCW, Chorus-TV
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Tweepy
◼ Tweepy est une librairie
permettant d’interagir
avec Twitter aussi bien
pour poster que pour
récupérer des
informations.
►Nécessite des clés pour
accéder à l’API Twitter
►Nécessite de coder toutes
ses propres programmes
en Python, appelant la
librairie
◼ Doc :
http://docs.tweepy.org/
en/latest/
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 130
TwiiterSearch2Gephi
◼ TwitterSearch2Gephi est une
application Windows CLI qui vous
permet de collecter des données
sur les réseaux sociaux et de les
convertir en un ensemble de
données CSV pouvant être utilisé
avec Gephi.
◼ Votre ordinateur doit être équipé
de .NET
◼ Actuellement, il prend en charge
►Twitter
►Reddit
►Youtube
►Domaines WWWn URL
◼ Le dossier doit se trouver à la
racine du disque C:
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 131
Quelques outils « recalés »
132EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
BotSight
◼ BotSight (Norton) est
une extension pour
navigateur qui
entend détecter les
robots Twitter à
partir d’un vingtaine
de critères.
►Inadapté à l’actuelle
interface de Twitter :
seuls les comptes cités
dans un tweet sont
détectés (pas le
compte émetteur)
►L’évaluation (ici de
Michael Lomüller) est
fantaisiste.
133
A lire : Introducing BotSight: A New Tool to Detect Bots on Twitter in Real-Time (NortonLifeLock, 2020)
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
SocioViz
◼ SocioViz
►Recherche
ponctuelle (gratuit)
ou récurrente
(payant)
►Résultats :
• Utilisateurs les plus
actifs sur une
recherche
• Réseau de mots
• Réseau
d’utilisateurs (liens
par mentions ou
retweets, grosseur
du point en fonction
des citations ou
retweets)
• Réseau d’emoji
• Réseau de hashtags
(reliés si co-
présence)
►Limites de la
version gratuite
• 100 tweets pour
chaque requêtes
• 1 semaine de
profondeur
• Top 10 des hashtags
►Export possible
134
A lire : Tutoriel | Tutoriel avancé | Tarifs
EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Export Comments
◼ Export Comments… exporte les
commentaires d’un tweet
►Export Excel très propre
►Mais limité à 100 dans a version gratuite
►Les versions payantes sont chères !
135EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Sleeping Time
◼ Sleeping Time analyse les 1000 derniers tweets et détermine les heures de
sommeil de son/sa propriétaire à partir des plages où il/elle tweete le
moins. Nécessite une connexion à votre compte. Ne détecte pas le fuseau
horaire !
136EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
SocialBearing
◼ SocialBearing : puissantes analyses de comptes, mais version gratuite très
limitée et version payante plus que chères !
137EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Tinfoleak
◼ Tinfoleak (script Python nécessitant des clés pour l’API Twitter)
►Incompatible avec Python 3)
►Pas mise à jour depuis le 04/09/2018
138EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Twitter Audit
◼ Twitter Audit : analyse la possibilité qu’un
compte soit faux ou de mauvaises qualité.
◼ Aucune précision sur les algorithmes
utilisés !
139EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Surplus
140EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
◼ https://developer.twitter.com/en/docs/tutorials/filtering-tweets-by-
location
◼ https://developer.twitter.com/en/docs/twitter-api/v1/data-
dictionary/overview/geo-objects
◼ https://help.twitter.com/fr/safety-and-security/tweet-location-settings
141EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Intérêts des API « Premium »
et « Entreprises »
142EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
◼ https://developer.twitter.com/en/docs/twitter-
api/v1/tweets/search/guides/premium-operators
◼ https://developer.twitter.com/en/docs/twitter-api/v1/tweets/filter-
realtime/overview/powertrack-api
143EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Prix
◼ https://developer.twitter.com/en/pricing/search-30day
144EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
Serge Courrier
◼ Formateur (depuis 1996)
► Intervenant à l’École Européenne d’Intelligence
Économique (EEIE) depuis sa création, il y enseigne
les outils et méthodologies de veille, les réseaux et
médias sociaux, la visualisation de données,
l’OSINT/SOCMINT/OSINT, etc.
► Il intervient également à l’association des
professionnels de l’information (ADBS), à l’Institut
national de l’audiovisuel (INA), à l’Ecole des
bibliothécaires et documentalistes (EBD, assure
également la formation des rédactions et
documentalistes de France Télévisions, etc.
◼ Consultant (depuis 2005)
► Il intervient auprès d’entreprises et d’organismes
publics, pour développer leurs outils et stratégies de
recherche et de veille, ainsi que leurs usages
avancés d’Internet et notamment du Web 2.0.
◼ Ex-Journaliste spécialisé
► Il a traité entre 1990 et 2014 de sujets liés à
Internet et à l’Intelligence économique pour des
magazines spécialisés et grand public. A
précédemment occupé les postes de rédacteur en
chef adjoint de Génie Industriel, Science et Vie
Micro (SVM) et Micro Hebdo.
◼ Créée en 2005, l’Ecole européenne
d’intelligence économique (EEIE) est la
seule école habilitée en France à remettre
le titre d’État de « Consultant(e) en
Intelligence Économique », enregistré au
Répertoire National des Certifications
Professionnelles (RNCP).
◼ L’école est située à Versailles.
◼ Retrouvez nos Webinars en Replay sur
notre site : www.eeie.fr/webinars/
145EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►

Contenu connexe

Tendances

Améliorez l'impact de vos présentations
Améliorez l'impact de vos présentationsAméliorez l'impact de vos présentations
Améliorez l'impact de vos présentations
OpenClassrooms
 
Telecharger Exercices corrigés PL/SQL
Telecharger Exercices corrigés PL/SQLTelecharger Exercices corrigés PL/SQL
Telecharger Exercices corrigés PL/SQL
webreaker
 
Initiation r
Initiation rInitiation r
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
Yassine Badri
 
Introduction aux bases de données NoSQL
Introduction aux bases de données NoSQLIntroduction aux bases de données NoSQL
Introduction aux bases de données NoSQL
Antoine Augusti
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
Lilia Sfaxi
 
LES JOINTURES
LES JOINTURESLES JOINTURES
LES JOINTURES
danaobrest
 
pandas - Python Data Analysis
pandas - Python Data Analysispandas - Python Data Analysis
pandas - Python Data Analysis
Andrew Henshaw
 
Tp1 - OpenERP (1)
Tp1 - OpenERP (1)Tp1 - OpenERP (1)
Tp1 - OpenERP (1)
Lilia Sfaxi
 
Etl -
Etl -Etl -
Conception datawarehouse
Conception datawarehouseConception datawarehouse
Conception datawarehouse
Hassane Dkhissi
 
SeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQLSeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQLParis, France
 
Présentation de Django @ Orange Labs (FR)
Présentation de Django @ Orange Labs (FR)Présentation de Django @ Orange Labs (FR)
Présentation de Django @ Orange Labs (FR)
Martin Latrille
 
Introduction à l'IoT: du capteur à la donnée_Presentation Mix-IT2015
Introduction à l'IoT: du capteur à la donnée_Presentation Mix-IT2015Introduction à l'IoT: du capteur à la donnée_Presentation Mix-IT2015
Introduction à l'IoT: du capteur à la donnée_Presentation Mix-IT2015
Sameh BEN FREDJ
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
Lilia Sfaxi
 
Cours partie1 elgarrai zineb
Cours partie1 elgarrai zinebCours partie1 elgarrai zineb
Cours partie1 elgarrai zineb
Zineb ELGARRAI
 
LUP IRT 2021_2022 - Cours - Programmation Python (Partie I).pdf
LUP IRT 2021_2022 - Cours - Programmation Python (Partie I).pdfLUP IRT 2021_2022 - Cours - Programmation Python (Partie I).pdf
LUP IRT 2021_2022 - Cours - Programmation Python (Partie I).pdf
RedaBelattar
 
Cours JavaScript
Cours JavaScriptCours JavaScript
Cours JavaScript
Olivier Le Goaër
 
Une introduction à HBase
Une introduction à HBaseUne introduction à HBase
Une introduction à HBase
Modern Data Stack France
 

Tendances (20)

Améliorez l'impact de vos présentations
Améliorez l'impact de vos présentationsAméliorez l'impact de vos présentations
Améliorez l'impact de vos présentations
 
Telecharger Exercices corrigés PL/SQL
Telecharger Exercices corrigés PL/SQLTelecharger Exercices corrigés PL/SQL
Telecharger Exercices corrigés PL/SQL
 
Initiation r
Initiation rInitiation r
Initiation r
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
 
Introduction aux bases de données NoSQL
Introduction aux bases de données NoSQLIntroduction aux bases de données NoSQL
Introduction aux bases de données NoSQL
 
Présentation bi 1.0
Présentation bi 1.0Présentation bi 1.0
Présentation bi 1.0
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
LES JOINTURES
LES JOINTURESLES JOINTURES
LES JOINTURES
 
pandas - Python Data Analysis
pandas - Python Data Analysispandas - Python Data Analysis
pandas - Python Data Analysis
 
Tp1 - OpenERP (1)
Tp1 - OpenERP (1)Tp1 - OpenERP (1)
Tp1 - OpenERP (1)
 
Etl -
Etl -Etl -
Etl -
 
Conception datawarehouse
Conception datawarehouseConception datawarehouse
Conception datawarehouse
 
SeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQLSeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQL
 
Présentation de Django @ Orange Labs (FR)
Présentation de Django @ Orange Labs (FR)Présentation de Django @ Orange Labs (FR)
Présentation de Django @ Orange Labs (FR)
 
Introduction à l'IoT: du capteur à la donnée_Presentation Mix-IT2015
Introduction à l'IoT: du capteur à la donnée_Presentation Mix-IT2015Introduction à l'IoT: du capteur à la donnée_Presentation Mix-IT2015
Introduction à l'IoT: du capteur à la donnée_Presentation Mix-IT2015
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
Cours partie1 elgarrai zineb
Cours partie1 elgarrai zinebCours partie1 elgarrai zineb
Cours partie1 elgarrai zineb
 
LUP IRT 2021_2022 - Cours - Programmation Python (Partie I).pdf
LUP IRT 2021_2022 - Cours - Programmation Python (Partie I).pdfLUP IRT 2021_2022 - Cours - Programmation Python (Partie I).pdf
LUP IRT 2021_2022 - Cours - Programmation Python (Partie I).pdf
 
Cours JavaScript
Cours JavaScriptCours JavaScript
Cours JavaScript
 
Une introduction à HBase
Une introduction à HBaseUne introduction à HBase
Une introduction à HBase
 

Similaire à Webinar EEIE #09 : Investigations sur Twitter

Webinar EEIE #04 - Investigations sur Facebook
Webinar EEIE #04 - Investigations sur FacebookWebinar EEIE #04 - Investigations sur Facebook
Webinar EEIE #04 - Investigations sur Facebook
Groupe EEIE
 
Modèle d'une plateforme de veille visant à automatiser la rediffusion de l'in...
Modèle d'une plateforme de veille visant à automatiser la rediffusion de l'in...Modèle d'une plateforme de veille visant à automatiser la rediffusion de l'in...
Modèle d'une plateforme de veille visant à automatiser la rediffusion de l'in...
Serge Courrier
 
Atelier Faire rayonner un évènement sur les médias sociaux et focus sur le li...
Atelier Faire rayonner un évènement sur les médias sociaux et focus sur le li...Atelier Faire rayonner un évènement sur les médias sociaux et focus sur le li...
Atelier Faire rayonner un évènement sur les médias sociaux et focus sur le li...
Audrey Bardon
 
Conference IIM - TLD 28072023.pdf
Conference IIM - TLD 28072023.pdfConference IIM - TLD 28072023.pdf
Conference IIM - TLD 28072023.pdf
Tanguy Le Duff
 
ISCOM::HTML/CSS::session1 (20140930)
ISCOM::HTML/CSS::session1 (20140930)ISCOM::HTML/CSS::session1 (20140930)
ISCOM::HTML/CSS::session1 (20140930)
Nicolas Aguenot
 
Rebuild 2018 - Comment faire un bon Chatbot avec Microsoft Luis et Bot Builder
Rebuild 2018 - Comment faire un bon Chatbot avec Microsoft Luis et Bot BuilderRebuild 2018 - Comment faire un bon Chatbot avec Microsoft Luis et Bot Builder
Rebuild 2018 - Comment faire un bon Chatbot avec Microsoft Luis et Bot Builder
Vincent Guigui
 
L’actualité High-Tech de la semaine : WordPress, BitAngels, Blekko, Google et...
L’actualité High-Tech de la semaine : WordPress, BitAngels, Blekko, Google et...L’actualité High-Tech de la semaine : WordPress, BitAngels, Blekko, Google et...
L’actualité High-Tech de la semaine : WordPress, BitAngels, Blekko, Google et...
Phil Jeudy
 

Similaire à Webinar EEIE #09 : Investigations sur Twitter (7)

Webinar EEIE #04 - Investigations sur Facebook
Webinar EEIE #04 - Investigations sur FacebookWebinar EEIE #04 - Investigations sur Facebook
Webinar EEIE #04 - Investigations sur Facebook
 
Modèle d'une plateforme de veille visant à automatiser la rediffusion de l'in...
Modèle d'une plateforme de veille visant à automatiser la rediffusion de l'in...Modèle d'une plateforme de veille visant à automatiser la rediffusion de l'in...
Modèle d'une plateforme de veille visant à automatiser la rediffusion de l'in...
 
Atelier Faire rayonner un évènement sur les médias sociaux et focus sur le li...
Atelier Faire rayonner un évènement sur les médias sociaux et focus sur le li...Atelier Faire rayonner un évènement sur les médias sociaux et focus sur le li...
Atelier Faire rayonner un évènement sur les médias sociaux et focus sur le li...
 
Conference IIM - TLD 28072023.pdf
Conference IIM - TLD 28072023.pdfConference IIM - TLD 28072023.pdf
Conference IIM - TLD 28072023.pdf
 
ISCOM::HTML/CSS::session1 (20140930)
ISCOM::HTML/CSS::session1 (20140930)ISCOM::HTML/CSS::session1 (20140930)
ISCOM::HTML/CSS::session1 (20140930)
 
Rebuild 2018 - Comment faire un bon Chatbot avec Microsoft Luis et Bot Builder
Rebuild 2018 - Comment faire un bon Chatbot avec Microsoft Luis et Bot BuilderRebuild 2018 - Comment faire un bon Chatbot avec Microsoft Luis et Bot Builder
Rebuild 2018 - Comment faire un bon Chatbot avec Microsoft Luis et Bot Builder
 
L’actualité High-Tech de la semaine : WordPress, BitAngels, Blekko, Google et...
L’actualité High-Tech de la semaine : WordPress, BitAngels, Blekko, Google et...L’actualité High-Tech de la semaine : WordPress, BitAngels, Blekko, Google et...
L’actualité High-Tech de la semaine : WordPress, BitAngels, Blekko, Google et...
 

Plus de Groupe EEIE

Webinar EEIE #11 : Lobbying et éthique
Webinar EEIE #11 : Lobbying et éthiqueWebinar EEIE #11 : Lobbying et éthique
Webinar EEIE #11 : Lobbying et éthique
Groupe EEIE
 
Webinar EEIE #10 : Fake News dans le monde de l'information professionnelle
Webinar EEIE #10 : Fake News dans le monde de l'information professionnelleWebinar EEIE #10 : Fake News dans le monde de l'information professionnelle
Webinar EEIE #10 : Fake News dans le monde de l'information professionnelle
Groupe EEIE
 
SNA - NodeXL (2020)
SNA - NodeXL (2020)SNA - NodeXL (2020)
SNA - NodeXL (2020)
Groupe EEIE
 
Support de présentation EECS
Support de présentation EECSSupport de présentation EECS
Support de présentation EECS
Groupe EEIE
 
Webinar EEIE #07 : Droit du Secret des Affaires
 Webinar EEIE #07 : Droit du Secret des Affaires Webinar EEIE #07 : Droit du Secret des Affaires
Webinar EEIE #07 : Droit du Secret des Affaires
Groupe EEIE
 
Webinar EEIE #08 : Le RGPD
Webinar EEIE #08 : Le RGPDWebinar EEIE #08 : Le RGPD
Webinar EEIE #08 : Le RGPD
Groupe EEIE
 
Webinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataWebinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la data
Groupe EEIE
 
Webinar EEIE #05 - Cybersécurité : Best Practices
Webinar EEIE #05 - Cybersécurité : Best PracticesWebinar EEIE #05 - Cybersécurité : Best Practices
Webinar EEIE #05 - Cybersécurité : Best Practices
Groupe EEIE
 
Webinar EEIE #03 : L'Intelligence Financière à la portée de tous
Webinar EEIE #03 :  L'Intelligence Financière à la portée de tousWebinar EEIE #03 :  L'Intelligence Financière à la portée de tous
Webinar EEIE #03 : L'Intelligence Financière à la portée de tous
Groupe EEIE
 

Plus de Groupe EEIE (9)

Webinar EEIE #11 : Lobbying et éthique
Webinar EEIE #11 : Lobbying et éthiqueWebinar EEIE #11 : Lobbying et éthique
Webinar EEIE #11 : Lobbying et éthique
 
Webinar EEIE #10 : Fake News dans le monde de l'information professionnelle
Webinar EEIE #10 : Fake News dans le monde de l'information professionnelleWebinar EEIE #10 : Fake News dans le monde de l'information professionnelle
Webinar EEIE #10 : Fake News dans le monde de l'information professionnelle
 
SNA - NodeXL (2020)
SNA - NodeXL (2020)SNA - NodeXL (2020)
SNA - NodeXL (2020)
 
Support de présentation EECS
Support de présentation EECSSupport de présentation EECS
Support de présentation EECS
 
Webinar EEIE #07 : Droit du Secret des Affaires
 Webinar EEIE #07 : Droit du Secret des Affaires Webinar EEIE #07 : Droit du Secret des Affaires
Webinar EEIE #07 : Droit du Secret des Affaires
 
Webinar EEIE #08 : Le RGPD
Webinar EEIE #08 : Le RGPDWebinar EEIE #08 : Le RGPD
Webinar EEIE #08 : Le RGPD
 
Webinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataWebinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la data
 
Webinar EEIE #05 - Cybersécurité : Best Practices
Webinar EEIE #05 - Cybersécurité : Best PracticesWebinar EEIE #05 - Cybersécurité : Best Practices
Webinar EEIE #05 - Cybersécurité : Best Practices
 
Webinar EEIE #03 : L'Intelligence Financière à la portée de tous
Webinar EEIE #03 :  L'Intelligence Financière à la portée de tousWebinar EEIE #03 :  L'Intelligence Financière à la portée de tous
Webinar EEIE #03 : L'Intelligence Financière à la portée de tous
 

Webinar EEIE #09 : Investigations sur Twitter

  • 1. Investigations sur Twitter Introduction aux méthodes et outils légers EEIE } Webinar #09 19 novembre 2020 } Serge Courrier Respectons les auteurs !
  • 2. Sommaire ◼ Préparer son navigateur ◼ Rechercher ◼ Outils tiers (simples) en ligne ◼ Boîtes à outils ◼ Analyse de graphes ◼ Scripts Python ◼ Logiciels (payants) ◼ Outils de veille ◼ Annexes ►Autres solutions payantes ►Requérir un accès à l’API Twitter ►Pour en savoir plus… ►Autres outils intéressants ►Quelques outils recalés ►Surplus… EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 2
  • 3. Préparer son navigateur 3EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 4. Préparer son navigateur Chrome & Co ◼ Gestionnaire d’extensions ►Nooboss ◼ Préserver les onglets et les fenêtres de son navigateur entre deux sessions ►Tab Session Manager ◼ Scroller automatiquement une page ►Simple Autoscroll ◼ Sauvegarder proprement une page Web au format numérique ►Save Page WE (se placer en bas de la page) ou SingleFile Firefox ◼ Préserver les onglets et les fenêtres de son navigateur entre deux sessions ►Tab Session Manager ◼ Sauvegarder vers la WayBack Machine ou accéder à une page archivée ►Wayback Machine ◼ Scroller automatiquement une page ►FoxScroller ◼ Sauvegarder proprement une page Web au format numérique ►Save Page WE (se placer en bas de la page) ou SingleFile EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 4
  • 5. Rechercher 5EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 6. Travailler son lexique avec soin (non ce n’est pas si évident !) 6EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 7. Soigner le lexique 7 gilets jaunes à Toulouse Le questionnement est simple ? Et pourtant… EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 8. Champs lexicaux dans Twitter Notion 1 : gilets jaunes Notion 2 : Toulouse "gilet jaune" Toulouse "gilets jaunes" Toulousain #giletjaune Toulousains #giletsjaunes Toulousaine #gj Toulousaines Capitole "ville rose" 8EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 9. Requête résultante 9 "gilet jaune OR "gilets jaunes" OR #giletjaune OR #giletsjaunes OR #gj toulouse OR toulousain OR toulousains OR toulousaine OR toulousaines OR capitole OR "ville rose" -weed –cocaine -cannabis EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 10. En résumé 1. Se mettre à la place des personnes qui rédigent les tweets 2. Lister le lexique qu’ils peuvent utiliser pour décrire ce qui vous intéresse (et y revenir à plusieurs reprises pour l’enrichir) 3. Ne pas oublier le féminin et le pluriel des mots, le jargon, les sigles… 4. Ne pas oublier que les groupes nominaux sont concaténés lorsqu’ils se retrouvent intégrés dans des hashtags 5. Être à l’affut de l’évolution des hashtags 10EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 11. Maîtriser la syntaxe de recherche avancée …et ses subtilités ! 11EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 12. Comptes et listes 12 ◼ @compte : citant ce compte ◼ from:secou : émis par @secou ◼ from:secou OR from:crid : produits par @secou ou @crid ◼ -from:secou : sauf les tweets émis par @secou ◼ to:secou : destinés à @secou ◼ filter:verified : comptes vérifiés (calicot bleu) ◼ filter:news : comptes de médias, de journalistes identifiés, ou pointant vers de sites Web de médias ◼ -filter:news : utile pour faire émerger des tweets « grand public » ◼ -filter:news –filter:verified ◼ list:908341978005458944 : tweets émis par des membres de la liste (le numéro de la liste apparait dans l’URL de la liste) ◼ filter:follows : comptes auxquels vous êtes abonné.e EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 13. Nature du tweet 13 ◼ filter:replies : réponse ◼ filter:nativeretweets : retweets ◼ filter:quote : dans le commentaire d’un tweet ◼ quoted_tweet_id:1138631847783608321 : commentaires d’un tweet dont l’ID est 1138631847783608321 (l’ID d’un tweet apparaît dans l’URL du tweet, une fois isolé) ◼ quoted_user_id:11348282 : commentaires de tweets émis par un compte dont l’ID est 11348282 (voir plus loin pour savoir comment identifier l’ID d’un compte) EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 14. Opérateurs orientés médias 14 ◼ filter:images : fichiers images ◼ card_name:animated_gif : gif animés ◼ filter:videos : fichiers vidéos (dont partages YouTube…) ◼ filter:native_video : fichiers vidéos (sans partages YouTube…) ◼ filter:vine : vidéos publiés via l’app Vine (abandonnée en octobre 2016 (mais les archives sont toujours accessible) ◼ filter:periscope OR card_domain:pscp.tv OR url:twitter.com/i/broadcasts/ : videos tournées en direct et archivées EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 15. Opérateurs temporels 15 ◼ until:2019-06-23 : jusqu’à ◼ since:2018-05-12 : depuis ◼ since:2018-05-12 until:2019-06-23 : entre deux dates ◼ Mais aussi… EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 16. Opérateurs temporels 16 ◼ À la seconde près ? ◼ Vraiment ? ◼ until_time:1569483022 : jusqu’au 26 septembre 2019 à 07:30:22 ◼ since_time:1569470400 : jusqu’au 26 septembre 2019 à 07:30:22 EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 17. Recherche sur Twitter en précisant une heure 17 lubrizol until_time:1569470400 Heure Unix (UTC) Epoch Converter Requête finale : lubrizol filter:native_video until_time:1569470400 exclude:retweets (classée avec l’onglet « Récent) Attention à s’adapter au fuseau horaire du lieu L’opposé de until_time: ? since_time: Merci à Giovanni Nazzaro pour la piste ! EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 18. Localisation 18 ◼ ATTENTION : La plupart des tweets ne sont plus géolocalisés ! La recherche s’effectue surtout sur les localisations des comptes (dans la biographie)… ce qui limite de beaucoup son intérêt ! ◼ near:paris ◼ near:paris within:15km ◼ near:florida ◼ near:lebanon ◼ geocode:37.7764685,-122.4172004,10km : 10 km autour de San Francisco EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 19. Engagement 19 ◼ min_retweets:25 ◼ min_faves:30 ◼ min_replies:100 ◼ -min_retweets:25 ◼ -min_faves:30 ◼ -min_replies:100 EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 20. Autres opérateurs intéressants 20 ◼ lang:fr OR lang:en : 47 langues disponibles ► ◼ url:cia.gov : même si l’URL twittée a été raccourcie (bit.ly, buff.ly, ift.tt…) ◼ url:data : un élément dans l’URL ◼ filter:links : trouver des tweets pointant vers des URL ◼ 📢 : emojis et émoticons ◼ ‫ن‬ : recherche par caractères (dans le tweet ou le nom de l’utilisateur) EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 21. Pour en savoir plus… ◼ L’énorme recueil d’Igor Brigadir (surGitHub) : Advanced Search on Twitter 21EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 22. Travailler sur les URL EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 22
  • 23. Travailler sur les URL 23 ◼ Les éléments à ajouter à l’URL d’un compte ◼ media : https://twitter.com/realdonaldtrump/media ◼ likes : https://twitter.com/realdonaldtrump/likes EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 24. Outils tiers (simples) en ligne Si votre OPSEC n’est pas trop stricte ! 24EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 25. Trouver le Twitter ID 25EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 26. Find Twitter ID ◼ Trouve l’identifiant d’un compte (utile dans certains services) ►Find Twitter ID ►TweetrID ►GetTwitterID ◼ Pour connaître le compte derrière un user_id : https://twitter.com/ intent/user?user_id =2622731 26EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 27. 3 stratégies de sourcing à ne pas négliger (parmi tant d’autres) 27EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 28. Stratégies de sourcing ◼ Followerwonk (Search Bios) ►Compte les plus populaires contenant des mots particuliers dans leur bio ►Version gratuite : • 50 recherches par jour • 100 réponses par page • Pas d’export des résultats ◼ Parcourir les abonnements d’un compte ◼ Chercher et parcourir des listes ►site:twitter.com/*/lists/* intitle:privacy 28 Possible recherche par pays ou ville (si indiqué dans le profil) Classement par défaut : nombre d’abonnés décroissant. Par « Social Authority » : algo maison, proche de Klout. Usage de « | » à la place de l’opérateur booléen « OR » et du « - » à la place du « NOT » EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 29. Analyser un compte 29EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 30. Twitonomy : une vision d’ensemble ◼ Twitonomy (analyse statistique d’un compte, gratuit, nécessite la connexion à son compte) ►[+++] Heures et jours d’utilisation ►[+++] Outils de publications utilisés ►[+++] Hashtags les plus utilisés ►[+++] Comptes les plus retweetés, les plus mentionnés, les plus commentés 30 Profile A lire : détail de la version payante (19$/mois) EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 31. SparkScore de SparkToro ◼ SparkScore : évaluation transparente de la « réputation » d’un compte 31EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 32. Allegedly ◼ Allegedly : détecte les différents outils utilisés par un compte pour tweeter et leur utilisation dans le temps (pendant les 15 derniers jours) 32EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 33. Spoonbill : changements dans les bios ◼ Spoonbill : suivre l’évolution de la bio des comptes que l’on suit et consulter l’historique de modification de la bio de n’importe quel compte. 33 Par mail quotidien : tous les changements dans les bios des personnes que vous suivez En ligne : l’historique des changements de bio de n’importe quel compte https://spoonbill.io/twitter/data/OSINTtechniques/ EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 34. Détecter les abonnés douteux ? Robots ? Sock puppets ? 34EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 35. SparkScore : Fake Followers Audit ◼ SparkToro Fake Followers Audit ►Attention : l’analyse porte sur des caractéristiques qui ne sont pas nécessairement des marqueurs de faux abonnés ! 35EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 36. Botometer ◼ Botometer (détection de robots) ►Attention : l’analyse porte sur des caractéristiques qui ne sont pas nécessairement des marqueurs de faux abonnés ! 36EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 37. BotSlayer ◼ BotSlayer [Beta] (Indiana University) : outil (à héberger) de détection de robots ◼ Tutoriel ◼ BotSlayer-CE sur GitHub 37 Hoaxy BotSlayer EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 38. Indices lors d’une analyse directe d’un compte ◼ Photo de profil ►Image de stock ? ►Image générée par IA ? ◼ Nom d’utilisateur ►Plein de numéros ? ◼ Fréquence de publication ►Surhumaine ? ◼ Timing de publication ►Pas de pause pour le sommeil ? ◼ Abonnements/abonnés ►Beaucoup d’abonnements, très peu d’abonnés ? ◼ Contenus répétitifs ►Une seule thématique ►Publié à l’identique par d’autres comptes 38EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► A lire : If you follow me, I’ll OSINT you (Matthias Wilson, a.k.a. @mwosint, 2020), West Papua: New Online Influence Operation Attempts to Sway Independence Debate (Benjamin Strick, a.k.a. @BenDoBrown, 2020)
  • 39. Lister et comparer des abonnés, abonnements, tweets 39EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 40. TweepDiff ◼ TweepDiff ►Abonnés ou abonnements en commun entre plusieurs comptes • Exemple : faire émerger des sources d’informations communes à plusieurs acteurs d’un même secteur. • Exemple : faire émerger les abonnés communs aux comptes appartenant à une même communauté ►Pas d’export 40EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 41. All my Tweets ◼ All My Tweets : pour un compte quelconque affichage rapide, sur une seule page de (au choix) : ►ses tweets (les 3200 derniers) ►son fil d’actualité (les 800 derniers) ►ses « likes » ►ses abonnés ►ses abonnements 41EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 42. Twiangulate ◼ Twiangulate Search (nécessite l’identification via son compte) ◼ Travaille sur deux comptes et fournit ►les abonnement communs ►les abonnés communs ►les 100 abonnés communs dont la portée des tweets est la plus grande ◼ Sur un compte ►Les abonnés à un compte contenant le/les mêmes mots dans leur bio EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 42
  • 43. doesfollow ◼ Doesfollow : est-ce que tel compte est abonné à tel compte ? (nécessite la connexion de son compte au service) 43EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 44. First Follower ◼ First Follower : fournit le premier abonné à un compte (qui ne se soit pas désabonné) 44EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 45. Mesurer les tendances 45EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 46. SMAT (Social Media Analysis Tool) ◼ SMAT : conçu par la fondation Mozilla ►Recherche sur Twitter, mais aussi sur Reddit, 4chan, 8kun) ►Borne temporelle large (plusieurs années) ►Export CSV ►Très fréquemment surchargé ◼ Fonctions ►Timeline : évolution de l’usage d’un mot dans un tweet pendant une période de temps ►Hashtag : hashtags associés à un hashtag sur une période de temps ►Link Counter : liens associés à un mot ►Activity : affiche les comptes ayant le plus utilisé ce mot sur une période donnée 46 Exemple : holdup, RealDonalTrump (inbound graph) | Explications EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 47. Trends24 ◼ Trends24 : accès aux tendances mondiales, par pays et grandes villes 47EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 48. TrendsMap ◼ TrendsMap (freemium) : tendances (hashtags, compte, mots) sur une carte (7 jours) 48EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 49. Se pencher sur les hashtags 49EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 50. Hashtagify ◼ Hashtagify (freemium) ►Version gratuite • Index de popularité d’un hashtag • Hashtags associés • Pays d’utilisation • Evolution sur 8 semaines • Comptes les plus influents • Langues les plus utilisées • Nombre de requêtes limité 50EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 51. onemilliontweetmap ◼ #onemilliontweetmap : localisation mondiale de tweets sur 24 heures contenant un mot ou hashtag particulier (temps réel ou lors d’une période particulière). Possibilité de comparaison entre deux tweets. Vision très partielle au vu de résultats obtenus en novembre 2020 sur #biden #trump et #holdup. 51EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 52. Evaluer la diffusion d’une URL 52EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 53. CrowdTangle ◼ La plateforme CrowdTangle (Facebook) est connue pour sa capacité à analyser les publications Facebook, mais propose également l’extension CrowdTangle Link Checker pour Chrome qui fournit des statistiques de partage d’une URL sur Twitter. Nécessite une identification sur un compte Facebook. L’export des données au format CSV ne concerne que les interactions sur Facebook. 53EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 54. Prendre en charge images et vidéos 54EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 55. Télécharger le format original d’une photo ◼ Dans cet exemple… ►clic sur la photo ►Clic droit > « Ouvrir l’image dans un nouvel onglet » (Chrome) ou « Afficher l’image » (Firefox) ►Clic droit > Enregistrer l’image sous ►Changer « .jfif » en « .jpg » 55EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 56. DownAlbum ◼ DownAlbum ►Extension Chrome permettant de récupérer les images (et les vignettes des vidéos) publiées par un compte. ►Sauvegarde simple par « Ctrl+S » en choisissant le format « Page Web complète ». ►Limite : ne prend que la page affichée dans le navigateur donc peut nécessiter l’emploi d’une extension de scroll automatique. ►L’export « Photos URL », au format texte, permet (après nettoyage) d’obtenir adresses et dates de publication des images et vidéos ►Attention, si l’image est supprimée du compte, le lien ne fonctionne plus, mais identifie tout de même le compte. 56EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 57. DownloadTwitterVideo ◼ Attention : aucune métadonnée d’horodatage ni de géolocalisation. ◼ FBDown ►extension Chrome permettant de télécharger une vidéo particulière. Sinon, pour Firefox et autres, coller l’adresse de la vidéo sur le site fbdown.net ◼ Video Downloader Ultimate (Chrome) ◼ Video DownloadHelper ►Chrome, Firefox ◼ DownloadTwitterVideo ►Télécharge la vidéo en fournissant l’URL du tweet. 57EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 58. Métamoteur de recherche inversée ◼ Search By Image (extension pour Firefox, Chrome/Brave et Opera) ►Interroge ou pointe vers 21 moteurs de recherche inversée. ►Il est possible d’ordonnancer et d’activer/désactiver les moteurs. 58EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 59. Autres outils recherche inversée ◼ Moteurs ►Google Images ►Tineye ►Yandex Images (ru) ►Baidu Image Search (cn) ◼ Extensions pour navigateurs ►[+++] NooBox • Extension pour Chrome/Brave • Affiche sur une seule page les réponses de Google Images, Yandex, Bing, Baidu, Tineye, IQBD, SauceNao • Impossible de désactiver certains moteurs (Baidu, par exemple) ►[+++] InVid Verification Plugin ►RevEye Reverse Image Search • Extension pour Chrome/Brave et Firefox • Interroge Google, Bing, Yandex et TinEye ►Fast Image Research • Extension pour Chrome/Brave • Interroge Tineye et Google Image (à préciser dans les options) 59EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 60. Moteurs de recherche inversés sur mobiles ◼ iPhone ►Reverse Image Search App ◼ Android ►Search by Image Interroge Google Images, Tineye, Yandex, Bing et Baidu 60 Interroge Google Images, Tineye et Yandex EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 61. Retrouver des tweets effacés 61EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 62. Tweets effacés ◼ Politwoops : tweets supprimés par des personnalités politiques dans le monde entier et pays par pays ! ►Afficher les tweets supprimés dans certains pays (beaucoup de filtres une fois que l’on a cliqué sur « View all deleted tweets » en bas de la page) ►Recevoir un mail si des tweets supprimés contiennent un mot particulier (dans le monde entier, dans un pays particulier, par une personne particulière) ◼ Fallait pas supprimer ►Compte français, non limité aux politiques. 62EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 63. Trouver des tweets effacés ◼ WayBack Machine ►https://web.archive.org/web/*/twitte r.com/{nom d’utilisateur} ►https://web.archive.org/web/*/twitte r.com/{nom d’utilisateur}/likes ◼ Le cache Google (ou simplement le texte du tweet sous le lien) ►site:twitter.com/{nom d’utilisateur}/status/* ► {requête} site:twitter.com/*/status/* Essai avec des personnes aynt publié récemment "deleted all my tweets" filter:verified ◼ Etudier les réponses ou les tweets adressés à la personne pour en comprendre le sens, voir trouver une copies d’écran 63EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 64. Premier tweet 64EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 65. Premier tweet ◼ First Tweet (basé sur le projet de labnol ci-dessous) fournit le premier tweet contenant un mot. ►Souvent surchargé ◼ Who Tweeted it First ►Lent et pas toujours efficace 65EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 66. Extraction 66EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 67. Twlets ◼ Twlets (extension Chrome) : export Excel des derniers tweets, retweets et réponses d’un compte Twitter (payant, 1000 crédits disponibles au début). ◼ Récupération max de 3200 tweets. ◼ Pour chaque tweet est indiqué ►La date de création du tweet ►Le texte du tweet (sans l’éventuel lien inclus) ►Son ID ►Le lien pointant vers le tweet ►Les liens pointant vers les médias associés ►Le nombre de fois où il a été « liké » • (jusqu’à 15 000) ►Le nombre de fois où il a été retweeté et le nom du compte à partir duquel un tweet à été retweeté • (jusqu'à 3200). 67 Après installation de l’extension, clic droit sur l’icône puis « option » pour la configurer. EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 68. Visualiser les discussions 68EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 69. Treeverse ◼ Treeverse : graphe de discussions (sans export possible) : Firefox, Chrome 69 Test : exemple de tweet à analyser EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 70. Boîtes à outils 70EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 71. TweetBeaver ◼ TweetBeaver (demande une connexion avec votre compte Twitter). Présentation à l’écran ou téléchargement au format CSV. 71 200 derniers tweets 200 derniers tweets 3 200 derniers tweets 3 200 derniers tweets 90 000 comptes 5 000 comptes10 000 comptes 10 000 comptes 5 000 comptes 3 200 derniers tweets EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 72. Analyse de graphes 72EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 73. Hoaxy (1/2) : requêtes ◼ Hoaxy (bêta) récupère les résultats d’une requête sur les 7 derniers jours pour un maximum de 1000 comptes. ◼ Plus les ronds sont grands plus le compte a été retweeté. ◼ Les points rouges représentent les comptes qui sont certainement des robots (évalué par Botometer). ◼ L’export CSV ne contient pas les textes des tweets. 73EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 74. Hoaxy (2/2) : articles ◼ Hoaxy (bêta) permet aussi de visualiser la diffusion des seuls articles collectés par Hoaxy (affirmations et fact-checks). ◼ Les points rouges représentent les comptes qui sont certainement des robots (évalué par Botometer). ◼ Plus les ronds sont grands plus le compte a été retweeté. 74EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 75. NodeXL Modèle Excel pour Windows (voir le tutoriel associé) 75EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 76. NodeXL (1/8) ◼ NodeXL est un modèle Excel (compatible Windows à partir d’Excel 2010). ◼ Il ajoute un onglet à Excel. ◼ Il est capable d’interroger le moteur de recherche de Twitter ou le réseau d’utilisateurs. ◼ Vous devrez connecter votre compte Twitter à NodeXL pour qu’il puisse interroger Twitter. ◼ Voir le support dédié pour plus de détails. 76EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 77. NodeXL (2/8) EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 77
  • 78. NodeXL (3/8) EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 78
  • 79. NodeXL (4/8) 79EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 80. NodeXL (5/8) 80EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 81. NodeXL (6/8) 81EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 82. NodeXL (7/8) 82EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 83. NodeXL (8/8) 83EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 84. Gephi et l’extension Twitter Streaming Importer Logiciel multiplateforme (voir le tutoriel associé) 84EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 85. Gephi et l’extension Twitter Streaming Importer ◼ Gephi est un logiciel d’analyse et de visualisation de réseaux multiplateforme. ◼ Son extension Twitter Streaming Importer nécessite d’avoir un compte Twitter et d’obtenir des clés d’API Twitter. ◼ Il permet de… ►collecter des tweets en temps réel, sur le sujet que vous aurez choisi ►extraire les connexions entre les utilisateurs mentionnés dans ces tweets ►visualiser ces connexions dans Gephi, ou juste exporter tous les tweets vers Excel. 85EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 86. Scripts Python Un grand merci à Marc Rénier et « Pangar-Ban » pour leurs éclairages… 86EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 87. Bien préparer son environnement (sous Windows) 87EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 88. Bien préparer son environnement (sous Windows) ◼ Environnement logiciel ►Python (logiciel à installer) ►Pipenv à installer par la ligne de commande : • pip install --user pipenv ►Git (à installer) : pour télécharger des dépôts GitHub ►Microsoft Visual C++ (MSVC) : a télécharger pour faire fonctionner certains programmes ►PyCharm : à installer pour disposer d’un environnement d’exécution et de programmation plus intuitif ►Bien vérifier (ou faire en sorte) que les applications soient présentes dans le PATH de Windows (trouvables directement lorsque l’on tape leur nom après avoir frappé la touche du clavier). ◼ Organisation (suggestion) ►Créer un dossier dédié à recevoir vos scripts à la racine de votre dossier « utilisateur », par exemple 88 C:Users{user}ScriptsPython PyCharm EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 89. Quelques commandes utiles (à partir de l’invite de commande : + cmd sous Windows) 89EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 90. ◼ pipenv install nom_du_script ►Après s’être placé dans le dossier contenant le script ►Place le script dans un environnement virtuel ◼ pipenv run nom_du_script –h ►Fournit l’aide du programme ◼ pipenv run nom_du-script nom_de_la_commande… ►Une fois placé dans le dossier ad hoc, lance un programme en pipenv et exécute commande et arguments ◼ Ctrl+C : interruption de l’exécution d’un script ◼ git pull : mise à jour du programme (une fois placé dans son dossier) Quelques commandes utiles ◼ + cmd : lance l’interface en ligne de commande ◼ cd : pour accéder à un dossier ►cd ScriptsPythontwint ◼ cd .. : remonte dans l’arborescence d’un dossier ◼ dir : liste le contenu d’un dossier ◼ Touche « tab » : autocomplétion d’un nom de dossier par exemple ◼ git clone url_du_depôt_github ►Après s’être placé dans le dossier qui contient tous vos scripts ►Récupère le code 90 A lire : What is Command Line Interface (CLI)? (W3Schools) EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 91. Twint Un couteau suisse pour scraper Twitter (quand il marche !) 91EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 92. Twint ◼ Twint (dépôt Github + wiki) est un programme qui ne repose pas sur l’API Twitter. ►Très riche possibilités d’interrogation (en ligne de commande) • Recherche : –s • Utilisateurs : -u ►Possibilité d’exporter les résultats très riches ►Nombreux dysfonctionnement actuels sur des requêtes complexes ►Pour accéder à des rapports très visuels, il faut installer et configurer ElasticSearch et Kibana ◼ Toujours bien lire les recommandations d’installation ◼ Une fois placé dans le dossier contenant vos scripts) ►git clone https://github.com/twintproject/twint ◼ Création de l’environnement pipenv une fois placé dans le dossier « twint » ►pipenv install Dans d’autres cas, il faudra… pipenv install requirements.txt voire installer les packages un par un… pipenv install nom_du-package ◼ Aide ►pipenv run twint -h 92EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 93. Exemple : followers ◼ Une fois dans le dossier « twint » ◼ Stocke dans le dossier « twint » un fichier « secou-following.csv » contenant tous les noms de compte auxquels est abonné @secou 93 pipenv run twint -u secou --following -o secou-following.csv EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 94. Pour en savoir plus… ◼ Wiki Officiel (dont Basic usage et Storing objects in an Elasticsearch instance) ◼ Articles/tutoriels ►Mine Twitter for Targeted Information with Twint (Null Byte, 2019) ►Twint – an OSINT Tool for Collection on Twitter at Scale (2019) ►How to use Twint as an OSINT tool (Privacy Globe, 2019) ►OSINT'ing at Scale (video, 2020) ◼ Utilisation avancée ►Analyzing Tweets with NLP in minutes with Spark, Optimus and Twint (Towards Data Science, 2019) ►Twint: Loading tweets into Kafka and Neo4j (2019) ◼ Retex ►Using OSINT to help build the OSINT community on Twitter (2018) 94EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 95. TwitWork Le graphe temps-réel 95EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 96. TwitWork : le graphe temps réel ◼ TwitWork (développé par @atmon3r, nécessite d’installer NodeJS et de disposer de clés pour l’API Twitter) ►Permet de construire en temps réel un graphe des interactions autour d’un mot ou groupe nominal, un hashtag, un nom d’utilisateur, mais pas, a priori, une requête quelconque. ►La sortie, uniquement en jpg, est de faible résolution et ne permet pas de visualiser de grands graphes clairement. ►Une fois installé, lancer avec « npm start » ►Exemples • @gdarmanin • #holdup 96EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► @gdarmanin
  • 97. Tafferugli 97EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 98. Tafferugli ◼ Tafferugli v. 0.2 (développé par s0dust, nécessite des clés API pour Twitter). ► Il sert à filtrer, collecter et analyser les tweets. ► Il est pensé pour faciliter l'analyse de certains phénomènes liés aux opérations de propagande, comme le comportement coordonné et l'affichage automatisé. ► Les conseils d’installation visent les environnements Ubuntu/Debian et le conteneur Docker. ► Nécessite l’installation de graph-tool, indisponible sur Windows, sauf sous le moteur de virtualisation Docker. EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 98 En savoir plus : Documentation, Démo
  • 99. Logiciels (payants) 99EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 100. Maltego 100EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 101. Maltego ◼ Maltego : logiciel très utilisé en OSINT et criminalistique. ►Existe en version gratuite limitée : Maltego CE (choix à effectuer après installation) ►Dispose de ses fonctions propres mais accepte de nombreux plugins (transforms) gratuits ou payants. ►On définit des entités auxquelles on applique des traitements (transforms), ou on lance des « machines » qui automatisent des processus. ►Pour fonctionner avec Twitter, des clés API Twitter sont nécessaires. ►La version CE ne peut gérer que 12 entités ►License annuelle version Pro : 1000 ou 2000 $ par utilisateur. Renouvellement : 500 à 1000 $. 101 Pour en savoir plus : Documentation, Maltego training video for absolute beginners (2015), les vidéos de Maltego Essentials (2020) EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 102. Maltego > Twitter Monitor 102 Source : Use Maltego to Monitor Twitter for Disinformation Campaigns (Null-Byte, 2018) Choix de la « machine » Twitter Monitor EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 103. Maltego > Twitter Monitor 103 Apparition des résultats Saisie de la requête EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 104. Maltego > Twitter Monitor 104 Améliorer la visualisation EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 105. Maltego > Twitter Monitor 105 En zoomant, les détails apparaissent Se repérer dans l’espace EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 106. Maltego + Social Links ◼ SocialLinks est un package de 700 transforms pour Maltego principalement dédiées à l’enquête sur les réseaux et médias sociaux : Facebook, Linkedin, Instagram, Skype, Telegram, Twitter, VKontakte, WikiLeaks, YouTube, etc. Il s’immisce également dans le darkweb ◼ License : 290$/mois, 2750$/an ◼ Existe également en version gratuite limitée : SocialLinks CE (225 transforms et 45 entités) ◼ Liste des Transforms de SocialLinks 106 Pour en savoir plus : Ressources (webinars, tutoriels), chaine YouTube EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 107. Visibrain 107EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 108. Visibrain ◼ Visibrain : plateforme d’analyse et de surveillance des réseaux/médias sociaux (surtout Twitter) très orientée e-réputation, communication de crise, influenceurs, tendances. ◼ Veille temps réel ◼ Export Gephy ◼ Alertes sur des événements particuliers (hausse de volume de tweets utilisant des mots particuliers. 108 Pour en savoir plus : Documentation, Guides Crédit : Visibrain EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 109. Le blog Cartorezo (Guillaume Sylvestre) : retours d’expérience d’analyses de réseaux avec Visibrain+Gephi 109 Blog Cartorezo (Guillaume Sylvestre) EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 110. Outils de veille 110EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 111. TweetDeck (Twitter) : le champion du temps réel ◼ TweetDeck est un service en ligne gratuit appartenant à Twitter et capable d’afficher en temps réel le fil d’actualité, requêtes, listes, etc., sous forme de colonnes 111EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 112. Inoreader : lecteur de fil RSS compatible avec Twitter ◼ Inoreader est un lecteur de fil RSS en ligne qui permet, dans sa version Pro (50€/an), de suivre jusqu’à 30 flux Twitter : ► comptes Twitter (pas intéressant parce que vite saturé par la limite de 30) ► recherches Twitter (aussi complexes soient-elles) ► listes Twitter ◼ Il est possible ensuite de filtrer les tweets ◼ Tous les tweets sont archivés ◼ Il est possible (moyennant finance) de relever la limite des 30 flux. 112 URL d’une requête Twitter Fil RSS de la requête Tweets EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 113. Feedly : lecteur de fil RSS compatible avec Twitter ◼ Feedly est un lecteur de fil RSS en ligne qui permet, dans ses versions Pro+ (144$/an) et Business (246$/an) : ► comptes Twitter ► recherches Twitter (aussi complexes soient-elles) ► listes Twitter ◼ Les requêtes sont gérées directement dans Feedly (contrairement à Inoreader) ◼ Permet de lire l’article lié au tweet directement dans l’interface ◼ Permet de valoriser ou d’exclure certains mots dans les tweets ou les article liés ◼ Feedly a une limite de 5000 articles par jour de chaque source Twitter. 113EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 114. Tweet Archiver : extension Google Sheets (1/2) ◼ Tweet Archiver est une extension pour Google Sheets ►Une seule règle d’extraction dans la version gratuite, raffraîchie toutes les heures ►Pour l’installer allez dans une feuille Google Sheets vierge > Modules Complémentaires > Télécharger des modules complémentaires > chercher « Tweet Archiver » > Installer ►Regardez le tutoriel ►A la première utilisation, l’extension vous demande d’accéder à votre compte Twitter ►Accéder à la fonction « Create rule » (vous pouvez élaborer des requêtes complexes dans la sone « Advanced Rules ») ►Create Search Rule ►A partir de là, la requête reprendra toutes les heures (mais il est possible de la rafraichir anuellement) ►Version payante à 4,95 €/mois pour 10 requêtes ou 7,95$/mois pour 25 requêtes raffraîchies toutes les 15 minutes 114EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 115. Tweet Archiver : extension Google Sheets (2/2) 115 La feuille finale contient de nombreuses informations pour chaque tweet. Export possible au format Excel, CSV… EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 116. FeedBro ◼ FeedBro est un lecteur de fil RSS gratuit sous forme d’extension pour navigateur (Firefox ou Chrome). ◼ Il est capable de s’abonner à n’importe quelle entité sur Twitter affichée à l’écran : ►compte ►résultat de recherche ►liste 116EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 117. Nitter ◼ Nitter : service en ligne générant un fil RSS relayant les tweets d’un compte donné. ►Saisissez le nom d’utilisateur (sans « @ ») et lancez la recherche ►Localisez le compte dans la liste et cliquez dessus ►Le fil RSS se trouve en haut et à droite de la page 117 Fil RSS EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 118. RSS Bridge : le couteau suisse qui se penche sur Twitter ◼ RSS Bridge : solution à héberger accumulant des « bridges », dont un pour Twitter, qui permet de récupérer sous forme de fil RSS (en fait Atom) : ► les tweets contenant un mot, une expression ou un hashtag ► les tweets d’un utilisateur particulier ► les tweets d’une liste 118EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 119. EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 119 Ouf ! C’est fini ! (en fait il en reste encore… mais c’est annexe)
  • 120. Autres solutions payantes 120EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 121. Autres solutions payantes ◼ Echosec ►Recherche et surveillance temps réel par mots clés et localisation de publications Twitter, Instagram, Foursquare, Flickr, Wikipédia, Reddit, VKontakte… ◼ TweetReach ►Expose la diffusion de tweets et l’engagement ◼ Tweet Archivist ►Surveillance et archivage de tweets. EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 121
  • 122. Requérir un accès à l’API Twitter 122EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 123. Obtenir un accès officiel à l’API de Twitter (1/3) ◼ Get access to the Twitter API 123 Processus gratuit, si vos besoins sont modestes, un peu long puisqu’il vous faut expliquer en longueur ce que vous voulez tirer de l’API. Au final vous obtenez les clés de votre accès à l’API de Twitter EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 124. Obtenir un accès officiel à l’API de Twitter (2/3) 124EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 125. Obtenir un accès officiel à l’API de Twitter (3/3) 125EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 126. Pour en savoir plus… 126EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 127. Quelques ressources Web ◼ https://www.mindmeister.com/fr/88482291/twitter-tools-directory ◼ https://www.labnol.org/internet/twitter-guide-do-everything-with- twitter/4916/ ◼ https://buffer.com/library/free-twitter-tools/ ◼ https://docs.google.com/spreadsheets/d/18rtqh8EG2q1xBo2cLNyhIDuK9jrP GwYr9DI2UncoqJQ/edit#gid=1700243466 127EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 128. Autres outils intéressants 128EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 129. Chorus Project ◼ Chorus Project ►Utilise l’API Twitter (compte développeur à créer sur https://dev.twitter.com) ►Chorus-TCD (TweetCatcher Desktop), gratuit sur demande • Scraping de recherches ►Chorus-TCW (TweetCatcher Web) : usage réservé aux universitaires ►Chorus-TV (TweetVis) : usage réservé aux universitaires • Timeline Explorer • Cluster Explorer 129 Chorus-TCD Chorus-TCW, Chorus-TV EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 130. Tweepy ◼ Tweepy est une librairie permettant d’interagir avec Twitter aussi bien pour poster que pour récupérer des informations. ►Nécessite des clés pour accéder à l’API Twitter ►Nécessite de coder toutes ses propres programmes en Python, appelant la librairie ◼ Doc : http://docs.tweepy.org/ en/latest/ EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 130
  • 131. TwiiterSearch2Gephi ◼ TwitterSearch2Gephi est une application Windows CLI qui vous permet de collecter des données sur les réseaux sociaux et de les convertir en un ensemble de données CSV pouvant être utilisé avec Gephi. ◼ Votre ordinateur doit être équipé de .NET ◼ Actuellement, il prend en charge ►Twitter ►Reddit ►Youtube ►Domaines WWWn URL ◼ Le dossier doit se trouver à la racine du disque C: EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►► 131
  • 132. Quelques outils « recalés » 132EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 133. BotSight ◼ BotSight (Norton) est une extension pour navigateur qui entend détecter les robots Twitter à partir d’un vingtaine de critères. ►Inadapté à l’actuelle interface de Twitter : seuls les comptes cités dans un tweet sont détectés (pas le compte émetteur) ►L’évaluation (ici de Michael Lomüller) est fantaisiste. 133 A lire : Introducing BotSight: A New Tool to Detect Bots on Twitter in Real-Time (NortonLifeLock, 2020) EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 134. SocioViz ◼ SocioViz ►Recherche ponctuelle (gratuit) ou récurrente (payant) ►Résultats : • Utilisateurs les plus actifs sur une recherche • Réseau de mots • Réseau d’utilisateurs (liens par mentions ou retweets, grosseur du point en fonction des citations ou retweets) • Réseau d’emoji • Réseau de hashtags (reliés si co- présence) ►Limites de la version gratuite • 100 tweets pour chaque requêtes • 1 semaine de profondeur • Top 10 des hashtags ►Export possible 134 A lire : Tutoriel | Tutoriel avancé | Tarifs EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 135. Export Comments ◼ Export Comments… exporte les commentaires d’un tweet ►Export Excel très propre ►Mais limité à 100 dans a version gratuite ►Les versions payantes sont chères ! 135EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 136. Sleeping Time ◼ Sleeping Time analyse les 1000 derniers tweets et détermine les heures de sommeil de son/sa propriétaire à partir des plages où il/elle tweete le moins. Nécessite une connexion à votre compte. Ne détecte pas le fuseau horaire ! 136EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 137. SocialBearing ◼ SocialBearing : puissantes analyses de comptes, mais version gratuite très limitée et version payante plus que chères ! 137EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 138. Tinfoleak ◼ Tinfoleak (script Python nécessitant des clés pour l’API Twitter) ►Incompatible avec Python 3) ►Pas mise à jour depuis le 04/09/2018 138EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 139. Twitter Audit ◼ Twitter Audit : analyse la possibilité qu’un compte soit faux ou de mauvaises qualité. ◼ Aucune précision sur les algorithmes utilisés ! 139EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 140. Surplus 140EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 141. ◼ https://developer.twitter.com/en/docs/tutorials/filtering-tweets-by- location ◼ https://developer.twitter.com/en/docs/twitter-api/v1/data- dictionary/overview/geo-objects ◼ https://help.twitter.com/fr/safety-and-security/tweet-location-settings 141EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 142. Intérêts des API « Premium » et « Entreprises » 142EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 144. Prix ◼ https://developer.twitter.com/en/pricing/search-30day 144EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►
  • 145. Serge Courrier ◼ Formateur (depuis 1996) ► Intervenant à l’École Européenne d’Intelligence Économique (EEIE) depuis sa création, il y enseigne les outils et méthodologies de veille, les réseaux et médias sociaux, la visualisation de données, l’OSINT/SOCMINT/OSINT, etc. ► Il intervient également à l’association des professionnels de l’information (ADBS), à l’Institut national de l’audiovisuel (INA), à l’Ecole des bibliothécaires et documentalistes (EBD, assure également la formation des rédactions et documentalistes de France Télévisions, etc. ◼ Consultant (depuis 2005) ► Il intervient auprès d’entreprises et d’organismes publics, pour développer leurs outils et stratégies de recherche et de veille, ainsi que leurs usages avancés d’Internet et notamment du Web 2.0. ◼ Ex-Journaliste spécialisé ► Il a traité entre 1990 et 2014 de sujets liés à Internet et à l’Intelligence économique pour des magazines spécialisés et grand public. A précédemment occupé les postes de rédacteur en chef adjoint de Génie Industriel, Science et Vie Micro (SVM) et Micro Hebdo. ◼ Créée en 2005, l’Ecole européenne d’intelligence économique (EEIE) est la seule école habilitée en France à remettre le titre d’État de « Consultant(e) en Intelligence Économique », enregistré au Répertoire National des Certifications Professionnelles (RNCP). ◼ L’école est située à Versailles. ◼ Retrouvez nos Webinars en Replay sur notre site : www.eeie.fr/webinars/ 145EEIE ►► Webinar 2020 ►► Investigations sur Twitter ►► 19 novembre 2020 ►► CC BY-NC-ND 2.0 FR ►►