CapCom13: CN4: Comment aborder l'ère du Big Data ?
Mettre en oeuvre sa veille informationnelle sur internet
1. LA VEILLE SELON L’AFNOR
« ACTIVITÉ CONTINUE
ET EN GRANDE PARTIE
ITÉRATIVE VISANT À UNE
SURVEILLANCE ACTIVE
DE L’ENVIRONNEMENT
TECHNOLOGIQUE,
COMMERCIAL, ETC.,
POUR EN ANTICIPER
LES ÉVOLUTIONS. »
Source : Norme AFNOR XP X 50-053 – 1998
L
’ ’
’ ,
.
L
, ’ ’
.
LA VEILLE INFORMATIONNELLE
« Une veille informationnelle est l’ensemble
des stratégies mises en place pour rester
informé, en y consacrant le moins de temps
possible et en utilisant des processus de
signalement automatisés. »
Source : JP Lardy – Urfist de Lyon
E ’ ,
’ ’ .
L’ ’
, , , . .
E ’ .
PAR MÉTHODE
• Veille active
• Veille passive
• Veille offensive
PAR TEMPS DE LA VEILLE
• Veille ponctuelle
• Veille périodique
• Veille permanente
PAR DOMAINES D’INTÉRÊT
• Veille stratégique
• Veille sociétale
• Veille sectorielle
• Veille concurrentielle
• Veille commerciale
• Veille fournisseurs
• Veille juridique et réglementaire
• Veille image
• Veille technologique
INTRODUCTION
Veille
concurentielle
Veille
technologique
Veille
environnementale
Veille
commerciale
Veille
commerciale
ENTRANTS
POTENTIELS
FOURNISSEURS CLIENTS
CONCURRENTS
DU SECTEUR
SUBSTITUTS
O R G A N I S E R S A V E I L L E S U R I N T E R N E T | 0 1 . 2 0 1 5 |
1
2. NotesLES FONCTIONS DE LA
VEILLE
• Anticiper
• Informer
• Analyser et synthétiser
• Mettre en forme
• Animer et communiquer
LES ÉTAPES DE LA VEILLE
VEILLE VS CURATION
La eille est une tec ni ue de
rec erc e documentaire et de
traitement de l’information a ant
pour but la prise de décision
stratégi ue d’une entreprise.
La curation de contenus est une
prati ue ui consiste sélection-
ner, éditorialiser et partager les
contenus les plus pertinents du
eb sur un su et donné.
Source : Wikipédia
Animer et
communiquer
Anti
ciper Infor
m
er
Mettre
e
n
forme
Analyser et
synthétiser
> Stockage et
partage de
l'information
mise en forme
> Identi cation
et cadrage
des besoins
> Identi cation
des sources
pertinentes
> Récupération
et sélection
des informations
CIBLAGE
SOURCING
COLLECTE
ANALYSE
> Traitement
des informations
collectées
DIFFUSION
O R G A N I S E R S A V E I L L E S U R I N T E R N E T | 0 1 . 2 0 1 5 |
INTRODUCTION
1
3. DÉFINITION DES BESOINS
DANS CETTE ÉTAPE,
L’OBJECTIF EST DE DÉFINIR
LES THÈMES QUI FERONT
L’OBJET D’UNE SURVEILLANCE.
ILS SERONT HIÉRARCHISÉS
ET CETTE ACTIVITÉ
SE CONCRÉTISERA
PAR LA CRÉATION
D’UN TABLEAU DE BORD
DE SUIVI ET D’UNE
GRILLE DE VEILLE.
LE CONTEXTE ORGANISER SA VEILLE
Il s’agit surtout ici de définir les périmètres
de sur eillance pour c acun des ob ectifs
identi és.
Les ob ectifs sont tout d’abord déclinés
en thèmes correspondant au su ets sur
les uels la sur eillance doit se focaliser.
En nombre limité, ces t émati ues seront
hiérarchisées pour re éter l’intensité de
leur intér t dans le processus de eille.
Ensuite, et en relation a ec c acun des
t mes, un premier eu de sources
d’information sera sélectionné.
Cette étape concrétise les premiers péri-
m tres sur eiller.
Ils constituent une premi re étape dans
la création du tableau de bord de suivi
nécessaire la gestion de la eille.
O R G A N I S E R S A V E I L L E S U R I N T E R N E T | 0 1 . 2 0 1 5 |
Pourquoi ? Quels sont mes besoins d’information ?
Quelles sont les ressources existantes ?
Pour quels enjeux ? À qui la veille est-elle destinée ?
2
CIBLAGE
4. GÉRER SA VEILLE
Le tableau de bord de sui i permet
une s nt se des sur eillances
e ectuées, recensant le nom des
sources, les URLs, l’ob ectif, les
destinataires, etc.
O R G A N I S E R S A V E I L L E S U R I N T E R N E T | 0 1 . 2 0 1 5 |
LISTER DÉFINIR PLANIFIER RÉVISER
Lister les sources, canau
d’information et points
d’acc s utiliser.
Pour commencer lister
os sources actuelles
bookmarks na igateurs,
réseau sociau , .
Répertorier os abonnements
ne sletters, re ues,
presses, mailing,.. .
Dé nir les é uations de
rec erc e re u te selon le
t pe d’outil utilisé.
Rec erc er des mots-clés
pour c a ue t me a n
d’obtenir une grille de
eille c e sui ante .
Créer et tester les re u tes
formulation des uestions
sur les di ers outils de
rec erc e et les a uster.
Déterminer un calendrier
de sui i des sources.
Les sources comme par
e emple les sites eb
ne sont pas mis our
en permanence dates
pré isionnelles annoncées
ou déterminer .
Ré ision périodi ue des
ob ectifs de eille.
Il est nécessaire d’a uster
réguli rement les ob ectifs
de la eille et le dispositif
mis en place pour répondre
par e emple l’é olution
de la stratégie de l’entreprise
ou de l’é olution éditoriale
des sources.
TYPES DE
SOURCE
NOM/URL OBJECTIFS DESTINATAIRES REQUÊTES
FRÉQUENCE D’INTERROGATION
HEURE/JOUR/SEMAINE/MOIS
ACTUALISATION ... ...
fichiers
sites
revues
contacts
...
TABLEAU DE BORD DE SUIVI
CIBLAGE2
5. CIBLAGE
O R G A N I S E R S A V E I L L E S U R I N T E R N E T | 0 1 . 2 0 1 5 |
LISTER LES PREMIÈRES
SOURCES D’INFORMATIONS
Il est courant de classer l’information
selon trois t pes
• Il a d’abord l’information ue l’on
uali e de «blanche». C’est la plus
courante. Elle est accessible facilement
compris par le grand public. Elle peut
nécessiter un enregistrement. C’est le
domaine de la veille informationnelle.
Exemples : presse, sites web accessible
par les moteurs de recherches classiques.
Extranet,…
• Sou ent méconnue, informelle et
di cilement accessible sans une re-
c erc e approfondie, il a l’information
«grise». Elle ne rel e pas en général de la
eille informationnelle mais plus de
l’intelligence économi ue.
Exemples : Pages web hors périmètre
des moteurs de recherche, documents
publiés par inadvertance, discussions,...
• En n les informations dont la di usion
est restreinte, a ec aut enti cation et
sécurisation forte dé nissent l’information
«noire». L’ac uisition non autorisée de ce
t pe d’information rel e de l’espionnage.
DÉFINIR LES STRATÉGIES
DE RECHERCHE
En relation a ec les t émati ues
identi ées, le c oi des mots-clés est
la problémati ue centrale.
L’utilisation con ointe d’outils de t pe
dictionnaires, t ésaurus, glossaire,
tables, inde , permettra de créer la grille
de eille. Cette derni re facilite les
éc anges entre le eilleur et les
destinataires de la eille. Elle doit tre
actualisée réguli rement ou
e ceptionnellement lors ue l’actualité
l’e ige.
Cette grille indi ue les t mes su ets,
catégories sur eiller ainsi ue les
mots-clés associés.
Exemple de grille de veille :
Pour aller plus loin, il peut tre utile de
représenter les conne ions sémanti ues
entre di érentes idées, et les liens iérar-
c i ues entre di érents concepts gr ce
au outils de mind mapping.
Exemple de hiérarchisation :
Source wikipedia
DÉFINITION DES REQUÊTES
Outils de recherche
yGénéralistes Google, Bing, a oo
ySpécialisés Blogs, réseau sociau ,
actualités, personnes, images,
c iers, bookmaking
yMétamoteurs
yTemps réel
ttp ne s. ebplanete.net
ttp ne smap. p
ttp emm.ne sbrief.eu Ne s-
Brief clusteredition fr rs. tml
yPortails, sites internet, catalogues,
bases de données, répertoires
Annuaires, BNF, Ale a, ois, IA,
yBases de données bibliograp i ues,
Open access et autres arc i es.
yListe de moteurs de rec erc e
ttp en. ikipedia.org iki List of
searc engines EN
y ttp fr. ikipedia.org iki Liste de
moteurs de rec erc e FR
yIl est possible de créer son propre
moteur de rec erc e
ttps .google.com cse
ttp .eurekster.com
THÈMES MOTS-CLÉS
La politique fiscale
du gouvernement
Fiscalité, TVA,
impôts, ISF, prime
pour l’emploi, taxe,
redevance,
cotisations sociales
La situation en
Géorgie
Accord de Moscou,
Ossétie, Présidents
Saakachvili,
sommet exceptionnel
à Bruxelles...
ORDINATEUR
UTILISATEUR
MATÉRIEL
Unité
centrale
Périphérique
de sortie
Périphérique
de saisie
Microprocesseur
Mémoire
Applications
Systhème d’exploitation
BIOS
Explorateur
web
Messagerie
Éditeur
de texte
Disque dur
Écran
Haut-parleur
LOGICIELSouris
Clavier
À partir des mots-clés sélectionnés, des questions doivent tre formulées pour une mise
en uvre sur les divers outils de recherche.
3
6. LA SYNTAXE DE RECHERCHE
La syntaxe varie selon les outils et les
requ tes doivent tre a ustées en créant
des formulations multiples adaptées.
Ils ont généralement les éléments suivants
en commun
Opérateurs booléens
AND, OR, AND NOT BUT NOT NOT ET
OU SAUF
Les caractères spéciaux
Parenthèses combine les mots-clés ,
guillemets expression exacte , troncature
avec , ou - pour inclure ou exclure
Orthographe
Ma uscule, minuscule, accents et signes,
singulier pluriel et l’ordre des mots
PLANIFIER LA SURVEILLANCE
DES SOURCES
A n de compléter le tableau de suivi, il est
nécessaire d’identi er la périodicité de
publications ou la fréquence de mise our.
O R G A N I S E R S A V E I L L E S U R I N T E R N E T | 0 1 . 2 0 1 5 |
Réseaux sociaux
Sites web, blog
Presse
webociauxx web
Presse
papier
S
FRÉQUENCE DE
PUBLICATION ÉLEVÉE
FRÉQUENCE DE
PUBLICATION FAIBLE
DIFFUSION
RESTREINTE
DIFFUSION
IMPORTANTE
SMS et IM
Newsletters
Presse
spécialisée
Notes
CIBLAGE3
7. SOURCING
et COLLECTE
O R G A N I S E R S A V E I L L E S U R I N T E R N E T | 0 1 . 2 0 1 5 |
QUALIFIER SES SOURCES
LA PERTINENCE DES SOURCES
D’INFORMATIONS
La pertinence d’une source dépend avant
tout des ob ectifs poursuivis. Les critères
in uen ant le degré de pertinence sont
Sa nature
Sites institutionnels, presse en ligne,
annuaires et portails documentaires,
blogs, forums, bases de données, réseaux
sociaux
Les publics visés
Grand public, professionnels,
spécialistes,
Son rayon de diffusion
Local, régional, national, international.
LA QUALIFICATION
D’autres critères in uencent la qualité
des sources. Tout d’abord les éditeurs et
les auteurs, quelle est leur réputation,
leur crédibilité, leur visibilité ou leur
in uence dans la thématique surveillée
Ensuite l’information est-elle exacte,
traitée avec ob ectivité, est-elle actualisée
et récente
Et en n l’information est-elle traitée de
manière super cielle ou plus en en
profondeur
L’ÉVALUATION DES SOURCES
Les sources étant maintenant pertinentes
et de qualité, il s’agit de véri er qu’elles
couvrent bien tous les besoins détectés
lors du ciblage thèmes, fréquence de
publication, langues, aire géographique
tout en s’assurant qu’une source ne soit
pas dominante et que tous les points de
vues sur les problématiques traiter
soient représentés.
COLLECTER L’INFORMATION
Maintenant que les sources sont connues
l’extraction ou la récupération des
informations peut commencer. La
collecte s’e ectue selon deux modalités
complémentaires nommées « pull » et
« push »
LE “PULL”
L’information est périodiquement
recherchée et extraite par l’utilisateur :
• moteurs de recherche,
• revue de presse,
• historique de recherche,
• signets web et navigateur.
LE “PUSH”
L’information est poussée diffusée
automatiquement vers l’utilisateur :
• Suivi des mots-clés, en fonction des
équations de recherche requ tes
soumises un service d’alerte ou
des ux d’information .
• Abonnement des ux d’information,
en fonction de préférences et de critères
préétablis par l’utilisateur pro ls .
• Surveillance des pages ou des sites
Internet.
LES DIFFÉRENTS FLUX D’INFORMATION
• Bases de données presse, publica-
tions, brevets, appels d’o res, etc.
gratuites ou payantes, avec ou sans
interface web
• Moteurs méta moteurs de recherche
sur Internet
• Sites web ou parties de sites, ou
pages web spéci ques , forums de
discussion
• Listes de di usion et newsletters
électroniques
• Flux RSS
•
Notes
4
8. FLUX RSS ET LA SYNDICATION
DES CONTENUS
La première fonction des ux ou ls
RSS Really Simple syndication est
d’agréger des ux d’actualités d’un site
web. Ils sont identi ables par le logo
Exemple :
La page web http://www.lemonde.fr/rss/
récapitule tous les flux RSS du journal
le monde. Il est possible de s’y abonner
(en cliquant sur le symbole) et d’en suivre
l’actualité. Pour faciliter la lecture, chaque
article présent dans un flux ne reprend
que le titre, une courte description,
la date et un lien vers l’article complet.
Les flux sont mis à jour en permanence.
Ce procédé est la syndication de contenu.
Il rend disponible une partie d’un site web
pour une utilisation sur d’autres sites.
Pour lire ces flux d’actualités, il est
nécessaire d’utiliser un agrégateur de flux.
Les outils de surveillance
Suivre les modi cations de pages de
sites actualités d’un concurrent,
y ebsite watcher
>Flux RSS ou monitoring de page
tre averti lorsque des mots-clés sont
cités dans l’actualité
yGoogle Alerts
yTalk alker Alerts
Suivre l’actualité avec les lecteurs et
agrégateurs de ux RSS presses, institu-
tions,
yNetvibes
yFeedly
O R G A N I S E R S A V E I L L E S U R I N T E R N E T | 0 1 . 2 0 1 5 |
SITES WEB
PAGES
RSS
MAILINGLIST
FORUMS
NEWS
MICRO
BLOGGING
RÉSEAU
X
SOCIAUX
MOTEURS DERECHERCHE
META
MOTEURS
OPEN
ARCHIVES
O
PEN
DATA
R
BLOGS
SOURCING et COLLECTE
4
9. ANAL SE
et TRAITEMENT
O R G A N I S E R S A V E I L L E S U R I N T E R N E T | 0 1 . 2 0 1 5 |
ÉVALUER ET VÉRIFIER
ENRICHIR
TRAITEMENT
L’automatisation de la collecte peu selon
les cas fournir de grandes quantités
d’informations. Il peut tre nécessaire
d’e ectuer des traitements pour atteindre
les ob ectifs de la veille ou faciliter la t che
des destinataires de cette veille. Il s’agit
selon les cas d’évaluer, d’enrichir ou de
synthétiser les éléments du corpus produit
en amont. Cette étape optionnelle fait
généralement intervenir un expert
et est di cilement automatisable.
ANALYSE
À c té de l’analyse humaine réalisée par
des experts, il existe de nombreux outils
permettant des analyses automatisées.
SUIVRE des indicateurs quantitatifs
comme la fréquence de certains mots-clés,
ou le nombre d’articles issus d’une m me
source ou écrit par un m me auteur.
DÉTECTER des thématiques, sources,
acteurs émergents.
wordle.net
infomous.com
EXTRAIRE du sens du corpus gr ce au
textmining. Ces outils permettent
d’acquérir de connaissances partir des
données textuelles qui ont été collectées.
Ils sont couplés un outil de visualisation
hypertexte et graphiques a n d’explorer
et d’analyser les résultats.
ÉTABLIR et surveiller des réseaux
d’acteurs ou l’évolution de l’usage de
mots-clés.
carrot2.org
RÉVISERRÉRÉVIVISESERR
TRIER CLASSER VÉRIFIER
COMMENTER RELIER
• Inclure ou exclure des
informations voire des
sources en fonction
de leur pertinence
dédoublonnage,
obsolescence,...
• Classer les informations
selon des critères
conformes au plan
de veille date, auteur,
catégorie,...
• La qualité des informations
obtenues
• Recouper ou déterminer
• A outer des commentaires
sur l’information elle m me
• Relier les informations
entre elles précédence,
citation,...
• Agréger plusieurs contenus
5
10. En n il existe des outils d’analyse straté-
gique qui peuvent tre alimentés par le
ux d’information de la veille. Ils sont
la frontière de la veille et de l’intelligence
économique. Ce sont
La matrice MOFF (SWOT en anglais)
O R G A N I S E R S A V E I L L E S U R I N T E R N E T | 0 1 . 2 0 1 5 |
ENTRANTS
POTENTIELS
FOURNISSEURS CLIENTS
CONCURRENTS
DU SECTEUR
SUBSTITUTS
g
FORCES FAIBLESSES
OPPORTUNITÉS MENACES
ENTRANTS
ECONOMIQUE
LA FIRME ET
SON MARCHÉ
POLITIQUE SOCIO-CULTUREL
ECOLOGIQUE
TECHNOLOGIQUELÉGAL
L’analyse de PESTEL
Le modèle des cinq forces de PORTER
ANAL SE et TRAITEMENT
5
Notes
11. O R G A N I S E R S A V E I L L E S U R I N T E R N E T | 0 1 . 2 0 1 5 |
LA DIFFUSION
Les supports de di usion peuvent prendre
de multiples formes
• Des outils eb CMS, Intranet, Extranet,
Site web, RSE,
• L’e-mailing Alertes, Newsletters HTML
ou PDF,
• Des outils de microblogging Twitter,
Tumblr,..
• Des plateformes de curation Scoop.it,
Pearltree,
•
Pour chacun d’entre eux, plusieurs moyens
de di usion existent qui vont de la publi-
cation de pages web aux sms en passant
par les ux RSS eux-m mes ou le courrier
électronique avec ou sans pièce ointe .
COMMENT CHOISIR ?
Plusieurs facteurs in uencent le choix de
ces canaux de di usion
• Le degré de con dentialité
• Le nombre et la qualité des destinataires
Dirigeants, Responsables, Employés
• Veille temps réel ou di érée
• La richesse des contenus images, son,
vidéo, PJ,
La mise en forme désirée des résultats de
la veille newsletters, cartographies des
connaissances, benchmark, avis, notes
d’étonnement, revue de presse, bibliogra-
phie, a également un impact.
En n la fréquence de transmission en
permanence, périodique ou la demande
sera déterminante.
PRÉPARER LA DIFFUSION
Après avoir sélectionné les outils de
di usion il reste
• Finaliser la mise en forme des informa-
tions lors d’une étape de maquettage.
Il s’agit de créer des modèles de docu-
ments qui permettront la mise en forme
des contenus. Cette dernière pourra
éventuellement tre automatisée.
• Mettre en place des outils de surveil-
lance des usages. Pour un site web, par
exemple, l’utilisation de script Google
Analytics permet de mesurer le nombre
de pages vues, le temps des sessions,
l’origine, etc.
DIFFUSION
Microblogging
Sites web, blog
curation
Microblogging
FRÉQUENCE DE
DIFFUSION ÉLEVÉE
FRÉQUENCE DE
PUBLICATION FAIBLE
DIFFUSION
RESTREINTE
DIFFUSION
ÉLARGIE
SMS
Intranet et
extranet
E-mailing
@
6
12. FINALISER LES WORKFLOW
Le work ow décrit le circuit de valida-
tion, les t ches accomplir entre les
di érents acteurs du processus de
veille. Il indique également les délais et
les modes de validation.
Son ob ectif est de fournir chacun les
informations nécessaires pour la réali-
sation de ses t ches.
Exemple :
Dans le cas d’un processus de publication
en ligne, il est nécessaire de modéliser les
tâches de l’ensemble de la chaîne édito-
riale qui va de la définition du modèle de
document à l’automatisation de leur mise
en forme en passant par la création du
contenu.
PRÉPARER LA DIFFUSION
Après une étape de test qui validera les
automatismes et les mises en forme, la
di usion devra tre surveillée et adaptée
continuellement aux ob ectifs de la veille.
En n, l’usage, les choix de mode de
di usion, leurs formes et les contenus
peuvent ne pas satisfaire les destinataires
pour des raisons de culture information-
nelle. Le facteur humain entravera alors le
déploiement de la veille. La mise en oeuvre
d’une sensibilisation aux intér ts de la
di usion de l’information voire une
incitation atténuera ce phénomène.
O R G A N I S E R S A V E I L L E S U R I N T E R N E T | 0 1 . 2 0 1 5 |
Notes
DIFFUSION
6
13. S NTH SE
O R G A N I S E R S A V E I L L E S U R I N T E R N E T | 0 1 . 2 0 1 5 |
SÉLECTION DES INFORMATIONS TRAITEMENT DIFFUSION
CIBLAGES
Création
de la grille
de veille et
du tableau
de bord de suivi.
DÉDOUBLONNER
CLASSER
FILTRER
ALERTES SMS
MAILING
FLUX RSS
NOTES DE
SYNTHÈSE
TABLEAU
DE BORD
BLOG
ANALYSES
(Statistiques,
Textmining,...)
EXPERTISE
SOURCING
Bouquet de sources
(moteurs, sites web,
bases de données,...)
quali ées et
pertinentes
COLLECTE
Récupération et
extraction de
contenus
FLUX
D’INFORMATION
(RSS,...)
DÉFINITION
DES BESOINS
DE VEILLE
7