Support de présentation du webinar co-organisé par l'ADBS Languedoc Roussillon et Actulligence Consulting sur les tendances et innovation dans le monde de la recherche d'information.
2. F. MARTINET - ACTULLIGENCE CONSULTING
✓ Frédéric Martinet, Consultant indépendant
spécialisé en Intelligence économique, en
veille stratégique et en veille image, e-
reputation.
1. Spécialisé en logiciels de veille et de recherche
d’information
2. Spécialiste des plateformes de veille stratégique et de
gestion de la réputation en ligne
3. Accompagnement dans la mise en place de cellules
de veille stratégique et de veille image : conception du
dispositif, organisation, formation des équipes et
déploiement
2
Actulligence Consulting : Présentation
* enregistré auprès de la DIRECCTE Languedoc-Roussillon sous le numéro 91 34 07476 34. Cet enregistrement ne vaut pas
agrément de l’état
3. Texte
✓ Formation
1. Modules de formations :
• Veille et recherche d’information sur Internet
• Formation au logiciel de veille Website
Watcher
• Web 2.0 et veille
• E-reputation : qu’est -ce que c’est ?
Comment en faire ?
• Utilisation de Twitter dans un cadre
professionnel
2. Formateur indépendant & Formateur
occasionnel pour le compte de l’ADBS
(Association des Documentalistes
Bibliothécaires Spécialisés)
3. Intervenants dans plusieurs 3èmes
cycles sur de modules d’intelligence
économique et d’e-réputation
3
Actulligence Consulting :
Formations
F. MARTINET - ACTULLIGENCE CONSULTING
5. Les nouvelles tendances et les
innovations dans la recherche
d’information
Webinar organisé par Actulligence Consulting et l’ADBS Languedoc-
Roussillon
6. Plan
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 6
✓ Les nouveautés de Google
✓ Big Data et Structuration de
la donnée
✓ Médias sociaux et veille
1
2
3
7. 12/04/2014 F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
✓ Google et ses
nouveautés
7
1
8. Des algorithmes qui n’en finissent pas
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Depuis 3 ans Google accélère les changements de son
algorithme
✓ En février 2011 Google a lancé Panda, un algorithme qui pour la
première fois avait un nom et visait a réduire drastiquement le
spam qui était devenu endémique y compris sur les première
pages de résultats.
✓ Suivront différentes mises à jour de Panda puis la sortie de
Penguin en avril 2012, qui durcira la lutte contre le spam.
✓ En août 2013 Google commence à déployer HummingBirds, un
algorithme visant à bouleverser Google et à le faire basculer du
statistique au sémantique.
8
Source : http://moz.com/google-algorithm-change
9. Statistiques VS Sémantique
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 9
Statistique
- Appliquer un algorithme de
pondération des contenus par rapport
aux mots clés
- Les mots sont traités indépendamment
de leur contexte
- Les résultats sont sous forme de liste
- Les algorithmes évoluent en fonction
des contournements détectés
Sémantique
- Le mot est compris dans son contexte
- La requête peut-être traitée même si
elle est exprimée de façon naturelle
- Les résultats peuvent apparaître de
façons différentes en fonction de la
question
- Il peut s’agir d’une réponse même
plutôt que d’une forme de résultats
10. Un exemple de sémantique
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 10
11. Le Knowledge Graph
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Le Google Knowledge Graph vise à structurer l’information à la
volée en agrégeant une fiche réponse et en proposant une
navigation exploratoire pertinente sur le sujet.
✓ Les données sont agrégées de tous types de sources :
1. Wikipédia
2. Site officiel de l’entité
3. Articles de presse
4. Images
5. Vidéos
✓ Le Knowledge Graph veut apporter une réponse et non pas une
liste de résultats.
✓ Pour les professionnels de la recherche d’information
permettre à terme de disposer d’un « pré-rapport ».
11
12. La fin du RSS ?
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Avec la fin de Google Reader, Google a porté un coup fatal à la
démocratisation de la technologie RSS.
✓ Plus globalement il suit le mouvement amorcé par Facebook et Twitter
qui referment leur écosystème.
✓ Google était même allé jusqu’à supprimer pendant quelques semaines le
format RSS de ses Google Alertes qu’il a toutefois restauré.
✓ Google maintient cependant le RSS sur sa plateforme de blogs.
12
13. Des Google Alertes en perdition
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Les Google Alertes qui n’étaient déjà pas un outil très
performant sont en perdition complètes.
✓ Sur la plupart des requêtes un seul résultat quotidien est
ramené.
✓ Il y a parfois plus de résultat dans les « meilleurs résultats »
que dans « tous les résultats ».
✓ Google Alertes est incapable d’adresser les corpus en
différentes langues.
✓ Pistes d’améliorations :
1. Disposer de plusieurs comptes Google en différentes langues
2. Splitter les Google alertes par type de corpus et les multiplier
3. Multiplier les requêtes et combinaisons de mots plutôt que de faire une
longue équation de recherche
13
14. Marche forcée sur Google +
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Google veut rattraper son retard sur le social :
1. Il supprime toutes les applications concurrentes ou les délaisse (Wave /
Gtalk est replacé par Hangouts, Picasa par Google + photos, les Apps sont
remplacées par Google Drive et intégrées à Google +)
2. L’intégration avec son OS téléphone est « forcée ». Quasiment impossible
d’avoir un téléphone Androïd sans compte Google+.
3. Google + commence à s’intégrer dans les résultats des moteurs de
recherche.
14
15. Google Glasses
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Bienvenue dans Minority Report :
1. Head Up Display
2. Contrôle vocal
3. Traduction
4. Recherche visuelle
5. …
✓ La recherche en continue, sans le demander
15
16. F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 16
Recherche et affichage d’images
Speech to text et traduction
GPS
Vision conférence en direct
17. F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 17
Recherche et affichage d’images
Speech to text et traduction
GPS
18. F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 18
Recherche et affichage d’images
Speech to text et traduction
19. F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 19
Recherche et affichage d’images
20. F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 20
21. Google c’est …
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Une infrastructure serveurs et réseaux qui assure la
disponibilité
✓ Un algorithme qui ordonne la pertinence
✓ Des technologies qui assurent l’immersion
1. Google Glass
2. Voice search
✓ Des modèle qui assurent la permanence :
1. Sur son ordinateur
2. Sur son mobile
3. Sur sa télé
✓ Une communauté fermée qui promet la cosanguinité
21
Mais c’est avant tout un moteur de recherche qui répond à un besoin là où aucune
autre solution n’est crédible
22. 12/04/2014 22
✓ Et dans d’autres pays ?
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
23. Google laisse échapper l’Asie
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 23
Source : http://webcertain.com/search-engines.html
25. 12/04/2014 F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
✓ « Avant les enjeux
étaient de savoir
comment stocker
la donnée,
maintenant il s’agit
de les
comprendre, de
les analyser »
Zettaset
25
26. Big data : nouveau nom, ancienne histoire ?
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Big data : ensemble de données qui devient tellement
volumineux qu’il est difficile de travailler avec des outils de
gestion de bases de données.
✓ Avant le big data on parlait de data warehouse, Business
Intelligence, décisionnel, data mining
✓ Un nouvel enjeu : les logs et les UGC
1. Log : traces laissées sur un serveur, une application par des individus et qui
enregistrent toutes leurs interactions
2. UGC : User Generated Content / informations créées par les internautes
sur les réseaux sociaux
26
27. Une équation magique
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 27
UGC + logs = insights
…
28. Les nouvelles technologies
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Calcul distribué et optimisé :
1. Hadoop
2. MapReduce
✓ Base de données :
1. Hbase
2. NOSQL
✓ Schedulers et Trackers (ordonnanceurs) :
1. Oozie
2. …
✓ Infrastructure locale et cloud
28
Traiter plus, traiter mieux, stocker efficacement, requêter rapidement
29. Les enjeux du big data pour le search
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Des nouvelles technologies pour les bases de données et les
index :
1. Plus rapides
2. Plus légères
✓ Des enrichissements de données :
1. Croiser web traditionnel et UGC, usages sociaux et publications
personnelles
2. Apporter des nouvelles dimensions aux données :
• Données physiques : Qui ?
• Données environnementales : Dans quel environnement ? Contexte ?
• Données géographiques : à quel endroit ?
• Données temporelles : Quand ? Pendant combien de temps ?
29
30. La Dataviz : big data, statistiques et représentation
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Utilisations de la Dataviz :
1. Dès qu’il y a des entités et des relations entre ces dernières, on parle alors
souvent de SNA (Social Network Analysis)
2. Pour détecter :
• Des communautés
• Des influenceurs / des hubs
• Des relations cachées
• Des signaux faibles
3. Applicables aux données de veille :
• Sur les relations entre les sites Web
• Sur les relations entre les documents
• Sur les relations entre les entités nommées
30
32. F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
Exemples de mapping des
forces antagonistes, les
« neutres » (plutôt médias
presse / TV) apparaissent
en blanc.
33. Les difficultés du Big Data appliquées à la veille
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Data ≠ Text
✓ Il faut créer de la donnée à partir de textes :
1. Des métriques / comptages
2. Structurer le contenu en créant de la méta donnée
3. Lever les ambiguïtés / rapprocher
4. Créer de la relation
✓ Alors il est possible d’apporter du sens
✓ Le big data appliqué au search et à la veille implique des
technologies de traduction, d’extraction d’entités nommées, de
sémantique.
33
34. Open Data et Big Data (1)
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 34
35. Open Data et Big Data (2)
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 35
36. 12/04/2014 F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
✓ Réseaux sociaux
et veille
36
3
37. Les médias sociaux et les réseaux sociaux
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Des endroits où l’on peut trouver :
1. De l’information divergente / originale
2. Des personnes
✓ Des fonctionnalités pour :
1. Partager
2. Se faire connaître
3. Apprendre
✓ De l’information :
1. Segmentée
2. Cloisonnée
37
40. Votre réseau de personnes
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 40
41. Les réseaux de personnes
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 41
42. De nombreux réseaux sociaux dédiés
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Par métier
✓ Par zone géographique
✓ Par centres d’intérêt :
1. IT
2. Innovation
3. Environnement
4. …
42
43. Réseaux sociaux par spécialisation (1)
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 43
44. Réseaux sociaux par spécialisation (2)
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 44
45. Réseaux sociaux par spécialisation (3)
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 45
46. Réseaux sociaux par spécialisation (4)
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 46
47. Les difficultés de la surveillance des réseaux sociaux
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Elles comportent de nombreuses données personnelles qui
sont donc techniquement protégées
✓ Un réseau « facile » à observer de son point de vue : vous
pouvez observer et accéder à votre réseau. Au-delà c’est
compliqué :
1. Vous devez donc vous identifier et vous dévoiler.
2. Il est sinon possible de développer des solutions coûteuses de crawling.
✓ Les APIs donnent accès à l’information mais les contraintes de
volumétrie sont très fortes
✓ Les stratégies de crawling sont particulièrement complexes à
mettre en œuvre :
1. Reposant sur des moteurs de recherche
2. Nécessitant plusieurs passes
47
48. Autres réseaux sociaux
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Les réseaux sociaux de lieux – Particulièrement utiles dans le
domaine industriel
1. Identifier des personnes se rendant à …
2. Identifier des photos
3. Identifier des sites
• Peut être utilisé pour accéder aux implantations des agences ?
✓ Les réseaux sociaux de partages vidéos et photos :
1. Photos des lieux de production
2. Photos des machines outils
3. Use cases produits
48
50. Info localisée en temps réel
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014 50
Le démonstrateur créé par Ubisoft
pour faire la démonstration du jeu
Watch Dogs démontre à quel point
la localisation de l’information
disponible en temps réel et de
façon ouverte sur les réseaux
sociaux et l’open data offre une
vision éclairée d’un espace et de
ce qui s’y passe.
http://wearedata.watchdogs.com
52. Quelques prévisions
F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR
12/04/2014
✓ Un combat contre le spamdexing qui n’en finira jamais : une guerre
technologique, une guerre algorithmique, une guerre de robots pour la
maîtrise de l’espace « Search Results »
✓ Une recherche sans la demander : dans votre téléphone, sur votre frigo,
pendant que vous jouez à votre console, sur vos lunettes, vos lentilles,
le HUD de votre véhicule
✓ Des réponses plutôt que des résultats : détecter les méta données, les
structurer à la volée, interpréter le langage humain, dialoguer avec le
web chercheur, guider (orienter?) sa recherche, structurer la réponse
✓ Dynamique, cinétique et prédictivité : le search, le sémantique et le big
data appliqués à la modélisation des écosystèmes webs mais aussi IRL
(épidémiologie, cours de bourse, élections)
✓ Un web cloisonné, cosanguin, ou la recherche est un moyen de
captiver, de capturer et de rentabiliser l’attention
52
54. ✓ Support de
présentation Tous
droits réservés
Frédéric Martinet
@ Actulligence
Consulting
✓ Ne pas rediffuser
sans accord
préalable
12/04/2014 F. MARTINET | ACTULLIGENCE CONSULTING & ADBS LR 54
Respectez les auteurs qui partagent gratuitement leurs créations et leurs réflexions