SlideShare une entreprise Scribd logo
1  sur  80
Du Big Data à la « Smart Information »
: comment valoriser les actifs
informationnels de votre entreprise ?
Pierre Col – Directeur Marketing pcol@antidot.net @PierreCol
2
Pierre Col @PierreCol
1978
1963
1983
1986
1996
2007
2010
3
Antidot
● Éditeur de logiciels
● Moteurs de recherche| enrichissement des données
● Depuis 1999 | Paris, Lyon, Aix-en-Provence
● 48 collaborateurs, +200 clients
● Mission : délivrer à nos clients des solutions
hautement configurables et innovantes qui créent de
la valeur à partir de leurs données et augmentent
leur performance opérationnelle
4
Parmi nos clients
● Production de contenus
● Industrie
● E-Commerce
● Santé
5
Agenda
● Du Big Data à la Smart Information : quelle
approche ?
● Linked Enterprise Data
● Quels outils pour créer la Smart Information ?
● Web de données
● Machine Learning
● Exemples variés
6
Du Big Data à la
Smart Information :
quelle approche ?
7
Qu’est ce que le Big Data ?
● Volume
● Vélocité
● Variété
● Valeur
Les 4 V portent les enjeux du Big Data
8
Exploiter la variété - Créer la valeur
● Ne pas s’enfermer dans une approche
trop technologique liée à
● la volumétrie des données
● la vélocité de traitement
● Ne pas se focaliser uniquement sur les
données structurées numériques
9
Exploiter la variété - Créer la valeur
10
Exploiter la variété - Créer la valeur
11
Exploiter la variété - Créer la valeur
● Il faut tirer profit de l’énorme gisement de
valeur des données non structurées :
● documents bureautiques, courriels
● GED – gestion électronique de documents
● CRM – gestion de la relation clients
● ERP – outils de gestion d’entreprise
● …
et de toute leur richesse sémantique
!
12
http://www.flickr.com/photos/jimgris/281139738/
Changer de paradigme
Siège social d’Oracle, l’éditeur du SGBDR le
plus utilisé dans le monde, dans la Silicon
Valley
13
Changer de paradigme
● Ne plus considérer les applications mais
SEULEMENT LES DONNÉES
14
Relier les données
● Mettre les données de l’entreprise en
commun, les mailler au niveau le plus fin
15
Faire émerger l’implicite
16
Créer des objets informationnels « métier »
17
Quels outils ?
Le web de données
18
Web de données - web sémantique
● Une fois de plus la solution vient du Web qui
apporte des standards reconnus
19
Web de données – Web sémantique
● Nouvelle évolution du Web dans laquelle les
ordinateurs peuvent publier, capter et
échanger des données de façon automatique
et non ambiguë
● Le Linked Data consiste à lier ces données
et à transformer le Web en une gigantesque
base de connaissances distribuée
20
Le web sémantique, concrètement
Certains en parlent…
d’autres le font !
21
Le web sémantique, concrètement
22
Le web sémantique, concrètement
Knowledge
Graph
23
Knowledge
Graph
Le web sémantique, concrètement
24
Knowledge Graph
Le web sémantique, concrètement
25
Le web sémantique, concrètement
Knowledge
Graph
26
Le web sémantique, concrètement
Knowledge Graph
27
Knowledge
Graph
Le web sémantique, concrètement
28
Le web sémantique, concrètement
Knowledge Graph
29
Le web sémantique, concrètement
Knowledge
Graph
30
Tim Berners-Lee verbatim
« The Semantic Web is a web of data,
in some ways like a global database »
« The Semantic Web is not a separate Web
but an extension of the current one,
in which information is given
well-defined meaning,
better enabling computers and people
to work in cooperation »
31
« Raw data now ! » février 2009
http://www.ted.com/talks/tim_berners_lee_on_the_next_web?language=fr
32
http://www.flickr.com/photos/jimgris/281139738/
L’idée : casser la vieille logique des silos
de données cloisonnées…
Siège social d’Oracle, l’éditeur du SGBDR le
plus utilisé dans le monde, dans la Silicon
Valley
33
…pour partager la donnée structurée sur
un espace décentralisé : le web
Un Web de documents
● Documents reliés par des liens
● Pas de structuration sémantique
● Pas de requêtes structurées
34
…pour partager la donnée structurée sur
un espace décentralisé: le web
Puis un Web d’applications
● Données exposées à travers des API
● API valables uniquement pour un silo
● Pas d’interopérabilité entre les silos
35
…pour partager la donnée structurée sur
un espace décentralisé : le web
Et maintenant un Web de données
● Web de données = espace unifié
● Liens entre les données elles-mêmes
● APIs remplacées par des standards ouverts
36
Une condition nécessaire : assurer
l’interopérabilité des données structurées
● Transport
37
Une condition nécessaire : assurer
l’interopérabilité des données structurées
● Syntaxe
38
Une condition nécessaire : assurer
l’interopérabilité des données structurées
● Sémantique
39
Un langage pour les machines
Une grammaire Le vocabulaire
Des règles
d’écriture
Des moyens
de communication
RDF
RDFS / OWL
Ontologie
RDF/XML
N3, Turtle
RDFa
HTTP
SPARQL
40
Standards : le layer cake aujourd’hui
Déjà normalisé ou
en cours de normalisation
au W3C
41
Le Linked Open Data Cloud - 2014
42
Exemple :
« Musées de France »
43
Le cœur du mashup
« Construire un site
agrégeant des
informations sur les
musées de France »
● Usages : une idée
générale de
l’usage à
développer
● Données : choix du
jeu de données
principal
44
Des jeux de données complémentaires
45
Modélisation des données
Musée
(data.gouv.fr)
Musée
(MCC)
Musée
(Wikidata)
Catégo Musée
(Commons)
Musée
(BnF)
Livre
(BnF)
Oeuvre
(Wikidata)
Artiste
(Wikidata)
POI
(OSM)
Identifiant
Museofile
Nom du musée
Coordonnées
géographiques
46
Objectifs fonctionnels
● Pour l’internaute :
une porte d’entrée
● Se projeter
immédiatement
dans la visite
47
Objectifs fonctionnels
● Pour les
professionnels : un
tableau de bord
● Centraliser
l’information pour
faciliter la curation
des données
48
Construire l’interface utilisateur
Une page Une page agrégeant
de recherche les données
49
Construire l’interface utilisateur
Un onglet thématique par jeu de données :
Œuvres
50
Construire l’interface utilisateur
Un onglet thématique par jeu de données :
Artistes
51
Construire l’interface utilisateur
Un onglet thématique par jeu de données :
Bibliographie
52
Construire l’interface utilisateur
Un onglet thématique par jeu de données :
Images
d’œuvres
53
Construire l’interface utilisateur
Un onglet thématique par jeu de données :
Réseaux
sociaux
54
Construire l’interface utilisateur
Un onglet thématique par jeu de données :
POI
alentour
55
Ce mashup / démo est en ligne
Les Musées en France :
http://bit.ly/MuseesFrance
Profitez-en pour vos week-ends !
56
Quels outils ?
Le Machine Learning
57
Qu’est ce que le Machine Learning ?
● Définition :
Faculté donnée à un ordinateur
d’apprendre un comportement
à partir d’exemples
● Fondement scientifique :
Intelligence Artificielle (IA)
58
L’Intelligence Artifi-quoi ?
59
Re-re-renaissance de l’IA
● L’Intelligence Artificielle a été inventée…
dans les années 70
● Elle est de retour sur le devant de la scène
● Deux facteurs principaux :
● Le développement de la puissance de calcul
● La disponibilités accrues des données !
60
L’événement qui change tout
61
L’événement qui change tout
● Puissance de calcul : 100 serveurs
● Données disponibles : 200 millions de pages
62
L’événement qui change tout
63
Machine Learning : les principes
Dire si un logement se
trouve à New York ou
San Francisco
Altitude des logements
Concept d’attribut
Crédit : http://www.r2d3.us
64
Machine Learning : les principes
Dire si un logement se
trouve à New York ou
San Francisco
Concept de modèle
d’entrainement
65
Données
d’entrainement
Données de test
Machine Learning : les principes
Dire si une maison se
trouve à New York ou
San Francisco
Concept de
surentraînement
66
Qu’est-ce que le Deep Learning ?
● Se base sur les algorithmes de type réseaux
de neurones
● Le système découvre lui-même les attributs et
construit seul le modèle d’entraînement
● Il n’est pas certain qu’un humain puisse
« comprendre » comment fonctionne
vraiment le modèle !
67
Qu’est-ce que le Deep Learning ?
● Peut même aller jusqu’à s’affranchir d’une
base d’entrainement : pas de documents
étiquetés, apprentissage non supervisé
● Avènement rendu possible par la puissance
des GPU - Graphic Computing Units - très
adaptés à ce type de calcul
68
Qu’est-ce que le Deep Learning ?
69
Machine Learning : pour quoi faire ?
● Reconnaissance du texte - y compris
manuscrit - et de la voix humaine
● Traduction automatique
● Text Mining : extraction d’informations
signifiantes
● Aide à la recherche d’information
70
Machine Learning : pour quoi faire ?
● Assistants personnels
● Assistance au diagnostic médical
● Smart cities
● Sécurité informatique
● Robotique
● …
71
Machine Learning : pour quoi faire ?
Boston Dynamics a été racheté par Google en 2013…
72
Le Machine Learning chez Antidot
Enrichir Trouver
Search
Semantic & ComplexMachine Learning
Graph &
Linked Data
73
Classification automatique
74
Classification automatique
75
Classification automatique
76
Enrichissement sémantique
77
Enrichissement sémantique
78
Extraction d’entités
79
Les avantages du ML pour le Text Mining
Merci de votre attention
Des questions ?

Contenu connexe

Tendances

MutEC 2007-2013, pourquoi nous avons inventé nos métiers
MutEC 2007-2013, pourquoi nous avons inventé nos métiersMutEC 2007-2013, pourquoi nous avons inventé nos métiers
MutEC 2007-2013, pourquoi nous avons inventé nos métiersOpenEdition
 
Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.Aleph Technologies
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Philippe METAYER
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessVincent de Stoecklin
 
Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Lilia Sfaxi
 
Mise en place d'une stratégie data
Mise en place d'une stratégie dataMise en place d'une stratégie data
Mise en place d'une stratégie dataData2B
 
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDIPrésentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDIHaShem Selmi
 
La géomatique pous les objets connectés
La géomatique pous les objets connectésLa géomatique pous les objets connectés
La géomatique pous les objets connectésData2B
 
Vers une meilleure connaissance client grâce au big data
Vers une meilleure connaissance client grâce au big dataVers une meilleure connaissance client grâce au big data
Vers une meilleure connaissance client grâce au big dataData2B
 
Utilisation d'Azure Machine Learning dans la détection de Spam
Utilisation d'Azure Machine Learning dans la détection de SpamUtilisation d'Azure Machine Learning dans la détection de Spam
Utilisation d'Azure Machine Learning dans la détection de SpamMicrosoft Décideurs IT
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introductionMouna Torjmen
 
La data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurMicrosoft Ideas
 

Tendances (12)

MutEC 2007-2013, pourquoi nous avons inventé nos métiers
MutEC 2007-2013, pourquoi nous avons inventé nos métiersMutEC 2007-2013, pourquoi nous avons inventé nos métiers
MutEC 2007-2013, pourquoi nous avons inventé nos métiers
 
Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
 
Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture
 
Mise en place d'une stratégie data
Mise en place d'une stratégie dataMise en place d'une stratégie data
Mise en place d'une stratégie data
 
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDIPrésentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDI
 
La géomatique pous les objets connectés
La géomatique pous les objets connectésLa géomatique pous les objets connectés
La géomatique pous les objets connectés
 
Vers une meilleure connaissance client grâce au big data
Vers une meilleure connaissance client grâce au big dataVers une meilleure connaissance client grâce au big data
Vers une meilleure connaissance client grâce au big data
 
Utilisation d'Azure Machine Learning dans la détection de Spam
Utilisation d'Azure Machine Learning dans la détection de SpamUtilisation d'Azure Machine Learning dans la détection de Spam
Utilisation d'Azure Machine Learning dans la détection de Spam
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introduction
 
La data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeur
 

Similaire à Du Big Data à la Smart Information : comment valoriser les actifs informationnels de votre entreprise ?

Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Antidot
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataLudovic Piot
 
SPS Montréal 2018 Comprendre la valeur de Microsoft 365
SPS Montréal 2018   Comprendre la valeur de Microsoft 365SPS Montréal 2018   Comprendre la valeur de Microsoft 365
SPS Montréal 2018 Comprendre la valeur de Microsoft 365Patrick Guimonet
 
Linked Enterprise Data ou comment disposer d'une vue consolidée des données
Linked Enterprise Data ou comment disposer d'une vue consolidée des donnéesLinked Enterprise Data ou comment disposer d'une vue consolidée des données
Linked Enterprise Data ou comment disposer d'une vue consolidée des donnéesAntidot
 
Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Antidot
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel businessMouhsine LAKHDISSI
 
Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)BorderCloud
 
Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019
Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019
Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019Eric Giraudin
 
Projets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersProjets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersEmmanuelle Morlock
 
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...Antidot
 
Abf normandie formation 1 les outils de la communication
Abf normandie formation 1 les outils de la communicationAbf normandie formation 1 les outils de la communication
Abf normandie formation 1 les outils de la communicationSophie C.
 
RV TIC - Le balisage sémantique
RV TIC - Le balisage sémantiqueRV TIC - Le balisage sémantique
RV TIC - Le balisage sémantiqueSherbrooke Innopole
 
Le balisage sémantique, une opportunité pour votre visibilité web
Le balisage sémantique, une opportunité pour votre visibilité webLe balisage sémantique, une opportunité pour votre visibilité web
Le balisage sémantique, une opportunité pour votre visibilité webChic & Barda
 
Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...Gilbert Paquette
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataBorderCloud
 
Tic recherche-scientifique
Tic recherche-scientifiqueTic recherche-scientifique
Tic recherche-scientifiquelazoumi ouarfli
 
Animer un portail documentaire : E-sidoc
Animer un portail documentaire : E-sidocAnimer un portail documentaire : E-sidoc
Animer un portail documentaire : E-sidocClaire Chignard
 
Animer un portail documentaire - E-sidoc
Animer un portail documentaire - E-sidocAnimer un portail documentaire - E-sidoc
Animer un portail documentaire - E-sidocClaire Chignard
 

Similaire à Du Big Data à la Smart Information : comment valoriser les actifs informationnels de votre entreprise ? (20)

Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
 
SPS Montréal 2018 Comprendre la valeur de Microsoft 365
SPS Montréal 2018   Comprendre la valeur de Microsoft 365SPS Montréal 2018   Comprendre la valeur de Microsoft 365
SPS Montréal 2018 Comprendre la valeur de Microsoft 365
 
Linked Enterprise Data ou comment disposer d'une vue consolidée des données
Linked Enterprise Data ou comment disposer d'une vue consolidée des donnéesLinked Enterprise Data ou comment disposer d'une vue consolidée des données
Linked Enterprise Data ou comment disposer d'une vue consolidée des données
 
Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...
 
Internet et ia
Internet et ia Internet et ia
Internet et ia
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)
 
Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019
Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019
Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019
 
Projets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersProjets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiers
 
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
 
Abf normandie formation 1 les outils de la communication
Abf normandie formation 1 les outils de la communicationAbf normandie formation 1 les outils de la communication
Abf normandie formation 1 les outils de la communication
 
Solution Linux 2008 Enterprise 2.0
Solution Linux 2008  Enterprise 2.0Solution Linux 2008  Enterprise 2.0
Solution Linux 2008 Enterprise 2.0
 
RV TIC - Le balisage sémantique
RV TIC - Le balisage sémantiqueRV TIC - Le balisage sémantique
RV TIC - Le balisage sémantique
 
Le balisage sémantique, une opportunité pour votre visibilité web
Le balisage sémantique, une opportunité pour votre visibilité webLe balisage sémantique, une opportunité pour votre visibilité web
Le balisage sémantique, une opportunité pour votre visibilité web
 
Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec Wikidata
 
Tic recherche-scientifique
Tic recherche-scientifiqueTic recherche-scientifique
Tic recherche-scientifique
 
Animer un portail documentaire : E-sidoc
Animer un portail documentaire : E-sidocAnimer un portail documentaire : E-sidoc
Animer un portail documentaire : E-sidoc
 
Animer un portail documentaire - E-sidoc
Animer un portail documentaire - E-sidocAnimer un portail documentaire - E-sidoc
Animer un portail documentaire - E-sidoc
 

Plus de Antidot

Antidot Content Classifier
Antidot Content ClassifierAntidot Content Classifier
Antidot Content ClassifierAntidot
 
Cas client CAIJ
Cas client CAIJCas client CAIJ
Cas client CAIJAntidot
 
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"Antidot
 
Flyer AFS@Store 2015 FR
Flyer AFS@Store 2015 FRFlyer AFS@Store 2015 FR
Flyer AFS@Store 2015 FRAntidot
 
WISS 2015 - Machine Learning lecture by Ludovic Samper
WISS 2015 - Machine Learning lecture by Ludovic Samper WISS 2015 - Machine Learning lecture by Ludovic Samper
WISS 2015 - Machine Learning lecture by Ludovic Samper Antidot
 
Do’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerceDo’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerceAntidot
 
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...Antidot
 
En 2015, quelles sont les bonnes pratiques du searchandising ?
En 2015, quelles sont les bonnes pratiques du searchandising ?En 2015, quelles sont les bonnes pratiques du searchandising ?
En 2015, quelles sont les bonnes pratiques du searchandising ?Antidot
 
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...Antidot
 
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...Antidot
 
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...Antidot
 
Comment sélectionner, qualifier puis exploiter les données ouvertes
Comment sélectionner, qualifier puis exploiter les données ouvertesComment sélectionner, qualifier puis exploiter les données ouvertes
Comment sélectionner, qualifier puis exploiter les données ouvertesAntidot
 
Wikidata : quand Wikipédia s'intéresse aux données
Wikidata : quand Wikipédia s'intéresse aux donnéesWikidata : quand Wikipédia s'intéresse aux données
Wikidata : quand Wikipédia s'intéresse aux donnéesAntidot
 
Comment mettre en relation 
données et documents pour produire 
une informati...
Comment mettre en relation 
données et documents pour produire 
une informati...Comment mettre en relation 
données et documents pour produire 
une informati...
Comment mettre en relation 
données et documents pour produire 
une informati...Antidot
 
Comment booster de 30% et plus le taux de conversion de votre site marchand ?
Comment booster de 30% et plus le taux de conversion de votre site marchand ?Comment booster de 30% et plus le taux de conversion de votre site marchand ?
Comment booster de 30% et plus le taux de conversion de votre site marchand ?Antidot
 
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...Antidot
 
Web sémantique et référentiels : l'avenir de l'image sur le Web
Web sémantique et référentiels : l'avenir de l'image sur le WebWeb sémantique et référentiels : l'avenir de l'image sur le Web
Web sémantique et référentiels : l'avenir de l'image sur le WebAntidot
 
Site web, drives, magasins : AFS@Store, le moteur de recherche qui démultipli...
Site web, drives, magasins : AFS@Store, le moteur de recherche qui démultipli...Site web, drives, magasins : AFS@Store, le moteur de recherche qui démultipli...
Site web, drives, magasins : AFS@Store, le moteur de recherche qui démultipli...Antidot
 
Site web, application mobile ou tablette : AFS@Store, le moteur de recherche ...
Site web, application mobile ou tablette : AFS@Store, le moteur de recherche ...Site web, application mobile ou tablette : AFS@Store, le moteur de recherche ...
Site web, application mobile ou tablette : AFS@Store, le moteur de recherche ...Antidot
 
Avec AFS@Store, tirez profit des bonnes pratiques du searchandizing pour boos...
Avec AFS@Store, tirez profit des bonnes pratiques du searchandizing pour boos...Avec AFS@Store, tirez profit des bonnes pratiques du searchandizing pour boos...
Avec AFS@Store, tirez profit des bonnes pratiques du searchandizing pour boos...Antidot
 

Plus de Antidot (20)

Antidot Content Classifier
Antidot Content ClassifierAntidot Content Classifier
Antidot Content Classifier
 
Cas client CAIJ
Cas client CAIJCas client CAIJ
Cas client CAIJ
 
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
 
Flyer AFS@Store 2015 FR
Flyer AFS@Store 2015 FRFlyer AFS@Store 2015 FR
Flyer AFS@Store 2015 FR
 
WISS 2015 - Machine Learning lecture by Ludovic Samper
WISS 2015 - Machine Learning lecture by Ludovic Samper WISS 2015 - Machine Learning lecture by Ludovic Samper
WISS 2015 - Machine Learning lecture by Ludovic Samper
 
Do’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerceDo’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerce
 
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
 
En 2015, quelles sont les bonnes pratiques du searchandising ?
En 2015, quelles sont les bonnes pratiques du searchandising ?En 2015, quelles sont les bonnes pratiques du searchandising ?
En 2015, quelles sont les bonnes pratiques du searchandising ?
 
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
 
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
 
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
 
Comment sélectionner, qualifier puis exploiter les données ouvertes
Comment sélectionner, qualifier puis exploiter les données ouvertesComment sélectionner, qualifier puis exploiter les données ouvertes
Comment sélectionner, qualifier puis exploiter les données ouvertes
 
Wikidata : quand Wikipédia s'intéresse aux données
Wikidata : quand Wikipédia s'intéresse aux donnéesWikidata : quand Wikipédia s'intéresse aux données
Wikidata : quand Wikipédia s'intéresse aux données
 
Comment mettre en relation 
données et documents pour produire 
une informati...
Comment mettre en relation 
données et documents pour produire 
une informati...Comment mettre en relation 
données et documents pour produire 
une informati...
Comment mettre en relation 
données et documents pour produire 
une informati...
 
Comment booster de 30% et plus le taux de conversion de votre site marchand ?
Comment booster de 30% et plus le taux de conversion de votre site marchand ?Comment booster de 30% et plus le taux de conversion de votre site marchand ?
Comment booster de 30% et plus le taux de conversion de votre site marchand ?
 
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...
 
Web sémantique et référentiels : l'avenir de l'image sur le Web
Web sémantique et référentiels : l'avenir de l'image sur le WebWeb sémantique et référentiels : l'avenir de l'image sur le Web
Web sémantique et référentiels : l'avenir de l'image sur le Web
 
Site web, drives, magasins : AFS@Store, le moteur de recherche qui démultipli...
Site web, drives, magasins : AFS@Store, le moteur de recherche qui démultipli...Site web, drives, magasins : AFS@Store, le moteur de recherche qui démultipli...
Site web, drives, magasins : AFS@Store, le moteur de recherche qui démultipli...
 
Site web, application mobile ou tablette : AFS@Store, le moteur de recherche ...
Site web, application mobile ou tablette : AFS@Store, le moteur de recherche ...Site web, application mobile ou tablette : AFS@Store, le moteur de recherche ...
Site web, application mobile ou tablette : AFS@Store, le moteur de recherche ...
 
Avec AFS@Store, tirez profit des bonnes pratiques du searchandizing pour boos...
Avec AFS@Store, tirez profit des bonnes pratiques du searchandizing pour boos...Avec AFS@Store, tirez profit des bonnes pratiques du searchandizing pour boos...
Avec AFS@Store, tirez profit des bonnes pratiques du searchandizing pour boos...
 

Du Big Data à la Smart Information : comment valoriser les actifs informationnels de votre entreprise ?

Notes de l'éditeur

  1. Avant de nous présenter, une petite question : qui ici était né en 1978 ? Peu de monde… et cela confirme ce que laisse penser ma barbe blanche : je suis devenu « un vieux con de l’informatique » :-) En 1978, âgé de 15 ans, je codais mon premier programme en assembleur Z80 ensuite après une école d’ingénieurs en informatique et intelligence artificielle j’ai vu passer plusieurs vagues technologiques et pas des moindres : j’ai d’abord co-écrit un logiciel serveur pour le web 0.0, celui qu’on consultait sur un petit cube marron avec un écran N&B de 24 lignes par 40 caractères  Puis j’ai vu les débuts du web il y a un peu plus de 20 ans et travaillé pour un des principaux hébergeurs français, Jet Multimédia, depuis vendu à SFR. J’ai ensuite accompagné le lancement de quelques startup lyonnaises avant de rejoindre l’éditeur de logiciels lyonnais Antidot. Je tiens aussi un blog chez ZDNet France où je parle d’infrastructures Internet. Si j’ai tenu à parler devant vous, c’est parce que je considère que la combinaison du web, du big data et de l’intelligence artificielle via le machine learning va apporter une accélération extraordinaire, non seulement de l’informatique mais de toute l’humanité.
  2. Antidot est un éditeur de logiciels lyonnais, qui travailel depuis 15 ans à apporter des solutions logicielles pour que les entreprises valorisent mieux leurs informations et leurs données
  3. Nous avons des clients dans tous les secteurs, principalement ceux-ci.
  4. Voici de quoi je vais vous parler aujourd’hui.
  5. Le Big Data se définit par la combinaison des 4 V… et vous allez voir pourquoi nous considérons que les 2 derniers, Variété et Valeur, sont étroitement liés.
  6. Limiter le Big Data aux données structurées – ce qui peut rentrer dans un tableaux Excel, même gigantesque – c’est passer à côté d’énormément de valeur.
  7. Cette étude de 2012 montre la sous-exploitation des données non structurées
  8. Les données non structurées sont partout dans l’entreprise.
  9. Toutes les applications produisent des données non structurées : comment en exploiter le sens ?
  10. Quand on voit le siège social d’Oracle, principal éditeur de logiciels de bases de données, on comprend pourquoi la vieille logique des silos de données est si prégnante, encore aujourd’hui…
  11. Les données sont le principal actif d’une entreprise. Des entreprises sont mortes d’avoir perdu leurs données.
  12. En reliant des données et documents, on crée de la « smart information »
  13. Le courriel envoyé par le client X de l’entreprise E au commercial Y de votre entreprise parle du projet P, qui implique les produits A et B, etc…
  14. La « smart information » n’est pas générique, elle est produite dans un contexte métier.
  15. Le W3C – http://w3c.org – est l’organisme international indépendant qui standardise le web.
  16. Car le web sémantique est l’objet de nombreuses conférences et travaux de recherche depuis des années, mais c’est aussi déjà une réalité industrielle, notamment pour Google… avec le Knowledge Graph
  17. Pour construire son "graphe de connnaissances", Google agrège des contenus structurés, issus notamment de Freebase (rachetée en 2010) du World Fact Book de la CIA et de plus en plus de Wikidata, la « base de données structurée » de Wikipedia.
  18. Le Knowledge Graph, ce sont ces informations factuelles situées dans une boîte à droite des résultats de recherche… ici pour Antidot où nous travaillons…
  19. Ici pour IDRAC, qui nous a fourni un alternant de bon niveau…
  20. … remarquez que Google y partage une information qu’il détient, comme les « avis » ou les « recherches associées », ici avec d’autres écoles de management.
  21. Le Knowledge Graph permet à Google de répondre directement à des questions, ici sur la population de la France, avec une synthèse d’informations fiables et pertinentes.
  22. Le Knowledge Graph propose également de l’information culturelle, ici avec une frise donnant accès à une info synthétique sur les peintres impressionnistes…
  23. … et là sur le chanteur Renaud…
  24. … pour lequel sont donnés des éléments biographiques et aussi un accès direct à ses principales œuvres, même si à mes yeux il manque la chanson « Hexagone », victime de la censure giscardienne quand j’étais lycéen et codeur débutant, et que je vous invite à écouter ;-)
  25. En cliquant sur l’album « Laisse béton », on a une information très complète sur son contenu et une frise de tous les autres albums, toujours sans quitter Google !
  26. Ce que commence à faire Google avec le Knowledge Graph répond exactement à la vision de Tim Berners-Lee, qui a théorisé le web de données il y a près de 15 ans (une base de données globale pour favoriser la coopération hommes-machines)...
  27. … avant de lancer le mouvement du Linked Open Data en 2009, dans une conférence TED demeurée célèbre et que je vous invite à revoir, en version sous-titrée.
  28. Quand on voit le siège social d’Oracle, principal éditeur de logiciels de bases de données, on comprend pourquoi la vieille logique des silos de données est si prégnante, encore aujourd’hui…
  29. Ca c’est le web des années 90, avec des hyperliens reliant des documents texte, sans vraie structure
  30. Ca c’est le web des années 2000, avec des API permettant d’accéder aux données, chaque fournissseur de données apportant son API spécifique
  31. Et ça c’est le web sémantique, qui a pris son essor dans les années 2010 : les liens se font au niveau le plus granulaire, entre les données elles-mêmes ! Comment est-ce possible ?
  32. Le web fonctionne selon un modèle en couches : HTTP standardise le transport des données…
  33. XML simplifie l’échange direct des données, sans transcodage ou conversion de format…
  34. Reste à mettre derrière les données une sémantique, indépendante de la langue que parlent les internautes… c’est le rôle des ontologies
  35. Voici les standard du web sémantique, tels qu’ils sont validés par le W3C…
  36. Ils forment un socle éprouvé pour des applications industrielles et pérennes… même s’il reste encore un peu de travail, notamment dans les couches supérieures, et particulièrement en ce qui concerne la « confiance » que l’on peut accorder aux données disponibles sur le web.
  37. Voici le « Linked Open Data Cloud », le « nuage des données ouvertes liées » accessibles directement et librement sur le web. Je laisse maintenant la parole à Julien, jeune Jedi du web sémantique, qui va vous montrer en quoi c’est un sabre laser aussi puissant que précis !
  38. Loi de Moore. Plus de données grâce au Big Data et aux objets connectés.
  39. Loi de Moore. Plus de données grâce au Big Data et aux objets connectés.
  40. 2011 : victoire d’IBM Watson sur les deux meilleurs champions de Jeopardy. À plate couture. Evénéments précurseurs (source Wikipedia) : le 11 mai 1997, Deep Blue est devenu le premier système informatique de jeu d'échecs à battre le champion du monde en titre, Garry Kasparov134. En 2005, un robot de Stanford a remporté le DARPA Grand Challenge en conduisant de manière autonome pendant 131 milles sur une piste de désert sans avoir fait de reconnaissance préalable135. Deux ans plus tard, une équipe de Carnegie-Mellon remporte le DARPA Urban Challenge, cette fois en navigant en autonome pendant 55 milles dans un environnement urbain tout en respectant les conditions de trafic et le code de la route136. En février 2011, dans un match de démonstration du jeu télévisé Jeopardy!, les deux plus grands champions de Jeopardy!, Brad Rutter et Ken Jennings ont été battus avec une marge confortable par le système de questions-réponses conçu par IBM, au centre de recherche Watson137. https://fr.wikipedia.org/wiki/Histoire_de_l%27intelligence_artificielle
  41. Si on y réfléchit à deux fois, 200 millions de pages ce n’est pas grand chose à l’échelle de l’information disponible sur le web.
  42. Le système analyse la question et recherche les réponses potentielles en puisant dans un historique des questions/réponses Jeopardy et dans une base documentaire. Mais la particularité du système réside dans la façon dont les réponses potentielles trouvées sont choisies. Les ingénieurs d’IBM n’ont pas développé un algorithme décisionnel classique pour parvenir à ce choix, ils ont laissé la machine apprendre quelles sont les bonnes réponses de sorte que nul ne peut définir aujourd’hui quel est l’agencement de paramètres réellement utilisé par Watson lorsqu’il fait ce choix.
  43. http://www.r2d3.us/visual-intro-to-machine-learning-part-1/
  44. Wired : Google’s Artificial Brain Learns to Find Cat Videos http://www.wired.com/2012/06/google-x-neural-network/
  45. Issu du site de notre client http://www.rechercheisidore.fr Classification automatique de 4 millions de documents de recherche en sciences humaines et sociales selon plus de trente disciplines.
  46. Issu du site de notre client http://www.rechercheisidore.fr Classification automatique de 4 millions de documents de recherche en sciences humaines et sociales selon plus de trente disciplines.
  47. Issu du site de notre client http://caij.qc.ca Classification automatique de 1,5 millions de décisions de justice (ie jurisprudence) selon plus de 100 domaines de droit.
  48. Portail d’information juridique, 5 millions de documents de toutes sortes Suggestions de recherches sémantiques
  49. Portail d’information juridique, 5 millions de documents de toutes sortes Filtrage des informations selon des métadonnées métier.
  50. Implémenté au journal Le Point pour assister à l’étiquetage des articles de la rédaction.
  51. Meilleure qualité Peu d’adhérence à la langue Temps de traitement courts, temps de mise en œuvre court, maintenance très peu chronophage.