SlideShare une entreprise Scribd logo
Comment l’intelligence artificielle
réinvente la fouille de texte
Documation – Data Information Forum 2016
William Lesguillier – Product manager offre Valorisation des Contenus
2
Antidot – Qui sommes-nous ?
● Editeur de logiciels
● Moteurs de recherche| enrichissement des données
● Depuis 1999 | Paris, Lyon, Aix-en-Provence
● 47 collaborateurs, +150 clients
● Mission : délivrer à nos clients des solutions hautement
configurables et innovantes qui créent de la valeur à partir de
leurs données et augmentent leur performance
opérationnelle
3
Parmi nos clients
● Production de contenus
● Industrie
● E-Commerce
● Santé
4
Qu’est-ce que le Machine Learning
● Définition : faculté donnée à un
ordinateur d’apprendre un
comportement à partir d’exemples
● Discipline scientifique : l’Intelligence Artificielle
(IA)
● Mais fondée sur une approche probabiliste, par
opposition aux approches par règles
5
Re-re-renaissance de l’IA
● Après une histoire mouvementée,
l’Intelligence Artificielle est de retour sur le
devant de la scène
● Deux facteurs techniques principaux :
● Le développement de la puissance de calcul
● La disponibilités accrues des données
● Et surtout : des applications directes
6
L’événement qui change tout
William Wilkinson’s ‘An account of the principalities of Wallachia and Modavia’ inspired this author’s most famous novel.
7
L’événement qui change tout
● Puissance de calcul : 100 servers
● Données disponibles : 200 millions de pages
8
L’événement qui change tout
9
ML : illustrations des principes
Dire si un logement se
trouve à New York ou
San Francisco
Altitude des logements
Concept d’attribut
Crédit : http://www.r2d3.us
10
ML : illustrations des principes
Dire si un logement se
trouve à New York ou
San Francisco
Concept de modèle
d’entrainement
11
Données
d’entrainement
Données de test
ML : illustrations des principes
Dire si une maison se
trouve à New York ou
San Francisco
Concept de
surentrainement
12
Qu’est-ce que le Deep Learning ?
● Se base sur les algorithmes de réseaux de
neurones
● Très adapté pour la reconnaissances de signaux
: analyse d’images photo ou vidéo,
reconnaissance sonore, reconnaissance
vocale…
● Avènement grâce à la puissance des GPU
(Graphic Computing Units) très adaptés à ce type
de calcul
13
Approche par couches d’attributs
Yann LeCun, leçon inaugurale au Collège de France : http://www.college-de-france.fr/site/yann-lecun/inaugural-lecture-
2016-02-04-18h00.htm
14
Reconnaissance de texte
Yann LeCun, Collège de France : http://www.college-de-france.fr/site/yann-lecun/inaugural-lecture-2016-02-04-18h00.htm
15
Détection de piétons
Yann LeCun : https://www.youtube.com/watch?v=MnZNSZGNGyc
16
Approches combinées
+ =
17
Approches combinées
18
Machine Learning : pour quoi faire ?
● Reconnaissance du
texte (y compris
manuscrit) et de la
voix
● Traduction
automatique
● Text mining
● Aide à la recherche
d’information
● Assistants personnels
● Assistance au
diagnostic médical
● Smart cities
● Sécurité informatique
● Voiture autonome
● Robotique
● …
19
Le Machine Learning chez Antidot
Enrich Access
Search
Semantic & ComplexText mining
Graph &
Linked Data
20
Classification automatique de texte
Droit de la famille
Droit fiscal
Droit pénal
21
Classification sur rechercheisidore.fr
22
Classification automatique
23
Classifier à partir d’un corpus catégorisé
24
Ou d’un corpus non catégorisé
25
Classification automatique
26
Atelier d’entrainement
27
Atelier d’entrainement
28
Atelier d’entrainement
29
Boucle d’amélioration continue
30
31
Mesurer la qualité des résultats
32
Mesurer la qualité des résultats
33
Précision inégalée
34
Extraction d’entités nommées
35
Extraction d’entités
36
Les avantages du ML pour le text mining
37
Nos autres rendez-vous Documation
● Démonstration Content Classifier
● Speed Demo sur le stand de Sollan aujourd’hui de
12h30 à 12h45
● Conférence avec Spark Archives
● Demain à 10h30
● Notre stand D23
38
Sources et ressources
● Wikipedia : Histoire de l’intelligence artificielle
● TEDx: Ken Jennings, « Watson, Jeopardy and me, the obsolete know-it-all »
● TechRepublic : IBM Watson: The inside story of how the Jeopardy-winning supercomputer was
born, and what it wants to do next
● A visual introduction to machine learning
● Wired : Google’s Artificial Brain Learns to Find Cat Videos
● IBM : machine learning applications
● Le Monde : série d’articles de Morgane Tual sur l’intelligence artificielle
● Yann LeCun : leçon inaugurale au Collège de France
● Yann LeCun, Marc'Aurelio Ranzato : Deep Learning tutorial
● Olivier Ezratty : série de billets de blog sur l’IA
● Tastehit.com : Google DeepMind's AlphaGo: How it works
Merci de votre attention
A vos questions !
@AntidotNet
info@antidot.net

Contenu connexe

Tendances

Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation
Séminaire BIG DATA, SYNTHÈSE - ORSYS FormationSéminaire BIG DATA, SYNTHÈSE - ORSYS Formation
Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation
ORSYS
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big data
Abdelghani Azri
 
Data mining et data science
Data mining et data scienceData mining et data science
Data mining et data science
Rima Jamli Faidi
 
Hadoop en 1461 leçons
Hadoop en 1461 leçonsHadoop en 1461 leçons
Hadoop en 1461 leçons
David Morel
 
Mise en place d'une stratégie data
Mise en place d'une stratégie dataMise en place d'une stratégie data
Mise en place d'une stratégie data
Data2B
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
Vincent de Stoecklin
 
La géomatique pous les objets connectés
La géomatique pous les objets connectésLa géomatique pous les objets connectés
La géomatique pous les objets connectés
Data2B
 
Vers une meilleure connaissance client grâce au big data
Vers une meilleure connaissance client grâce au big dataVers une meilleure connaissance client grâce au big data
Vers une meilleure connaissance client grâce au big data
Data2B
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
Philippe METAYER
 
MutEC 2007-2013, pourquoi nous avons inventé nos métiers
MutEC 2007-2013, pourquoi nous avons inventé nos métiersMutEC 2007-2013, pourquoi nous avons inventé nos métiers
MutEC 2007-2013, pourquoi nous avons inventé nos métiers
OpenEdition
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introduction
Mouna Torjmen
 

Tendances (11)

Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation
Séminaire BIG DATA, SYNTHÈSE - ORSYS FormationSéminaire BIG DATA, SYNTHÈSE - ORSYS Formation
Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big data
 
Data mining et data science
Data mining et data scienceData mining et data science
Data mining et data science
 
Hadoop en 1461 leçons
Hadoop en 1461 leçonsHadoop en 1461 leçons
Hadoop en 1461 leçons
 
Mise en place d'une stratégie data
Mise en place d'une stratégie dataMise en place d'une stratégie data
Mise en place d'une stratégie data
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
 
La géomatique pous les objets connectés
La géomatique pous les objets connectésLa géomatique pous les objets connectés
La géomatique pous les objets connectés
 
Vers une meilleure connaissance client grâce au big data
Vers une meilleure connaissance client grâce au big dataVers une meilleure connaissance client grâce au big data
Vers une meilleure connaissance client grâce au big data
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
 
MutEC 2007-2013, pourquoi nous avons inventé nos métiers
MutEC 2007-2013, pourquoi nous avons inventé nos métiersMutEC 2007-2013, pourquoi nous avons inventé nos métiers
MutEC 2007-2013, pourquoi nous avons inventé nos métiers
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introduction
 

Similaire à Comment l’intelligence artificielle réinvente la fouille de texte

Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
Ludovic Piot
 
Le Machine Learning pour lutter contre les menaces en termes de Cybersécurité...
Le Machine Learning pour lutter contre les menaces en termes de Cybersécurité...Le Machine Learning pour lutter contre les menaces en termes de Cybersécurité...
Le Machine Learning pour lutter contre les menaces en termes de Cybersécurité...
Philippe Beraud
 
Softshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et TechnologiesSoftshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et Technologies
OCTO Technology Suisse
 
L'IoT, c'est maintenant. Microsoft Experiences 2016
L'IoT, c'est maintenant. Microsoft Experiences 2016L'IoT, c'est maintenant. Microsoft Experiences 2016
L'IoT, c'est maintenant. Microsoft Experiences 2016
Alex Danvy
 
La data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeur
Microsoft Ideas
 
2019-06-04 aOS Strasbourg - Décideurs 1 - L'intelligence artificielle démysti...
2019-06-04 aOS Strasbourg - Décideurs 1 - L'intelligence artificielle démysti...2019-06-04 aOS Strasbourg - Décideurs 1 - L'intelligence artificielle démysti...
2019-06-04 aOS Strasbourg - Décideurs 1 - L'intelligence artificielle démysti...
aOS Community
 
Comment le Data et Deep Learning révolutionnent la science
Comment le Data et Deep Learning révolutionnent la scienceComment le Data et Deep Learning révolutionnent la science
Comment le Data et Deep Learning révolutionnent la science
habib200
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4j
Neo4j
 
EXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptxEXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptx
Infopole1
 
XebiCon'17 : Le Deep Learning dans la vraie vie - Sandra Pietrowska et Yoann ...
XebiCon'17 : Le Deep Learning dans la vraie vie - Sandra Pietrowska et Yoann ...XebiCon'17 : Le Deep Learning dans la vraie vie - Sandra Pietrowska et Yoann ...
XebiCon'17 : Le Deep Learning dans la vraie vie - Sandra Pietrowska et Yoann ...
Publicis Sapient Engineering
 
IA C'EST MON DADA : Conference introduction machine learning et IA
IA C'EST MON DADA : Conference introduction machine learning et IAIA C'EST MON DADA : Conference introduction machine learning et IA
IA C'EST MON DADA : Conference introduction machine learning et IA
Halszka de Breza
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4j
Neo4j
 
Reconnaissance de formes
Reconnaissance de formesReconnaissance de formes
Reconnaissance de formes
ASSAH Esdras Jean Jude
 
Objets Connectés (IoT) et Data Science
Objets Connectés (IoT) et Data ScienceObjets Connectés (IoT) et Data Science
Objets Connectés (IoT) et Data Science
Soft Computing
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
Mouhsine LAKHDISSI
 
IODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceIODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data Science
BorderCloud
 
29/06/17 Matinale Python
29/06/17 Matinale Python29/06/17 Matinale Python
29/06/17 Matinale Python
Soft Computing
 
Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...
Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...
Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...
I MT
 
Outils data
Outils dataOutils data
Outils data
JonathanChauvin1
 
Conférence les technologies du numérique st exupéry 8 nov. 2017
Conférence les technologies du numérique st exupéry 8 nov.  2017Conférence les technologies du numérique st exupéry 8 nov.  2017
Conférence les technologies du numérique st exupéry 8 nov. 2017
SinGuy
 

Similaire à Comment l’intelligence artificielle réinvente la fouille de texte (20)

Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
 
Le Machine Learning pour lutter contre les menaces en termes de Cybersécurité...
Le Machine Learning pour lutter contre les menaces en termes de Cybersécurité...Le Machine Learning pour lutter contre les menaces en termes de Cybersécurité...
Le Machine Learning pour lutter contre les menaces en termes de Cybersécurité...
 
Softshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et TechnologiesSoftshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et Technologies
 
L'IoT, c'est maintenant. Microsoft Experiences 2016
L'IoT, c'est maintenant. Microsoft Experiences 2016L'IoT, c'est maintenant. Microsoft Experiences 2016
L'IoT, c'est maintenant. Microsoft Experiences 2016
 
La data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeur
 
2019-06-04 aOS Strasbourg - Décideurs 1 - L'intelligence artificielle démysti...
2019-06-04 aOS Strasbourg - Décideurs 1 - L'intelligence artificielle démysti...2019-06-04 aOS Strasbourg - Décideurs 1 - L'intelligence artificielle démysti...
2019-06-04 aOS Strasbourg - Décideurs 1 - L'intelligence artificielle démysti...
 
Comment le Data et Deep Learning révolutionnent la science
Comment le Data et Deep Learning révolutionnent la scienceComment le Data et Deep Learning révolutionnent la science
Comment le Data et Deep Learning révolutionnent la science
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4j
 
EXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptxEXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptx
 
XebiCon'17 : Le Deep Learning dans la vraie vie - Sandra Pietrowska et Yoann ...
XebiCon'17 : Le Deep Learning dans la vraie vie - Sandra Pietrowska et Yoann ...XebiCon'17 : Le Deep Learning dans la vraie vie - Sandra Pietrowska et Yoann ...
XebiCon'17 : Le Deep Learning dans la vraie vie - Sandra Pietrowska et Yoann ...
 
IA C'EST MON DADA : Conference introduction machine learning et IA
IA C'EST MON DADA : Conference introduction machine learning et IAIA C'EST MON DADA : Conference introduction machine learning et IA
IA C'EST MON DADA : Conference introduction machine learning et IA
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4j
 
Reconnaissance de formes
Reconnaissance de formesReconnaissance de formes
Reconnaissance de formes
 
Objets Connectés (IoT) et Data Science
Objets Connectés (IoT) et Data ScienceObjets Connectés (IoT) et Data Science
Objets Connectés (IoT) et Data Science
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
IODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceIODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data Science
 
29/06/17 Matinale Python
29/06/17 Matinale Python29/06/17 Matinale Python
29/06/17 Matinale Python
 
Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...
Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...
Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...
 
Outils data
Outils dataOutils data
Outils data
 
Conférence les technologies du numérique st exupéry 8 nov. 2017
Conférence les technologies du numérique st exupéry 8 nov.  2017Conférence les technologies du numérique st exupéry 8 nov.  2017
Conférence les technologies du numérique st exupéry 8 nov. 2017
 

Plus de Antidot

Antidot Content Classifier
Antidot Content ClassifierAntidot Content Classifier
Antidot Content Classifier
Antidot
 
Cas client CAIJ
Cas client CAIJCas client CAIJ
Cas client CAIJ
Antidot
 
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Antidot
 
Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?
Antidot
 
Flyer AFS@Store 2015 FR
Flyer AFS@Store 2015 FRFlyer AFS@Store 2015 FR
Flyer AFS@Store 2015 FR
Antidot
 
WISS 2015 - Machine Learning lecture by Ludovic Samper
WISS 2015 - Machine Learning lecture by Ludovic Samper WISS 2015 - Machine Learning lecture by Ludovic Samper
WISS 2015 - Machine Learning lecture by Ludovic Samper
Antidot
 
Do’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerceDo’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerce
Antidot
 
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Antidot
 
En 2015, quelles sont les bonnes pratiques du searchandising ?
En 2015, quelles sont les bonnes pratiques du searchandising ?En 2015, quelles sont les bonnes pratiques du searchandising ?
En 2015, quelles sont les bonnes pratiques du searchandising ?
Antidot
 
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Antidot
 
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Antidot
 
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Antidot
 
Comment sélectionner, qualifier puis exploiter les données ouvertes
Comment sélectionner, qualifier puis exploiter les données ouvertesComment sélectionner, qualifier puis exploiter les données ouvertes
Comment sélectionner, qualifier puis exploiter les données ouvertes
Antidot
 
Wikidata : quand Wikipédia s'intéresse aux données
Wikidata : quand Wikipédia s'intéresse aux donnéesWikidata : quand Wikipédia s'intéresse aux données
Wikidata : quand Wikipédia s'intéresse aux données
Antidot
 
Comment mettre en relation 
données et documents pour produire 
une informati...
Comment mettre en relation 
données et documents pour produire 
une informati...Comment mettre en relation 
données et documents pour produire 
une informati...
Comment mettre en relation 
données et documents pour produire 
une informati...
Antidot
 
Comment booster de 30% et plus le taux de conversion de votre site marchand ?
Comment booster de 30% et plus le taux de conversion de votre site marchand ?Comment booster de 30% et plus le taux de conversion de votre site marchand ?
Comment booster de 30% et plus le taux de conversion de votre site marchand ?
Antidot
 
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...
Antidot
 
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Antidot
 
Web sémantique et référentiels : l'avenir de l'image sur le Web
Web sémantique et référentiels : l'avenir de l'image sur le WebWeb sémantique et référentiels : l'avenir de l'image sur le Web
Web sémantique et référentiels : l'avenir de l'image sur le Web
Antidot
 
Site web, drives, magasins : AFS@Store, le moteur de recherche qui démultipli...
Site web, drives, magasins : AFS@Store, le moteur de recherche qui démultipli...Site web, drives, magasins : AFS@Store, le moteur de recherche qui démultipli...
Site web, drives, magasins : AFS@Store, le moteur de recherche qui démultipli...
Antidot
 

Plus de Antidot (20)

Antidot Content Classifier
Antidot Content ClassifierAntidot Content Classifier
Antidot Content Classifier
 
Cas client CAIJ
Cas client CAIJCas client CAIJ
Cas client CAIJ
 
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
 
Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?
 
Flyer AFS@Store 2015 FR
Flyer AFS@Store 2015 FRFlyer AFS@Store 2015 FR
Flyer AFS@Store 2015 FR
 
WISS 2015 - Machine Learning lecture by Ludovic Samper
WISS 2015 - Machine Learning lecture by Ludovic Samper WISS 2015 - Machine Learning lecture by Ludovic Samper
WISS 2015 - Machine Learning lecture by Ludovic Samper
 
Do’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerceDo’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerce
 
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
 
En 2015, quelles sont les bonnes pratiques du searchandising ?
En 2015, quelles sont les bonnes pratiques du searchandising ?En 2015, quelles sont les bonnes pratiques du searchandising ?
En 2015, quelles sont les bonnes pratiques du searchandising ?
 
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
 
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
 
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
 
Comment sélectionner, qualifier puis exploiter les données ouvertes
Comment sélectionner, qualifier puis exploiter les données ouvertesComment sélectionner, qualifier puis exploiter les données ouvertes
Comment sélectionner, qualifier puis exploiter les données ouvertes
 
Wikidata : quand Wikipédia s'intéresse aux données
Wikidata : quand Wikipédia s'intéresse aux donnéesWikidata : quand Wikipédia s'intéresse aux données
Wikidata : quand Wikipédia s'intéresse aux données
 
Comment mettre en relation 
données et documents pour produire 
une informati...
Comment mettre en relation 
données et documents pour produire 
une informati...Comment mettre en relation 
données et documents pour produire 
une informati...
Comment mettre en relation 
données et documents pour produire 
une informati...
 
Comment booster de 30% et plus le taux de conversion de votre site marchand ?
Comment booster de 30% et plus le taux de conversion de votre site marchand ?Comment booster de 30% et plus le taux de conversion de votre site marchand ?
Comment booster de 30% et plus le taux de conversion de votre site marchand ?
 
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...
Antidot Semantic Publishing - Réussir un site éditorial agrégeant plusieurs s...
 
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
 
Web sémantique et référentiels : l'avenir de l'image sur le Web
Web sémantique et référentiels : l'avenir de l'image sur le WebWeb sémantique et référentiels : l'avenir de l'image sur le Web
Web sémantique et référentiels : l'avenir de l'image sur le Web
 
Site web, drives, magasins : AFS@Store, le moteur de recherche qui démultipli...
Site web, drives, magasins : AFS@Store, le moteur de recherche qui démultipli...Site web, drives, magasins : AFS@Store, le moteur de recherche qui démultipli...
Site web, drives, magasins : AFS@Store, le moteur de recherche qui démultipli...
 

Comment l’intelligence artificielle réinvente la fouille de texte

Notes de l'éditeur

  1. Loi de Moore. Plus de données grâce au Big Data et aux objets connectés.
  2. 2011 : victoire d’IBM Watson sur les deux meilleurs champions de Jeopardy. A plate couture. Evénements précurseurs (source Wikipedia) : le 11 mai 1997, Deep Blue est devenu le premier système informatique de jeu d'échecs à battre le champion du monde en titre, Garry Kasparov134. En 2005, un robot de Stanford a remporté le DARPA Grand Challenge en conduisant de manière autonome pendant 131 milles sur une piste de désert sans avoir fait de reconnaissance préalable135. Deux ans plus tard, une équipe de Carnegie-Mellon remporte le DARPA Urban Challenge, cette fois en navigant en autonome pendant 55 milles dans un environnement urbain tout en respectant les conditions de trafic et le code de la route136. En février 2011, dans un match de démonstration du jeu télévisé Jeopardy!, les deux plus grands champions de Jeopardy!, Brad Rutter et Ken Jennings ont été battus avec une marge confortable par le système de questions-réponses conçu par IBM, au centre de recherche Watson137. https://fr.wikipedia.org/wiki/Histoire_de_l%27intelligence_artificielle
  3. Si on y réfléchit à deux fois, 200 millions de pages ce n’est pas grand chose à l’échelle de l’information disponible sur le web.
  4. Le système analyse la question et recherche les réponses potentielles en puisant dans un historique des questions/réponses Jeopardy et dans une base documentaire. Mais la particularité du système réside dans la façon dont les réponses potentielles trouvées sont choisies. Les ingénieurs d’IBM n’ont pas développé un algorithme décisionnel classique pour parvenir à ce choix, ils ont laissé la machine apprendre quelles sont les bonnes réponses de sorte que nul ne peut définir aujourd’hui quel est l’agencement de paramètres réellement utilisé par Watson lorsqu’il fait ce choix.
  5. http://www.r2d3.us/visual-intro-to-machine-learning-part-1/
  6. Laboratoires Bel, lecture automatique de texte, 1992. Yann LeCun, Collège de France : http://www.college-de-france.fr/site/yann-lecun/inaugural-lecture-2016-02-04-18h00.htm
  7. Yann LeCun : https://www.youtube.com/watch?v=MnZNSZGNGyc
  8. Issu du site de notre client http://www.rechercheisidore.fr Classification automatique de 3,5 millions de documents de recherche en sciences humaines et sociales selon plus de trente disciplines.
  9. Issu du site de notre client http://caij.qc.ca Classification automatique de 1,5 millions de décisions juridiques (ie jurisprudence) selon plus de 100 domaines de droit.
  10. Implémenté au journal Le Point pour assister à l’étiquetage des articles de la rédaction.
  11. Meilleure qualité Peu d’adhérence à la langue Temps de traitement courts, temps de mise en œuvre court, maintenance très peu chronophage.