Comment l’intelligence artificielle
réinvente la fouille de texte
Documation – Data Information Forum 2016
William Lesguil...
2
Antidot – Qui sommes-nous ?
● Editeur de logiciels
● Moteurs de recherche| enrichissement des données
● Depuis 1999 | Pa...
3
Parmi nos clients
● Production de contenus
● Industrie
● E-Commerce
● Santé
4
Qu’est-ce que le Machine Learning
● Définition : faculté donnée à un
ordinateur d’apprendre un
comportement à partir d’e...
5
Re-re-renaissance de l’IA
● Après une histoire mouvementée,
l’Intelligence Artificielle est de retour sur le
devant de l...
6
L’événement qui change tout
William Wilkinson’s ‘An account of the principalities of Wallachia and Modavia’ inspired thi...
7
L’événement qui change tout
● Puissance de calcul : 100 servers
● Données disponibles : 200 millions de pages
8
L’événement qui change tout
9
ML : illustrations des principes
Dire si un logement se
trouve à New York ou
San Francisco
Altitude des logements
Concep...
10
ML : illustrations des principes
Dire si un logement se
trouve à New York ou
San Francisco
Concept de modèle
d’entraine...
11
Données
d’entrainement
Données de test
ML : illustrations des principes
Dire si une maison se
trouve à New York ou
San ...
12
Qu’est-ce que le Deep Learning ?
● Se base sur les algorithmes de réseaux de
neurones
● Très adapté pour la reconnaissa...
13
Approche par couches d’attributs
Yann LeCun, leçon inaugurale au Collège de France : http://www.college-de-france.fr/si...
14
Reconnaissance de texte
Yann LeCun, Collège de France : http://www.college-de-france.fr/site/yann-lecun/inaugural-lectu...
15
Détection de piétons
Yann LeCun : https://www.youtube.com/watch?v=MnZNSZGNGyc
16
Approches combinées
+ =
17
Approches combinées
18
Machine Learning : pour quoi faire ?
● Reconnaissance du
texte (y compris
manuscrit) et de la
voix
● Traduction
automat...
19
Le Machine Learning chez Antidot
Enrich Access
Search
Semantic & ComplexText mining
Graph &
Linked Data
20
Classification automatique de texte
Droit de la famille
Droit fiscal
Droit pénal
21
Classification sur rechercheisidore.fr
22
Classification automatique
23
Classifier à partir d’un corpus catégorisé
24
Ou d’un corpus non catégorisé
25
Classification automatique
26
Atelier d’entrainement
27
Atelier d’entrainement
28
Atelier d’entrainement
29
Boucle d’amélioration continue
30
31
Mesurer la qualité des résultats
32
Mesurer la qualité des résultats
33
Précision inégalée
34
Extraction d’entités nommées
35
Extraction d’entités
36
Les avantages du ML pour le text mining
37
Nos autres rendez-vous Documation
● Démonstration Content Classifier
● Speed Demo sur le stand de Sollan aujourd’hui de...
38
Sources et ressources
● Wikipedia : Histoire de l’intelligence artificielle
● TEDx: Ken Jennings, « Watson, Jeopardy an...
Merci de votre attention
A vos questions !
@AntidotNet
info@antidot.net
Prochain SlideShare
Chargement dans…5
×

Comment l’intelligence artificielle réinvente la fouille de texte

2 906 vues

Publié le

La fouille de texte a déjà prouvé son intérêt pour tirer le sens des contenus et les enrichir avec des informations contextuelles, ce qui facilite la navigation, la recherche et aujourd’hui la recommandation automatique d’information. Cependant, les approches conventionnelles sont complexes à mettre en œuvre et coûteuses à exploiter pour une qualité pas toujours au rendez-vous.
Grâce aux nouvelles approches statistiques issues du machine learning, la classification automatique de documents et l’extraction d’entités nommées deviennent très accessibles et bien plus qualitatives. 
Antidot vous présentera deux retours d’expérience sur ces nouvelles approches dans des contextes clients opérationnels dans le domaine de l’information juridique avec le CAIJ (Centre d’Accès à l’Information Juridique du Québec) et dans le domaine de la presse avec l’hebdomadaire Le Point.

Publié dans : Internet
  • Soyez le premier à commenter

Comment l’intelligence artificielle réinvente la fouille de texte

  1. 1. Comment l’intelligence artificielle réinvente la fouille de texte Documation – Data Information Forum 2016 William Lesguillier – Product manager offre Valorisation des Contenus
  2. 2. 2 Antidot – Qui sommes-nous ? ● Editeur de logiciels ● Moteurs de recherche| enrichissement des données ● Depuis 1999 | Paris, Lyon, Aix-en-Provence ● 47 collaborateurs, +150 clients ● Mission : délivrer à nos clients des solutions hautement configurables et innovantes qui créent de la valeur à partir de leurs données et augmentent leur performance opérationnelle
  3. 3. 3 Parmi nos clients ● Production de contenus ● Industrie ● E-Commerce ● Santé
  4. 4. 4 Qu’est-ce que le Machine Learning ● Définition : faculté donnée à un ordinateur d’apprendre un comportement à partir d’exemples ● Discipline scientifique : l’Intelligence Artificielle (IA) ● Mais fondée sur une approche probabiliste, par opposition aux approches par règles
  5. 5. 5 Re-re-renaissance de l’IA ● Après une histoire mouvementée, l’Intelligence Artificielle est de retour sur le devant de la scène ● Deux facteurs techniques principaux : ● Le développement de la puissance de calcul ● La disponibilités accrues des données ● Et surtout : des applications directes
  6. 6. 6 L’événement qui change tout William Wilkinson’s ‘An account of the principalities of Wallachia and Modavia’ inspired this author’s most famous novel.
  7. 7. 7 L’événement qui change tout ● Puissance de calcul : 100 servers ● Données disponibles : 200 millions de pages
  8. 8. 8 L’événement qui change tout
  9. 9. 9 ML : illustrations des principes Dire si un logement se trouve à New York ou San Francisco Altitude des logements Concept d’attribut Crédit : http://www.r2d3.us
  10. 10. 10 ML : illustrations des principes Dire si un logement se trouve à New York ou San Francisco Concept de modèle d’entrainement
  11. 11. 11 Données d’entrainement Données de test ML : illustrations des principes Dire si une maison se trouve à New York ou San Francisco Concept de surentrainement
  12. 12. 12 Qu’est-ce que le Deep Learning ? ● Se base sur les algorithmes de réseaux de neurones ● Très adapté pour la reconnaissances de signaux : analyse d’images photo ou vidéo, reconnaissance sonore, reconnaissance vocale… ● Avènement grâce à la puissance des GPU (Graphic Computing Units) très adaptés à ce type de calcul
  13. 13. 13 Approche par couches d’attributs Yann LeCun, leçon inaugurale au Collège de France : http://www.college-de-france.fr/site/yann-lecun/inaugural-lecture- 2016-02-04-18h00.htm
  14. 14. 14 Reconnaissance de texte Yann LeCun, Collège de France : http://www.college-de-france.fr/site/yann-lecun/inaugural-lecture-2016-02-04-18h00.htm
  15. 15. 15 Détection de piétons Yann LeCun : https://www.youtube.com/watch?v=MnZNSZGNGyc
  16. 16. 16 Approches combinées + =
  17. 17. 17 Approches combinées
  18. 18. 18 Machine Learning : pour quoi faire ? ● Reconnaissance du texte (y compris manuscrit) et de la voix ● Traduction automatique ● Text mining ● Aide à la recherche d’information ● Assistants personnels ● Assistance au diagnostic médical ● Smart cities ● Sécurité informatique ● Voiture autonome ● Robotique ● …
  19. 19. 19 Le Machine Learning chez Antidot Enrich Access Search Semantic & ComplexText mining Graph & Linked Data
  20. 20. 20 Classification automatique de texte Droit de la famille Droit fiscal Droit pénal
  21. 21. 21 Classification sur rechercheisidore.fr
  22. 22. 22 Classification automatique
  23. 23. 23 Classifier à partir d’un corpus catégorisé
  24. 24. 24 Ou d’un corpus non catégorisé
  25. 25. 25 Classification automatique
  26. 26. 26 Atelier d’entrainement
  27. 27. 27 Atelier d’entrainement
  28. 28. 28 Atelier d’entrainement
  29. 29. 29 Boucle d’amélioration continue
  30. 30. 30
  31. 31. 31 Mesurer la qualité des résultats
  32. 32. 32 Mesurer la qualité des résultats
  33. 33. 33 Précision inégalée
  34. 34. 34 Extraction d’entités nommées
  35. 35. 35 Extraction d’entités
  36. 36. 36 Les avantages du ML pour le text mining
  37. 37. 37 Nos autres rendez-vous Documation ● Démonstration Content Classifier ● Speed Demo sur le stand de Sollan aujourd’hui de 12h30 à 12h45 ● Conférence avec Spark Archives ● Demain à 10h30 ● Notre stand D23
  38. 38. 38 Sources et ressources ● Wikipedia : Histoire de l’intelligence artificielle ● TEDx: Ken Jennings, « Watson, Jeopardy and me, the obsolete know-it-all » ● TechRepublic : IBM Watson: The inside story of how the Jeopardy-winning supercomputer was born, and what it wants to do next ● A visual introduction to machine learning ● Wired : Google’s Artificial Brain Learns to Find Cat Videos ● IBM : machine learning applications ● Le Monde : série d’articles de Morgane Tual sur l’intelligence artificielle ● Yann LeCun : leçon inaugurale au Collège de France ● Yann LeCun, Marc'Aurelio Ranzato : Deep Learning tutorial ● Olivier Ezratty : série de billets de blog sur l’IA ● Tastehit.com : Google DeepMind's AlphaGo: How it works
  39. 39. Merci de votre attention A vos questions ! @AntidotNet info@antidot.net

×