SlideShare une entreprise Scribd logo
1  sur  26
MASTER WEB INTELLIGENCE
PLATE-FORME ET
COMPÉTITION POUR
L’APPRENTISSAGE ACTIF
David Combe 16 juin 2009
L’apprentissage actif
 Il consiste à faire apprendre une machine sur la
base d’une interaction avec une entité en
connexion avec le concept à découvrir.
 Il permet de se passer d’une phase de
consolidation des données et, s’il est bien fait, de
minimiser les données utilisées.
 Exemples de la vie quotidienne
 Mastermind
 Dichotomie
Applications
 Filtrage d’e-mail
 Wrapper induction (contexte de données dans
des pages web par exemple)
 Etude de circuits intégrés
 Robotique
 Recherche d’information basée sur des
évaluations…
L’Oracle
 C’est souvent un être humain, parfois même
un expert.
 Il n’aime pas forcément être ennuyé.
 Il est soucieux du nombre et la nature des
requêtes utilisées.
 Plus encore que la complexité temporelle,
c’est le nombre de requêtes utilisées qui
distingue un bon algorithme.
Requêtes
 La grammaire dont il est question ici est celle
des langages rationnels (AFD)
 Requête d’appartenance
le mot « ab » appartient-il au langage étudié ?
 Requête d’équivalence
l’automate que je propose pour le langage est-il
correct.
Zulu
 Zulu propose de comparer l’efficacité des
algorithmes d’apprentissage actif d’automates
et d’en découvrir de nouveaux.
 Proposer la génération de tâches
À partir du générateur d’automates de Gowachin.
Gowachin est aussi en charge de l’échantillon de
test de 1800 mots.
Tâche
 Un automate tiré aléatoirement
 On fixe une borne maximum du nombre d’états
 On définit la taille de l’alphabet.
 Le but
Après un nombre prédéterminé de requêtes
d’appartenance autorisées, il faut arriver à classer
1800 mots dans les classes positif/négatif.
Tâche
Tâche
Tableau de bord
Evaluation
Et aussi
 Création de challenge pour comparer son
score à celui d’un autre joueur
 Panneau d’administration
 Fil RSS des scores publiés
Cible et challenge
Déroulement
 Phase d’entraînement
 Communication auprès des personnes
concernées
 Phase de compétition
 Formation d’un comité scientifique
 Evaluation des performances à définir
Algorithme de référence
 Pour montrer que la problématique est réelle
 Pour fournir un algorithme réalisant la tâche,
susceptible d’être amélioré et faciliter l’entrée
des participants dans le projet
 L’algorithme proposé est L*.
Résultats théoriques
 Il n’est pas possible d’apprendre de manière
exacte un automate avec uniquement des
requêtes d’appartenance.
 Il n’est pas possible d’apprendre de manière
exacte un automate avec uniquement des
requêtes d’équivalence.
 L’apprentissage d’un automate est possible
avec ces 2 types de requêtes
polynomialement sur le nombre de requêtes.
L*
 Créé par Dana Angluin en 1989
 L* renvoie toujours l’automate minimal.
 L* construit une table d’observation et fait en
sorte qu’elle respecte 2 propriétés :
 la fermeture
 la consistance
 Lorsque ces 2 propriétés sont vérifiées, L*
construit l’automate associé et le soumet à
l’Oracle pour validation.
Simulation
 Exécution de L* sur un langage simple
 L = {les mots qui finissent par « ba »}
 Les requêtes d’équivalence sont en pratique
difficiles à formuler. D. Angluin propose de les
remplacer par un ensemble de requêtes
d’appartenance sur des mots choisis au
hasard.
 L’apprentissage devient non déterministe et
statistique.
Comportement de L*
 L* a un effet de palier important :
Un automate n’est constructible que lorsque la
table d’observation est fermée et consistante, ce
qui arrive entre 6 et 11 fois sur des problèmes
moyens à 2 lettres et encore moins souvent avec
3 lettres et plus.
 Lorsque l’on a atteint la limite de requêtes on
retombe au palier précédent.
 Pour avoir un bon score il faudra gommer ces
effets ou prévoir la fin des requêtes autorisées
Exemple
40
50
60
70
80
90
100
0 500 1000 1500 2000 2500 3000 3500 4000
Score
Nombre de requêtes d'appartenance
Nombre de requêtes / score lors
des simulations de requêtes
d’équivalence
Sur un même problème
de 107 états
Evaluation
 Un problème multi-dimensions difficile à
évaluer
 Dimensions à maximiser :
 Score
 Nombre d’états de l’automate
 Taille de l’alphabet
 Dimension à minimiser :
 Nombre de requêtes
Différentes façons de proposer une
tâche évaluable
 Fixer un score minimal à atteindre, par exemple
97% de l’automate appris, et un nombre de
requêtes autorisées. Le gagnant est le joueur qui
a appris de cette manière le plus gros automate.
 Similaire à Abbadingo
 La baseline sert à établir un nombre de référence
des requêtes autorisées. Le gagnant est la
personne qui obtient le meilleur rapport « Score
du joueur / Score de la baseline » pour le nombre
de requêtes autorisées
 Sous réserve que la baseline soit suffisamment bonne
et que le score de la baseline ne soit pas trop
aléatoire
 Restreindre la classe des automates
Compétition : évaluation
 Divers problèmes générés à
l’avance, identiques pour tous les joueurs
 Le gagnant devra envoyer son programme
pour validation du classement.
 Compétition en 2010.
Perspectives
 Autres requêtes (telles que les requêtes de
correction)
 Autres grammaires (langages hors-contexte)
Fin

Contenu connexe

En vedette

Presentation Journée Thématique - Fouille de Grands Graphes
Presentation Journée Thématique - Fouille de Grands GraphesPresentation Journée Thématique - Fouille de Grands Graphes
Presentation Journée Thématique - Fouille de Grands GraphesJuan David Cruz-Gómez
 
ToTeM : une méthode de détection de communautés adaptée à la fouille de résea...
ToTeM : une méthode de détection de communautés adaptée à la fouille de résea...ToTeM : une méthode de détection de communautés adaptée à la fouille de résea...
ToTeM : une méthode de détection de communautés adaptée à la fouille de résea...David Combe
 
A Social Network Based Model for e-Mail Information Visualization - Sunbelt ...
A Social Network Based Model for e-Mail  Information Visualization - Sunbelt ...A Social Network Based Model for e-Mail  Information Visualization - Sunbelt ...
A Social Network Based Model for e-Mail Information Visualization - Sunbelt ...Juan David Cruz-Gómez
 
The Digital Divide and Teaching: How Do Our Students Really Use Technology?
The Digital Divide and Teaching: How Do Our Students Really Use Technology?The Digital Divide and Teaching: How Do Our Students Really Use Technology?
The Digital Divide and Teaching: How Do Our Students Really Use Technology?Derek Bruff
 
Big Data à destination du secteur commercial
Big Data à destination du secteur commercialBig Data à destination du secteur commercial
Big Data à destination du secteur commercialDavid Combe
 
Détection de communautés dans des réseaux d’information utilisant liens et at...
Détection de communautés dans des réseaux d’information utilisant liens et at...Détection de communautés dans des réseaux d’information utilisant liens et at...
Détection de communautés dans des réseaux d’information utilisant liens et at...David Combe
 
Teaching Problem Solving
Teaching Problem SolvingTeaching Problem Solving
Teaching Problem SolvingDerek Bruff
 
Authoring cycle 2
Authoring cycle 2Authoring cycle 2
Authoring cycle 2erbigelow
 
A comparative study of social network analysis tools
A comparative study of social network analysis toolsA comparative study of social network analysis tools
A comparative study of social network analysis toolsDavid Combe
 
Social network analysis course 2010 - 2011
Social network analysis course 2010 - 2011Social network analysis course 2010 - 2011
Social network analysis course 2010 - 2011guillaume ereteo
 
Social Network Analysis - Lecture 4 in Introduction to Computational Social S...
Social Network Analysis - Lecture 4 in Introduction to Computational Social S...Social Network Analysis - Lecture 4 in Introduction to Computational Social S...
Social Network Analysis - Lecture 4 in Introduction to Computational Social S...Lauri Eloranta
 

En vedette (15)

Poster presented at EGC 2011
Poster presented at EGC 2011Poster presented at EGC 2011
Poster presented at EGC 2011
 
Presentation Journée Thématique - Fouille de Grands Graphes
Presentation Journée Thématique - Fouille de Grands GraphesPresentation Journée Thématique - Fouille de Grands Graphes
Presentation Journée Thématique - Fouille de Grands Graphes
 
Sunbelt 2013 Presentation
Sunbelt 2013 PresentationSunbelt 2013 Presentation
Sunbelt 2013 Presentation
 
ToTeM : une méthode de détection de communautés adaptée à la fouille de résea...
ToTeM : une méthode de détection de communautés adaptée à la fouille de résea...ToTeM : une méthode de détection de communautés adaptée à la fouille de résea...
ToTeM : une méthode de détection de communautés adaptée à la fouille de résea...
 
A Social Network Based Model for e-Mail Information Visualization - Sunbelt ...
A Social Network Based Model for e-Mail  Information Visualization - Sunbelt ...A Social Network Based Model for e-Mail  Information Visualization - Sunbelt ...
A Social Network Based Model for e-Mail Information Visualization - Sunbelt ...
 
The Digital Divide and Teaching: How Do Our Students Really Use Technology?
The Digital Divide and Teaching: How Do Our Students Really Use Technology?The Digital Divide and Teaching: How Do Our Students Really Use Technology?
The Digital Divide and Teaching: How Do Our Students Really Use Technology?
 
Big Data à destination du secteur commercial
Big Data à destination du secteur commercialBig Data à destination du secteur commercial
Big Data à destination du secteur commercial
 
Presentation OOC2013
Presentation OOC2013Presentation OOC2013
Presentation OOC2013
 
Détection de communautés dans des réseaux d’information utilisant liens et at...
Détection de communautés dans des réseaux d’information utilisant liens et at...Détection de communautés dans des réseaux d’information utilisant liens et at...
Détection de communautés dans des réseaux d’information utilisant liens et at...
 
Teaching Problem Solving
Teaching Problem SolvingTeaching Problem Solving
Teaching Problem Solving
 
Authoring cycle 2
Authoring cycle 2Authoring cycle 2
Authoring cycle 2
 
A comparative study of social network analysis tools
A comparative study of social network analysis toolsA comparative study of social network analysis tools
A comparative study of social network analysis tools
 
Social network analysis course 2010 - 2011
Social network analysis course 2010 - 2011Social network analysis course 2010 - 2011
Social network analysis course 2010 - 2011
 
Théorie Des Graphes
Théorie Des GraphesThéorie Des Graphes
Théorie Des Graphes
 
Social Network Analysis - Lecture 4 in Introduction to Computational Social S...
Social Network Analysis - Lecture 4 in Introduction to Computational Social S...Social Network Analysis - Lecture 4 in Introduction to Computational Social S...
Social Network Analysis - Lecture 4 in Introduction to Computational Social S...
 

Similaire à Zulu DFA active learning

Meetup IA Open Source On Premise
Meetup  IA Open Source On Premise Meetup  IA Open Source On Premise
Meetup IA Open Source On Premise Clément Marianne
 
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...TelecomValley
 
BRMS JUG Toulouse 20100615
BRMS JUG Toulouse 20100615BRMS JUG Toulouse 20100615
BRMS JUG Toulouse 20100615JUG Toulouse
 
Definitiondesbesoinsuml
DefinitiondesbesoinsumlDefinitiondesbesoinsuml
DefinitiondesbesoinsumlVINOT Bernard
 
Industrialisation Du Logiciel - Introduction Et Bonnes Pratiques
Industrialisation Du Logiciel  - Introduction Et Bonnes PratiquesIndustrialisation Du Logiciel  - Introduction Et Bonnes Pratiques
Industrialisation Du Logiciel - Introduction Et Bonnes PratiquesEmmanuel Hugonnet
 
Industrialisation Du Logiciel Introduction Et Bonnes Pratiques V1.4
Industrialisation Du Logiciel   Introduction Et Bonnes Pratiques   V1.4Industrialisation Du Logiciel   Introduction Et Bonnes Pratiques   V1.4
Industrialisation Du Logiciel Introduction Et Bonnes Pratiques V1.4Emmanuel Hugonnet
 
Presentation BRMS Toulouse JUG
Presentation BRMS Toulouse JUGPresentation BRMS Toulouse JUG
Presentation BRMS Toulouse JUGEmmanuel Bonnet
 
Nos Systèmes by Fing : "Kit d'auto-évaluation des algorithmes"
Nos Systèmes by Fing : "Kit d'auto-évaluation des algorithmes"Nos Systèmes by Fing : "Kit d'auto-évaluation des algorithmes"
Nos Systèmes by Fing : "Kit d'auto-évaluation des algorithmes"Fing
 
PerfUG Comment tester et optimiser la performance d'un SI ?
PerfUG Comment tester et optimiser la performance d'un SI ?PerfUG Comment tester et optimiser la performance d'un SI ?
PerfUG Comment tester et optimiser la performance d'un SI ?Marc Bojoly
 
Démystifions le machine learning avec spark par David Martin pour le Salon B...
Démystifions le machine learning avec spark par David Martin pour le Salon B...Démystifions le machine learning avec spark par David Martin pour le Salon B...
Démystifions le machine learning avec spark par David Martin pour le Salon B...Ippon
 
Cours - TC - Histoire Algorithmique.pdf
Cours - TC - Histoire Algorithmique.pdfCours - TC - Histoire Algorithmique.pdf
Cours - TC - Histoire Algorithmique.pdfadeljaouadi
 
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4Test
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4TestIA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4Test
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4TestMimoun Kissi 🤖
 
Architecture Logiciel_GRASP11111111.pptx
Architecture Logiciel_GRASP11111111.pptxArchitecture Logiciel_GRASP11111111.pptx
Architecture Logiciel_GRASP11111111.pptxafamanalafa2001
 
Robot Framework Introduction
Robot Framework IntroductionRobot Framework Introduction
Robot Framework Introductionlaurent bristiel
 
Apprentissage Automatique et moteurs de recherche
Apprentissage Automatique et moteurs de rechercheApprentissage Automatique et moteurs de recherche
Apprentissage Automatique et moteurs de recherchePhilippe YONNET
 
2009 m1 ensta_projet_bases_de_donnees
2009 m1 ensta_projet_bases_de_donnees2009 m1 ensta_projet_bases_de_donnees
2009 m1 ensta_projet_bases_de_donneeskarousn
 
2009 m1 ensta_projet_bases_de_donnees
2009 m1 ensta_projet_bases_de_donnees2009 m1 ensta_projet_bases_de_donnees
2009 m1 ensta_projet_bases_de_donneeskarousn
 
Machine Leargning_supérvisé.pptx
Machine Leargning_supérvisé.pptxMachine Leargning_supérvisé.pptx
Machine Leargning_supérvisé.pptxbely26
 

Similaire à Zulu DFA active learning (20)

Meetup IA Open Source On Premise
Meetup  IA Open Source On Premise Meetup  IA Open Source On Premise
Meetup IA Open Source On Premise
 
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...
 
BRMS JUG Toulouse 20100615
BRMS JUG Toulouse 20100615BRMS JUG Toulouse 20100615
BRMS JUG Toulouse 20100615
 
Definitiondesbesoinsuml
DefinitiondesbesoinsumlDefinitiondesbesoinsuml
Definitiondesbesoinsuml
 
Industrialisation Du Logiciel - Introduction Et Bonnes Pratiques
Industrialisation Du Logiciel  - Introduction Et Bonnes PratiquesIndustrialisation Du Logiciel  - Introduction Et Bonnes Pratiques
Industrialisation Du Logiciel - Introduction Et Bonnes Pratiques
 
Industrialisation Du Logiciel Introduction Et Bonnes Pratiques V1.4
Industrialisation Du Logiciel   Introduction Et Bonnes Pratiques   V1.4Industrialisation Du Logiciel   Introduction Et Bonnes Pratiques   V1.4
Industrialisation Du Logiciel Introduction Et Bonnes Pratiques V1.4
 
Presentation BRMS Toulouse JUG
Presentation BRMS Toulouse JUGPresentation BRMS Toulouse JUG
Presentation BRMS Toulouse JUG
 
Les algorithmes de tri
Les algorithmes de triLes algorithmes de tri
Les algorithmes de tri
 
Nos Systèmes by Fing : "Kit d'auto-évaluation des algorithmes"
Nos Systèmes by Fing : "Kit d'auto-évaluation des algorithmes"Nos Systèmes by Fing : "Kit d'auto-évaluation des algorithmes"
Nos Systèmes by Fing : "Kit d'auto-évaluation des algorithmes"
 
PerfUG Comment tester et optimiser la performance d'un SI ?
PerfUG Comment tester et optimiser la performance d'un SI ?PerfUG Comment tester et optimiser la performance d'un SI ?
PerfUG Comment tester et optimiser la performance d'un SI ?
 
Démystifions le machine learning avec spark par David Martin pour le Salon B...
Démystifions le machine learning avec spark par David Martin pour le Salon B...Démystifions le machine learning avec spark par David Martin pour le Salon B...
Démystifions le machine learning avec spark par David Martin pour le Salon B...
 
Cours - TC - Histoire Algorithmique.pdf
Cours - TC - Histoire Algorithmique.pdfCours - TC - Histoire Algorithmique.pdf
Cours - TC - Histoire Algorithmique.pdf
 
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4Test
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4TestIA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4Test
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4Test
 
Architecture Logiciel_GRASP11111111.pptx
Architecture Logiciel_GRASP11111111.pptxArchitecture Logiciel_GRASP11111111.pptx
Architecture Logiciel_GRASP11111111.pptx
 
Robot Framework Introduction
Robot Framework IntroductionRobot Framework Introduction
Robot Framework Introduction
 
Apprentissage Automatique et moteurs de recherche
Apprentissage Automatique et moteurs de rechercheApprentissage Automatique et moteurs de recherche
Apprentissage Automatique et moteurs de recherche
 
2009 m1 ensta_projet_bases_de_donnees
2009 m1 ensta_projet_bases_de_donnees2009 m1 ensta_projet_bases_de_donnees
2009 m1 ensta_projet_bases_de_donnees
 
2009 m1 ensta_projet_bases_de_donnees
2009 m1 ensta_projet_bases_de_donnees2009 m1 ensta_projet_bases_de_donnees
2009 m1 ensta_projet_bases_de_donnees
 
Machine Leargning_supérvisé.pptx
Machine Leargning_supérvisé.pptxMachine Leargning_supérvisé.pptx
Machine Leargning_supérvisé.pptx
 
Drools
DroolsDrools
Drools
 

Dernier

Cours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETCours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETMedBechir
 
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSKennel
 
Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Alain Marois
 
PIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfPIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfRiDaHAziz
 
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .Txaruka
 
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSKennel
 
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSKennel
 
PIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfPIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfRiDaHAziz
 
Le Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeLe Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeXL Groupe
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...Faga1939
 
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSKennel
 
Bernard Réquichot.pptx Peintre français
Bernard Réquichot.pptx   Peintre françaisBernard Réquichot.pptx   Peintre français
Bernard Réquichot.pptx Peintre françaisTxaruka
 
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 37
 
Principe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsPrincipe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsRajiAbdelghani
 
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETCours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETMedBechir
 
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 37
 
Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Gilles Le Page
 
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSKennel
 

Dernier (19)

Cours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETCours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSET
 
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
 
Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024Zotero avancé - support de formation doctorants SHS 2024
Zotero avancé - support de formation doctorants SHS 2024
 
PIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdfPIE-A2-P4-support stagiaires sept 22-validé.pdf
PIE-A2-P4-support stagiaires sept 22-validé.pdf
 
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
 
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
 
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
 
PIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdfPIE-A2-P 5- Supports stagiaires.pptx.pdf
PIE-A2-P 5- Supports stagiaires.pptx.pdf
 
Le Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeLe Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directe
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
 
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
 
Bernard Réquichot.pptx Peintre français
Bernard Réquichot.pptx   Peintre françaisBernard Réquichot.pptx   Peintre français
Bernard Réquichot.pptx Peintre français
 
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
 
Principe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsPrincipe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 temps
 
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETCours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
 
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
 
DO PALÁCIO À ASSEMBLEIA .
DO PALÁCIO À ASSEMBLEIA                 .DO PALÁCIO À ASSEMBLEIA                 .
DO PALÁCIO À ASSEMBLEIA .
 
Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024
 
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
 

Zulu DFA active learning

  • 1. MASTER WEB INTELLIGENCE PLATE-FORME ET COMPÉTITION POUR L’APPRENTISSAGE ACTIF David Combe 16 juin 2009
  • 2. L’apprentissage actif  Il consiste à faire apprendre une machine sur la base d’une interaction avec une entité en connexion avec le concept à découvrir.  Il permet de se passer d’une phase de consolidation des données et, s’il est bien fait, de minimiser les données utilisées.  Exemples de la vie quotidienne  Mastermind  Dichotomie
  • 3. Applications  Filtrage d’e-mail  Wrapper induction (contexte de données dans des pages web par exemple)  Etude de circuits intégrés  Robotique  Recherche d’information basée sur des évaluations…
  • 4. L’Oracle  C’est souvent un être humain, parfois même un expert.  Il n’aime pas forcément être ennuyé.  Il est soucieux du nombre et la nature des requêtes utilisées.  Plus encore que la complexité temporelle, c’est le nombre de requêtes utilisées qui distingue un bon algorithme.
  • 5. Requêtes  La grammaire dont il est question ici est celle des langages rationnels (AFD)  Requête d’appartenance le mot « ab » appartient-il au langage étudié ?  Requête d’équivalence l’automate que je propose pour le langage est-il correct.
  • 6. Zulu  Zulu propose de comparer l’efficacité des algorithmes d’apprentissage actif d’automates et d’en découvrir de nouveaux.  Proposer la génération de tâches À partir du générateur d’automates de Gowachin. Gowachin est aussi en charge de l’échantillon de test de 1800 mots.
  • 7. Tâche  Un automate tiré aléatoirement  On fixe une borne maximum du nombre d’états  On définit la taille de l’alphabet.  Le but Après un nombre prédéterminé de requêtes d’appartenance autorisées, il faut arriver à classer 1800 mots dans les classes positif/négatif.
  • 12. Et aussi  Création de challenge pour comparer son score à celui d’un autre joueur  Panneau d’administration  Fil RSS des scores publiés
  • 14. Déroulement  Phase d’entraînement  Communication auprès des personnes concernées  Phase de compétition  Formation d’un comité scientifique  Evaluation des performances à définir
  • 15. Algorithme de référence  Pour montrer que la problématique est réelle  Pour fournir un algorithme réalisant la tâche, susceptible d’être amélioré et faciliter l’entrée des participants dans le projet  L’algorithme proposé est L*.
  • 16. Résultats théoriques  Il n’est pas possible d’apprendre de manière exacte un automate avec uniquement des requêtes d’appartenance.  Il n’est pas possible d’apprendre de manière exacte un automate avec uniquement des requêtes d’équivalence.  L’apprentissage d’un automate est possible avec ces 2 types de requêtes polynomialement sur le nombre de requêtes.
  • 17. L*  Créé par Dana Angluin en 1989  L* renvoie toujours l’automate minimal.  L* construit une table d’observation et fait en sorte qu’elle respecte 2 propriétés :  la fermeture  la consistance  Lorsque ces 2 propriétés sont vérifiées, L* construit l’automate associé et le soumet à l’Oracle pour validation.
  • 18. Simulation  Exécution de L* sur un langage simple  L = {les mots qui finissent par « ba »}  Les requêtes d’équivalence sont en pratique difficiles à formuler. D. Angluin propose de les remplacer par un ensemble de requêtes d’appartenance sur des mots choisis au hasard.  L’apprentissage devient non déterministe et statistique.
  • 19. Comportement de L*  L* a un effet de palier important : Un automate n’est constructible que lorsque la table d’observation est fermée et consistante, ce qui arrive entre 6 et 11 fois sur des problèmes moyens à 2 lettres et encore moins souvent avec 3 lettres et plus.  Lorsque l’on a atteint la limite de requêtes on retombe au palier précédent.  Pour avoir un bon score il faudra gommer ces effets ou prévoir la fin des requêtes autorisées
  • 20. Exemple 40 50 60 70 80 90 100 0 500 1000 1500 2000 2500 3000 3500 4000 Score Nombre de requêtes d'appartenance
  • 21. Nombre de requêtes / score lors des simulations de requêtes d’équivalence Sur un même problème de 107 états
  • 22. Evaluation  Un problème multi-dimensions difficile à évaluer  Dimensions à maximiser :  Score  Nombre d’états de l’automate  Taille de l’alphabet  Dimension à minimiser :  Nombre de requêtes
  • 23. Différentes façons de proposer une tâche évaluable  Fixer un score minimal à atteindre, par exemple 97% de l’automate appris, et un nombre de requêtes autorisées. Le gagnant est le joueur qui a appris de cette manière le plus gros automate.  Similaire à Abbadingo  La baseline sert à établir un nombre de référence des requêtes autorisées. Le gagnant est la personne qui obtient le meilleur rapport « Score du joueur / Score de la baseline » pour le nombre de requêtes autorisées  Sous réserve que la baseline soit suffisamment bonne et que le score de la baseline ne soit pas trop aléatoire  Restreindre la classe des automates
  • 24. Compétition : évaluation  Divers problèmes générés à l’avance, identiques pour tous les joueurs  Le gagnant devra envoyer son programme pour validation du classement.  Compétition en 2010.
  • 25. Perspectives  Autres requêtes (telles que les requêtes de correction)  Autres grammaires (langages hors-contexte)
  • 26. Fin