Tock & Mélusine, 2 solutions IA Open Source créées par des grands comptes en France (SNCF, MAIF) #AIParis 2020.
⏩ https://doc.tock.ai
⏩ https://maif.github.io/melusine/
5. ARCHITECTURE D’UN BOT CONVERSATIONNEL
« Je veux aller
à Marseille
demain »
STT NLP
Intention : recherche
Destination : Marseille
Date : demain
Action / Réponse
Recherche, filtres
Règles métier
Présentation des
résultats
Back-office
CRM / CSP
( )
Modèle métier et
logique conversationnelle
Tock.ai
6. INTÉGRATIONS TOCK : CANAUX, NLP, LANG., CSP…
« Je veux aller
à Marseille
demain »
STT NLP
Intention : recherche
Destination : Marseille
Date : demain
Action / Réponse
Recherche, filtres
Règles métier
Présentation des
résultats
Back-office
CRM / CSP
( )
Modèle métier et
logique conversationnelle
Tock.ai
7. TOCK STUDIO : ANALYSE DU LANGAGE & APPRENTISSAGE SUPERVISÉ Tock.ai
• Tock Studio
• Intentions / entités /
sous-entités
• Qualification &
reconstruction à chaud
• Suivi performance &
qualité des modèles
8. CONSTRUCTION DE DIALOGUES ET D’ARBRES DE DÉCISION Tock.ai
• Interfaces
pour créer
des dialogues
• Réponses riches (images, boutons, caroussels)
• Gestion des règles & réponses
(par canal, par langue, Feature Flipping, etc.)
• Arbres de décision, navigation par sous-intentions ou entités
12. POURQUOI AVOIR PRIVILÉGIÉ L’OPEN SOURCE
• Rester agiles et réactifs
(pas d’effet « boîte noire »)
• Capitaliser compétences
et savoir-faire (tech, UX, produit…)
• Conserver le cœur de valeur
(modèles statistiques métier)
• Maîtriser les coûts
(hébergement, multicanal, multilingue, multibots…)
Tock.ai
13. NOS DÉBUTS DANS LE CONVERSATIONNEL (2016)
• Commencer par le transactionnel
• Une vraie équipe pluridisciplinaire
autonome pour chaque bot
(jusqu’à 15 personnes / DevOps UX PO)
• Pas d’équipe / budget
dédiés à la plateforme
• « Code-first » en Kotlin
Tock.ai
14. DE CONSOMMATEUR À PRODUCTEUR
• 2017 : GitHub
• 2018 : Devoxx & Meetup
• 2019 : domaine tock.ai
plateforme libre-service
hackathon public
Paris Open Source Summit
• 2020 : support à la
communauté
AlloCovid
AI Paris
Tock.ai
15. DES SUCCÈS POUR L’ENTREPRISE
• Des projets réussis,
un rythme soutenu
• Emergence de nouveaux
métiers et savoir-faire
• Une filière qui s’est structurée
(2 → 6 assistants et 15 → 40 personnes en 2019)
• Une posture d’innovation
différenciante, contribuant
à l’image de l’entreprise / marques
• Fidélisation des talents, attractivité
Tock.ai
16. DES RÉCOMPENSES DE LA COMMUNAUTÉ
• « Best Robot Experience » 2018
• « Best Robot Experience » 2019
• « Meilleure Stratégie Open Source » 2019
Tock.ai
17. VERS DE NOUVEAUX DÉFIS À RELEVER…
• RGPD
• Désintermédiation
• Souveraineté numérique
• Etat de l’art IA
(Deep Learning, Question Answering,
BERT, Sentiment Analysis, NLG…)
• Animation & gouvernance OSS
Tock.ai
18. AVEC UNE COMMUNAUTÉ QUI GRANDIT…
• Gitter animé, issues GitHub,
contributions externes
(Rocket.Chat, DialogFlow)
• Des ESN & PME qui commencent
à proposer développements
ou support sur Tock
• Tock utilisé hors SNCF :
AlloCovid
LinTO.ai (Linagora)
ENEDIS
Tock.ai
https://doc.tock.ai/
(licence Apache 2)
20. Melusine, pour assister et fluidifier la relation
les grandes étapes
T4 2016
Lancement POC avec
startup IA
Désillusion sur la
pertinence technologique
-
RDV manqué sur la valeur
promise
T4 2017
Promesses de valeur
Attractivité/Désirabilité
démontrer
T2 2017 Melusine devient un
socle stratégique de
l’entreprise
-
Concentrant la majorité
des cas d’usages NLP
-
engagement pluri-annuel
réaffirmé
2020
T1 2019
01/2018
Se forger une conviction
partage du rex avec métiers,
confirmation de la valeur et
des pré-requis
-
Engagement d’un POC
"maison" sur un périmètre
simplifié pour confirmer le
pré-réquis (compétence,
tech,…)
Construction
trajectoire produit
-
Démultiplication des
cas d’usage
confirmerdévelopper
T4 2018
03/2018
Généralisation Melusine
-
Visibilité/Reconnaissance
Communication,
acculturation, partage
Pitch vision et alignement
métiers/Sponsors
engagement
expérimentation
21. Contexte Projet
15 000
Emails / jour
Large volume d’emails entrants
En augmentation constante
✗ ✗ ✓
Nombreux transferts entre entités
Solution IA déployée en production à la MAIF
Un routage complexe : Augmentation des délais
de prise en charge de l’email !
> 2 jours
Délai supplémentaire par re-routage
23. Formule de
politesse
Fonctionnalités de Mélusine
Data Prep /
Cleaning
Extraction de
mots clés
Classification
Text cleaning
spécifique aux
emails
Résumé des
emails
Catégoriser les
emails
Analyse
Sémantique
Identification de thèmes au sein
d’un document
(non-supervisée)
Salutations
Remerciements
Signature
Corps du mail
Détection intentions
Reconnaissance
d’entités : demande
de documents,
remerciements, …
+
25. IA en production : les chiffres clés
3 000 000+ emails analysés
84% des mails sont routés par l’IA
180 ms de temps de réponse moyen par l’API
Diminution de 40%du délai de réponse au sociétaire
Agilité dans les déploiements >15totalement transparents pour les utilisateurs
27. Projet Open-Source Melusine
18+
Mois de projet
10+
Contributeurs
10 000+
Lignes de python
Melusine en chiffres
182
Stars sur le GitHub Melusine
Melusine
Déclinaison Open-Source du projet en
production à la MAIF
https://github.com/MAIF/melusine
28. Les tutoriels : porte d’entrée pour prendre en main Melusine !
Tuto Data Préparation
Tuto gestion Mails Transférés
Tuto Word Embeddings
Tuto Extraction Keywords
Tuto Semantic Detector
etc
Tuto Classification
29. Pourquoi « open-sourcer » le projet ?
Contribution à la
communauté
scientifique, bâti sur des
briques open sources.
Regards et
contributions
extérieurs. Contribution
scientifique profitable à
l’ensemble de la
communauté.
Effet positif sur la
marque employeur.
Un code de qualité ++
Une émulation des
collaborateurs
Transparence vis-à-
vis des sociétaires
MAIF sur les
modèles de
traitement des
données.
ADN MAIF : ouverture de nos savoirs et partage par tous
30. Open-Source ➔ Multiplication des cas d’usages internes
pourriez
vous
s’il
vous
plait
m’envoyer
mon
relevé
d’information
?
0
0
padding
Embedding dimension
Max sentence
length
Kernel
size
Number of filters
Kernel
size
Dropout Dropout
Number of filters
Dense
VAM
Global max pooling
Dense
Meta données : heure de
réception, nom de domaine
(gmail, outlook …), type de pièce
jointes, jour de la semaine
Modèle IA
Règles métiers
emails
Enquêtes
Comptes-rendus
d’expertise
MELUSINE
Réponse automatique
Courrier postal
Commentaires
Conseillers
+
gestionnaires
Contactez-nous maif.fr Classement automatique
Priorisation
Routage
Synthèse demande
Détection insatisfaction
Extraction d’informations
Appels api
depuis digital
Appels depuis applicatifs
d’analyse
31. Pour une IA éthique
Modèles IA en résonnance avec les valeurs de la mutuelle : Utilisation de l’IA non comme un substitut à l’homme, mais
comme le moyen d’augmenter son impact et d’améliorer son travail
l’IA va aider à « remettre de l’humain dans le travail » : recentrage sur les aspects relationnels et à valeur ajoutée pour
toujours plus de qualité dans la relation sociétaire
MAIF attentive aux risques du numérique et en particulier aux impacts de nos traitements IA
(sociétaux, environnementaux)
Réalisation d’une « Check-list » permettant d’identifier risques et
faiblesses de nos traitements IA
Partagée en open-source
Complétée d’un outil d’exploration de données permettant de visualiser la distribution des
prédictions d’un modèle IA selon certaines variables afin d’aider à identifier d’éventuels biais
discriminatoires
33. • RDV sur https://doc.tock.ai et https://maif.github.io/melusine/ ;-)
• L’Open Source a de réels avantages, ça vaut le coup d’y réfléchir
• Vous POUVEZ passer de consommateur à producteur
• N’hésitez pas à rejoindre/créer des communautés
34. Tock / Mélusine
2 Solutions IA Open Source créées
par des grands comptes en France
(SNCF & MAIF)
Le REX technique :
IA & Open Source
Un sujet pour les grands comptes en 2020 ?
(SNCF, ENEDIS, MAIF, TOSIT)
La table ronde :
RDV @