Jeudi 13 juin 2019 à l’ESME Sudria (groupe IONIS), le Club Commerce Connecté vous invitait à un rendez-vous public consacré aux assistants vocaux. Au programme :
- AT Internet: premiers retours d’expérience sur l’analytics des skills d’Alexa
- NG Media: les assistants vocaux ne riment pas forcément avec IA
- EA4T: présentation de sa solution qui réinvente les interfaces Homme / Machine
CCC-ConneCtion de Pâques, 12 avril 2016, IAE de Bordeaux
CCC-CONNECTION - les assistants vocaux - 13 juin 2019
1. CCC-CONNECTION
#conf #réseau
un rendez-vous public du
CLUB COMMERCE CONNECTÉ
Jeudi 13 juin 2019
18h-21h
les assistants vocaux
////////////
ESME, 4 Place Ravezies
33300 Bordeaux
(rez-de-chaussée du bâtimentGaz de Bordeaux)
présente
5. Digital Intelligence Solutions
A c q u i s i t i o n E n g a g e m e n t C o n v e r s i o n F i d é l i s a t i o n
Do n n é e s f i a b l e s e t a c t i o n n ab l es d e b o u t e n b o u t
6. Digital Intelligence SolutionsDigital Intelligence Solutions
› AT Internet has been named a
“Leader” by independent research
firm Forrester Research, Inc. for the
second time in a row in its global
report “The Forrester WaveTM: Web
Analytics, Q4 2017”.
8. Digital Intelligence Solutions
Amazon Alexa en France
• Alexa est disponible en France depuis Juin
2018,
• Les radios ont été précurseurs au lancement de
l’offre.
• 258 Skills au lancement et +1 000 Skills à la fin
2018
• Catégories les plus populaires:
• Catégorie Kids : plus de 60 skills avec un rating
très élevé.
• Domotique : de 40 Skills au lancement à 180
avec une couverture multi-pays
Source: Philippe Daly, General Manager Alexa Skills, Amazon lors
de la conférence du GESTE en Avril 2019
9. Digital Intelligence Solutions
Concept du tracking analytics
Hey Alexa
1st: audio
3rd: forwarding
5th: audio
going through decision tree
AT Internet data
collection Server
18. Frédéric CLEMENT, Directeur général
Quand les assistants vocaux ne riment pas forcément avec IA
les assistants vocaux
(une conférence accueillie par ESME)
13 juin 2019
CCC-CONNECTION
#conf
#réseau
CLUB
COMMERCE
CONNECTÉ
21. Pour faire simple
Assistants Vocaux > C’est Quoi ?
vizu.live21
Une interface à qui on peut poser une Question …
Et qui va nous fournir une Réponse !!
Par la Voix, bien sûr.
22. Exemple
Assistants Vocaux > C’est Quoi ?
vizu.live22
Quel temps fera t’il demain ?
Il devrait y avoir du soleil à
Bordeaux. La température
maximale sera de 25°.
24. Une Intelligence …
Assistants Vocaux > Quelle Maturité ?
vizu.live24
Boosté par les progrès
• de l’Intelligence Artificielle (I.A.),
• de la Reconnaissance Vocale,
• et du Traitement du Langage Naturel
Idéal en mobilité, main libre, pour lancer une application
ou demander la météo …
25. … encore au niveau de la maternelle
Assistants Vocaux > Quelle Maturité ?
vizu.live25
"indéniablement utile, mais au niveau de la maternelle en termes d'utilisations potentielles"
Adam Fingerman (Chief Experience Officer and cofounder of ArcTouch)
26. Taux d’adoption sur Smartphone
Assistants Vocaux > Quelle Maturité ?
vizu.live26
52% 52% des utilisateurs de smartphone utilisent leur assistant vocal
D’après un sondage Verto Analytics
27. Fréquence d’utilisation
Assistants Vocaux > Quelle Maturité ?
vizu.live27
Smartphone
Enceintes intelligentes
0,33
2,79
Utilisation moyenne de l’assistant vocal, par jour :
D’après un sondage Verto Analytics
28. Cas d’utilisation: Achats en ligne
Assistants Vocaux > Quelle Maturité ?
vizu.live28
Dans la publicité pour les enceintes intelligentes,
la capacité de faire ses courses en ligne
est l’une des fonctionnalités les plus mises en avant …
30. Cas d’utilisation: Achats en ligne
Assistants Vocaux > Quelle Maturité ?
vizu.live30
2% 2% des détenteurs d’un Amazon Echo utilisent leur enceinte
intelligente pour passer des commandes en ligne
D’après un rapport de The Information
En faisant des achats, les utilisateurs veulent pouvoir parcourir les produits, voir les options et faire
des comparaisons, ce qui n’est pas possible avec une enceinte intelligente.
A cette fin Amazon a lancé Echo Show, l’enceinte intelligente dotée d’un écran tactile
31. Maturité de la Technologie
Assistants Vocaux > Quelle Maturité ?
vizu.live31
2018, descente vers la
vallée des désillusions
33. La Voix à la base de la communication
Assistants Vocaux > Vocal vs Visuel
vizu.live33
La Voix permet de rentrer en relation, d’échanger
instantanément
Elle est à la base de la communication humaine
On passe par la Voix avec un conseiller en magasin, avec un
conseiller au téléphone, avec un assistant vocal
34. Mais la Voix ne fait pas tout
Assistants Vocaux > Vocal vs Visuel
vizu.live34
7%
38
%5…
Les éléments de la Communication :
D’après la règle des 3V du Dr Albert Mehrabian
• 7% Verbal (signification des mots)
• 38% Vocal (intonation et son de la voix)
• 55% Visuel (expression du visage et du langage corporel)
35. Intérêts du Visuel
Assistants Vocaux > Vocal vs Visuel
vizu.live35
• Vocal : linéaire, limité à moins de 3 mots par seconde
• Visuel : spatial, permet de saisir, parcourir, comparer et
comprendre une multitude d’informations en un temps
record
37. Décrire vs Montrer
Assistants Vocaux > Vocal vs Visuel
vizu.live37
77% 77% des consommateurs apprécieraient de pouvoir utiliser la caméra
de leur smartphone pour montrer une situation plutôt que de la
décrire à un conseiller
Selon une récente étude de l’Observatoire des Services clients BVA
39. Pour faire simple, ici,
Assistants Vocaux > Une autre Vision
vizu.live39
L’interface pour la question … c’est Votre site Web
La réponse est … augmentée par l’un de Vos Conseillers
La voix est … augmentée par la Visualisation
Bref, ici, le canal Voix est fusionné à votre canal Web.
40. Bénéfices
Assistants Vocaux > Une autre Vision
vizu.live40
Le client pose sa question sans quitter Votre site Web
La réponse pourra être de qualité et favoriser la conversion
Le site web permet au conseiller et au client de visualiser les
mêmes informations en même temps, et donc de parler de la
même chose !
41. Cas d’utilisation: Site Marchand
Assistants Vocaux > Une autre Vision
vizu.live41
Une personne fait une recherche et est attirée
sur votre site marchand.
Le produit semble correspondre à son besoin,
mais une information lui manque, elle hésite, …
Que fait-elle ?!
A. Elle demande à son assistant vocal ?
C. Elle appelle votre service client ?
B. Elle démarre un chat via votre site ?
D. Elle se rend en magasin ?
E. Autre ?
42. Cas d’utilisation: Site Marchand
Assistants Vocaux > Une autre Vision
vizu.live42
Vue AssistantVue Client
44. Assistants Vocaux
Assistants Vocaux > Conclusion
vizu.live44
L’innovation dans le domaine du Web, du Vocal et de l’I.A. est source
d’opportunités prometteuses et de risques.
Les Assistants Vocaux s’inscrivent comme un élément précurseur des
Interfaces Conversationnelles à venir.
Mais ces technologies ne s’avèrent productives à ce jour que pour des
cas relativement limités.
Cependant des technologies plus matures et mêlant l’humain permettent
déjà d’augmenter l’eXpérience Utilisateur en fusionnant le canal Voix
sur le canal Web et en concevant des pages pour une collaboration Live.
45.
46. Mathilde Couraud, Ingénieur de recherche
La voix, l’avenir du web
les assistants vocaux
(une conférence accueillie par ESME)
13 juin 2019
CCC-CONNECTION
#conf
#réseau
CLUB
COMMERCE
CONNECTÉ
48. Google Trends :
Requêtes de recherche vocale
multipliées par 35 entre 2008
et 2016
Gartner (18/10/2017) :
30% des recherches en 2020
seront effectuées sans écran
ComScore :
50% des requêtes sur le Web
réalisées par la voix d’ici 2020
La voix est l’avenir du web…
51. …. Mais un marché B-to-B soutenu par la technologie
Les startups du chatbot doivent
désormais intégrer la
reconnaissance vocale à leur
système. Seules 8% des sociétés
mentionnées permettent à leur
interface d’être vocalisée. Les
assistants vocaux n’en sont qu’à
leur début et ce type
d’interaction est un vrai défi pour
l’avenir de la communication
entre un homme et une machine
52. … mais les performances sont encore décevantes…
53. Limitation des technologies de bots textuels ou vocaux
• Pipelines optimisés pour la syntaxe et
l’orthographe, plutôt que la sémantique
• Relations disjointes entre les composants de
traitement de la parole et l’analyse sémantique,
ce qui rend la contextualisation complexe
• Approches de compréhension trop universelles,
essentiellement basée sur des mots-clés
• Modèles acoustiques rarement entraînés avec des
données en conditions réelles
• Absence de contrôle sur la sécurité et la
territorialité des données
Sur tous ces points
AIRUDIT apporte une
réponse fiable,
ouverte, robuste et
technologiquement
efficace
55. Limitation des approches dites universelles
55
SIRI
Siri dans ce cas
comprend
uniquement le
défaut de paiement
Siri dans ce cas
répond n’importe
quoi Google renvoie vers
un lien contenant
les deux mots clés
SIRI
Les réponses existent sur le Web, mais les assistants personnels
du marché, ne sont pas fait pour des requêtes complexes,
nécessitant des connaissances métier
SIRI ne fait pas la
correspondance
entre la machine et
le monde extérieur
56. Limitation des approches en Corpus
56
Pas de réponse précise
Phrase complexe donc
pas de réponse
57. Limitation des modèles acoustiques
Les modèles acoustiques dédiés
sont très complexes à mettre en
place pour les GAFAM
Malgré l’utilisation de technologies
de LLP/NLU et de Machine Learning,
le % de non réponses reste trop
important
Les non-réponses donnent
obligation de reprise de contrôle
par des humains
59. Limitation dans l’utilisation seule du NLP
Lemmatisation
Étiquetage morpho-syntaxique
Reconnaissance d'entités nommées
Compréhension du langage naturel
Construction de réponse
Approche linguistique
Approche statistique
(machine learning)
Segmentation du texte
Lemmatisation
Étiquetage morpho-syntaxique
Reconnaissance d'entités nommées
Compréhension du langage naturel
61. Approches traditionnelles : processus dissociés peu adaptables
« Bonjour, je voudrais connaître
le nombre de jours de RTT qu’il
me reste à prendre ? »
« Il vous reste 3 jours à prendre
avant le 31 décembre »
62. Ecouter….. Ce n’est pas comprendre !
62
Relation disjointe entre le système RAP et le moteur TAL
• Passage à la forme écrite lors d’un dialogue oral est-il naturel, nécessaire ?
• La transcription est-elle adaptée dans le cadre d’une communication orale ?
• Que doit-on « transcrire » pour maximiser l’interprétation sémantique ?
Solution proposée : Speech-to-text → Speech-to-concept & Speech to context
Redéfinir le problème de transcription et la place du moteur RAP dans le cadre d’une
communication humain-machine
65. C’est quoi une ontologie ?
Une ontologie en informatique, c’est
une représentation interprétable par
la machine de concepts reliés entre
eux par des relations hiérarchiques et
sémantiques
L’ontologie désigne une cartographie
de la réalité d’un domaine métier. Elle
se traduit par un modèle adapté au
domaine et qui peut aussi se
comprendre comme l’ensemble des
thèmes et ders connaissances définis
66. Airudit : Un processus de compréhension disruptif
Interprétation directe de la
parole qui évite tous les biais
de la retranscription écrite
68. Airudit : un moteur RAP aux performances objectivées
Les + de notre
moteur RAP :
Adaptabilité
Modèle acoustique
dédié
69. Airudit : un moteur RAP aux performances objectivées
29,31
%
31,03
%
13,79
%
Google Speech
API
Microsoft Speech API
EA4T Speech API
70. Approche Airudit : processus maîtrisés et sécurisation des
données
Un triptyque technologique
«maison» qui embarque :
Un moteur RAP
Un moteur sémantique
basé sur les ontologies
Un moteur d’élaboration
de réponse et de
gestion des scénarios
71. Use case 1 : Assistant pour le pilote du Rafale
72. Use case 2 : Assistant au Central d’Opérations
80. + de voix
+ de texte
chatbots
vocalbots
+ de contexte
Notre positionnement stratégique : disruption et adaptabilité aux
métiers
Airudit : acteur positionné de
façon originale vis-à-vis des
concurrents de notre taille.
SteadyBear : technologie
conçue d’emblée pour traiter le
langage naturel (écrit et parlé,
ce qui apporte une véritable
avance sur les autres sociétés
du marché
Airudit :
une approche différenciante
81. Merci
Contact
• Philippe Lebas (fondateur)
• plebas@airudit.com
• contact@airudit.com
• +(33).7.63.03.00.15
Site : www.airudit.com
82. Eric CULNAERT / Camila ARCADER
L’actu du Club Commerce Connecté
13 juin 2019
CCC-CONNECTION
#conf
#réseau
CLUB
COMMERCE
CONNECTÉ les assistants vocaux
(une conférence accueillie par ESME)