[Suggestion : affichez le document en plein écran pour éviter la pixellisation]
Que signifient ces acronymes ? Quel est leur apport dans le fonctionnement d'un agent conversationnel ?
Téléchargez la fiche pratique issue de notre livre blanc "Panorama 2019 des éditeurs d'agents conversationnels" disponible ici : https://www.thinkmarket.fr/actualite/decouvrez-nos-deux-livres-blancs-2019-agents-conversationnels-plateformes-e-commerce/
1. 01.Définitionsetprincipes
defonctionnement
Page8
Nous désignons par Agent Conversationnel (AC) l’ensemble des dispositifs automatisés
pouvant recréer de manière artificielle un dialogue dans le but d’automatiser une tâche.
Ce programme informatique est capable d’interagir avec un ou plusieurs utilisateurs par la
voix ou par écrit en reproduisant les codes d’une conversation humaine.
Pour cela, l’AC repose sur différents niveaux d’intelligence qui permettront la réalisation de
l’action. De manière très générique, la programmation d’un arbre de conversations peut
par exemple être intégrée de sorte que l’AC puisse répondre automatiquement à des ques-
tions définies à l’avance.
À un autre niveau, le « moteur » de l’AC peut reposer sur des technologies beaucoup plus
poussées comme l’Intelligence Artificielle (IA). Dans ce cas, l’AC peut être éduqué pour
comprendre l’utilisateur et ainsi détecter ses intentions afin de fournir une réponse adaptée.
Aussi, la compréhension et le traitement du langage humain reposent sur un domaine spé-
cifique de l’IA que l’on appelle le NLP : Natural Language Processing.
Qu’est-ce que l’IA ?
C’est une discipline scientifique recouvrant les techniques et technologies permettant de simuler un raisonnement similaire
à celui d’un être humain. L’objectif de l’IA est de produire des machines autonomes capables d’accomplir des tâches com-
plexes en utilisant des processus réflectifs semblables à ceux des humains. Il est courant de distinguer l’IA faible, program-
mée pour répondre à une tâche donnée, de l’IA forte,capable d’appliquer l’intelligence à tout problème plutôt qu’à un
problème spécifique. Cette dernière se distingue par sa capacité d’apprentissage, elle a pour vocation d’évoluer et d’ap-
prendre à proposer des solutions inédites. A date, l’ensemble des technologies utilisées communément reposent sur de
l’IA faible bien que cette dénomination soit trompeuse, étant donné les innombrables applications potentielles. En effet,
prenons l’exemple de la reconnaissance d’image, domaine dans lequel l’IA a fait d’immenses progrès. L’IA est aujourd’hui
en capacité de reconnaître, identifier et décrire des images jamais vues auparavant. Pourtant la mécanique qui se cache
derrière cette technologie repose sur la capacité de l’IA à comparer et faire matcher son immense base de connaissance
avec l’image proposée. L’IA détecte sur une image des suites de pixels qu’elle compare avec celles préalablement enre-
gistrées et en dresse une liste ordonnée en fonction de la probabilité de reconnaissance. C’est en augmentant cette base
de connaissance et l’association des objets rattachés que l’IA progresse, raison pour laquelle les GAFA, grâce à l’immense
volume de données qu’ils drainent chaque jour, dominent aujourd’hui le marché.
Qu’est-ce que le Machine Learning ?
C’est une technique d’éducation d’IA supervisée par l’Homme. Prenons ici l’exemple d’un système de reconnaissance
d’images : pour reconnaître une voiture, on va « montrer » en entrée une photo d’une voiture associée à la réponse désirée.
Après chaque exemple, la machine ajuste ses réglages propres afin de tendre vers la réponse souhaitée. C’est après avoir
recommencé ce processus plusieurs milliers de fois que la machine pourra classifier correctement la plupart des images de
voiture. L’intérêt de cette technique d’apprentissage est que la machine sera aussi capable de classifier des images qu’elle
n’a jamais vues grâce à la capacité de « généralisation ». Cette technique a ses limites et demande des ressources consi-
dérables en termes de données brutes. Des techniques plus avancées existent, appelées Deep Learning. Sans rentrer dans
les détails, ces systèmes, à la différence de systèmes de Machine Learning classiques, sont décomposés en plusieurs mo-
dules indépendants (réseaux neuronaux) qui apprennentséparémentetpermettentensemble de résoudre des problèmes
beaucoup plus complexes.
Qu’est-ce que le NLP ?
Le Natural Language Processing (NLP) est donc une branche de l’IA spécialisée dans le traitement du langage. Elle englobe
le Natural Language Understanding (NLU) etle Natural Language Generation (NLG) qui sontrespectivementles domaines
de la compréhension et de la génération du langage naturel. Ce groupe de technologies permet à une interface de simuler
le langage humain et de communiquer de la manière la plus naturelle possible avec l’utilisateur. Cela s’applique autant à
l’analyse et la génération de texte qu’aux extraits vocaux. Plus simplement, les moteurs NLP ont pour but de traduire le lan-
gage naturel en langage machine c’est-à-dire de transformer une requêtevocale ou texte en données structurées qui seront
interprétables par un programme informatique. De manière générale, l’efficacité des technologies NLP actuelles repose
essentiellement sur l’IA et les techniques de Deep Learning.
2. Quelle que soit la solution,
pour adopter un mode conversationnel, l’AC doit effectuer une succession d’actions qui
vont lui permettre de créer une boucle de dialogue :
1.
COLLECTER
2.
COMPRENDRE
3.
ANALYSER
4.
TRAITER
5.
RESTITUER
Traitement fonctionnel Traitement technique
COLLECTER
COMPRENDRE
ANALYSER
TRAITER
RESTITUER
Collecter l’ensemble des éléments formulés
par l’utilisateur sur un canal donné (messa-
geries instantanées, chat, assistant vocal…).
Lorsque l’utilisateur dit par exemple “Hello Google” puis énonce oralement sa
requête, la solution va dans un premier temps transformer ce fichier audio en
texte. C’est là que la technologie de reconnaissance automatique du langage
ou ASR (Automatic Speech Recognition) joue son rôle. C’est elle qui traduit la
parole en texte afin qu’elle soit traitée par le moteur NLU. Bien sûr, cette étape
n’est pas nécessaire lorsque la conversation s’effectue directement à l’écrit.
Comprendre les éléments, c’est-à-dire les
associer à une signification ou à une inten-
tion permettant de rattacher la phrase à une
requête ou une action donnée.
Le traitement NLU s’effectue alors de la façon suivante : l’algorithme extrait
deux éléments principaux de la requête utilisateur, l’intention qui est le but
général de la phrase (acheter un objet, trouver un lieu ou une information…)
puis les objets (ou entités), qui portent le sens de la requête en langage
naturel. Ainsi en faisant le lien et en analysant sémantiquement la phrase ou
la requête, le programme sera capable de trouver des correspondances et de
proposer une réponse adéquate. Notons que certains moteurs NLU avancés
peuvent également détecter les émotions en analysant sémantiquement le
texte ou sa ponctuation par exemple.
Analyser les informations transmises par
l’interlocuteur et disponibles en base pour
enrichir le sens et la signification (données
personnelles, base de connaissance,
contexte).
Traiter la tâche correspondant à l’intention
détectée.
Lors de la phase suivante, c’est le Dialog Manager qui va décider des actions
à réaliser en fonction de la requête. Se basant sur un arbre de décision ou sur
une solution basée également sur l’Intelligence Artificielle, le Dialog Manager
validera les prochaines actions après l’analyse contextuelle. Pour prendre sa
décision, l’outil prendra en compte les modélisations et scenarii intégrés ainsi
que les potentiels historiques de communication, le CRM et les API tierces.
Restituer une réponse à l’utilisateur sur le ca-
nal correspondant et sous la forme attendue
(écrite ou vocale).
La réponse à la requête doit être apportée de la manière la plus proche du
langage naturel. Pour être proposée sous format audio, la réponse passera
par un module de synthèse vocale ou Text To Speech (TTS), qui traduira cette
réponse texte en voix à destination de l’utilisateur. Pour les plus avancés qui
ont déjà intégré un moteur NLG, cette technologie sera en capacité de générer
automatiquement des éléments de réponses en langage écrit naturel à partir
des informations récoltées.