Bonjour à tous !
Voici un petit travail à vocation éducative grand public qui synthétise (dans les grandes lignes bien-sûr et non dans le détail) comment fonctionnent globalement les IA génératives dont ChatGPT fait partie.
La majorité des IA grand public que nous connaissons actuellement sont des IA de type générative car elles s'appuient sur du contenu existant pour générer du nouveau contenu.
La formation de ces systèmes suit généralement une trame commune même si la tâche à laquelle ils sont associés diffère (génération de textes, d'images, de vidéos, d'audios, de codes, etc.).
C'est pourquoi, détenir ces connaissance vous permettra de mieux employer ces outils. En effet, la performance de ces IA (bien que catégorisées comme des IA "faibles") nous a tellement surpris (et ce n'est que le début !) qu'il convient d'approfondir notre compréhension de leur fonctionnement pour éviter certains "a priori" et démystifier certains fantasmes (ce sont des outils fonctionnant sur des systèmes mathématiques, certes complexes et poussés, mais qui restent des mathématiques).
Plus nous maîtriserons ces connaissances, mieux nous utiliserons ces outils adéquatement et à notre service (et non l'inverse !).
Bonne lecture ! 🙂🎓
www.bigbrainevolution.com
3. Définition de l’intelligence artificielle
Son histoire
Ses disciplines
Les intelligences artificielles dites génératives
4. L’INTELLIGENCE
ARTIFICIELLE, C’EST QUOI ?
L'intelligence artificielle (IA) est un domaine de la
science informatique qui crée des machines ou des
logiciels capables d'effectuer des tâches qui
nécessitent habituellement l'intelligence humaine.
Cela inclut des activités comme apprendre,
raisonner, résoudre des problèmes, comprendre le
langage naturel, reconnaître des formes et des
objets, ou encore prendre des décisions. L'objectif
est de simuler l'intelligence humaine pour permettre
aux machines d'agir de manière autonome et
intelligente.
www.bigbrainevolution.com
5. Une utilisation déjà bien ancrée dans
notre quotidien
IL S’AGIT D’UN VASTE DOMAINE DONT LE DÉVELOPPEMENT ET
L’UTILISATION SONT DÉJÀ BIEN IMPLANTÉS
www.bigbrainevolution.com
6. CE N’EST PAS UN DOMAINE NAISSANT MAIS BIEN PLUS ANCIEN
01
ANNÉES 50'- 70'
02 03 04
ANNÉES 80' ANNÉES 90' ANNÉES 2010'
05
ANNÉES 2020'
Nouvel essor des IA
avec le
développement des
systèmes experts
capables de reproduire
le fonctionnement
logique de spécialistes
Emergence des
réseaux de neurones
et de l'apprentissage
automatique. Une IA
bat un champion du
monde des échecs,
une premières !
Nouvel essor des IA
basées sur
l'apprentissage profond
grâce au
développement du Big
Data et de la puissance
de calcul des
ordinateurs
2022/2023 : l'année de
l'IA : un déploiement à
grande échelle auprès
du grand public avec
des outils devenus
populaires comme
ChatGPT et Midjourney
par exemple
Apparition des
premières théories et
début des premiers
développements
propulsés par Alan
Turing et Arthur
Samuel
ANNÉES 2030'
www.bigbrainevolution.com
7. VISION PAR
ORDINATEUR
QUELLES PRINCIPALES DISCIPLINES
ENGLOBE-T-ELLE ?
TRAITEMENT DU
LANGAGE
NATUREL
ROBOTIQUE APPRENTISSAGE
AUTOMATIQUE
APPRENTISSAGE
PROFOND
www.bigbrainevolution.com
8. LA VISION PAR ORDINATEUR
La vision par ordinateur est un domaine de l'intelligence
artificielle et de l'informatique qui se concentre sur la
compréhension et l'interprétation des images et des vidéos
par les machines. L'objectif est de permettre aux ordinateurs
de traiter, analyser et comprendre les images de la même
manière que la vision humaine le fait. La vision par
ordinateur est utilisée dans de nombreux domaines tels que
la sécurité, la navigation des véhicules autonomes, la
reconnaissance faciale, la surveillance, la robotique,
l'inspection industrielle, la santé, et dans les applications
interactives comme les jeux vidéo et la réalité augmentée.
www.bigbrainevolution.com
9. Le traitement du langage naturel (TAL) est un domaine de
l'intelligence artificielle et de la linguistique informatique qui
se concentre sur l'interaction entre les ordinateurs et le
langage humain. L'objectif est de permettre aux machines
de comprendre, interpréter, et répondre au texte ou à la
parole humaine de manière naturelle et utile. Le traitement
du langage naturel est utilisé dans de nombreux domaines
tels que la recherche d'informations, les interfaces
utilisateur, l'analyse de données, l'éducation, le service
client, et dans de nombreuses applications interactives où
l'interaction en langage naturel est essentielle.
www.bigbrainevolution.com
LE TRAITEMENT DU LANGAGE NATUREL
10. La robotique est un domaine interdisciplinaire qui englobe
l'ingénierie, l'informatique, l'intelligence artificielle, la
mécatronique et d'autres domaines connexes. Elle se
concentre sur la conception, la construction, l'opération et
l'utilisation de robots. Ces robots peuvent être utilisés dans
une multitude de situations et pour diverses applications. La
robotique joue un rôle crucial dans de nombreux secteurs,
notamment l'industrie, la santé, le service, la recherche
scientifique, l'éducation, et la défense. Elle continue
d'évoluer rapidement, ouvrant de nouvelles possibilités et
applications.
www.bigbrainevolution.com
LA ROBOTIQUE (HUMANOÏDE OU NON)
11. L'apprentissage automatique (machine learning en
anglais) est une branche de l'intelligence artificielle qui se
concentre sur le développement de systèmes capables
d'apprendre et de s'améliorer à partir de l'expérience sans
être explicitement programmés comme pour le cas d’un
système traditionnel. Des algorithmes apprennent les règles
applicables directement depuis les données.
L'apprentissage automatique a révolutionné la manière
dont les données sont utilisées pour prendre des décisions
et a des applications dans presque tous les secteurs de
l'économie et de la recherche scientifique.
www.bigbrainevolution.com
L’APPRENTISSAGE AUTOMATIQUE (ML)
12. L'apprentissage profond (deep learning en anglais) est un
sous-ensemble avancé de l'apprentissage automatique qui
utilise des architectures complexes de réseaux de neurones.
Ces réseaux, composés de plusieurs couches de traitement,
permettent au modèle d'apprendre des caractéristiques et
des motifs à différents niveaux d'abstraction. En d’autres
mots, il s’agit d’un domaine de l’apprentissage automatique
permettant de traiter des données beaucoup plus
volumineuses et complexes qu’un programme
d’apprentissage automatique traditionnel. Son impact
continue de croître à mesure que la technologie évolue.
www.bigbrainevolution.com
L’APPRENTISSAGE PROFOND (DL)
13. IA FAIBLE IA FORTE
Capacités
limitées à une
seule tâche
Capacités
semblables ou
supérieures à
l'être humain
IL EXISTE DEUX GRANDES CATÉGORIES D’INTELLIGENCES
ARTIFICIELLES
À l'heure actuelle, seules les intelligences artificielles dites 'faibles' sont une réalité. Ces systèmes sont spécialisés
dans des tâches spécifiques et ne possèdent pas de conscience ou de compréhension générale. En revanche,
l'intelligence artificielle forte, également connue sous le nom d'intelligence artificielle générale, qui équivaudrait à
une compréhension et à une conscience humaine, reste pour l'instant au stade théorique.
www.bigbrainevolution.com
15. Actuellement, le type d'intelligence artificielle le plus en vogue est l'IA générative. Cette forme d'IA se
compose de modèles mathématiques développés sur la base de l'apprentissage automatique,
souvent en utilisant des techniques d'apprentissage profond. Ces modèles sont capables de créer
du contenu – qu'il s'agisse de textes, d'images, de fichiers audio, de vidéos ou de code – en
s'inspirant de contenus existants de même nature. La formation de ces modèles s’effectue sur la
base de 3 éléments clés : des données, un modèle mathématique (formule ou algorithme
complexe) contenant des paramètres de calculs initialisés aléatoirement par défaut, et un
algorithme d’apprentissage qui modifie les paramètres du modèle pour l’entrainer dans sa tâche.
www.bigbrainevolution.com
16.
17. EN QUOI LES DONNÉES SONT-ELLES IMPORTANTES ?
www.bigbrainevolution.com
Dans le domaine de l'intelligence artificielle (IA), l'importance des données est
primordiale, agissant comme la pierre angulaire de ces systèmes. Similaires
au rôle du carburant pour les moteurs, les données alimentent et orientent le
fonctionnement de l'IA. Ces données sont spécifiquement choisies en fonction
de l'application visée par le système d'IA. Ainsi, pour un système de traitement
du langage naturel tel que ChatGPT, les données textuelles sont utilisées pour
construire le modèle de langage. De la même manière, pour une IA spécialisée
dans la création d'images, ce seront des données visuelles qui seront
nécessaires, et pour le traitement de l'audio, des données sonores seront
utilisées. La collecte, le traitement et l'analyse de ces données sont des
processus clés dans l'élaboration de systèmes d'IA à la fois performants et
fiables.
18.
19. QU’EST-CE QU’UN MODÈLE MATHÉMATIQUE ?
www.bigbrainevolution.com
Dans le secteur de l'intelligence artificielle (IA), un modèle mathématique se
définit comme une structure ou une représentation mathématique
spécialement conçue pour l'analyse de problèmes ou l'exécution de tâches
déterminées. Ces modèles forment le noyau central des systèmes d'IA,
assurant une variété de fonctions cruciales. En particulier, dans le domaine de
l'apprentissage automatique, ces modèles mathématiques sont entraînés sur
des ensembles de données pour affiner leurs paramètres grâce à des
algorithmes d’apprentissage. Cette optimisation vise à minimiser la différence
entre les prédictions du modèle et les résultats réels ou à traiter et interpréter
les données de manière plus précise. ChatGPT est un exemple de modèle
mathématique (complexe !). Ce dernier a été ajusté pour imiter fidèlement le
langage humain, s'appuyant sur un vaste corpus de textes issus d'Internet
pour son apprentissage.
20.
21. UN ALGORITHME, C’EST QUOI ?
www.bigbrainevolution.com
Les modèles d'intelligence artificielle (IA) apprennent et s'améliorent grâce à
des règles spéciales appelées algorithmes d'apprentissage. Ces règles aident
l'IA à comprendre et à utiliser les informations. Il existe différents types de ces
règles. Par exemple, certaines aident l'IA à apprendre à partir de données où
chaque information est déjà étiquetée ou classée (apprentissage supervisé),
tandis que d'autres lui permettent de découvrir des motifs et des liens par elle-
même dans des données non classées (apprentissage non supervisé). Il y a
aussi des règles qui fonctionnent comme un jeu : l'IA reçoit des récompenses
ou des pénalités et apprend en conséquence (apprentissage par
renforcement). Chaque type de règle utilise des méthodes mathématiques
pour aider l'IA à mieux fonctionner selon son objectif. Le choix et l'efficacité de
ces règles sont très importants car ils déterminent à quel point l'IA est précise
et capable de s'adapter à de nouvelles informations, ce qui affecte
directement sa performance globale.
22. UN MODÈLE D’IA GÉNÉRATIVE EST DONC LA
COMBINAISON DE CES TROIS ÉLÉMENTS
Un modèle d'IA générative basé sur l'apprentissage profond fusionne ces trois composants essentiels. En prenant
l'exemple de ChatGPT, ce système utilise des données textuelles pour former le modèle, lequel est structuré autour d'un
réseau de neurones profond, le modèle mathématique. L'algorithme d'apprentissage dirige ensuite l'ajustement des
paramètres du modèle, lui permettant d'apprendre comment compléter des séquences de mots. Cette combinaison
rend ChatGPT capable de générer du texte de manière cohérente et pertinente, démontrant l'efficacité de l'IA
générative dans le traitement du langage naturel.
www.bigbrainevolution.com
23.
24. DES DONNÉES TEXTUELLES...
...ET GÉNÉRER DU TEXTE PAR
PRÉDICTION DE MOTS.
...ALIMENTANT UN RÉSEAU DE
NEURONES ARTIFICIELS...
...ENTRAÎNÉ POUR COMPRENDRE
LE LANGAGE HUMAIN...
www.bigbrainevolution.com
25. chiens chats
animaux chiens
J' aime
aime chiens
des les
80 %
78 %
53 %
33 %
72 %
Les modèles de langage tels que GPT, et donc par extension ChatGPT, sont des systèmes informatiques organisés
selon un schéma analogue aux réseaux de neurones biologiques mais en utilisant des formules mathématiques
liées entre elles, d’où le nom de réseaux de neurones artificiels. Les systèmes sont entrainés sur de vastes
volumes de textes pour analyser les relations entre les mots (ou tokens) dans le langage humain et reproduire
ces relations selon des liens de probabilités.
www.bigbrainevolution.com
26. Et ce processus est appliqué à toute la prédiction de mots ou tokens en sortie. Les relations sémantiques apprises
lors de l'entrainement sont donc en réalité des probabilités statistiques
Ceci est un ?
...
? ?
Ceci est un
...
...
...
...
Input
?
Modèle de langage
...
...
...
...
...
? ? ? ?
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
www.bigbrainevolution.com
27. Ceci est un ? cours ?
Ceci est un
Input
Modèle de langage
cours
sur
.
GPT
...
sur ? GPT ?
sur
.
...
GPT
...
GPT
.
...
...
...
.
...
...
...
...
www.bigbrainevolution.com
Chaque séquence de mots ou tokens établit un vecteur de probabilité de suite de mots. le mot ou token prédit
dont la probabilité établie par le modèle est la plus élevée est fournie en réponse à la requête en entrée
Output basé sur des prédictions
99 %
5 %
43 %
7 %
17 %
92 %
4 %
63 %
15 %
6 %
98 %
56 %
7 %
72 %
3 %
68 %
97 %
29 %
3 %
8 %
cours sur GPT .
28. C'est pour cette raison que dans le cadre de l'utilisation d'une application basée sur un modèle de langage, tel
que chatGPT par exemple, il est important d'employer des mots et un contexte clair ainsi que des phrases bien
structurées afin de que le modèle puisse cibler avec précision les mots à prédire.
Entrée de données (Input) Modèle de langage Sortie de données
Entrée de données (Input) Modèle de langage Sortie de données
Entrée de données (Input) Modèle de langage Sortie de données
J'aime les .... La liste des probabilités en
sortie est longue et non ciblée.
Ce peut être tout et n'importe
quoi : des animaux, des
personnes, etc.
J'aime les animaux tels que ... La liste des probabilités est
plus importance sur certaines
catégories de mots ayant un
vecteur proche du mot
"animaux" : chat, ours, chien,
sauvage, etc.
J'aime les animaux tels que les
félins, en particulier ...
La liste des probabilités est
plus importance sur certaines
catégories de mots ayant un
vecteur proche du mot "félins" :
chat, lion, tigre, lynx, etc.
www.bigbrainevolution.com
29. DONC DÉFINISSONS CHATGPT !
01 02 03 04
Modèle
de langage
Intelligence artificielle
générative
Apprentissage
automatique
Traitement du langage
automaotique
www.bigbrainevolution.com
ChatGPT est un modèle de langage avancé qui s'inscrit dans le cadre de l'apprentissage profond,
une branche spécialisée de l'apprentissage automatique. Développé par OpenAI, ChatGPT est conçu
pour comprendre, générer et interagir en utilisant le langage naturel. Il repose sur des techniques
d'apprentissage profond, notamment l'utilisation de réseaux de neurones à grande échelle, pour
traiter et répondre à des requêtes textuelles.
30. VOUS SOUHAITEZ EN SAVOIR PLUS ?
Visitez notre formation ChatGPT : Devenez
PROFESSIONNEL du PROMPT ENGINEERING !
www.bigbrainevolution.com
31. BigBrain Evolution, le prestataire de
formations en ligne de référence !
www.bigbrainevolution.com
MERCI!