2. Machine Learning.
Types de Machine Learning.
Machine Learning supervisé.
Les étapes du Machine Learning supervisé.
Exemple d’algorithme.
Agenda:
3. Machine Learning ( Apprentissage
Automatique ):
Est une catégorie d’algorithme qui permet aux
applications logicielles de prédire plus précisément les
résultats sans être explicitement programmées. Le
principe de base de l’apprentissage automatique est de
créer des algorithmes capables de recevoir des données
d’entrée et d’utiliser une analyse statistique pour prédire
une sortie tout en les mettant à jour à mesure que de
nouvelles données deviennent disponibles.
4. Types de Machine Learning :
Supervisé: toutes les
données sont étiquetées et
les algorithmes apprennent à
prédire le résultat des
données d’entrée.
Apprentissage par renforcement :
Considérer un agent autonome,
plongé au sein d'un environnement,
et qui doit prendre des décisions en
fonction de son état courant. En
retour, l'environnement procure à
l'agent une récompense, qui peut
être positive ou négative
Non supervisé: toutes les données
ne sont pas étiquetées et les
algorithmes apprennent la structure
inhérente à partir des données en
entrée.
5. Supervised Machine Learning(Apprentissage supervisé) :
C' est une technique d' apprentissage automatique où l'on cherche à produire
automatiquement des règles à partir d'une base de données d'apprentissage contenant des «
exemples » (en général des cas déjà traités et validés).
6. Les étapes du Machine Learning supervisé :
1. Importer un Dataset (x, y) qui contient nos exemples.
2. Développer un Modèle aux paramètres aléatoires.
3. Développer une Fonction Coût qui mesure les erreurs entre le modèle et le Dataset.
4. Développer un Algorithme d’apprentissage pour trouver les paramètres du modèle qui
minimisent la Fonction Coût.
8. 1. Dataset :
CETTE ÉTAPE CONSISTE À IMPORTER UN DATASET QUI CONTIENT LES EXEMPLES QUE
LA MACHINE DOIT ÉTUDIER.
Ce Dataset inclut toujours 2 types de variables :
Une variable objectif (target) y.
Une ou plusieurs variables caractéristiques (features) x.
Par convention, on dit que notre Dataset contient m exemples.
Par convention, on note également n le nombre de features dans notre Dataset, c’est-à-dire le
nombre de colonnes (hormis la colonne y).
Dernière convention : pour désigner une cellule de notre tableau, on note en général
10. 2. Le modèle :
C’est une représentation simplifiée de la réalité, que l’on peut utiliser pour prédire ce qui se
passerait dans certaines conditions.
C’est à nous de choisir le type de modèle et c’est à la machine de trouver les coefficients de
cette fonction qui donnent les meilleurs résultats.
Catégorisation des résultats :
• Régression: la variable de sortie est continue,
• Classification : la variable de sortie prend ses
valeurs dans des classes,
11. Exemples de modèle :
la machine trouver la valeur de a, b et c qui donne les meilleurs résultats.
:
On peut choisir de développer de
développer un modèle linéaire : f(x)
= ax + b
Ou bien on peut choisir un modèle non-
linéaire: f(x) = ax^2 + bx + c
12. 3. La Fonction Coût :
Solution :
La Fonction Coût évalue la performance du
modèle en calculant les erreurs entre les
prédictions du modèle f(x) et les valeur y
attendue dans le Dataset.
Problème :
Mesurer la performance d’un modèle
donné.
Comment mesuré la pérformence d’un tireur ?
Mesurer la distance entre la flèche (f(x)) et le centre de
la cible, qui n’est autre que le point (y) qu’elle est sensée
atteindre.
13. 4. l’Algorithme d’apprentissage :
C’est un algorithme de minimisation de la Fonction Coût: Il cherche quels sont les meilleurs
paramètres du modèle, ceux qui donneront la meilleure performance, c’est-à-dire les plus petites
erreurs (Fonction Coût).
14. La Descente de Gradient
C’est l’algorithme itératif le plus connu pour entraîner un modèle de Machine Learning.
Une fois que le modèle atteint une performance satisfaisante, c’est la fin de la phase
d’entrainement, et le modèle final est prêt à être déployé. C’est alors la phase d’utilisation, les
paramètres du modèle ne changent plus, ils sont fixes.
Notes de l'éditeur
L'apprentissage automatique est une branche de l'intelligence artificielle (IA) et de l'informatique qui utilise principalement des données et des algorithmes pour imiter la manière dont les être humains apprennent, en améliorant progressivement sa précision.
Semi-supervisé: Certaines données sont étiquetées mais la plupart d’entre elles ne sont pas étiquetées et un mélange de techniques supervisées et non supervisées peut être utilisé.
D’une manière générale, la machine peut apprendre une relation f : (Y = f (X)) qui relie x à y en ayant analysé des millions d’exemples d’associations x y.
-Consiste en des variables d’entrée (x) et une variable de sortie (Y). Vous utilisez un algorithme pour apprendre la fonction de mapping de l’entrée à la sortie. Y = f (X)
C’est l’étape la plus importante, qui consomme beaucoup de temps
Le modèle se comporte alors comme une table contenant tous les échantillons utilisés lors de l'apprentissage et perd ses pouvoirs de prédiction sur de nouveaux échantillon
(Par convention on appelle ces coefficients les paramètres du modèle.)
Le Modèle est le cœur de notre programme. C’est lui qui effectue les prédictions . Au début, les paramètres du modèle sont toujours choisis au hasard.