Il y a 20 ans, l’Extreme Programming était un framework novateur avec des pratiques de génie logiciel sans lesquelles nous n’imaginerions plus travailler aujourd’hui pour produire des logiciels de qualité. Dans cette présentation, nous découvrirons comment les pratiques de l’Extrême Data-Science, qui se reposent sur les épaules du géant Extrême Programming, nous permettent d’intégrer avec succès les data-scientists et leurs projets dans les équipes, et aident à assurer la qualité des livrables data-science qui offrent des fonctionnalités optimales pour l’utilisateur.
11. Enrichissement
et traitement
des données
brutes
Cycle de
Livraison des
prédictions
Apprentissage
artificiel
Déploiement des
modèles
Quelles données doit-on
utiliser pour le modèle?
Quelles métriques
doit-on optimiser ?
Quels algorithmes
benchmarker ?
À quelle fréquence doit-on
produire le modèle ?
À quelle fréquence doit-on
produire les prédictions ?
Comment prétraiter les
données disponibles ?
17. EXTREME DATA SCIENCE
masterofproject.com
1/ Transparence du processus et responsabilisation des acteurs
2/ Solutions data-science de qualité, ayant beaucoup moins de défauts
19. Data-Scientist
What my university thinks I do
What society thinks I do What my boss thinks I do What my coworkers think I do
What my younger me thought I’ll do What I actually do
Science
20. Data-Scientist
What my university thinks I do
What society thinks I do What my boss thinks I do What my coworkers think I do
What my younger me thought I’ll do What I actually do
Science
34. La systeme de recommandation
des videos ( à la YouTube)
Epic
Construire le prototype d’un
système de recommandation avec
une approche basée sur le contenu
Story 1
En tant qu'utilisateur je veux liker ou disliker les vidéos
visionnées afin de donner mon évaluation sur le contenu
Story 2
En tant que data-scientist je veux extraire les méta-informations (titre, genre de la vidéo,
actrices/acteurs principaux, BO) à partir des vidéos afin de les utiliser dans l’algorithme de
recommandation.
Story 3
En tant que data-scientist je veux modéliser les réactions
des utilisateur par rapport aux vidéos avec un réseau de neurones récurrents
35. ● Les histoires utilisateurs cadrent le besoin data-science
● Mise en production de la solution minimale rapidement
pour avoir le retour d’utilisateur
36. Data-Scientist
What my university thinks I do
What society thinks I do What my boss thinks I do What coworkers think I do
What my younger me thought I’ll do What I actually do
Science