Il n'est pas évident d'intégrer de la Data Science dans les sociétés qui développent un business qui de base ne prévoyait pas de l’intelligence artificielle (IA), et pour lequel l’IA n'est pas au cœur du métier. Malgré la motivation d'utiliser l’IA, de nombreux projets Data Science dans ces sociétés échouent.
C'est autant frustrant pour les responsables d'entreprises que démotivant pour les data-scientists, dont les projets finissent au placard. On va analyser ensemble cette situation, pour déterminer les raisons de ces échecs. On va également étudier comment éviter les erreurs les plus courantes, et comment mener ce changement sans encombre afin d'enrichir vos produits avec l’IA.
L’objectif du talk est que peu importe le profil que vous avez - dev front, dev back, data-scientist, CTO, CEO, Product Manager - vous retournerez lundi dans votre société en sachant à la fois identifier et mener à bien les opportunités de Data Science.
16. #MakeDataScienceGreatAgain @lievAnastazia
Quand un data-scientist sait ce qu'il doit chercher dans des données, il peut mettre
beaucoup du temps à le trouver, et le résultat n’est pas garanti.
Alors quand il ne sait pas ce qu’il doit chercher, c’est garanti qu’il ne trouvera rien
Axiome #1
21. #MakeDataScienceGreatAgain @lievAnastazia
Force à bien organiser la data (base de données et pipelines de prétraitement)
Permet de découvrir simplement les patterns et les règles métiers cachées dans la
data
AVANTAGES
22. #MakeDataScienceGreatAgain @lievAnastazia
Force à bien organiser la data (base de données et pipelines de prétraitement)
Permet de découvrir simplement les patterns et les règles métiers cachées dans la
data
Invite à porter attention à la qualité et à l’accessibilité des données
AVANTAGES
26. #MakeDataScienceGreatAgain @lievAnastazia
Definition de la Data Science
“La science des données est l'extraction de connaissance d'ensembles de données.
Elle emploie des techniques et des théories tirées de plusieurs autres domaines
plus larges des mathématiques, la statistique principalement, la théorie de
l'information et la technologie de l'information, notamment le traitement de signal,
des modèles probabilistes, l'apprentissage automatique, l'apprentissage statistique,
la programmation informatique, l'ingénierie de données, la reconnaissance de
formes et l'apprentissage, la visualisation, l'analytique prophétique, la modélisation
d'incertitude, le stockage de données, la compression de données et le calcul à
haute performance. Les méthodes qui s'adaptent aux données de masse sont
particulièrement intéressantes dans la science des données, bien que la discipline
ne soit généralement pas considérée comme limitée à ces données.La science des
données (en anglais data science) est une discipline qui s'appuie sur des outils
mathématiques, de statistiques, d'informatique (cette science est principalement une
« science des données numériques ») et de visualisation des données. ”
27. #MakeDataScienceGreatAgain @lievAnastazia
La Data-Science est un domaine pluridisciplinaire extrêmement vaste,
avec un grand nombre de spécialisations différentes,
qui supposent des techniques et des compétences différents
Axiome #2
36. #MakeDataScienceGreatAgain @lievAnastazia
“Pourtant, ce dernier (Data-Scientist),
sans les compétences du Data Engineer
ne peut pas forcément coder proprement
(voir un résumé du livre Clean code) et
livrer facilement un produit maintenable.”
37. #MakeDataScienceGreatAgain @lievAnastazia
Il n’y a pas de corrélation
entre les compétences en data-science appliquée et le niveau d'étude
Axiome #3
Bac +5
Dev
Bac +3
Dev
Bac +8
Whatever
Bac +5
Whatever
Bac +5
Data Science
38. #MakeDataScienceGreatAgain @lievAnastazia
Favoriser les candidats qui sont curieux et qui n’ont pas peur de coder
ou de rentrer dans le cœur des algorithmes
en décortiquant les formules mathématiques !
Action #3 CODE & CURIOUS
40. #MakeDataScienceGreatAgain @lievAnastazia
Ne pas confondre la data science en entreprise avec une compétition sur
Kaggle !
Le Data-Scientist ne crée pas des algorithmes innovants et complexes pour
publier un papier (on n’est plus au labo de recherche !)
41. #MakeDataScienceGreatAgain @lievAnastazia
Ne pas confondre la data science en entreprise avec une compétition sur
Kaggle !
Le Data-Scientist ne crée pas des algorithmes innovants et complexes pour
publier un papier (on n’est plus au labo de recherche !)
Le Data-Scientist crée de la valeur à partir de données,
une valeur perceptible par l’utilisateur et, donc, par le business.
42. #MakeDataScienceGreatAgain @lievAnastazia
Ne pas confondre la data science en entreprise avec une compétition sur
Kaggle !
Le Data-Scientist ne crée pas des algorithmes innovants et complexes pour
publier un papier (on n’est plus au labo de recherche !)
Le Data-Scientist crée de la valeur à partir de données,
une valeur perceptible par l’utilisateur et, donc, par le business.
Maîtriser les mathématiques est obligatoire
43. #MakeDataScienceGreatAgain @lievAnastazia
Ne pas confondre la data science en entreprise avec une compétition sur
Kaggle !
Le Data-Scientist ne crée pas des algorithmes innovants et complexes pour
publier un papier (on n’est plus au labo de recherche !)
Le Data-Scientist crée de la valeur à partir de données,
une valeur perceptible par l’utilisateur et, donc, par le business.
Maîtriser les mathématiques est obligatoire
Langages pour l’expérimentation ou langages pour la production.
56. #MakeDataScienceGreatAgain @lievAnastazia
Axiome #5
On bâtit les projets de Data-Science sur plusieurs hypothèses,
y compris des hypothèses liées à l’utilisateur final.
Connaître ses personae et comprendre leurs besoins
est donc crucial pour la réussite de ces projets.
72. #MakeDataScienceGreatAgain @lievAnastazia
Action #6 PRATIQUEZ L’AGILITE
La systeme de recommandation
des videos ( à la YouTube)
Epic
Construire un prototype d’un
système de recommandation avec
une approche basé sur le contenu
Story 1
En tant qu'utilisateur je veux liké ou disliké les vidéos visionnés
afin de donner mon retour explicit sur le contenu
Story 2
En tant que data-scientist je veux extraire les méta-informations (titre, genre de vidéos, actrices/acteurs
principales, musique) à partir de vidéos afin de les utiliser dans l’algorithme de recommandation.
74. #MakeDataScienceGreatAgain @lievAnastazia
“It’s always good to be reminded
that our knowledge and skill set can be expanded.
This, in turn, increases
our motivation as well as our humility.
“Rebel Talent”, Francesca Gino
75. #MakeDataScienceGreatAgain @lievAnastazia
“It’s always good to be reminded
that our knowledge and skill set can be expanded.
This, in turn, increases
our motivation as well as our humility.
“Rebel Talent”, Francesca Gino
Axiome #7
Seul, on va plus vite.
76. #MakeDataScienceGreatAgain @lievAnastazia
“It’s always good to be reminded
that our knowledge and skill set can be expanded.
This, in turn, increases
our motivation as well as our humility.
“Rebel Talent”, Francesca Gino
Axiome #7
Seul, on va plus vite. Ensemble, on va plus loin.