SlideShare une entreprise Scribd logo
1  sur  43
CHAPITRE 0
MACHINE LEARNING
OVERVIEW MATHS
Copyright Franck Bardol 2016 2
CV
Franck	Bardol	
+33	6	24	30	92	59	
bardolfranck@gmail.com	
@bardolfranck	
		
	
	
¡  Consultant	in	Machine	Learning	
	
¡  Jury	–	organizer	hackathons		
	
¡  Trainer	in	machine	learning	
¡  co-organiser		
meetup	Paris	Machine	Learning
¡  Fondements
“We are living the age of information and entering the age of
recommendation”
The Long tail - Chris Anderson
Copyright Franck Bardol 2016 3
PARADOX OF CHOICE
MORE IS LESS
¡  Fondements
§  “The web is leaving the era of search and entering one of discovery”
§  “Race to create a smart GOOGLE” – CNN –
Copyright Franck Bardol 2016 4
FROM SEARCH TO DISCOVERY
SEARCH
DISCOVERY
users
users
idea
idea
👧‍ 👨‍
👦
👩‍
👧‍ 👨‍
👦
👩‍
💡
🔮
❤️‍
💡
🔮
❤️‍
Copyright Franck Bardol 2016 5
FROM SEARCH TO DISCOVERY
“you may
also like” “people
you may
know”
“people
to
follow”
reco in
stealth
mode
👧‍ 👨‍
👦
👩‍
👩‍
👩‍
👮
80%
watch
via
RECO
¡  Quels sont les secteurs qui l’utilisent ?
§  Sites de streaming video
§  Sites marchands
§  Opérateur télécom
§  Formation & MOOC
Copyright Franck Bardol 2016 6
FROM SEARCH TO DISCOVERY
CA
+35%
click
+40%
¡  Apprentissage
Définition : Modification du comportement par l’expérience
¡  Machine learning
définition : Programmes executables qui :
ü apprennent les données
ü s’adaptent aux données
ü s’améliorent au cours du temps
Copyright Franck Bardol 2016 7
DATA-SCIENCE
QU’EST-CE-QUE C’EST ?
¡ Apprendre ?
comment ?
par l’exemple !!
les couleurs
Copyright Franck Bardol 2016 8
QU’EST-CE QUE C’EST ?
Copyright Franck Bardol 2016 9
QU’EST-CE QUE C’EST ?
Apprendre Généraliser
quoi ?
un concept
quand ?
sur nouvelles
données
comment ?
par l’exemple
pourquoi ?
généraliser
Copyright Franck Bardol 2016 10
COMMENT ÇA FONCTIONNE ?
Intuition
Hypothèses
Connaissances
Modèle /
programme Données
Données
Détecteur
schémas
cachés
Modèle/
programme
informatique
traditionnelle
informatique data
driven
X , Yf
X , Y f
fX Y
PRODUCTION
input decision predict
COMMENT ÇA FONCTIONNE ?
DESCRIPTEURS / FEATURES
nb_appel duree_
min
appel
internation
age categorie
_socio
type_
forfait
3 46 6 98 86 11
4 33 0 8 6 12
PREDICTION
reste_client
part
PREDICTION
part
reste_client
DESCRIPTEURS / FEATURES
nb_
appel
duree_
min
appel
internatio
n
age categori
e_socia
type_
forfait
3 46 6 98 86 11
4 33 0 8 6 12
1 - TRAIN
2 - TEST
34 7 56 2 3 - PREDICT
?
NOUVELLE DATA
BASE
D’APPRENTISSAGE
BASE DE TEST
PREDICTION
?
Copyright Franck Bardol 2016 11
GENERALIZATION VS. OVERFITTING
MEMORIZING VS. LEARNING
généraliser
Apprendre Généraliser
données d’apprentissage
STRUCTURE
DETAILS & BRUITS
nouvelles données
Copyright Franck Bardol 2016 12
Supervisé = exemples étiquettés
ü Régression
prédire des chiffres continus
ü Classification
prédire des étiquettes / classes / label
Copyright Franck Bardol 2016 13
APPRENTISSAGE
SUPERVISÉ
COMBIEN ?
EST-CE QUE ?
Supervisé = exemples étiquettés
ü Régression
prédire des chiffres continus
ü Classification
prédire des étiquettes / classes / label
Copyright Franck Bardol 2016 14
APPRENTISSAGE
SUPERVISÉ
big /
little ?
temperature
pressure stock markets
petit moyen grand très
grand ?
COMBIEN ?
EST-CE QUE ?
Non supervisé = pas d’étiquettes
ü Clustering
trouver des familles naturelles
ü Moteur de recommandation
Introduire de la sérendipité controllable
Copyright Franck Bardol 2016 15
APPRENTISSAGE
NON SUPERVISÉ
RESUME ?
Non supervisé = exemples non étiquettés
ü Clustering – anomaly detection – recommender system
§  Comprendre, explorer, simplifier les données, trouver des structures
cachées invisibles à l’oeil
Copyright Franck Bardol 2016 16
APPRENTISSAGE
NON SUPERVISÉ
CARTE TOPOLOGIQUE
300 variables économiques
(PIB/hab, accès eau, ….)
ANOMALY
DETECTION
RECOMMENDER SYSTEM
RESUME ?
Copyright Franck Bardol 2016 17
EXEMPLES
web log
text
text langue ?
EEG
web
log
who ?
epilepsy ?
bot?
gender ?
churn?
CRIME
where ?
when ?
predpol.com
deepinstinct.com
Malicious Code & Attacks ?
age?
click pub ?
¡  Règles écrites “à la main” èapproche peu performante
¡  Pas de règles / absence d’expertise humaine
§  bio informatique
¡  Trop de règles
§  Difficulté à poser les règles, les expliquer…
§  La solution évolue
§  Reconnaissance artificielle (vision, parole, signes gestes …)
§  Voiture autonome
§  Ranking, Tracking, poursuite
§  routing computer networks
§  pub temps réel
Copyright Franck Bardol 2016 18
C’EST EFFICACE QUAND ?
pedestrian detection
Automatic questions – answering
Requirement :
ü never seen these words before
ü comprehension
ü time element (« before », « after », …)
ü action (« go », « pick up », …)
Copyright Franck Bardol 2016 19
EXEMPLES
www.github.com/vinhkhuc/MemN2N-babi-python
Copyright Franck Bardol 2016 20
EXEMPLES
HEP@LHC-CERN
boson?
100 million events / sec
CA +30%
buy ?
hire?
sign ?
success ?
70% accuracy
Copyright Franck Bardol 2016 21
DATA
Scrapping = extract info
from web sites
opendata.cern.ch
data.gov
data.gouv.fr
www = thousand more
Open Data
Scrapping
Copyright Franck Bardol 2016 22
DATA, BECAUSE …
A
C
C
U
R
A
C
Y
DATA
Copyright Franck Bardol 2016 23
DATA, BECAUSE …
P
E
R
F
DATA
MORE
DATA !
¡  Pourquoi ?
Copyright Franck Bardol 2016 24
BUT ….
BE CAREFUL
¡  De quoi parle-t-on ?
Copyright Franck Bardol 2016 25
BEWARE OF THE DIMENSION
p features
(descripteurs - variables explicatives)
DIMENSION = p
V
O
L
U
M
E DATA
n
S
A
M
P
L
E
S
¡  De quoi parle-t-on ?
Copyright Franck Bardol 2016 26
DIMENSION ?
DIMENSION
V
O
L
U
M
E
TECHNO
BIG DATA
STATISTICS &
MACHINE
LEARNING
ACP
ACC
SOM
n
S
A
M
P
L
E
S
¡  é dimension du problème èRISQUE de …
§  é corrélation fallacieuses - spurious correlations – potentielles
Tendance aléatoire fortuite commune
http://www.tylervigen.com/spurious-correlations
§  é combinaisons fallacieuses - spurious combinations – potentielles
Combinaisons fallacieuses qui peuvent “prédire” un phénomène
é exponentielle du nombre de combinaisons entre les colonnes
§  é données nécessaires pour l’apprentissage
§  é exponentielle du nombre de lignes (samples) pour apprendre
convenablement
§  Curse of dimensionality
§  En très grande dimension, les données se trouvent toutes à égales distance.
§  Les méthode basées sur le voisinage (kNN…) échouent
Copyright Franck Bardol 2016 27
RÉDUCTION DIMENSION
DIMENSION
¡  é dimension du problème èRISQUE de …
§  é complexité de la solution
§  é complexité
§  Kolmogoroff
§  MDL : Minimum Description Length
§  Occam Razor “l’explication la plus simple est toujours la meilleure”
§  nb : simple ≠ simpliste
§  ê pouvoir explicatif de la solution
§  nb : pouvoir explicatif ≠ pouvoir prédictif
§  é sur-apprentissage – over fitting (par coeur vs. généralisation)
§  é difficulté de visualiser le problème (êintuition)
Copyright Franck Bardol 2016 28
RÉDUCTION DIMENSION
DIMENSION
¡  é dimension du problème èRISQUE de …
§ faire ECHOUER les méthodes statistiques et mathématiques
Exemple inspiré de
Copyright Franck Bardol 2016 29
RÉDUCTION DIMENSION
DIMENSION
¡  é dimension du problème èRISQUE de …
§ faire ECHOUER les méthodes statistiques et mathématiques
§  Exemple en bio-informatique - génomique :
§  Quelques centaines de lignes (les patients - samples) vs. 100 millions de
descripteurs (les gènes extraits - features)
Copyright Franck Bardol 2016 30
RÉDUCTION DIMENSION
DIMENSION
contexte
¡  é dimension du problème èRISQUE de …
§ faire ECHOUER les méthodes statistiques et mathématiques
Copyright Franck Bardol 2016 31
RÉDUCTION DIMENSION
DIMENSION
problème !
¡  Pourquoi ê dimension du problème ?
Vision d’ensemble donnée par 2 des plus grands spécialistes
§  Interview de Michael Jordan
§  Interview de Vladimir Vapnik
§  fichier “interview Vapnik”
Copyright Franck Bardol 2016 32
RÉDUCTION DIMENSION
Copyright Franck Bardol 2016 33
METHOD
KEY SKILL = FAST PROTOTYPING
AVOID
COMPLEXITY
N
O
O
K
N
O
SIMPLEST
SOLUTION
Copyright Franck Bardol 2016 34
COMPETE AGAINST OTHER DATA
SCIENTIST
Key figures:
•  400K data scientists
•  2 million machine learning models
Lessons learned from previous contest :
•  Top methods
•  XgBoost models : for structured problems
•  Deep Learning : for unstructured problems (sounds, visual, texts)
-  source : Anthony Goldbloom, CEO Kaggle – www.kaggle.com
Copyright Franck Bardol 2016 35
COMPETE AGAINST OTHER DATA SCIENTIST
www.datascience.net
www.challengedata.ens.fr
Copyright Franck Bardol 2016 36
DATA-SCIENCE + PYTHON = DREAM TEAM
¡  Python : langage de programmation
¡  Avantages :
§  Très vaste choix de librairies gratuites
§  Courbe d’apprentissage faible
§  Communauté d’utilisateurs actifs gigantesque
§  Le langage favori des data-scientists
§  Elimine la ré-écriture complète du code prototypé par data-scientist
§  langage interprété – prototyping rapide (pas de compilation – link)
§  lisibilité du code (via identation)
¡  Inconvénients :
§  langage interprété (pas d’étape compilation – link)
§  vitesse d’exécution
Copyright Franck Bardol 2016 37
DATA-SCIENCE AVEC PYTHON
Copyright Franck Bardol 2016 38
OPEN SOURCE TOOLS
vision langage
general purpose
machine learningvisualization
data management
optimization …
package
thousand other tools
Copyright Franck Bardol 2016 39
API
portails
API
www.mashape.com
www.programmableweb.com
www.mloss.org
thousand other tools
ULTRA FAST PROTOTYPING
#chargement des données
—  1 import pandas as pd
—  data = pd.read_csv(‘data_to_read.csv’)
#chargement d’une librairie
—  2 from sklearn import model
#chargement d’un algorithme de prédiction
—  3 clf = model.algo()
#ENTRAINEMENT sur les données d’apprentissage
—  4 clf.fit(data_train , out_train)
#TEST sur les données non vues
—  5 predict = clf.predict(data_test)
Copyright Franck Bardol 2016 40
 
Copyright Franck Bardol 2016
41
BIBLIO
ainews.posthaven.com/16-free-ebooks-on-machine-learning
 
Copyright Franck Bardol 2016
42
Internet ressources : MOOC
(massive onLine open courses)
Udacity.com
coursera.org
Edx.org
france-universite-numerique.fr
moocs.epfl.ch
...
Copyright Franck Bardol 2016
43
 
•  duplique le savoir d’experts
•  construit des programmes exécutables de décision
•  augmente la boite à outils des analystes
Prediction
TAKE HOME
Machine
Learning
Algo
Hidden
Pattern
Detector
DataTRAINING
PROD
Data
Hidden
Pattern
Detector

Contenu connexe

Tendances

La détection de la fraude par la connaissance des données - Carte Blanche Par...
La détection de la fraude par la connaissance des données - Carte Blanche Par...La détection de la fraude par la connaissance des données - Carte Blanche Par...
La détection de la fraude par la connaissance des données - Carte Blanche Par...Jean-François Tripodi
 
Pythonによる黒魔術入門
Pythonによる黒魔術入門Pythonによる黒魔術入門
Pythonによる黒魔術入門大樹 小倉
 
区間分割の仕方を最適化する動的計画法 (JOI 2021 夏季セミナー)
区間分割の仕方を最適化する動的計画法 (JOI 2021 夏季セミナー)区間分割の仕方を最適化する動的計画法 (JOI 2021 夏季セミナー)
区間分割の仕方を最適化する動的計画法 (JOI 2021 夏季セミナー)Kensuke Otsuki
 
ディープラーニングによるゆるキャラグランプリの得票数予想
ディープラーニングによるゆるキャラグランプリの得票数予想ディープラーニングによるゆるキャラグランプリの得票数予想
ディープラーニングによるゆるキャラグランプリの得票数予想Katsuya Ishiyama
 
パターン認識 第10章 決定木
パターン認識 第10章 決定木 パターン認識 第10章 決定木
パターン認識 第10章 決定木 Miyoshi Yuya
 
Pythonのガベージコレクション
PythonのガベージコレクションPythonのガベージコレクション
PythonのガベージコレクションAtsuo Ishimoto
 
Cloud runのオートスケールを検証してみる
Cloud runのオートスケールを検証してみるCloud runのオートスケールを検証してみる
Cloud runのオートスケールを検証してみる虎の穴 開発室
 
알파고 해부하기 1부
알파고 해부하기 1부알파고 해부하기 1부
알파고 해부하기 1부Donghun Lee
 
Jupyter NotebookとChainerで楽々Deep Learning
Jupyter NotebookとChainerで楽々Deep LearningJupyter NotebookとChainerで楽々Deep Learning
Jupyter NotebookとChainerで楽々Deep LearningJun-ya Norimatsu
 
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウKentaro Yoshida
 
確率的バンディット問題
確率的バンディット問題確率的バンディット問題
確率的バンディット問題jkomiyama
 
バンディット問題について
バンディット問題についてバンディット問題について
バンディット問題についてjkomiyama
 
【Tech circle】zabbix3.0ハンズオン
【Tech circle】zabbix3.0ハンズオン【Tech circle】zabbix3.0ハンズオン
【Tech circle】zabbix3.0ハンズオン隼人 渡邉
 
Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜
Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜
Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜Takahiro Inoue
 
Galera Cluster for MySQL vs MySQL (NDB) Cluster: A High Level Comparison
Galera Cluster for MySQL vs MySQL (NDB) Cluster: A High Level Comparison Galera Cluster for MySQL vs MySQL (NDB) Cluster: A High Level Comparison
Galera Cluster for MySQL vs MySQL (NDB) Cluster: A High Level Comparison Severalnines
 
異常行動検出入門 – 行動データ時系列のデータマイニング –
異常行動検出入門 – 行動データ時系列のデータマイニング –異常行動検出入門 – 行動データ時系列のデータマイニング –
異常行動検出入門 – 行動データ時系列のデータマイニング –Yohei Sato
 
Engineering Fast Indexes for Big-Data Applications: Spark Summit East talk by...
Engineering Fast Indexes for Big-Data Applications: Spark Summit East talk by...Engineering Fast Indexes for Big-Data Applications: Spark Summit East talk by...
Engineering Fast Indexes for Big-Data Applications: Spark Summit East talk by...Spark Summit
 
Intelligence artificielle et système multi-agent
Intelligence artificielle et système multi-agentIntelligence artificielle et système multi-agent
Intelligence artificielle et système multi-agentNoureddine Djebbari
 
データ解析5 単回帰分析
データ解析5 単回帰分析データ解析5 単回帰分析
データ解析5 単回帰分析Hirotaka Hachiya
 

Tendances (20)

La détection de la fraude par la connaissance des données - Carte Blanche Par...
La détection de la fraude par la connaissance des données - Carte Blanche Par...La détection de la fraude par la connaissance des données - Carte Blanche Par...
La détection de la fraude par la connaissance des données - Carte Blanche Par...
 
Pythonによる黒魔術入門
Pythonによる黒魔術入門Pythonによる黒魔術入門
Pythonによる黒魔術入門
 
区間分割の仕方を最適化する動的計画法 (JOI 2021 夏季セミナー)
区間分割の仕方を最適化する動的計画法 (JOI 2021 夏季セミナー)区間分割の仕方を最適化する動的計画法 (JOI 2021 夏季セミナー)
区間分割の仕方を最適化する動的計画法 (JOI 2021 夏季セミナー)
 
ディープラーニングによるゆるキャラグランプリの得票数予想
ディープラーニングによるゆるキャラグランプリの得票数予想ディープラーニングによるゆるキャラグランプリの得票数予想
ディープラーニングによるゆるキャラグランプリの得票数予想
 
パターン認識 第10章 決定木
パターン認識 第10章 決定木 パターン認識 第10章 決定木
パターン認識 第10章 決定木
 
Pythonのガベージコレクション
PythonのガベージコレクションPythonのガベージコレクション
Pythonのガベージコレクション
 
Cloud runのオートスケールを検証してみる
Cloud runのオートスケールを検証してみるCloud runのオートスケールを検証してみる
Cloud runのオートスケールを検証してみる
 
알파고 해부하기 1부
알파고 해부하기 1부알파고 해부하기 1부
알파고 해부하기 1부
 
Jupyter NotebookとChainerで楽々Deep Learning
Jupyter NotebookとChainerで楽々Deep LearningJupyter NotebookとChainerで楽々Deep Learning
Jupyter NotebookとChainerで楽々Deep Learning
 
1次式とノルムで構成された最適化問題とその双対問題
1次式とノルムで構成された最適化問題とその双対問題1次式とノルムで構成された最適化問題とその双対問題
1次式とノルムで構成された最適化問題とその双対問題
 
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
 
確率的バンディット問題
確率的バンディット問題確率的バンディット問題
確率的バンディット問題
 
バンディット問題について
バンディット問題についてバンディット問題について
バンディット問題について
 
【Tech circle】zabbix3.0ハンズオン
【Tech circle】zabbix3.0ハンズオン【Tech circle】zabbix3.0ハンズオン
【Tech circle】zabbix3.0ハンズオン
 
Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜
Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜
Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜
 
Galera Cluster for MySQL vs MySQL (NDB) Cluster: A High Level Comparison
Galera Cluster for MySQL vs MySQL (NDB) Cluster: A High Level Comparison Galera Cluster for MySQL vs MySQL (NDB) Cluster: A High Level Comparison
Galera Cluster for MySQL vs MySQL (NDB) Cluster: A High Level Comparison
 
異常行動検出入門 – 行動データ時系列のデータマイニング –
異常行動検出入門 – 行動データ時系列のデータマイニング –異常行動検出入門 – 行動データ時系列のデータマイニング –
異常行動検出入門 – 行動データ時系列のデータマイニング –
 
Engineering Fast Indexes for Big-Data Applications: Spark Summit East talk by...
Engineering Fast Indexes for Big-Data Applications: Spark Summit East talk by...Engineering Fast Indexes for Big-Data Applications: Spark Summit East talk by...
Engineering Fast Indexes for Big-Data Applications: Spark Summit East talk by...
 
Intelligence artificielle et système multi-agent
Intelligence artificielle et système multi-agentIntelligence artificielle et système multi-agent
Intelligence artificielle et système multi-agent
 
データ解析5 単回帰分析
データ解析5 単回帰分析データ解析5 単回帰分析
データ解析5 単回帰分析
 

En vedette

Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Antidot
 
Machine learning
Machine learningMachine learning
Machine learningebiznext
 
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big DataAzure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big DataMicrosoft
 
Machine Learning & SEO - SEO Camp'Us Paris 2016
Machine Learning & SEO - SEO Camp'Us Paris 2016Machine Learning & SEO - SEO Camp'Us Paris 2016
Machine Learning & SEO - SEO Camp'Us Paris 2016Julien Deneuville
 
Scikit-Learn: Machine Learning en Python
Scikit-Learn: Machine Learning en PythonScikit-Learn: Machine Learning en Python
Scikit-Learn: Machine Learning en PythonMicrosoft
 
Machine learning pour tous
Machine learning pour tousMachine learning pour tous
Machine learning pour tousDamien Seguy
 
Machine Learning - Spark / MLlib
Machine Learning - Spark / MLlibMachine Learning - Spark / MLlib
Machine Learning - Spark / MLlibebiznext
 
Introduction to Big Data/Machine Learning
Introduction to Big Data/Machine LearningIntroduction to Big Data/Machine Learning
Introduction to Big Data/Machine LearningLars Marius Garshol
 
Ecommerce Summit: Client Case SNCB
Ecommerce Summit: Client Case SNCBEcommerce Summit: Client Case SNCB
Ecommerce Summit: Client Case SNCBJonathan Wuurman
 
Digital First 2014 #D1st - Actito Marketing Automation #IRL
Digital First 2014 #D1st - Actito Marketing Automation #IRLDigital First 2014 #D1st - Actito Marketing Automation #IRL
Digital First 2014 #D1st - Actito Marketing Automation #IRLJonathan Wuurman
 
Email Summit 2015 - EMAIL IN CUSTOMER JOURNEY
Email Summit 2015 - EMAIL IN CUSTOMER JOURNEYEmail Summit 2015 - EMAIL IN CUSTOMER JOURNEY
Email Summit 2015 - EMAIL IN CUSTOMER JOURNEYJonathan Wuurman
 
Actito what can you do with it
Actito what can you do with itActito what can you do with it
Actito what can you do with itJonathan Wuurman
 
L’e-mail intégré dans une stratégie cross-canal pour le secteur FMCG
L’e-mail intégrédans une stratégie cross-canalpour le secteur FMCGL’e-mail intégrédans une stratégie cross-canalpour le secteur FMCG
L’e-mail intégré dans une stratégie cross-canal pour le secteur FMCGTechnofutur TIC
 
Email Summit 2016 Brussels Digimedia - What will you experience reading an em...
Email Summit 2016 Brussels Digimedia - What will you experience reading an em...Email Summit 2016 Brussels Digimedia - What will you experience reading an em...
Email Summit 2016 Brussels Digimedia - What will you experience reading an em...Jonathan Wuurman
 
Fundamentals of Managing the Data Center Life Cycle for Owners
Fundamentals of Managing the Data Center Life Cycle for OwnersFundamentals of Managing the Data Center Life Cycle for Owners
Fundamentals of Managing the Data Center Life Cycle for OwnersSchneider Electric
 
Emailing : Les secrets d'une segmentation réussie
Emailing : Les secrets d'une segmentation réussieEmailing : Les secrets d'une segmentation réussie
Emailing : Les secrets d'une segmentation réussieSimpleMail
 
Comment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texteComment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texteAntidot
 

En vedette (20)

Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...
 
XebiConFr15 - Les algorithmes du machine learning
XebiConFr15 - Les algorithmes du machine learningXebiConFr15 - Les algorithmes du machine learning
XebiConFr15 - Les algorithmes du machine learning
 
Démystification du Machine Learning
Démystification du Machine LearningDémystification du Machine Learning
Démystification du Machine Learning
 
Machine learning
Machine learningMachine learning
Machine learning
 
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big DataAzure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
 
Machine Learning & SEO - SEO Camp'Us Paris 2016
Machine Learning & SEO - SEO Camp'Us Paris 2016Machine Learning & SEO - SEO Camp'Us Paris 2016
Machine Learning & SEO - SEO Camp'Us Paris 2016
 
Scikit-Learn: Machine Learning en Python
Scikit-Learn: Machine Learning en PythonScikit-Learn: Machine Learning en Python
Scikit-Learn: Machine Learning en Python
 
Machine learning pour tous
Machine learning pour tousMachine learning pour tous
Machine learning pour tous
 
Machine Learning - Spark / MLlib
Machine Learning - Spark / MLlibMachine Learning - Spark / MLlib
Machine Learning - Spark / MLlib
 
Introduction to Big Data/Machine Learning
Introduction to Big Data/Machine LearningIntroduction to Big Data/Machine Learning
Introduction to Big Data/Machine Learning
 
Ecommerce Summit: Client Case SNCB
Ecommerce Summit: Client Case SNCBEcommerce Summit: Client Case SNCB
Ecommerce Summit: Client Case SNCB
 
Digital First 2014 #D1st - Actito Marketing Automation #IRL
Digital First 2014 #D1st - Actito Marketing Automation #IRLDigital First 2014 #D1st - Actito Marketing Automation #IRL
Digital First 2014 #D1st - Actito Marketing Automation #IRL
 
Email Summit 2015 - EMAIL IN CUSTOMER JOURNEY
Email Summit 2015 - EMAIL IN CUSTOMER JOURNEYEmail Summit 2015 - EMAIL IN CUSTOMER JOURNEY
Email Summit 2015 - EMAIL IN CUSTOMER JOURNEY
 
Actito what can you do with it
Actito what can you do with itActito what can you do with it
Actito what can you do with it
 
Actito presentation
Actito presentationActito presentation
Actito presentation
 
L’e-mail intégré dans une stratégie cross-canal pour le secteur FMCG
L’e-mail intégrédans une stratégie cross-canalpour le secteur FMCGL’e-mail intégrédans une stratégie cross-canalpour le secteur FMCG
L’e-mail intégré dans une stratégie cross-canal pour le secteur FMCG
 
Email Summit 2016 Brussels Digimedia - What will you experience reading an em...
Email Summit 2016 Brussels Digimedia - What will you experience reading an em...Email Summit 2016 Brussels Digimedia - What will you experience reading an em...
Email Summit 2016 Brussels Digimedia - What will you experience reading an em...
 
Fundamentals of Managing the Data Center Life Cycle for Owners
Fundamentals of Managing the Data Center Life Cycle for OwnersFundamentals of Managing the Data Center Life Cycle for Owners
Fundamentals of Managing the Data Center Life Cycle for Owners
 
Emailing : Les secrets d'une segmentation réussie
Emailing : Les secrets d'une segmentation réussieEmailing : Les secrets d'une segmentation réussie
Emailing : Les secrets d'une segmentation réussie
 
Comment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texteComment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texte
 

Similaire à Data science a machine learning tour (french)

Fondement et biaism Machine Learning Deep Learning
Fondement et biaism Machine Learning Deep LearningFondement et biaism Machine Learning Deep Learning
Fondement et biaism Machine Learning Deep LearningRichard Pawlowsky
 
Fondement et biais du Machine Learning et du Deep Learning
Fondement et biais du Machine Learning et du Deep LearningFondement et biais du Machine Learning et du Deep Learning
Fondement et biais du Machine Learning et du Deep LearningRichard Pawlowsky
 
Utilisation du big data en entreprise
Utilisation du big data en entrepriseUtilisation du big data en entreprise
Utilisation du big data en entreprisePierrick Thébault
 
Conférence Big data en Nouvelle-Calédonie
Conférence Big data en Nouvelle-CalédonieConférence Big data en Nouvelle-Calédonie
Conférence Big data en Nouvelle-CalédonieFrancois Cazals
 
Usable software design - code utilisable
Usable software design - code utilisableUsable software design - code utilisable
Usable software design - code utilisablemartinsson
 
Blockchain introduction créathon - 8 juillet 2016 - sajida zouarhi
Blockchain   introduction créathon - 8 juillet 2016 - sajida zouarhiBlockchain   introduction créathon - 8 juillet 2016 - sajida zouarhi
Blockchain introduction créathon - 8 juillet 2016 - sajida zouarhiSajida ZOUARHI
 
Softshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et TechnologiesSoftshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et TechnologiesOCTO Technology Suisse
 
What's Next Contenus : Et si on parlait Performance ?
What's Next Contenus : Et si on parlait Performance ? What's Next Contenus : Et si on parlait Performance ?
What's Next Contenus : Et si on parlait Performance ? DigitasLBi Paris
 
OWASP Québec - octobre 2016 - présentation sur les mots de passe
OWASP Québec - octobre 2016 - présentation sur les mots de passeOWASP Québec - octobre 2016 - présentation sur les mots de passe
OWASP Québec - octobre 2016 - présentation sur les mots de passePatrick Leclerc
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeJean Roger Mably
 
Sciences cognitives et design UX : quels (r)apports ?
Sciences cognitives et design UX : quels (r)apports ?Sciences cognitives et design UX : quels (r)apports ?
Sciences cognitives et design UX : quels (r)apports ?Akiani
 
Conférence Paris Retail Week : sur la voix d'un futur moins digital ?
Conférence Paris Retail Week : sur la voix d'un futur moins digital ?Conférence Paris Retail Week : sur la voix d'un futur moins digital ?
Conférence Paris Retail Week : sur la voix d'un futur moins digital ?Fabernovel
 
Amélioration de la productivité par les outils TIC/Internet - Recherche d'inf...
Amélioration de la productivité par les outils TIC/Internet - Recherche d'inf...Amélioration de la productivité par les outils TIC/Internet - Recherche d'inf...
Amélioration de la productivité par les outils TIC/Internet - Recherche d'inf...Karim ATTOUMANI MOHAMED
 
Optimisez vos Recherches, Formez-vous sur Expernova !
Optimisez vos Recherches, Formez-vous sur Expernova !Optimisez vos Recherches, Formez-vous sur Expernova !
Optimisez vos Recherches, Formez-vous sur Expernova !Expernova
 
Lettre d'information | Septembre 2018 | Transtech
 Lettre d'information | Septembre 2018 | Transtech  Lettre d'information | Septembre 2018 | Transtech
Lettre d'information | Septembre 2018 | Transtech Transtech Aquitaine
 
LUXEMBOURG CREATIVE 2019 : l'intelligence artificielle
LUXEMBOURG CREATIVE 2019 : l'intelligence artificielleLUXEMBOURG CREATIVE 2019 : l'intelligence artificielle
LUXEMBOURG CREATIVE 2019 : l'intelligence artificielleLUXEMBOURG CREATIVE
 
Les algorithmes génétiques dans tous leurs états
Les algorithmes génétiques dans tous leurs étatsLes algorithmes génétiques dans tous leurs états
Les algorithmes génétiques dans tous leurs étatsGeneticIO
 

Similaire à Data science a machine learning tour (french) (20)

Fondement et biaism Machine Learning Deep Learning
Fondement et biaism Machine Learning Deep LearningFondement et biaism Machine Learning Deep Learning
Fondement et biaism Machine Learning Deep Learning
 
Fondement et biais du Machine Learning et du Deep Learning
Fondement et biais du Machine Learning et du Deep LearningFondement et biais du Machine Learning et du Deep Learning
Fondement et biais du Machine Learning et du Deep Learning
 
Utilisation du big data en entreprise
Utilisation du big data en entrepriseUtilisation du big data en entreprise
Utilisation du big data en entreprise
 
Conférence Big data en Nouvelle-Calédonie
Conférence Big data en Nouvelle-CalédonieConférence Big data en Nouvelle-Calédonie
Conférence Big data en Nouvelle-Calédonie
 
Usable software design - code utilisable
Usable software design - code utilisableUsable software design - code utilisable
Usable software design - code utilisable
 
Blockchain introduction créathon - 8 juillet 2016 - sajida zouarhi
Blockchain   introduction créathon - 8 juillet 2016 - sajida zouarhiBlockchain   introduction créathon - 8 juillet 2016 - sajida zouarhi
Blockchain introduction créathon - 8 juillet 2016 - sajida zouarhi
 
Softshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et TechnologiesSoftshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et Technologies
 
What's Next Contenus : Et si on parlait Performance ?
What's Next Contenus : Et si on parlait Performance ? What's Next Contenus : Et si on parlait Performance ?
What's Next Contenus : Et si on parlait Performance ?
 
Ihedn 110318 fr_v1.0
Ihedn 110318 fr_v1.0Ihedn 110318 fr_v1.0
Ihedn 110318 fr_v1.0
 
OWASP Québec - octobre 2016 - présentation sur les mots de passe
OWASP Québec - octobre 2016 - présentation sur les mots de passeOWASP Québec - octobre 2016 - présentation sur les mots de passe
OWASP Québec - octobre 2016 - présentation sur les mots de passe
 
Oeinria
OeinriaOeinria
Oeinria
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
 
Saisie et exploitation des données cliniques
Saisie et exploitation des données cliniquesSaisie et exploitation des données cliniques
Saisie et exploitation des données cliniques
 
Sciences cognitives et design UX : quels (r)apports ?
Sciences cognitives et design UX : quels (r)apports ?Sciences cognitives et design UX : quels (r)apports ?
Sciences cognitives et design UX : quels (r)apports ?
 
Conférence Paris Retail Week : sur la voix d'un futur moins digital ?
Conférence Paris Retail Week : sur la voix d'un futur moins digital ?Conférence Paris Retail Week : sur la voix d'un futur moins digital ?
Conférence Paris Retail Week : sur la voix d'un futur moins digital ?
 
Amélioration de la productivité par les outils TIC/Internet - Recherche d'inf...
Amélioration de la productivité par les outils TIC/Internet - Recherche d'inf...Amélioration de la productivité par les outils TIC/Internet - Recherche d'inf...
Amélioration de la productivité par les outils TIC/Internet - Recherche d'inf...
 
Optimisez vos Recherches, Formez-vous sur Expernova !
Optimisez vos Recherches, Formez-vous sur Expernova !Optimisez vos Recherches, Formez-vous sur Expernova !
Optimisez vos Recherches, Formez-vous sur Expernova !
 
Lettre d'information | Septembre 2018 | Transtech
 Lettre d'information | Septembre 2018 | Transtech  Lettre d'information | Septembre 2018 | Transtech
Lettre d'information | Septembre 2018 | Transtech
 
LUXEMBOURG CREATIVE 2019 : l'intelligence artificielle
LUXEMBOURG CREATIVE 2019 : l'intelligence artificielleLUXEMBOURG CREATIVE 2019 : l'intelligence artificielle
LUXEMBOURG CREATIVE 2019 : l'intelligence artificielle
 
Les algorithmes génétiques dans tous leurs états
Les algorithmes génétiques dans tous leurs étatsLes algorithmes génétiques dans tous leurs états
Les algorithmes génétiques dans tous leurs états
 

Dernier

BOW 2024 - 3-2 - Stress thermique impact vaches laitières
BOW 2024 - 3-2 - Stress thermique impact vaches laitièresBOW 2024 - 3-2 - Stress thermique impact vaches laitières
BOW 2024 - 3-2 - Stress thermique impact vaches laitièresidelewebmestre
 
BOW 2024 - Jardins d'hiver en poulets de chair
BOW 2024 - Jardins d'hiver en poulets de chairBOW 2024 - Jardins d'hiver en poulets de chair
BOW 2024 - Jardins d'hiver en poulets de chairidelewebmestre
 
BOW 2024 - 3-6 - Adaptation climat chaud Porcs
BOW 2024 - 3-6 - Adaptation climat chaud PorcsBOW 2024 - 3-6 - Adaptation climat chaud Porcs
BOW 2024 - 3-6 - Adaptation climat chaud Porcsidelewebmestre
 
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleurBOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleuridelewebmestre
 
Accompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la NièvreAccompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la Nièvreidelewebmestre
 
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcins
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcinsBOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcins
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcinsidelewebmestre
 
BOW 2024 - Dedans/Dehors quand voir ne suffit pas
BOW 2024 - Dedans/Dehors quand voir ne suffit pasBOW 2024 - Dedans/Dehors quand voir ne suffit pas
BOW 2024 - Dedans/Dehors quand voir ne suffit pasidelewebmestre
 
BOW 2024 - L'écurie ouverte : un concept inspirant pour la filière équine
BOW 2024 - L'écurie ouverte : un concept inspirant pour la filière équineBOW 2024 - L'écurie ouverte : un concept inspirant pour la filière équine
BOW 2024 - L'écurie ouverte : un concept inspirant pour la filière équineidelewebmestre
 
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...idelewebmestre
 
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatiqueBOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatiqueidelewebmestre
 
Bow 2024 - Plein air à l'intérieur des bâtiments d'élevage de ruminants
Bow 2024 - Plein air à l'intérieur des bâtiments d'élevage de ruminantsBow 2024 - Plein air à l'intérieur des bâtiments d'élevage de ruminants
Bow 2024 - Plein air à l'intérieur des bâtiments d'élevage de ruminantsidelewebmestre
 
BOW 2024 - Logement des veaux laitiers en plein air
BOW 2024 - Logement des veaux laitiers en plein airBOW 2024 - Logement des veaux laitiers en plein air
BOW 2024 - Logement des veaux laitiers en plein airidelewebmestre
 
BOW 2024 - 3-3 - Adaptation des bâtiments pour ruminants au changement clima...
BOW 2024 - 3-3 -  Adaptation des bâtiments pour ruminants au changement clima...BOW 2024 - 3-3 -  Adaptation des bâtiments pour ruminants au changement clima...
BOW 2024 - 3-3 - Adaptation des bâtiments pour ruminants au changement clima...idelewebmestre
 
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...idelewebmestre
 
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdfSKennel
 
BOW 2024 -3-9 - Matelas de logettes à eau refroidie VL
BOW 2024 -3-9 - Matelas de logettes à eau refroidie VLBOW 2024 -3-9 - Matelas de logettes à eau refroidie VL
BOW 2024 -3-9 - Matelas de logettes à eau refroidie VLidelewebmestre
 
BOW 2024 - L'enrichissement du milieu des chèvres laitières
BOW 2024 - L'enrichissement du milieu des chèvres laitièresBOW 2024 - L'enrichissement du milieu des chèvres laitières
BOW 2024 - L'enrichissement du milieu des chèvres laitièresidelewebmestre
 
Cours polymère presentation powerpoint 46 pages
Cours polymère presentation powerpoint 46 pagesCours polymère presentation powerpoint 46 pages
Cours polymère presentation powerpoint 46 pagesPierreFournier32
 
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitièresBOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitièresidelewebmestre
 

Dernier (20)

BOW 2024 - 3-2 - Stress thermique impact vaches laitières
BOW 2024 - 3-2 - Stress thermique impact vaches laitièresBOW 2024 - 3-2 - Stress thermique impact vaches laitières
BOW 2024 - 3-2 - Stress thermique impact vaches laitières
 
BOW 2024 - Jardins d'hiver en poulets de chair
BOW 2024 - Jardins d'hiver en poulets de chairBOW 2024 - Jardins d'hiver en poulets de chair
BOW 2024 - Jardins d'hiver en poulets de chair
 
BOW 2024 - 3-6 - Adaptation climat chaud Porcs
BOW 2024 - 3-6 - Adaptation climat chaud PorcsBOW 2024 - 3-6 - Adaptation climat chaud Porcs
BOW 2024 - 3-6 - Adaptation climat chaud Porcs
 
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleurBOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
 
Accompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la NièvreAccompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la Nièvre
 
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcins
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcinsBOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcins
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcins
 
BOW 2024 - Dedans/Dehors quand voir ne suffit pas
BOW 2024 - Dedans/Dehors quand voir ne suffit pasBOW 2024 - Dedans/Dehors quand voir ne suffit pas
BOW 2024 - Dedans/Dehors quand voir ne suffit pas
 
BOW 2024 - L'écurie ouverte : un concept inspirant pour la filière équine
BOW 2024 - L'écurie ouverte : un concept inspirant pour la filière équineBOW 2024 - L'écurie ouverte : un concept inspirant pour la filière équine
BOW 2024 - L'écurie ouverte : un concept inspirant pour la filière équine
 
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...
 
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatiqueBOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
 
Bow 2024 - Plein air à l'intérieur des bâtiments d'élevage de ruminants
Bow 2024 - Plein air à l'intérieur des bâtiments d'élevage de ruminantsBow 2024 - Plein air à l'intérieur des bâtiments d'élevage de ruminants
Bow 2024 - Plein air à l'intérieur des bâtiments d'élevage de ruminants
 
BOW 2024 - Logement des veaux laitiers en plein air
BOW 2024 - Logement des veaux laitiers en plein airBOW 2024 - Logement des veaux laitiers en plein air
BOW 2024 - Logement des veaux laitiers en plein air
 
BOW 2024 - 3-3 - Adaptation des bâtiments pour ruminants au changement clima...
BOW 2024 - 3-3 -  Adaptation des bâtiments pour ruminants au changement clima...BOW 2024 - 3-3 -  Adaptation des bâtiments pour ruminants au changement clima...
BOW 2024 - 3-3 - Adaptation des bâtiments pour ruminants au changement clima...
 
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...
BOW 2024 - 3-8 - Adaptation des bâtiments d'élevages de volailles au changeme...
 
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
 
Webinaire lésions podales_04.04.2024.pptx
Webinaire lésions podales_04.04.2024.pptxWebinaire lésions podales_04.04.2024.pptx
Webinaire lésions podales_04.04.2024.pptx
 
BOW 2024 -3-9 - Matelas de logettes à eau refroidie VL
BOW 2024 -3-9 - Matelas de logettes à eau refroidie VLBOW 2024 -3-9 - Matelas de logettes à eau refroidie VL
BOW 2024 -3-9 - Matelas de logettes à eau refroidie VL
 
BOW 2024 - L'enrichissement du milieu des chèvres laitières
BOW 2024 - L'enrichissement du milieu des chèvres laitièresBOW 2024 - L'enrichissement du milieu des chèvres laitières
BOW 2024 - L'enrichissement du milieu des chèvres laitières
 
Cours polymère presentation powerpoint 46 pages
Cours polymère presentation powerpoint 46 pagesCours polymère presentation powerpoint 46 pages
Cours polymère presentation powerpoint 46 pages
 
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitièresBOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
 

Data science a machine learning tour (french)

  • 2. Copyright Franck Bardol 2016 2 CV Franck Bardol +33 6 24 30 92 59 bardolfranck@gmail.com @bardolfranck ¡  Consultant in Machine Learning ¡  Jury – organizer hackathons ¡  Trainer in machine learning ¡  co-organiser meetup Paris Machine Learning
  • 3. ¡  Fondements “We are living the age of information and entering the age of recommendation” The Long tail - Chris Anderson Copyright Franck Bardol 2016 3 PARADOX OF CHOICE MORE IS LESS
  • 4. ¡  Fondements §  “The web is leaving the era of search and entering one of discovery” §  “Race to create a smart GOOGLE” – CNN – Copyright Franck Bardol 2016 4 FROM SEARCH TO DISCOVERY SEARCH DISCOVERY users users idea idea 👧‍ 👨‍ 👦 👩‍ 👧‍ 👨‍ 👦 👩‍ 💡 🔮 ❤️‍ 💡 🔮 ❤️‍
  • 5. Copyright Franck Bardol 2016 5 FROM SEARCH TO DISCOVERY “you may also like” “people you may know” “people to follow” reco in stealth mode 👧‍ 👨‍ 👦 👩‍ 👩‍ 👩‍ 👮
  • 6. 80% watch via RECO ¡  Quels sont les secteurs qui l’utilisent ? §  Sites de streaming video §  Sites marchands §  Opérateur télécom §  Formation & MOOC Copyright Franck Bardol 2016 6 FROM SEARCH TO DISCOVERY CA +35% click +40%
  • 7. ¡  Apprentissage Définition : Modification du comportement par l’expérience ¡  Machine learning définition : Programmes executables qui : ü apprennent les données ü s’adaptent aux données ü s’améliorent au cours du temps Copyright Franck Bardol 2016 7 DATA-SCIENCE QU’EST-CE-QUE C’EST ?
  • 8. ¡ Apprendre ? comment ? par l’exemple !! les couleurs Copyright Franck Bardol 2016 8 QU’EST-CE QUE C’EST ?
  • 9. Copyright Franck Bardol 2016 9 QU’EST-CE QUE C’EST ? Apprendre Généraliser quoi ? un concept quand ? sur nouvelles données comment ? par l’exemple pourquoi ? généraliser
  • 10. Copyright Franck Bardol 2016 10 COMMENT ÇA FONCTIONNE ? Intuition Hypothèses Connaissances Modèle / programme Données Données Détecteur schémas cachés Modèle/ programme informatique traditionnelle informatique data driven X , Yf X , Y f fX Y PRODUCTION input decision predict
  • 11. COMMENT ÇA FONCTIONNE ? DESCRIPTEURS / FEATURES nb_appel duree_ min appel internation age categorie _socio type_ forfait 3 46 6 98 86 11 4 33 0 8 6 12 PREDICTION reste_client part PREDICTION part reste_client DESCRIPTEURS / FEATURES nb_ appel duree_ min appel internatio n age categori e_socia type_ forfait 3 46 6 98 86 11 4 33 0 8 6 12 1 - TRAIN 2 - TEST 34 7 56 2 3 - PREDICT ? NOUVELLE DATA BASE D’APPRENTISSAGE BASE DE TEST PREDICTION ? Copyright Franck Bardol 2016 11
  • 12. GENERALIZATION VS. OVERFITTING MEMORIZING VS. LEARNING généraliser Apprendre Généraliser données d’apprentissage STRUCTURE DETAILS & BRUITS nouvelles données Copyright Franck Bardol 2016 12
  • 13. Supervisé = exemples étiquettés ü Régression prédire des chiffres continus ü Classification prédire des étiquettes / classes / label Copyright Franck Bardol 2016 13 APPRENTISSAGE SUPERVISÉ COMBIEN ? EST-CE QUE ?
  • 14. Supervisé = exemples étiquettés ü Régression prédire des chiffres continus ü Classification prédire des étiquettes / classes / label Copyright Franck Bardol 2016 14 APPRENTISSAGE SUPERVISÉ big / little ? temperature pressure stock markets petit moyen grand très grand ? COMBIEN ? EST-CE QUE ?
  • 15. Non supervisé = pas d’étiquettes ü Clustering trouver des familles naturelles ü Moteur de recommandation Introduire de la sérendipité controllable Copyright Franck Bardol 2016 15 APPRENTISSAGE NON SUPERVISÉ RESUME ?
  • 16. Non supervisé = exemples non étiquettés ü Clustering – anomaly detection – recommender system §  Comprendre, explorer, simplifier les données, trouver des structures cachées invisibles à l’oeil Copyright Franck Bardol 2016 16 APPRENTISSAGE NON SUPERVISÉ CARTE TOPOLOGIQUE 300 variables économiques (PIB/hab, accès eau, ….) ANOMALY DETECTION RECOMMENDER SYSTEM RESUME ?
  • 17. Copyright Franck Bardol 2016 17 EXEMPLES web log text text langue ? EEG web log who ? epilepsy ? bot? gender ? churn? CRIME where ? when ? predpol.com deepinstinct.com Malicious Code & Attacks ? age? click pub ?
  • 18. ¡  Règles écrites “à la main” èapproche peu performante ¡  Pas de règles / absence d’expertise humaine §  bio informatique ¡  Trop de règles §  Difficulté à poser les règles, les expliquer… §  La solution évolue §  Reconnaissance artificielle (vision, parole, signes gestes …) §  Voiture autonome §  Ranking, Tracking, poursuite §  routing computer networks §  pub temps réel Copyright Franck Bardol 2016 18 C’EST EFFICACE QUAND ? pedestrian detection
  • 19. Automatic questions – answering Requirement : ü never seen these words before ü comprehension ü time element (« before », « after », …) ü action (« go », « pick up », …) Copyright Franck Bardol 2016 19 EXEMPLES www.github.com/vinhkhuc/MemN2N-babi-python
  • 20. Copyright Franck Bardol 2016 20 EXEMPLES HEP@LHC-CERN boson? 100 million events / sec CA +30% buy ? hire? sign ? success ? 70% accuracy
  • 21. Copyright Franck Bardol 2016 21 DATA Scrapping = extract info from web sites opendata.cern.ch data.gov data.gouv.fr www = thousand more Open Data Scrapping
  • 22. Copyright Franck Bardol 2016 22 DATA, BECAUSE … A C C U R A C Y DATA
  • 23. Copyright Franck Bardol 2016 23 DATA, BECAUSE … P E R F DATA MORE DATA !
  • 24. ¡  Pourquoi ? Copyright Franck Bardol 2016 24 BUT …. BE CAREFUL
  • 25. ¡  De quoi parle-t-on ? Copyright Franck Bardol 2016 25 BEWARE OF THE DIMENSION p features (descripteurs - variables explicatives) DIMENSION = p V O L U M E DATA n S A M P L E S
  • 26. ¡  De quoi parle-t-on ? Copyright Franck Bardol 2016 26 DIMENSION ? DIMENSION V O L U M E TECHNO BIG DATA STATISTICS & MACHINE LEARNING ACP ACC SOM n S A M P L E S
  • 27. ¡  é dimension du problème èRISQUE de … §  é corrélation fallacieuses - spurious correlations – potentielles Tendance aléatoire fortuite commune http://www.tylervigen.com/spurious-correlations §  é combinaisons fallacieuses - spurious combinations – potentielles Combinaisons fallacieuses qui peuvent “prédire” un phénomène é exponentielle du nombre de combinaisons entre les colonnes §  é données nécessaires pour l’apprentissage §  é exponentielle du nombre de lignes (samples) pour apprendre convenablement §  Curse of dimensionality §  En très grande dimension, les données se trouvent toutes à égales distance. §  Les méthode basées sur le voisinage (kNN…) échouent Copyright Franck Bardol 2016 27 RÉDUCTION DIMENSION DIMENSION
  • 28. ¡  é dimension du problème èRISQUE de … §  é complexité de la solution §  é complexité §  Kolmogoroff §  MDL : Minimum Description Length §  Occam Razor “l’explication la plus simple est toujours la meilleure” §  nb : simple ≠ simpliste §  ê pouvoir explicatif de la solution §  nb : pouvoir explicatif ≠ pouvoir prédictif §  é sur-apprentissage – over fitting (par coeur vs. généralisation) §  é difficulté de visualiser le problème (êintuition) Copyright Franck Bardol 2016 28 RÉDUCTION DIMENSION DIMENSION
  • 29. ¡  é dimension du problème èRISQUE de … § faire ECHOUER les méthodes statistiques et mathématiques Exemple inspiré de Copyright Franck Bardol 2016 29 RÉDUCTION DIMENSION DIMENSION
  • 30. ¡  é dimension du problème èRISQUE de … § faire ECHOUER les méthodes statistiques et mathématiques §  Exemple en bio-informatique - génomique : §  Quelques centaines de lignes (les patients - samples) vs. 100 millions de descripteurs (les gènes extraits - features) Copyright Franck Bardol 2016 30 RÉDUCTION DIMENSION DIMENSION contexte
  • 31. ¡  é dimension du problème èRISQUE de … § faire ECHOUER les méthodes statistiques et mathématiques Copyright Franck Bardol 2016 31 RÉDUCTION DIMENSION DIMENSION problème !
  • 32. ¡  Pourquoi ê dimension du problème ? Vision d’ensemble donnée par 2 des plus grands spécialistes §  Interview de Michael Jordan §  Interview de Vladimir Vapnik §  fichier “interview Vapnik” Copyright Franck Bardol 2016 32 RÉDUCTION DIMENSION
  • 33. Copyright Franck Bardol 2016 33 METHOD KEY SKILL = FAST PROTOTYPING AVOID COMPLEXITY N O O K N O SIMPLEST SOLUTION
  • 34. Copyright Franck Bardol 2016 34 COMPETE AGAINST OTHER DATA SCIENTIST Key figures: •  400K data scientists •  2 million machine learning models Lessons learned from previous contest : •  Top methods •  XgBoost models : for structured problems •  Deep Learning : for unstructured problems (sounds, visual, texts) -  source : Anthony Goldbloom, CEO Kaggle – www.kaggle.com
  • 35. Copyright Franck Bardol 2016 35 COMPETE AGAINST OTHER DATA SCIENTIST www.datascience.net www.challengedata.ens.fr
  • 36. Copyright Franck Bardol 2016 36 DATA-SCIENCE + PYTHON = DREAM TEAM
  • 37. ¡  Python : langage de programmation ¡  Avantages : §  Très vaste choix de librairies gratuites §  Courbe d’apprentissage faible §  Communauté d’utilisateurs actifs gigantesque §  Le langage favori des data-scientists §  Elimine la ré-écriture complète du code prototypé par data-scientist §  langage interprété – prototyping rapide (pas de compilation – link) §  lisibilité du code (via identation) ¡  Inconvénients : §  langage interprété (pas d’étape compilation – link) §  vitesse d’exécution Copyright Franck Bardol 2016 37 DATA-SCIENCE AVEC PYTHON
  • 38. Copyright Franck Bardol 2016 38 OPEN SOURCE TOOLS vision langage general purpose machine learningvisualization data management optimization … package thousand other tools
  • 39. Copyright Franck Bardol 2016 39 API portails API www.mashape.com www.programmableweb.com www.mloss.org thousand other tools
  • 40. ULTRA FAST PROTOTYPING #chargement des données —  1 import pandas as pd —  data = pd.read_csv(‘data_to_read.csv’) #chargement d’une librairie —  2 from sklearn import model #chargement d’un algorithme de prédiction —  3 clf = model.algo() #ENTRAINEMENT sur les données d’apprentissage —  4 clf.fit(data_train , out_train) #TEST sur les données non vues —  5 predict = clf.predict(data_test) Copyright Franck Bardol 2016 40
  • 41.   Copyright Franck Bardol 2016 41 BIBLIO ainews.posthaven.com/16-free-ebooks-on-machine-learning
  • 42.   Copyright Franck Bardol 2016 42 Internet ressources : MOOC (massive onLine open courses) Udacity.com coursera.org Edx.org france-universite-numerique.fr moocs.epfl.ch ...
  • 43. Copyright Franck Bardol 2016 43   •  duplique le savoir d’experts •  construit des programmes exécutables de décision •  augmente la boite à outils des analystes Prediction TAKE HOME Machine Learning Algo Hidden Pattern Detector DataTRAINING PROD Data Hidden Pattern Detector