Intelligence Artificielle
De retour de 3 ans en Chine, regard sur
l’IA en France et en Europe
Françoise Soulié-Fogelman
(Hub France IA)
Mardi 11 décembre 2018
Institut des Actuaires – Groupe de travail Big Data
Le buzz est à son comble, tout le monde en parle, mais avez-vous vu un Data Scientist travailler en temps réel sur des données Big Data ? Découvrez un cas d’utilisation basé sur des données Open Data et sur un modèle predictif.
Hervé Desaunois - Directeur technique, Valtech Toulouse
herve.desaunois@valtech.fr
Pierre-Yves Koenig – Data Scientist, Valtech Toulouse
pierre-yves.koenig@valtech.fr
Le buzz est à son comble, tout le monde en parle, mais avez-vous déjà eu l'occasion de voir un Data Scientist travailler en temps réel sur des données Big Data ? Découvrez un cas d’utilisation basé sur des données Open Data et sur un modèle predictif.
Geraud Duge De Bernonville - Architecte Big Data, Valtech
geraud.dugedebernonville@valtech.fr
Pierre-Yves Koenig - Data Scientist, Valtech
pierre-yves.koenig@valtech.fr
Introduction et conclusion du
séminaire UTICE "Les Learning Analytics : quand le big data s'intéresse à l'éducation" 19 janvier UBL
https://utice.u-bretagneloire.fr/evenement/les-learning-analytics-quand-le-big-data-sinteresse-leducation
Le buzz est à son comble, tout le monde en parle, mais avez-vous vu un Data Scientist travailler en temps réel sur des données Big Data ? Découvrez un cas d’utilisation basé sur des données Open Data et sur un modèle predictif.
Hervé Desaunois - Directeur technique, Valtech Toulouse
herve.desaunois@valtech.fr
Pierre-Yves Koenig – Data Scientist, Valtech Toulouse
pierre-yves.koenig@valtech.fr
Le buzz est à son comble, tout le monde en parle, mais avez-vous déjà eu l'occasion de voir un Data Scientist travailler en temps réel sur des données Big Data ? Découvrez un cas d’utilisation basé sur des données Open Data et sur un modèle predictif.
Geraud Duge De Bernonville - Architecte Big Data, Valtech
geraud.dugedebernonville@valtech.fr
Pierre-Yves Koenig - Data Scientist, Valtech
pierre-yves.koenig@valtech.fr
Introduction et conclusion du
séminaire UTICE "Les Learning Analytics : quand le big data s'intéresse à l'éducation" 19 janvier UBL
https://utice.u-bretagneloire.fr/evenement/les-learning-analytics-quand-le-big-data-sinteresse-leducation
Le Grand Équipement National de Calcul Intensif (GENCI) présente aux startuppers concernés par le calcul intensif la solution R&D SiMSEO, leur permettant d’accéder à des supercalculateurs et à un accompagnement afin de développer leurs travaux.
Softshake 2015 - Des small data aux big data - Méthodes et TechnologiesOCTO Technology Suisse
L'importance de la donnée et les informations que nous pouvons en tirer sont en train de révolutionner notre monde. De plus en plus massives et hétérogènes, l'exploitation de ces données induit de faire appel à de nouvelles méthodes et technologies. Ces évolutions récentes en termes de moyens de stockage, de capacités de calcul et de méthodes d'analyse donnent une nouvelle place aux données dans notre quotidien.
Cette présentation offre une découverte du monde du big data en introduisant les différentes méthodes et technologies utilisées et en les illustrant de plusieurs cas pratiques.
soft-shake.ch - Le développement durablesoft-shake.ch
Dominic Williams
La société civile et le monde politique soumettent les entreprises à une pression croissante pour intégrer des préoccupations sociales, environnementales et économiques dans leurs activités. A l'heure du développement durable, quelle part peut jouer le développement logiciel dans la révolution Green-IT, aujourd'hui principalement cantonnée aux problématiques matérielles ?
Après une brève introduction au domaine de la RSE (responsabilité sociale des entreprises), cette présentation dissèque le poids de l'activité de développement logiciel sur l'environnement et sur le bien-être des individus.
Ensuite, quelques grands axes de travail sont identifiés afin d'encourager chacun à contribuer, au travers du métier de développeur, à ce nos sociétés évoluent vers un modèle plus respectueux des gens et de la nature.
• S'approprier son métier, son poste et son entreprise.
• Adoption de technologies et méthodes de travail efficaces.
• Réduction de l'empreinte écologique des logiciels.
• Réduire, grâce aux logiciels, l'empreinte écologique d'autres activités.
• Développer les structures coopératives.
Cette présentation définit rapidement le Plan de gestion de données dans le cadre du Module Doctoral Cap sur les Données Environnement 2020 réalisé pour l'Université de Montpellier par la Commission Information Scientifique et Technique Agropolis.
Fabrication numérique en Livradois-Forez ?Meidosem
Introduction à la réalité de la fabrication numérique (pratiques et lieux). Problématique de cette réalité pour un territoire comme le Livradois-Forez.
Mise à jour le 24 avril 2011.
Conférence les technologies du numérique st exupéry 8 nov. 2017SinGuy
Conférence sur les technologies du numérique et l'impact sur les compétences à destination des proviseurs des lycées de l'académie d'Aix-Marseille. le 8 novembre 2017 au Lycée Saint-Exupéry de Marseille
Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...I MT
Colloque IMT "L'Intelligence Artificielle au cœur des mutations industrielles": Introduction de la journée par Christian Roux, directeur de la recherche et de l'innovation et Talel Abdessalem, animateur de la thématique IMT Data Analytics & IA et professeur (Télécom ParisTech).
Santé : accélérez avec la puissance du calcul intensif - GENCIFrenchTechCentral
Santé, intelligence artificielle... découvrez les ressources financières et stratégiques à votre disposition pour développer vos projets !
Explorez les ressources financières et stratégiques à votre disposition pour accélérer vos projets, avec les experts de GENCI. Intelligence artificielle, IoT médecine quantique... comment accéder aux outils de calcul et à l'accompagnement dont vous avez besoin?
Résumé des présentations et ressources de l'événement "Parcours Big Data" organisé par @Cetic dans la cadre de la Big Data Week 2014, en collaboration avec @awtbe
Le Grand Équipement National de Calcul Intensif (GENCI) présente aux startuppers concernés par le calcul intensif la solution R&D SiMSEO, leur permettant d’accéder à des supercalculateurs et à un accompagnement afin de développer leurs travaux.
Softshake 2015 - Des small data aux big data - Méthodes et TechnologiesOCTO Technology Suisse
L'importance de la donnée et les informations que nous pouvons en tirer sont en train de révolutionner notre monde. De plus en plus massives et hétérogènes, l'exploitation de ces données induit de faire appel à de nouvelles méthodes et technologies. Ces évolutions récentes en termes de moyens de stockage, de capacités de calcul et de méthodes d'analyse donnent une nouvelle place aux données dans notre quotidien.
Cette présentation offre une découverte du monde du big data en introduisant les différentes méthodes et technologies utilisées et en les illustrant de plusieurs cas pratiques.
soft-shake.ch - Le développement durablesoft-shake.ch
Dominic Williams
La société civile et le monde politique soumettent les entreprises à une pression croissante pour intégrer des préoccupations sociales, environnementales et économiques dans leurs activités. A l'heure du développement durable, quelle part peut jouer le développement logiciel dans la révolution Green-IT, aujourd'hui principalement cantonnée aux problématiques matérielles ?
Après une brève introduction au domaine de la RSE (responsabilité sociale des entreprises), cette présentation dissèque le poids de l'activité de développement logiciel sur l'environnement et sur le bien-être des individus.
Ensuite, quelques grands axes de travail sont identifiés afin d'encourager chacun à contribuer, au travers du métier de développeur, à ce nos sociétés évoluent vers un modèle plus respectueux des gens et de la nature.
• S'approprier son métier, son poste et son entreprise.
• Adoption de technologies et méthodes de travail efficaces.
• Réduction de l'empreinte écologique des logiciels.
• Réduire, grâce aux logiciels, l'empreinte écologique d'autres activités.
• Développer les structures coopératives.
Cette présentation définit rapidement le Plan de gestion de données dans le cadre du Module Doctoral Cap sur les Données Environnement 2020 réalisé pour l'Université de Montpellier par la Commission Information Scientifique et Technique Agropolis.
Fabrication numérique en Livradois-Forez ?Meidosem
Introduction à la réalité de la fabrication numérique (pratiques et lieux). Problématique de cette réalité pour un territoire comme le Livradois-Forez.
Mise à jour le 24 avril 2011.
Conférence les technologies du numérique st exupéry 8 nov. 2017SinGuy
Conférence sur les technologies du numérique et l'impact sur les compétences à destination des proviseurs des lycées de l'académie d'Aix-Marseille. le 8 novembre 2017 au Lycée Saint-Exupéry de Marseille
Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...I MT
Colloque IMT "L'Intelligence Artificielle au cœur des mutations industrielles": Introduction de la journée par Christian Roux, directeur de la recherche et de l'innovation et Talel Abdessalem, animateur de la thématique IMT Data Analytics & IA et professeur (Télécom ParisTech).
Santé : accélérez avec la puissance du calcul intensif - GENCIFrenchTechCentral
Santé, intelligence artificielle... découvrez les ressources financières et stratégiques à votre disposition pour développer vos projets !
Explorez les ressources financières et stratégiques à votre disposition pour accélérer vos projets, avec les experts de GENCI. Intelligence artificielle, IoT médecine quantique... comment accéder aux outils de calcul et à l'accompagnement dont vous avez besoin?
Résumé des présentations et ressources de l'événement "Parcours Big Data" organisé par @Cetic dans la cadre de la Big Data Week 2014, en collaboration avec @awtbe
Similaire à slides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelman (20)
Si la baisse de la productivité est effective dans toutes les économies développées... elle est particulièrement marquée en France. Au niveau national, cet essoufflement touche tous les secteurs, et plus particulièrement celui de l’industrie, usuellement caractérisé par des gains de productivité élevés. Depuis la crise Covid, le secteur industriel contribue pour 35 % environ à cette perte, alors qu’il ne représente que 9,3 % de la valeur ajoutée nationale brute en 2023. Dans ce contexte, est-il possible de mener une politique de réindustrialisation du pays sans y associer un objectif de hausse des gains de productivité ?Non rappelle ce Cube. Au contraire, ces deux objectifs, jusqu’alors indépendants l’un de l’autre, sont désormais deux défis à relever conjointement. En analysant les différents explications à la baisse de celle-ci observée en France et dans les autres économies développées, ce Cube suggère que l’augmenter en parallèle d’une politique de réindustrialisation sous-entend une réallocation des facteurs de production vers les entreprises industrielles à fort potentiel. Elle suppose également une une meilleure affectation des ressources.
1. Intelligence Artificielle
De retour de 3 ans en Chine, regard sur
l’IA en France et en Europe
Françoise Soulié-Fogelman
(Hub France IA)
Mardi 11 décembre 2018
Institut des Actuaires – Groupe de travail Big Data
2. Agenda
• Qu’est ce que l’IA
─ La définition
─ Les grands challenges
─ Quelques travaux personnels
• La course à l’IA
─ Les grands plans IA dans le monde
─ Le plan IA en France et les premières actions
─ Le plan IA de l’Europe
• Quelques remarques en guise de conclusion
11/12//2018 Regard sur l’IA en France et en Europe 2
4. Histoire (brève) de l’IA
4
Premières applications industrielles
Connexionnisme
GOFAI
2012
11/12//2018 Regard sur l’IA en France et en Europe
5. L’IA: les mots pour le dire
• Un mot chasse l’autre
─ Connexionnisme (numérique)
• Data Mining à Machine Learning
• Sur Google trends. Attention aux volumes 2004 vs 2018
5
https://trends.google.com/trends
11/12//2018 Regard sur l’IA en France et en Europe
6. L’IA: les mots pour le dire
• Un mot chasse l’autre
─ Connexionnisme (numérique)
• Neural Networks à Deep Learning
611/12//2018 Regard sur l’IA en France et en Europe
7. L’IA: les mots pour le dire
• GOFAI (Good Old Fashion AI = Symbolique)
─ Lente décroissance … qui n’explique pas la croissance de AI
711/12//2018 Regard sur l’IA en France et en Europe
8. Histoire (brève) de l’IA
Croissance de l’Intelligence Artificielle expliquée par:
Croissance des Big data
Connexionnisme (machine learning et deep learning))
malgré GOFAI (Good Old Fashion AI = Symbolique)
─ En fait
• Avant 2012, « AI » = GOFAI Après 2012, « AI » = Connexionnisme
811/12//2018 Regard sur l’IA en France et en Europe
9. Les différentes IA
11/12//2018 Regard sur l’IA en France et en Europe 9
https://www.iss.europa.eu/sites/default/files/EUISSFiles/Brief%2010%20AI.pdf
11. Qu’est ce que le deep learning
• Le sujet dont on parle
• Le responsable de la récente
« mode » de l’IA
─ Succès de Hinton à la compétition ImageNet de 2012
http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks
• En fait, une ancienne technique
datant de la fin des années 80
─ Un réseau de neurones TDNN
• Time Delay Neural Network
• La différence: aujourd’hui on a
─ Les données
─ Les machines
─ Les logiciels
─ Les compétences formées
─ Des milliers de chercheurs
11
1990.http://www.sciencedirect.com/science/article/pii/
089360809090028J
11/12//2018 Regard sur l’IA en France et en Europe
12. LA technique unique en perception
« Cette année-là, comme chaque année depuis 2010, un concours de reconnaissance d’images,
ImageNet, est organisé. Il s’agit de reconnaître des milliers d’images, puisées sur le site Flickr, en
leur attribuant la bonne étiquette, parmi 1 000 catégories environ (chat persan, husky, loup de
mer, bison, accordéon, berceau, tracteur, etc.). En 2011, le taux d’erreur était d’environ 25 %,
notamment en ayant recours à une technique -concurrente des réseaux de neurones et populaire
dans les années 2000, les support vector machine, ou SVM. Mais, en 2012, l’équipe de Geoffrey
Hinton, à Toronto, présente le programme d’un étudiant en fin de thèse, Alex Krizhevsky, et
écrase tout le monde avec sa technique d’apprentissage profond : 16 % d’erreurs. La
communauté de la vision était ratatinée. Un vrai tremblement de terre », tranche Patrick Gallinari,
professeur à Sorbonne-Université. L’année suivante, tout le monde dans cette communauté
de la vision par ordinateur, qui s’était fermée à ces techniques d’apprentissage profond à
la fin des années 1990, se jette sur celles-ci. Depuis, le taux d’erreur a chuté à quelques pour
cent, et les meilleures en la matière sont des -universités chinoises »
12
https://www.lemonde.fr/sciences/article/2018/08/14/apres-soixante-ans-de-
hauts-et-de-bas-les-reseaux-de-neurones-
triomphent_5342330_1650684.html
Octobre 2012
11/12//2018 Regard sur l’IA en France et en Europe
13. Qu’est ce qu’un neurone
• Si on veut construire un algorithme d’apprentissage, on peut en
regarder un bon : notre cerveau
• Un neurone artificiel (analogue à un neurone biologique)
─ Reçoit un exemple x sur ses inputs synapses
─ Calcule une somme pondérée de ces inputs W t . x
─ Passe la somme dans une fonction f dite fonction d’activation
─ Transfère le résultat y à ses voisins dendrite
13
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+= ∑
=
p
1j
jj0 xwwfy
http://www.robotspacebrain.com/wp-content/uploads/
2013/11/Santiago-Ramon-y-Cajal-Drawings.jpg
11/12//2018 Regard sur l’IA en France et en Europe
14. Réseau de neurones
• Un réseau est défini par:
─ Une structure de neurones interconnectés
─ Les fonctions d’activation des neurones
─ Un algorithme d’apprentissage
• Il y a beaucoup de sortes de réseaux
─ Multilayer Perceptron (MLP)
─ RBF, RCN, CNN …
• Le MLP est organisé en une suite de
couches
─ Le calcul se fait couche après couche
14
www.asimovinstitute.org/neural-network-zoo
input output
11/12//2018 Regard sur l’IA en France et en Europe
15. Apprentissage du MLP
• Passe avant: étant donné X, W(t-1)
─ Calculer X(l) pour toutes les couches
cachées de proche en proche,
─ Calculer l’output X(L)
• Passe arrière (Rétro-propagation du gradient)
─ Calculer les erreurs
• Calculer l’erreur pour le neurone de sortie
• Calculer le delta de sortie :
• De l=L-1, L-2, …, 1 , calculer
─ Mettre à jour les poids
• De l=L-1, L-2, …, 1
• Fin
─ Après un nombre fixe de passes / erreur en
apprentissage assez petite / erreur en validation
augmente
15
( )[ ]2L
XyE −=
( ) ( )( ) ( )( )LLL
1 S'f.Xy2 −−=δ
( )l
δ( )l
X
E
∂
∂
( )l
W
E
∂
∂
( )( ) ( )( ) ( ) ( )1llll
X.tW1tW −
−=+ δη
Avant X
Arrière Erreur
11/12//2018 Regard sur l’IA en France et en Europe
16. Plusieurs façons de connecter
16
Connexions complètes
– Poids : 2*6 = 12
Connexions locales
– Poids : 2*3 = 6
Poids partagés (réseaux
de convolution)
– Poids : 3
https://hal.archives-ouvertes.fr/hal-000033711990
11/12//2018 Regard sur l’IA en France et en Europe
17. Deep learning
• Un MLP avec beaucoup de couches
à Meilleure performance
• Un réseau de convolution
─ MLP à poids partagés
─ En image, on utilise des bases de
filtres 2D
─ Un réseau de convolution apprend
les filtres
17
http://www.deeplearningbook.org/
contents/mlp.html
11/12//2018 Regard sur l’IA en France et en Europe
18. Deep learning
• Aujourd’hui, réseau avec > 30 couches, des milliards de paramètres
• La technique pour
─ Reconnaissance d’images, de parole
─ Langue naturelle …
─ Mais il faut une « géométrie »
• Cependant nouveaux développements tous les jours
• Point d’attention: la technique est très gourmande en
─ Données : 3.5 Milliards d’images pour Facebook (https://code.fb.com/ml-applications/
advancing-state-of-the-art-image-recognition-with-deep-learning-on-hashtags/)
• Peut-on apprendre avec peu de données ? Transfer learning, reinforcement learning
─ Moyens de calcul
• Ferme de GPUs: Un modèle pour ImageNet demande 1 exaflops de calculs (https://
www.techrepublic.com/article/four-ways-machine-learning-is-evolving-according-to-
facebooks-ai-engineering-chief/)
• Explicabilité
─ Aujourd’hui impossible: un gros problème pour certaines applications
• L’IA ce n’est pas (que) le deep learning !!
1811/12//2018 Regard sur l’IA en France et en Europe
20. Constats
• Étudiants sans formation data mining … mais excellents
informaticiens
à « learning by doing »
• Focus sur quelques thèmes
─ Bénéfices du Big Data à Feature engineering
─ « Curse of dimensionality » à Representation learning
11/12//2018 Regard sur l’IA en France et en Europe 20
21. Bénéfices du Big Data
• La performance
─ Pour les modèles prédictifs : plus de données est toujours meilleur
• Augmenter le volume Ÿ Augmenter la variété (feature engineering)
─ Fraude à la carte bancaire
21
http://online.liebertpub.com/doi/full/10.1089/big.2013.0037 https://www.kaggle.com/c/kkbox-music-recommendation-challenge/leaderboard
Plus d’observations
11/12//2018 Regard sur l’IA en France et en Europe
( ) ( ) ( )h,nRR empGen εθθ +≤
( )
( )
n
nl
h
n
h
n2nl1
h,n
η
ε −
+
=
Théorie de Vapnik
Modèle Couverture Pertinence
Baseline 1,40% 8,18%
Baseline + Agg 9,13% 19,00%
Baseline + Agg + Var Soc. 9,09% 40,58%
Seg 19 5,09% 28,21%
Seg 19 + Agg. 7,38% 28,82%
Seg 19 + Agg + Var Soc. 16,46% 60,89%
22. 22F. Soulié Fogelman. Data Sciences pour l'Actuariat
La génération de features
• Augmenter la variété
– Calculer, à partir des variables existantes, de nouvelles variables
• Significatives pour le métier mais difficiles à apprendre par un modèle
– Difficile : coûteux en données, temps de calcul, complexité du modèle
• Exemples : ratios, agrégats sur fenêtres glissantes temporelles,
géographiques…
– Obtenir des variables supplémentaires de sources externes
• Open data, partenaires, data providers
– La variété augmente (et donc le volume)
• Plus les sources sont différentes, mieux c’est
• Différentes en sémantique/type (texte, réseau…)
• C’est le facteur de succès le plus important
– Cela permet de produire des modèles plus simples & plus performants
Domingos: http://www.centurion.link/w/_media/programming/a_few_useful_things_to_know_about_machine_learning.pdf
Formation Actuaire Data Scientist
Leçon inaugurale
Paris, 16 mars 2015
23. Feature Engineering
La chose à faire pour gagner une compétition Kaggle
• “In practice, almost all winners in recent Kaggle competitions have
extensively used feature engineering”
─ “Winners in the Grupo Bimbo Inventory Prediction reported that they spent
95% of their time on feature engineering and only 5% on modeling”
─ “In the Outbrain Click Prediction kaggle challenge, it was possible to get 19th
position by the help of feature engineering”
• Un processus manuel, d’essai-erreur, dépendant du domaine
Question
• Est-il possible d’automatiser le processus, indépendamment du
domaine ?
• Quels sont les meilleurs features ?
11/12//2018 Regard sur l’IA en France et en Europe 23
http://blog.kaggle.com/2016/09/27/grupo-bimbo-inventory-demand-winners-interviewclustifier-alex-andrey/
https://www.kaggle.com/c/outbrain-click-prediction
24. La compétition KKBox – WSDM 2018
11/12//2018 Regard sur l’IA en France et en Europe 24
https://www.kaggle.com/c/kkbox-music-recommendation-challenge/leaderboard
wsdm-cup-2018.kkbox.events/pdf/WSDM_KKboxs_Music_Recommendation_Challenge_6th_Solution.pdf
25. La compétition KKBox – WSDM 2018
• On génère167 nouvelles variables dont
─ 92 features SVD, 1 feature score CF, 8 features de similarité
• On utilise donc181 features dans le modèle final ( 167
+ 14 variables initiales)
• Un ensemble de modèles LightGBM
11/12//2018 Regard sur l’IA en France et en Europe 25
26. La compétition KKBox – WSDM 2018
• Résultats
11/12//2018 Regard sur l’IA en France et en Europe 26
Top 30 features les plus importants
Variation du score AUC sur le Public LB
• A: SVD representation of user-song pairs
• B: blending 10-fold cross-validation
• C: Similarity features, CF score, SVD
representation of user-artist pairs
27. Automatic Feature Engineering Machine
Famille de features (global/local, order-k)
• ↓𝑠𝑡𝑎𝑡 statistical features
─ Global, order-1 : {max, min, sum, mean, var, std ...} or {count, count-
distinct, most frequent ...}
─ Global, order 2 such as {ratio, mean-difference ...}.
• ↓𝑡𝑖𝑚𝑒 time-based features
─ Global, order-1: {day-of-week, day-of-month, …, time-to-last, time-
since-last, ...};
─ Local from ↓𝑠𝑡𝑎𝑡 : {max, min, sum, mean, var, std ...} or {count,
count-distinct, most frequent ...} in time windows {last-hour, last-day,
last-week, the-week-before-last-week, ...}.
• ↓𝑆𝑁 social graph-based features
─ Global features : {degree, clustering coefficient, community index ...};
─ Local from local ↓𝑠𝑡𝑎𝑡 : {max, min, sum, mean, var, std ...} or
{count, unique, most frequent ...} in {first-circle, second-circle,
community...}.
• ↓𝑅𝑒𝑝 representation-based features: global features
obtained through embedding
─ SVD, PCA, AE (auto-encoder), MLP (multi-layer perceptron)
11/12//2018 Regard sur l’IA en France et en Europe 27
28. Automatic Feature Engineering Machine
KDD’14: whether a crowd-funded project will be
”exciting”.
11/12//2018 Regard sur l’IA en France et en Europe 28
29. Automatic Feature Engineering Machine
• Last.fm: predicting the rating that a user will gives to
an artist.
• Question (travail en cours)
─ Peut-on faire du “transfer learning”
• Apprendre quels sont les bons features sur un ensemble de datasets
• Les utiliser sur un nouveau dataset
─ Oui ! Reinforcement learning
11/12//2018 Regard sur l’IA en France et en Europe 29
30. Representation learning
“Curse of dimensionality”
• Beaucoup d’algos de Machine Learning algos utilisent des
distances
─ SVM, k-nn, Recommandation par filtrage Collaboratif
• En grandes dimensions toutes les distances sont les mêmes
• 2 points sont proches si l’un est à une certaine (petite) distance de l’autre
• En 2 D, le cercle couvre 78% du carré
52% en 3 D, …0.24% en 10-D
• Quand la dimension augmente, les classifieurs
overfittent à il faut augmenter le nombre d’exemples
d’apprentissage
11/12//2018 Regard sur l’IA en France et en Europe 30
31. Representation learning
Idées pour Ψ
• ACP, SVD, NMF,
• Auto-encoder …
• “Network embedding”
Recommandation
• Users x items : matrice d’adjacence
• Item-based Top-N
𝑆𝑐𝑜𝑟𝑒(𝑎, 𝑖)=∑𝑗∈ 𝑉(𝑖)↑▒ 𝑟↓𝑎𝑗 × 𝑔[𝑆𝑖𝑚(𝑖, 𝑗)]
11/12//2018 Regard sur l’IA en France et en Europe 31
32. Résultats
• Datasets
• MovieLens 1M Book-crossing Lastfm
• Point rouge à (i,j) à grande similarité(i, j).
11/12//2018 Regard sur l’IA en France et en Europe 32
Dataset Preferences Implicit/Explicit Users Items Density
MovieLens1M 1,000,209 E binarized [15] 6,040 3,706 4.47%
Lastfm 82,053 I 1,867 6,953 0.63%
Book-crossing 134,319 I 4,006 3,127 1.07%
33. La course à l’IA
Les grands plans IA dans le monde
34. L’IA est la 3ème vague
34
Source: McKinsey (2018)
11/12//2018 Regard sur l’IA en France et en Europe
35. Les plans IA dans le monde
• Tous les pays lancent leurs plans IA à « la course à l’IA »
35
https://medium.com/politics-ai/an-overview-of-national-ai-strategies-2a70ec6edfd
11/12//2018 Regard sur l’IA en France et en Europe
36. Les USA
• Trump a-t-il utilisé Cambridge Analytica aux élections de 2016 ?
• En mai 2018, le White House summit on AI réduit la voilure
─ Il ne reste plus grand-chose de la stratégie IA (Committee on AI non financé)
─ “the government will focus on removing regulatory barriers to innovation”
• La DARPA maintient un programme ambitieux à "symbiose " ($11Md)
36
https://misciwriters.com/2017/04/18/did-big-data-win-the-election-for-trump/
https://www.whitehouse.gov/wp-content/uploads/2018/05/Summary-Report-of-White-House-AI-Summit.pdf
https://www.wired.com/story/the-us-needs-an-ai-strategy/ https://www.darpa.mil/work-with-us/ai-next-campaign
11/12//2018 Regard sur l’IA en France et en Europe
37. La Chine
• Next Generation Artificial Intelligence Development Plan
(08/07/2017)
─ Moteur de la croissance économique à Être le leader mondial en 2030
• Puis un plan d’action sur 3 ans 2018-2020 (14/12/2017)
─ Théorie : Big data intelligence theory, Autonomous coordination Systèmes
technologiques : robots, VR, chips et NLP
─ Plateformes d’innovation: hardware & software
─ Formation et recrutement de talents à l’étranger
• Gros investissements
─ 23 - 51 Md € à 2020
─ Achats de technologies (234 Md$ en 2018)
37
http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm, http://news.xinhuanet.com/english/2017-06/01/
c_136330954.htm, http://www.miit.gov.cn/n1146295/n1652858/n1653018/c5979643/content.html
The core of AI development lies in the massive amounts of data ... We believe
that AI presents the most favorable opportunity for us to lead the world”
(Kai-Fu Lee, chairman and CEO of Sinovation Ventures)
11/12//2018 Regard sur l’IA en France et en Europe
38. • Investissements massifs + accès aux données + support du
gouvernement à Des succès foudroyants, e.g. en reconnaissance
faciale, reconnaissance de la parole
─ SenseTime, Megvii (Face++ open platform for facial recognition), Yitu Tech
https://www.actuia.com/actualite/la-licorne-sensetime-boucle-un-tour-de-table-de-600-millions-de-dollars-pour-sa-technologie-de-
reconnaissance-faciale-ia/, https://www.prnewswire.com/news-releases/yitu-technology-won-first-place-in-prestigious-global-facial-
recognition-benchmark-test-300513646.html, https://www.scmp.com/tech/article/2156457/alibaba-joins-us600-million-fundraising-round-ai-
startup-megvii-sources-say, https://mobileidworld.com/vivo-megvii-3d-face-scanning-907051/
La Chine
3811/12//2018 Regard sur l’IA en France et en Europe
39. La Chine
• Speech synthesis + face animation on TV
11/12/2018 Regard sur l’IA en France et en Europe 39
https://www.abc.net.au/news/2018-11-09/chinese-news-agency-unveils-virtual-newsreader/10481170
40. • Des services à Confiance des citoyens (65 %)
─ Santé (Ali-Health, Ping An Good Doctor…)
─ e-commerce (robot livreur)
─ Sécurité (comportements dangereux, score social)
http://www.alihealth.cn/, http://video.lefigaro.fr/figaro/video/chine-des-robots-livreurs-en-circulation/
5810553085001/, https://www.nouvelobs.com/monde/20180712.OBS9563/chine-derriere-une-societe-
hyperconnectee-le-reve-du-controle-total.html, https://mp.weixin.qq.com/s/7fojkm6o8oxzRxsAIbpkiQ,
http://www.lefigaro.fr/secteur/high-tech/2017/12/27/32001-20171227ARTFIG00197-la-chine-met-en-place-
un-systeme-de-notation-de-ses-citoyens-pour-2020.php, https://mp.weixin.qq.com/s/
H2WlDe_STWelzqk1mhounw
La Chine
4011/12//2018 Regard sur l’IA en France et en Europe
41. La course à l’IA
Le plan IA en France et les premières actions
42. 2 Plans IA en France
• (Obama / Trump à Hollande / Macron)
• France Intelligence Artificielle - Rapport de synthèse (mars 2017)
─ 17 groupes de travail (559 contributeurs) à recommandations
• Mission Cédric Villani (mars 2018)
─ 420 auditions d'experts
─ Peu de recommandations concernant l’industrie
─ Macron annonce un financement de €1,5 Md
42
https://www.economie.gouv.fr/files/files/PDF/2017/Rapport_synthese_France_IA_.pdf
https://www.aiforhumanity.fr/pdfs/9782111457089_Rapport_Villani_accessible.pdf
11/12//2018 Regard sur l’IA en France et en Europe
43. Plan IA en France – Premières actions
• Coordinateur interministériel dédié à l'IA
─ Bertrand Pailhès est nommé en septembre 2018
─ AMI mutualisation de données pour l’IA
• Création d'instituts 3IA
─ 4 instituts présélectionnés (et non pas 5, comme annoncé initialement)
• Formation
─ 3 000 à 5 000 étudiants (?)
• Financements
─ €100 M pour l'amorçage et la croissance des start-up IA
─ Début en 2019 avec la BPI (?)
• Défense et innovation
─ Agence de l'innovation de la défense (Emmanuel Chiva) créé le 1/09/2018
• Voiture autonome
─ On avance lentement (loi Pacte)
43
https://www.lesechos.fr/amp/08/2215708.php, https://www.entreprises.gouv.fr/files/files/directions_services/numerique/grands-dossiers/
intelligence-artificielle/AMI-mutualisation-donnees.pdf, https://www.lesechos.fr/intelligence-artificielle/veille-technologique/0600097985060-la-
france-aura-quatre-instituts-dintelligence-artificielle-2219480.php#xtor=CS1-3046
11/12//2018 Regard sur l’IA en France et en Europe
45. L’IA pour le bien de tous
45
www.ijcai-18.org/wp-content/uploads/2018/07/1_20180717_IJCAI_ECAI_Cecile-Huet.pdf
11/12//2018 Regard sur l’IA en France et en Europe
49. Nos handicaps en France
• Peu d’enthousiasme
49
https://www.ipsos.com/sites/default/files/ct/publication/documents/2018-06/revolution_of_ai_at_work-2018.pdf
11/12//2018 Regard sur l’IA en France et en Europe
50. Nos handicaps en France
• Les choses vont peu changer pensent les français
50
https://www.ipsos.com/sites/default/files/ct/publication/documents/2018-06/revolution_of_ai_at_work-2018.pdf
11/12//2018 Regard sur l’IA en France et en Europe
51. Nos handicaps en France
• Peu d’utilisation
51
https://www.ipsos.com/sites/default/files/ct/publication/documents/2018-06/revolution_of_ai_at_work-2018.pdf
11/12//2018 Regard sur l’IA en France et en Europe
52. Nos handicaps en France
• Des craintes pour l’emploi
52
https://www.ipsos.com/sites/default/files/ct/publication/documents/2018-06/revolution_of_ai_at_work-2018.pdf
11/12//2018 Regard sur l’IA en France et en Europe
53. Quelles sont les clés du succès?
• Il faut former et
recruter
massivement
53
https://www.bcg.com/Images/
Reshaping%20Business%20with%20Artificial%20I
ntelligence_tcm9-177882.pdf
11/12//2018 Regard sur l’IA en France et en Europe
55. Pour en savoir plus
• Un livre à charger gratuitement,
pas technique, mais très riche sur
les applications de l’IA, les
logiciels, les start-ups
https://www.oezratty.net/Files/usagesia/
Usages%20intelligence%20artificielle%20
2018%20Olivier%20Ezratty.docx
11/12//2018 Regard sur l’IA en France et en Europe 55