SlideShare une entreprise Scribd logo
1  sur  44
Pierre Yves Koenig 
Data Scientist 
Valtech Toulouse 
2 
Open 
Data Scientist 
Sommaire 
• Qu’est-ce que l’« Open Data Scientist »? 
• Cas d’étude « eReputation » 
• Cas d’étude « Recommandation » 
• Cas d’étude « Molécules » 
• Cas d’étude « Velib » (ébauche) 
• Conclusion 
Géraud Dugé de Bernonville 
Architecte Big Data 
Valtech Toulouse
3 
Big 
Buzz
4 
Big Data 
Buzz 
« Big data is like teenage sex: 
everyone talks about it, 
nobody really knows how to do it, 
everyone thinks everyone else is doing it, 
so everyone claims they are doing it. » 
Dan Ariely
10,2 M€ 
Reste 
du 
Monde 
36 M€ 
USA 
36,3 M€ 
EUROPE DU SUD 
5 
Big Data 
Quelles solutions?
Nouveaux outils pour l’organisation 
des données 
• « schema-less » 
• Tolérants aux pannes 
• Disponibles 
• Distribués 
6 
Big Data 
NoSQL
7 
Big Data 
Architectures 
Temps réel 
Vs. 
Batch
• Liste non exhaustive !!! 
• Chaque jour de nouveaux acteurs 
8 
Big Data 
En perpétuelle 
évolution
9 
Picto 
section 
Répondre 
à une 
problématique
10 
Big Data 
Démarche Valtech 
Pour cela Valtech propose une démarche itérative 
• Data architecte / architecte SI 
• Rôle prédominant du « Data Scientist »
10,2 M€ 
Reste 
du 
Monde 
36 M€ 
USA 
36,3 M€ 
EUROPE DU SUD 
65,1 M€ 
EUROPE 
DU NORD 
11 
Open 
Data Scientist 
“Data Scientist: The 
Sexiest Job of the 21st” 
“Data Scientist’s Salary: 
$150,000 – $250,000 a year” 
fortune.com
12 
Data 
Science 
Un domaine pluri-disciplinaire
13 
Data Science 
Dangers !
14 
Big Data 
Du POC à la mise en 
oeuvre 
Utilisation de KNIME pour le prototypage, la fouille de données 
Déclinaison vers des implémentations Big Data adaptées
10,2 M€ 
Reste 
du 
Monde 
36 M€ 
USA 
36,3 M€ 
EUROPE DU SUD 
65,1 M€ 
EUROPE 
DU NORD 
« Elle est diffusée de manière 
structurée selon une méthodologie et 
une licence ouverte garantissant son 
libre accès et sa réutilisation par tous, 
sans restriction technique, juridique 
ou financière. » 
15 
Cas d’utilisation 
Open Data
Enjeux 
Open Data 
• Source d’innovation 
16 
• Tranquilien (SNCF) 
• Paris’Moov 
• Concours
17 
Picto 
section 
Data Scientist 
ToolBox
18 
ToolBox 
KNIME 
Description
19 
ToolBox 
Tulip 
Description
20 
Picto 
section 
Démarche 
Data Scientist
21 
Démarche 
Case Study 
• Collecte de l’information 
• Pré-traitement 
• Traitement 
• Regroupement 
• Présentation 
Case Study : 
• eReputation 
• Recommandation 
• Molecules 
• Velib
22 
Picto 
section 
Case study 
eReputation
65,1 M€ 
EUROPE 
DU NORD 
23 
Case study 
eReputation 
• Problématique 
• Collecte d’information 
• Pré-traitement 
• Traitement 
• Regroupement 
• Présentation
24 
Du POC au Big Data 
eReputation 
• Cloud Amazon 
• Elastic MapReduce 
• DynamoDB 
• Hadoop et Mahout
25 
Du POC au Big Data 
eReputation
26 
Picto 
section 
Case study 
Recommandation
27 
Case study 
Recommandation 
• Problématique 
• Collecte d’information 
• Pré-traitement 
• Traitement 
• Regroupement 
• Présentation
28 
Picto 
section 
Case study 
Molécules
29 
Case study 
Molécules 
• Problématique 
• Collecte d’information 
• Pré-traitement 
• Traitement 
• Regroupement 
• Présentation / Exploration
30 
Contexte 
Problématique
31 
Analyse et Structure de la donnée 
Pré traitement des données
32 
Case study 
Molécules 
Phase de traitement 
Choix du type de distance : 
• euclidienne 
• cosinus 
• Tanimoto 
• …
33 
Réseau de molécules 
Filtres
34 
Visualisation du réseau 
Exploration
35 
Case study 
Molécules 
Dessin de graphe : 
Algrithme force-resort
36 
Case study 
Molécules 
Dessin de graphe : 
Treemap circulaire
37 
Exploration 
Par voisinage
38 
Case study 
Molécules 
Demo
39 
Picto 
section 
Case study 
Velib’
40 
Case study 
Velib’ 
• Problématique 
• Collecte d’information 
• Pré-traitement 
• Traitement 
• Regroupement 
• Présentation 
• Définition d’un modèle 
prédictif
41 
Case study 
Velib’ 
Définition d’un model prédictif 
• Ajout des informations sur la météo 
• Evaluation
42 
Picto 
section 
Pour conclure
43 
Pour aller plus loin 
Positionnement 
Valtech 
Positionnement de Valtech : 
• Brainstormings pour identifier les cas d’utilisation 
• Conseil en Architecture Big Data 
• Expertise NoSQL, Hadoop 
• Analyse de données 
• Formations Big Data, NoSQL, Hadoop
44 
Picto 
section 
Merci 
de votre 
attention

Contenu connexe

Tendances

9 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_20179 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_2017Bertrand Tavitian
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessVincent de Stoecklin
 
Nouvelles opportunités pour les données fortement interconnectées : La base d...
Nouvelles opportunités pour les données fortement interconnectées : La base d...Nouvelles opportunités pour les données fortement interconnectées : La base d...
Nouvelles opportunités pour les données fortement interconnectées : La base d...Cédric Fauvet
 
Big Data: Concepts, techniques et démonstration de Apache Hadoop
Big Data: Concepts, techniques et démonstration de Apache HadoopBig Data: Concepts, techniques et démonstration de Apache Hadoop
Big Data: Concepts, techniques et démonstration de Apache Hadoophajlaoui jaleleddine
 
Big data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesBig data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesKezhan SHI
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introductionMouna Torjmen
 
Le Groupe PSA - Déterminer le renouvellement d'un client
Le Groupe PSA - Déterminer le renouvellement d'un clientLe Groupe PSA - Déterminer le renouvellement d'un client
Le Groupe PSA - Déterminer le renouvellement d'un clientJedha Bootcamp
 
slides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelman
slides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelmanslides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelman
slides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelmanshuai wang
 
Big data et open data
Big data et open dataBig data et open data
Big data et open dataBart Hanssens
 
Big data pierreevenou
Big data pierreevenouBig data pierreevenou
Big data pierreevenouFing
 
Forum des TIC de l'Aten : Introduction à l'open data et présentation de la dé...
Forum des TIC de l'Aten : Introduction à l'open data et présentation de la dé...Forum des TIC de l'Aten : Introduction à l'open data et présentation de la dé...
Forum des TIC de l'Aten : Introduction à l'open data et présentation de la dé...Charles Ruelle
 
15 03 16_data sciences pour l'actuariat_f. soulie fogelman
15 03 16_data sciences pour l'actuariat_f. soulie fogelman15 03 16_data sciences pour l'actuariat_f. soulie fogelman
15 03 16_data sciences pour l'actuariat_f. soulie fogelmanArthur Charpentier
 

Tendances (20)

Big data
Big dataBig data
Big data
 
9 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_20179 30 fandre-dist_cnrs_piv_2017
9 30 fandre-dist_cnrs_piv_2017
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
 
M allanic piv2017_c
M allanic piv2017_cM allanic piv2017_c
M allanic piv2017_c
 
Nouvelles opportunités pour les données fortement interconnectées : La base d...
Nouvelles opportunités pour les données fortement interconnectées : La base d...Nouvelles opportunités pour les données fortement interconnectées : La base d...
Nouvelles opportunités pour les données fortement interconnectées : La base d...
 
Big Data: Concepts, techniques et démonstration de Apache Hadoop
Big Data: Concepts, techniques et démonstration de Apache HadoopBig Data: Concepts, techniques et démonstration de Apache Hadoop
Big Data: Concepts, techniques et démonstration de Apache Hadoop
 
Big data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesBig data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuaires
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introduction
 
Big data
Big dataBig data
Big data
 
Le Groupe PSA - Déterminer le renouvellement d'un client
Le Groupe PSA - Déterminer le renouvellement d'un clientLe Groupe PSA - Déterminer le renouvellement d'un client
Le Groupe PSA - Déterminer le renouvellement d'un client
 
slides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelman
slides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelmanslides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelman
slides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelman
 
Big data et open data
Big data et open dataBig data et open data
Big data et open data
 
Bigdata opensource
Bigdata opensourceBigdata opensource
Bigdata opensource
 
Cours Big Data Part I
Cours Big Data Part ICours Big Data Part I
Cours Big Data Part I
 
Mc jacquemot piv2017_c
Mc jacquemot piv2017_cMc jacquemot piv2017_c
Mc jacquemot piv2017_c
 
Big data pierreevenou
Big data pierreevenouBig data pierreevenou
Big data pierreevenou
 
Forum des TIC de l'Aten : Introduction à l'open data et présentation de la dé...
Forum des TIC de l'Aten : Introduction à l'open data et présentation de la dé...Forum des TIC de l'Aten : Introduction à l'open data et présentation de la dé...
Forum des TIC de l'Aten : Introduction à l'open data et présentation de la dé...
 
Introduction au BIG DATA
Introduction au BIG DATAIntroduction au BIG DATA
Introduction au BIG DATA
 
15 03 16_data sciences pour l'actuariat_f. soulie fogelman
15 03 16_data sciences pour l'actuariat_f. soulie fogelman15 03 16_data sciences pour l'actuariat_f. soulie fogelman
15 03 16_data sciences pour l'actuariat_f. soulie fogelman
 
Big data
Big dataBig data
Big data
 

En vedette

Au Coeur des Saveurs - N°5 - Journal du Marché de Gros Lyon-Corbas
Au Coeur des Saveurs - N°5 - Journal du Marché de Gros Lyon-CorbasAu Coeur des Saveurs - N°5 - Journal du Marché de Gros Lyon-Corbas
Au Coeur des Saveurs - N°5 - Journal du Marché de Gros Lyon-CorbasMarché de Gros Lyon Corbas
 
8 propositions pour plus de transparence de la vie publique
8 propositions pour plus de transparence de la vie publique8 propositions pour plus de transparence de la vie publique
8 propositions pour plus de transparence de la vie publiqueFondation iFRAP
 
Resultats Etude Saint Valentin - IFOP BONIAL
Resultats Etude Saint Valentin - IFOP BONIALResultats Etude Saint Valentin - IFOP BONIAL
Resultats Etude Saint Valentin - IFOP BONIALkelrencontre
 
Instructivo evaluadores encuentro regional 2013- Eliana Santos
Instructivo evaluadores encuentro regional 2013- Eliana SantosInstructivo evaluadores encuentro regional 2013- Eliana Santos
Instructivo evaluadores encuentro regional 2013- Eliana SantosEliana Santos
 
Manual de Garden of War (GOW)
Manual de Garden of War (GOW)Manual de Garden of War (GOW)
Manual de Garden of War (GOW)sergio18
 
Sistemas De Informacion
Sistemas De InformacionSistemas De Informacion
Sistemas De Informaciongimmaster
 
Presentation2
Presentation2Presentation2
Presentation2Mary2
 
Perfil Del DiseñAdor
Perfil Del DiseñAdorPerfil Del DiseñAdor
Perfil Del DiseñAdorhpeg
 
Les 7 erreurs qui bloquent votre pensée créative
Les 7 erreurs qui bloquent votre pensée créativeLes 7 erreurs qui bloquent votre pensée créative
Les 7 erreurs qui bloquent votre pensée créativelhugo1
 
Depliant de l'Alerte jaune, campagne de dépistage des maladies du foie de l'e...
Depliant de l'Alerte jaune, campagne de dépistage des maladies du foie de l'e...Depliant de l'Alerte jaune, campagne de dépistage des maladies du foie de l'e...
Depliant de l'Alerte jaune, campagne de dépistage des maladies du foie de l'e...Association Maladies Foie
 
2013 i3 m3_desuremain-dorothée_memoire_v3
2013 i3 m3_desuremain-dorothée_memoire_v32013 i3 m3_desuremain-dorothée_memoire_v3
2013 i3 m3_desuremain-dorothée_memoire_v3Dorothée de Suremain
 

En vedette (20)

Au Coeur des Saveurs - N°5 - Journal du Marché de Gros Lyon-Corbas
Au Coeur des Saveurs - N°5 - Journal du Marché de Gros Lyon-CorbasAu Coeur des Saveurs - N°5 - Journal du Marché de Gros Lyon-Corbas
Au Coeur des Saveurs - N°5 - Journal du Marché de Gros Lyon-Corbas
 
8 propositions pour plus de transparence de la vie publique
8 propositions pour plus de transparence de la vie publique8 propositions pour plus de transparence de la vie publique
8 propositions pour plus de transparence de la vie publique
 
Resultats Etude Saint Valentin - IFOP BONIAL
Resultats Etude Saint Valentin - IFOP BONIALResultats Etude Saint Valentin - IFOP BONIAL
Resultats Etude Saint Valentin - IFOP BONIAL
 
Metodologias de Pla.Estrat
Metodologias de Pla.EstratMetodologias de Pla.Estrat
Metodologias de Pla.Estrat
 
Competitividad
CompetitividadCompetitividad
Competitividad
 
Plande Negocios Estrategico
Plande Negocios EstrategicoPlande Negocios Estrategico
Plande Negocios Estrategico
 
Flores
FloresFlores
Flores
 
Decrecimiento Sostenible En EconomíAs Ricas
Decrecimiento Sostenible En EconomíAs RicasDecrecimiento Sostenible En EconomíAs Ricas
Decrecimiento Sostenible En EconomíAs Ricas
 
Instructivo evaluadores encuentro regional 2013- Eliana Santos
Instructivo evaluadores encuentro regional 2013- Eliana SantosInstructivo evaluadores encuentro regional 2013- Eliana Santos
Instructivo evaluadores encuentro regional 2013- Eliana Santos
 
Manual de Garden of War (GOW)
Manual de Garden of War (GOW)Manual de Garden of War (GOW)
Manual de Garden of War (GOW)
 
Vr de luxe
Vr de luxeVr de luxe
Vr de luxe
 
Sistemas De Informacion
Sistemas De InformacionSistemas De Informacion
Sistemas De Informacion
 
Presentation2
Presentation2Presentation2
Presentation2
 
Mod 1 Clse 1
Mod 1 Clse 1Mod 1 Clse 1
Mod 1 Clse 1
 
Perfil Del DiseñAdor
Perfil Del DiseñAdorPerfil Del DiseñAdor
Perfil Del DiseñAdor
 
Les 7 erreurs qui bloquent votre pensée créative
Les 7 erreurs qui bloquent votre pensée créativeLes 7 erreurs qui bloquent votre pensée créative
Les 7 erreurs qui bloquent votre pensée créative
 
C:\Fakepath\Offsho[1]
C:\Fakepath\Offsho[1]C:\Fakepath\Offsho[1]
C:\Fakepath\Offsho[1]
 
Depliant de l'Alerte jaune, campagne de dépistage des maladies du foie de l'e...
Depliant de l'Alerte jaune, campagne de dépistage des maladies du foie de l'e...Depliant de l'Alerte jaune, campagne de dépistage des maladies du foie de l'e...
Depliant de l'Alerte jaune, campagne de dépistage des maladies du foie de l'e...
 
2013 i3 m3_desuremain-dorothée_memoire_v3
2013 i3 m3_desuremain-dorothée_memoire_v32013 i3 m3_desuremain-dorothée_memoire_v3
2013 i3 m3_desuremain-dorothée_memoire_v3
 
Cc Canada
Cc CanadaCc Canada
Cc Canada
 

Similaire à Valtech - Big Data en action

Softshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et TechnologiesSoftshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et TechnologiesOCTO Technology Suisse
 
Connected Event - Du Big Data au Smart Data 7Oct2015 - EPFL
Connected Event - Du Big Data au Smart Data 7Oct2015 - EPFLConnected Event - Du Big Data au Smart Data 7Oct2015 - EPFL
Connected Event - Du Big Data au Smart Data 7Oct2015 - EPFLRaphael Rollier
 
Valtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech
 
Les médiations socio-techniques de l’observation en ligne. Analyse réflexive ...
Les médiations socio-techniques de l’observation en ligne. Analyse réflexive ...Les médiations socio-techniques de l’observation en ligne. Analyse réflexive ...
Les médiations socio-techniques de l’observation en ligne. Analyse réflexive ...Gehan Kamachi
 
L'IoT, c'est maintenant. Microsoft Experiences 2016
L'IoT, c'est maintenant. Microsoft Experiences 2016L'IoT, c'est maintenant. Microsoft Experiences 2016
L'IoT, c'est maintenant. Microsoft Experiences 2016Alex Danvy
 
Présentation Françoise Soulié Fogelman
Présentation Françoise Soulié FogelmanPrésentation Françoise Soulié Fogelman
Présentation Françoise Soulié FogelmanKezhan SHI
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4jNeo4j
 
Introduction au projet Datapride
Introduction au projet DataprideIntroduction au projet Datapride
Introduction au projet Datapridedatapride
 
IODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceIODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceBorderCloud
 
Comment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texteComment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texteAntidot
 
Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Lilia Sfaxi
 
Matinée Découverte Big Data & Data Science - 24012017
Matinée Découverte Big Data & Data Science - 24012017Matinée Découverte Big Data & Data Science - 24012017
Matinée Découverte Big Data & Data Science - 24012017Micropole Group
 
Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation
Séminaire BIG DATA, SYNTHÈSE - ORSYS FormationSéminaire BIG DATA, SYNTHÈSE - ORSYS Formation
Séminaire BIG DATA, SYNTHÈSE - ORSYS FormationORSYS
 
La visibilité des enseignants-chercheurs sur internet
La visibilité des enseignants-chercheurs sur internetLa visibilité des enseignants-chercheurs sur internet
La visibilité des enseignants-chercheurs sur internetCedric Manara
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel businessMouhsine LAKHDISSI
 
Du Big Data à la Smart Information : comment valoriser les actifs information...
Du Big Data à la Smart Information : comment valoriser les actifs information...Du Big Data à la Smart Information : comment valoriser les actifs information...
Du Big Data à la Smart Information : comment valoriser les actifs information...Antidot
 
5Jpro CTLes : intervention Brigitte Michel
5Jpro CTLes : intervention Brigitte Michel5Jpro CTLes : intervention Brigitte Michel
5Jpro CTLes : intervention Brigitte MichelCTLes
 
Problématique du devenir des données au Centre de Calcul de l'IN2P3 - Pascal ...
Problématique du devenir des données au Centre de Calcul de l'IN2P3 - Pascal ...Problématique du devenir des données au Centre de Calcul de l'IN2P3 - Pascal ...
Problématique du devenir des données au Centre de Calcul de l'IN2P3 - Pascal ...Lesticetlart Invisu
 
[SoData] Open Data : Défis et Enjeux en recherche
[SoData] Open Data : Défis et Enjeux en recherche [SoData] Open Data : Défis et Enjeux en recherche
[SoData] Open Data : Défis et Enjeux en recherche Célya Gruson-Daniel
 

Similaire à Valtech - Big Data en action (20)

Softshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et TechnologiesSoftshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et Technologies
 
Connected Event - Du Big Data au Smart Data 7Oct2015 - EPFL
Connected Event - Du Big Data au Smart Data 7Oct2015 - EPFLConnected Event - Du Big Data au Smart Data 7Oct2015 - EPFL
Connected Event - Du Big Data au Smart Data 7Oct2015 - EPFL
 
Valtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entreprise
 
Les médiations socio-techniques de l’observation en ligne. Analyse réflexive ...
Les médiations socio-techniques de l’observation en ligne. Analyse réflexive ...Les médiations socio-techniques de l’observation en ligne. Analyse réflexive ...
Les médiations socio-techniques de l’observation en ligne. Analyse réflexive ...
 
L'IoT, c'est maintenant. Microsoft Experiences 2016
L'IoT, c'est maintenant. Microsoft Experiences 2016L'IoT, c'est maintenant. Microsoft Experiences 2016
L'IoT, c'est maintenant. Microsoft Experiences 2016
 
Présentation Françoise Soulié Fogelman
Présentation Françoise Soulié FogelmanPrésentation Françoise Soulié Fogelman
Présentation Françoise Soulié Fogelman
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4j
 
Introduction au projet Datapride
Introduction au projet DataprideIntroduction au projet Datapride
Introduction au projet Datapride
 
IODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceIODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data Science
 
Comment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texteComment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texte
 
Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture
 
Matinée Découverte Big Data & Data Science - 24012017
Matinée Découverte Big Data & Data Science - 24012017Matinée Découverte Big Data & Data Science - 24012017
Matinée Découverte Big Data & Data Science - 24012017
 
Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation
Séminaire BIG DATA, SYNTHÈSE - ORSYS FormationSéminaire BIG DATA, SYNTHÈSE - ORSYS Formation
Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation
 
La visibilité des enseignants-chercheurs sur internet
La visibilité des enseignants-chercheurs sur internetLa visibilité des enseignants-chercheurs sur internet
La visibilité des enseignants-chercheurs sur internet
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
Du Big Data à la Smart Information : comment valoriser les actifs information...
Du Big Data à la Smart Information : comment valoriser les actifs information...Du Big Data à la Smart Information : comment valoriser les actifs information...
Du Big Data à la Smart Information : comment valoriser les actifs information...
 
5Jpro CTLes : intervention Brigitte Michel
5Jpro CTLes : intervention Brigitte Michel5Jpro CTLes : intervention Brigitte Michel
5Jpro CTLes : intervention Brigitte Michel
 
Problématique du devenir des données au Centre de Calcul de l'IN2P3 - Pascal ...
Problématique du devenir des données au Centre de Calcul de l'IN2P3 - Pascal ...Problématique du devenir des données au Centre de Calcul de l'IN2P3 - Pascal ...
Problématique du devenir des données au Centre de Calcul de l'IN2P3 - Pascal ...
 
Parcours Big Data @ Cetic (6 mai 2014)
Parcours Big Data @ Cetic (6 mai 2014)Parcours Big Data @ Cetic (6 mai 2014)
Parcours Big Data @ Cetic (6 mai 2014)
 
[SoData] Open Data : Défis et Enjeux en recherche
[SoData] Open Data : Défis et Enjeux en recherche [SoData] Open Data : Défis et Enjeux en recherche
[SoData] Open Data : Défis et Enjeux en recherche
 

Plus de Valtech

Valtech - Réalité virtuelle : analyses, perspectives, démonstrations
Valtech - Réalité virtuelle : analyses, perspectives, démonstrationsValtech - Réalité virtuelle : analyses, perspectives, démonstrations
Valtech - Réalité virtuelle : analyses, perspectives, démonstrationsValtech
 
CES 2016 - Décryptage et revue des tendances
CES 2016 - Décryptage et revue des tendancesCES 2016 - Décryptage et revue des tendances
CES 2016 - Décryptage et revue des tendancesValtech
 
Stéphane Roche - Agilité en milieu multiculturel
Stéphane Roche - Agilité en milieu multiculturelStéphane Roche - Agilité en milieu multiculturel
Stéphane Roche - Agilité en milieu multiculturelValtech
 
Valtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raisonValtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raisonValtech
 
Tendances digitales et créatives // Cannes Lions 2015
Tendances digitales et créatives // Cannes Lions 2015Tendances digitales et créatives // Cannes Lions 2015
Tendances digitales et créatives // Cannes Lions 2015Valtech
 
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015Valtech
 
Valtech - Architecture Agile des SI
Valtech - Architecture Agile des SIValtech - Architecture Agile des SI
Valtech - Architecture Agile des SIValtech
 
Tendances mobiles et digitales du MWC 2015
Tendances mobiles et digitales du MWC 2015Tendances mobiles et digitales du MWC 2015
Tendances mobiles et digitales du MWC 2015Valtech
 
CES 2015 : Décryptage et tendances / Objets connectés
CES 2015 : Décryptage et tendances / Objets connectésCES 2015 : Décryptage et tendances / Objets connectés
CES 2015 : Décryptage et tendances / Objets connectésValtech
 
Valtech - Economie Collaborative
Valtech - Economie CollaborativeValtech - Economie Collaborative
Valtech - Economie CollaborativeValtech
 
Valtech - Adobe - Résultats du Baromètre Digital Marketing 2014
Valtech - Adobe - Résultats du Baromètre Digital Marketing 2014Valtech - Adobe - Résultats du Baromètre Digital Marketing 2014
Valtech - Adobe - Résultats du Baromètre Digital Marketing 2014Valtech
 
[Veille thématique et décryptage] Cannes Lions 2014
[Veille thématique et décryptage] Cannes Lions 2014[Veille thématique et décryptage] Cannes Lions 2014
[Veille thématique et décryptage] Cannes Lions 2014Valtech
 
Valtech - Usages et technologie SaaS
Valtech - Usages et technologie SaaSValtech - Usages et technologie SaaS
Valtech - Usages et technologie SaaSValtech
 
[ Revue Innovations ] Valtech - Mobile World Congress
[ Revue Innovations ] Valtech - Mobile World Congress[ Revue Innovations ] Valtech - Mobile World Congress
[ Revue Innovations ] Valtech - Mobile World CongressValtech
 
Valtech - Digitalisation du Point de Vente - Toulouse - Février 2014
Valtech - Digitalisation du Point de Vente - Toulouse - Février 2014Valtech - Digitalisation du Point de Vente - Toulouse - Février 2014
Valtech - Digitalisation du Point de Vente - Toulouse - Février 2014Valtech
 
[ Veille de tendances ] Valtech : Objets connectés
[ Veille de tendances ] Valtech : Objets connectés[ Veille de tendances ] Valtech : Objets connectés
[ Veille de tendances ] Valtech : Objets connectésValtech
 
Valtech - Sharepoint et le cloud Azure
Valtech - Sharepoint et le cloud AzureValtech - Sharepoint et le cloud Azure
Valtech - Sharepoint et le cloud AzureValtech
 
Microsoft - Le Cloud OS et présentation de Windows Azure
Microsoft - Le Cloud OS et présentation de Windows AzureMicrosoft - Le Cloud OS et présentation de Windows Azure
Microsoft - Le Cloud OS et présentation de Windows AzureValtech
 
Valtech - Adobe - Résultats du Baromètre Digital Marketing Toulouse 2013
Valtech - Adobe - Résultats du Baromètre Digital Marketing Toulouse 2013Valtech - Adobe - Résultats du Baromètre Digital Marketing Toulouse 2013
Valtech - Adobe - Résultats du Baromètre Digital Marketing Toulouse 2013Valtech
 
Valtech - Digitalisation du point de vente
Valtech - Digitalisation du point de venteValtech - Digitalisation du point de vente
Valtech - Digitalisation du point de venteValtech
 

Plus de Valtech (20)

Valtech - Réalité virtuelle : analyses, perspectives, démonstrations
Valtech - Réalité virtuelle : analyses, perspectives, démonstrationsValtech - Réalité virtuelle : analyses, perspectives, démonstrations
Valtech - Réalité virtuelle : analyses, perspectives, démonstrations
 
CES 2016 - Décryptage et revue des tendances
CES 2016 - Décryptage et revue des tendancesCES 2016 - Décryptage et revue des tendances
CES 2016 - Décryptage et revue des tendances
 
Stéphane Roche - Agilité en milieu multiculturel
Stéphane Roche - Agilité en milieu multiculturelStéphane Roche - Agilité en milieu multiculturel
Stéphane Roche - Agilité en milieu multiculturel
 
Valtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raisonValtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raison
 
Tendances digitales et créatives // Cannes Lions 2015
Tendances digitales et créatives // Cannes Lions 2015Tendances digitales et créatives // Cannes Lions 2015
Tendances digitales et créatives // Cannes Lions 2015
 
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
 
Valtech - Architecture Agile des SI
Valtech - Architecture Agile des SIValtech - Architecture Agile des SI
Valtech - Architecture Agile des SI
 
Tendances mobiles et digitales du MWC 2015
Tendances mobiles et digitales du MWC 2015Tendances mobiles et digitales du MWC 2015
Tendances mobiles et digitales du MWC 2015
 
CES 2015 : Décryptage et tendances / Objets connectés
CES 2015 : Décryptage et tendances / Objets connectésCES 2015 : Décryptage et tendances / Objets connectés
CES 2015 : Décryptage et tendances / Objets connectés
 
Valtech - Economie Collaborative
Valtech - Economie CollaborativeValtech - Economie Collaborative
Valtech - Economie Collaborative
 
Valtech - Adobe - Résultats du Baromètre Digital Marketing 2014
Valtech - Adobe - Résultats du Baromètre Digital Marketing 2014Valtech - Adobe - Résultats du Baromètre Digital Marketing 2014
Valtech - Adobe - Résultats du Baromètre Digital Marketing 2014
 
[Veille thématique et décryptage] Cannes Lions 2014
[Veille thématique et décryptage] Cannes Lions 2014[Veille thématique et décryptage] Cannes Lions 2014
[Veille thématique et décryptage] Cannes Lions 2014
 
Valtech - Usages et technologie SaaS
Valtech - Usages et technologie SaaSValtech - Usages et technologie SaaS
Valtech - Usages et technologie SaaS
 
[ Revue Innovations ] Valtech - Mobile World Congress
[ Revue Innovations ] Valtech - Mobile World Congress[ Revue Innovations ] Valtech - Mobile World Congress
[ Revue Innovations ] Valtech - Mobile World Congress
 
Valtech - Digitalisation du Point de Vente - Toulouse - Février 2014
Valtech - Digitalisation du Point de Vente - Toulouse - Février 2014Valtech - Digitalisation du Point de Vente - Toulouse - Février 2014
Valtech - Digitalisation du Point de Vente - Toulouse - Février 2014
 
[ Veille de tendances ] Valtech : Objets connectés
[ Veille de tendances ] Valtech : Objets connectés[ Veille de tendances ] Valtech : Objets connectés
[ Veille de tendances ] Valtech : Objets connectés
 
Valtech - Sharepoint et le cloud Azure
Valtech - Sharepoint et le cloud AzureValtech - Sharepoint et le cloud Azure
Valtech - Sharepoint et le cloud Azure
 
Microsoft - Le Cloud OS et présentation de Windows Azure
Microsoft - Le Cloud OS et présentation de Windows AzureMicrosoft - Le Cloud OS et présentation de Windows Azure
Microsoft - Le Cloud OS et présentation de Windows Azure
 
Valtech - Adobe - Résultats du Baromètre Digital Marketing Toulouse 2013
Valtech - Adobe - Résultats du Baromètre Digital Marketing Toulouse 2013Valtech - Adobe - Résultats du Baromètre Digital Marketing Toulouse 2013
Valtech - Adobe - Résultats du Baromètre Digital Marketing Toulouse 2013
 
Valtech - Digitalisation du point de vente
Valtech - Digitalisation du point de venteValtech - Digitalisation du point de vente
Valtech - Digitalisation du point de vente
 

Valtech - Big Data en action

  • 1.
  • 2. Pierre Yves Koenig Data Scientist Valtech Toulouse 2 Open Data Scientist Sommaire • Qu’est-ce que l’« Open Data Scientist »? • Cas d’étude « eReputation » • Cas d’étude « Recommandation » • Cas d’étude « Molécules » • Cas d’étude « Velib » (ébauche) • Conclusion Géraud Dugé de Bernonville Architecte Big Data Valtech Toulouse
  • 4. 4 Big Data Buzz « Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it. » Dan Ariely
  • 5. 10,2 M€ Reste du Monde 36 M€ USA 36,3 M€ EUROPE DU SUD 5 Big Data Quelles solutions?
  • 6. Nouveaux outils pour l’organisation des données • « schema-less » • Tolérants aux pannes • Disponibles • Distribués 6 Big Data NoSQL
  • 7. 7 Big Data Architectures Temps réel Vs. Batch
  • 8. • Liste non exhaustive !!! • Chaque jour de nouveaux acteurs 8 Big Data En perpétuelle évolution
  • 9. 9 Picto section Répondre à une problématique
  • 10. 10 Big Data Démarche Valtech Pour cela Valtech propose une démarche itérative • Data architecte / architecte SI • Rôle prédominant du « Data Scientist »
  • 11. 10,2 M€ Reste du Monde 36 M€ USA 36,3 M€ EUROPE DU SUD 65,1 M€ EUROPE DU NORD 11 Open Data Scientist “Data Scientist: The Sexiest Job of the 21st” “Data Scientist’s Salary: $150,000 – $250,000 a year” fortune.com
  • 12. 12 Data Science Un domaine pluri-disciplinaire
  • 13. 13 Data Science Dangers !
  • 14. 14 Big Data Du POC à la mise en oeuvre Utilisation de KNIME pour le prototypage, la fouille de données Déclinaison vers des implémentations Big Data adaptées
  • 15. 10,2 M€ Reste du Monde 36 M€ USA 36,3 M€ EUROPE DU SUD 65,1 M€ EUROPE DU NORD « Elle est diffusée de manière structurée selon une méthodologie et une licence ouverte garantissant son libre accès et sa réutilisation par tous, sans restriction technique, juridique ou financière. » 15 Cas d’utilisation Open Data
  • 16. Enjeux Open Data • Source d’innovation 16 • Tranquilien (SNCF) • Paris’Moov • Concours
  • 17. 17 Picto section Data Scientist ToolBox
  • 18. 18 ToolBox KNIME Description
  • 19. 19 ToolBox Tulip Description
  • 20. 20 Picto section Démarche Data Scientist
  • 21. 21 Démarche Case Study • Collecte de l’information • Pré-traitement • Traitement • Regroupement • Présentation Case Study : • eReputation • Recommandation • Molecules • Velib
  • 22. 22 Picto section Case study eReputation
  • 23. 65,1 M€ EUROPE DU NORD 23 Case study eReputation • Problématique • Collecte d’information • Pré-traitement • Traitement • Regroupement • Présentation
  • 24. 24 Du POC au Big Data eReputation • Cloud Amazon • Elastic MapReduce • DynamoDB • Hadoop et Mahout
  • 25. 25 Du POC au Big Data eReputation
  • 26. 26 Picto section Case study Recommandation
  • 27. 27 Case study Recommandation • Problématique • Collecte d’information • Pré-traitement • Traitement • Regroupement • Présentation
  • 28. 28 Picto section Case study Molécules
  • 29. 29 Case study Molécules • Problématique • Collecte d’information • Pré-traitement • Traitement • Regroupement • Présentation / Exploration
  • 31. 31 Analyse et Structure de la donnée Pré traitement des données
  • 32. 32 Case study Molécules Phase de traitement Choix du type de distance : • euclidienne • cosinus • Tanimoto • …
  • 33. 33 Réseau de molécules Filtres
  • 34. 34 Visualisation du réseau Exploration
  • 35. 35 Case study Molécules Dessin de graphe : Algrithme force-resort
  • 36. 36 Case study Molécules Dessin de graphe : Treemap circulaire
  • 37. 37 Exploration Par voisinage
  • 38. 38 Case study Molécules Demo
  • 39. 39 Picto section Case study Velib’
  • 40. 40 Case study Velib’ • Problématique • Collecte d’information • Pré-traitement • Traitement • Regroupement • Présentation • Définition d’un modèle prédictif
  • 41. 41 Case study Velib’ Définition d’un model prédictif • Ajout des informations sur la météo • Evaluation
  • 42. 42 Picto section Pour conclure
  • 43. 43 Pour aller plus loin Positionnement Valtech Positionnement de Valtech : • Brainstormings pour identifier les cas d’utilisation • Conseil en Architecture Big Data • Expertise NoSQL, Hadoop • Analyse de données • Formations Big Data, NoSQL, Hadoop
  • 44. 44 Picto section Merci de votre attention

Notes de l'éditeur

  1. Visuel à remplacer par une nouvelle photo montrant en premier plan net les nouveaux devices, et en arrière plan, flou, les hommes qui développent et utilisent ce objets.
  2. À conserver en attendant de disposer d’un nouveau visuel, fortement inspiré du visage de David Bowman dans 2001 l’odysée de l’espace.
  3. Ref — Dan Ariely Date de janvier 2013, depuis cela a évolué: il existe de véritables réalisation de Big Data
  4. Ref : http://batman.wikia.com/wiki/The_Riddler_%28Frank_Gorshin%29 Idéalement, il faut partir d’une problématique, pour aider, Valtech mets en place des sessions de Brainstorming basées sur des Innovation games afin de définir les cas d’utilisation
  5. Salaire: https://datajobs.com/big-data-salary
  6. Ref: http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram Statistics helps by making sure your conclusions are valid. Machine learning helps by making your predictions of the future accurate. Math is a general skill that helps everything. Les dangers: Finding false causation Building bad models Bad A/B tests Telling bad stories Ref: http://www.quora.com/In-the-data-science-venn-diagram-why-is-the-common-region-of-Hacking-Skills-and-Substantive-Expertise-considered-as-danger-zone
  7. Ref http://www.tylervigen.com/
  8. Proto avec Knime: Knime plateforme dotée d’un ETL, permettant l’analyse de donnée et la visualisation. L’idée est de valider une méthologie avec KNIME qui permet un prototypage rapide
  9. http://www.w3.org/DesignIssues/LinkedData.html
  10. http://www.w3.org/DesignIssues/LinkedData.html
  11. À conserver en attendant de disposer d’un nouveau visuel, fortement inspiré du visage de David Bowman dans 2001 l’odysée de l’espace.
  12. À conserver en attendant de disposer d’un nouveau visuel, fortement inspiré du visage de David Bowman dans 2001 l’odysée de l’espace.
  13. Le datascientist intervient a different dans le processus d’analyse. Source -> validité Manipulation -> pourquoi filtrer des valeur qui sont par exemple statistiquement non significative Valarisation -> quels type d’algorithm est le mieux adapter à la question posée IL nous faut une question ` Collect de l’information - Au choix : bd sql /nosql; fichier, des site internet, web service … Pre traitement des données Utilisation massive de knime Le pre traitement peut etre du text mining -> case study eReputation Recherche d’artefacts ou données non utiles-> recommandation Image : histogram des couleur Text : occurrence – filtre -> eReputation Filter -> velib Valorisation Suivant le type des données Image : feature inside, classification Text : mise en evidence de thematique, regroupement de document -> ereputaion Suivant la masse des données Regroupement -> molecules Suivant la complexité des données Structuration de la donnée Mise en graphe -> molecules Regroupement / clustering ou profilage Definitionde model predictif Presentation/ representation Information peut rester volumineuse Differentes representations Visualisation
  14. À conserver en attendant de disposer d’un nouveau visuel, fortement inspiré du visage de David Bowman dans 2001 l’odysée de l’espace.
  15. • problématique - visibilité - positionnement veille technologique • collect d’information - differentes source d’information (google, twitter …) - Nb rows? • pre traitement - text mining (stop word, pos filter, tf idf) - Nb words? • traitement - regroupement kmean - Nb words/cluster?
  16. http://ereputation.ddns.net:8080/REST/index.html#resume
  17. À conserver en attendant de disposer d’un nouveau visuel, fortement inspiré du visage de David Bowman dans 2001 l’odysée de l’espace.
  18. • problematique​ - amazon, .. wikipedia​  - recommander un film​  etant donné un film,  le​   conseiller ou pas​  j’aime les films que mes ​ voisins aiment.​ Voisin? • regroupement​  - profil
  19. À conserver en attendant de disposer d’un nouveau visuel, fortement inspiré du visage de David Bowman dans 2001 l’odysée de l’espace.
  20. Nous allons ici vous presenter un cas d’etude resultant d’une mission chez un groupe pharmasotique. Comme toujours nous allons suivre la demarche de definition de la problematique, les données, Les differents traitement réalisé …
  21. Contexte : On se place dans un contexte de recherche en pharmacologie. Le développement d’un médicament est un processus long (une dizaine d’années) qui commence toujours par le choix de molécules à investiguer. Partant d’une collection importante de molécules, il faut choisir suivant différents critères un sous ensemble prometteur. Comment faire ? // to be add but : Trouver des nouveaux médicaments Améliorer des médicament existant Médicament = molécule Tester toutes les molécules : impossible ! $$ ! ( Collection de plus de 3 millions molécules) Comment choisir les bonnes molécules à tester?
  22. Analyse et Structuration de la donnée : On peut pour chaque molécule calculer une empreinte digitale de par leur structure chimique. Ce calcul consiste à répertorier l’ensemble des sous graphes constituant les molécules. Pour chaque molécule on obtient un vecteur caractéristique. Cette opération est très couteuse et est souvent parallélisée. Ces vecteurs vont nous permettre de comparer les molécules entre elles en calculant une distance entre ces vecteurs. La distance qu’on utilise est une distance d’inclusion (Tanimoto), montrant ainsi combien deux molécules partagent une même structure.
  23. Quelle distance choisir … Il existe enormement de distance et il convient de choisir la mieux adapter a notre cas : Euclidienne : les données sont projeter dans le plan euclidien suivant x et y et on calcule alors la distance entre (x1, y1) et (x2, y2) cosinus : le cosinus de l’angle formé par les deux vecteurs (souvant utilisé pour les vecteurs de mot avec ponderation tf idf) tanimoto : (A n B) / (A u B) -> distance ensembliste (peut etre pondérée) mahathan … Dans notre cas ce qui nous interesse c’est le sous ensemble comun entre les molecules. On va donc s’orienter vers une distance ensembliste tel que Tanimoto
  24. Réseau de molécules : On construit ainsi un réseau dans lequel les entités sont nos molécules et les relations entre elles sont pondérées par la distance de Tanimoto. Au début nous avons un graphe complet où toutes les molécules sont reliées entre elles. Une distance de Tanimoto inférieur à 0,7 est jugée comme non significative, un premier filtre est donc appliqué à notre réseau. Cette opération va nous déconnecter le réseau de molécule faisant ainsi apparaitre des groupes de molécules (séries chimiques). L’utilisateur expert du métier va vouloir une représentation de ce réseau afin de pouvoir l’explorer.
  25. Visualisation du réseau : Il va pouvoir dans un premier temps valider ou non le découpage et le cas échéant l’affiner en jouant sur les filtres mis à sa disposition. Cette visualisation va lui permettre aussi de contrôler la véracité de l’information et modifier le réseau localement. La visualisation du réseau permet par des artifices visuels de rendre compte de propriétés des données. En effet sur une molécule, nous disposons de plus d’information que sa structure chimique. Comme par exemple l’ensemble des tests d’activité, de toxicités… . Ces informations peuvent être représentés par la couleur, la taille, ou encore la texture du cercle qui la représente.
  26. Chaque composant connexte, ou serie chimique, est desinner a l’aide d’un algorithme force resort. Les molecules sont consideré comme des billes metlique ayant une charge electrique variable. Les liens entre molecule sont quant a eux considéré comme des resort ayant une taille initiale et une raideur. L’algorithme de dessin est inspiré de la phisque et de la loie d’equilibre des system. Negligeant les frotements , l’algorithme simule les attraction et repulsion des molecules jusqu’’atteindre l’equibre.
  27. L’ensemble des composantes sont considerés par la suite comme des nœuds, on suit alors un algorithme de pavage de l’espace. Le plus souvant carré ou rectangulaire, la treemap choisie ici est la treemap circulaire. On choisi alors de placer la composante la plus grosse (ayant le plus de molecule) au centre du dessin. D’autre algorithme de dessin consiste a utiliser une treemap classique comme grille, on parle alors de packing component Cet algortihme de dessin a été concu dans un soucis de lisibilité, de taille et de vitesse.
  28. Exploration par voisinage : L’activité d’une molécule décrit la quantité de produit nécessaire afin d’avoir un effet notable. Ainsi plus une molécule est active, plus sont absorption est facile jouant ainsi sur la posologie du médicament. Notre réseau peut être orienté en fonction de l’activité de ces molécules. Cela permet de par une navigation par voisinage d’affiner la sélection. Par exemple, pour une molécule dont l’activité est faible avec une posologie en intra veineuse, on peut vouloir cherche dans son voisinage une molécule plus active ayant le même principe actif avec une posologie moins contraignante. Une exploration par voisinage est donc ici nécessaire. Ce n’est pas la seul interaction que nous fournissons à l’utilisateur. Un calcul des plus court chemin peut par exemple renseigner sur le processus de synthèse de la molécule cible.
  29. Dans cette demo, malheureusement vous ne pourez pas voir le logitiel qui a été utilisé pour les images, ce logitiel est la propriété du client. Par contre avec l’aide de knime et de tulip nous pouvons nous en approcher tres fortement, avec moins d’interaction specifique bien sure. Cependant, tulip offre des interacteur tres interessant pour une exploration de proche en proche … par voisinage.
  30. À conserver en attendant de disposer d’un nouveau visuel, fortement inspiré du visage de David Bowman dans 2001 l’odysée de l’espace.
  31. • Prédire l’occupation d’une station en terme de place disponible et de vélo disponible • Prévoir un itinéraire
  32. • Stockage de la données (on ne stock que les changements) • Agrégation de l’information par 5, 10 minute, par heure, par jours • Open data : web service qui interoge toute les minute l’ensemble des stations de paris • Prevision meteo • Calendrier (weekend et jours feries)
  33. À conserver en attendant de disposer d’un nouveau visuel, fortement inspiré du visage de David Bowman dans 2001 l’odysée de l’espace.
  34. À conserver en attendant de disposer d’un nouveau visuel, fortement inspiré du visage de David Bowman dans 2001 l’odysée de l’espace.