SlideShare une entreprise Scribd logo
1  sur  19
Télécharger pour lire hors ligne
PROJET DE DATA SCIENCE
JUILLET 2019 – Emmanuelle Guyot
QUELLES STARTUPS
RECOMMANDER AUX
GRANDS GROUPES ?
CONSTAT
LES GRANDS GROUPES DÉPENSENT DES
MILLIONS POUR INNOVER…
…SANS FORCÉMENT Y ARRIVER
CONSTAT
CONSTAT
PROBLÈME
Comment recommander plus facilement aux grands groupes
des startups innovantes qui pourraient les intéresser ?
Vous allez surement aimer…
Ces recommandations sont inspirées de votre historique de startups consultées et suivies.
SIMPLIFICATION DU PROBLÈME POUR LE PROJET
• Problème de timing pour avoir les données sur les grands groupes à temps
(uniquement celles sur les startups)
• Transformation de l’objectif : pour une startup donnée, recommander des clients
(grands groupes)
DONNÉES DISPONIBLES :  800 startups
1 ligne = 1 startup avec 6 attributs, dont ses clients
DONNÉES DISPONIBLES :  800 startups
1 ligne = 1 startup avec 6 attributs, dont ses clients
DÉMARCHE
Objectif : pour des tags donnés, trouver des startups similaires et recommander leurs clients
Démarche :
• Créer un tableau avec en ligne les startups, et en colonnes les tags
• Mettre des 0 et des 1 aux intersections selon que la startup possède ou nonce tag
• Pour une nouvelle liste de tags donnée, faire le produit scalaire avec chaque ligne de ce tableau
pour en ressortir les startups semblables
• Retourner les clients de ces startups
Etape 1 : cleaner les tags
Créer une fonction qui :
• clean les tags
• les sépare
• les mets en minuscule
• les ajoute à une liste
col_tags devient la colonne « propre » des tags
Etape 1 : cleaner les tags
Avant Après
Etape 2 : supprimer les startups qui n’ont pas de clients
Créer une autre colonne de tags où les startups
qui n’ont pas de clients sont supprimées
Créer une liste des tags (uniques) que l’on
utilisera pour créer les colonnes du tableau
Etape 3 : supprimer les tags en doublon
Etape 3 : supprimer les tags en doublon
s : l :
Etape 4 : populer le tableau colonne par colonne
• Créer chaque colonne en prenant un par un
les tags de la liste
• Ligne par ligne, ajouter un 0 si la startup ne
possède pas ce tag, ou un 1 si elle le possède
• Créer le tableau
Etape 4 : populer le tableau colonne par colonne
(Plus de 400 colonnes)
Etape 5 : comparer des tags aux startups de la base et retourner les clients
les plus pertinents
• Créer une fonction qui prend en argument
une liste de tags
• Traduire ces tags en liste de 0 et 1
• Faire le produit scalaire entre cette liste et
chaque ligne du tableau des startups
• Créer une colonne « Similarity » qui
enregistre le résultat du produit scalaire
• Retourner les 10 startups qui ont le plus grand
produit scalaire avec les tags d’entrée,
accompagnées de la liste de leurs clients
Etape 5 : comparer des tags aux startups de la base et retourner les clients
des startups similaires
Recommandation de clients : Vérification de la similarité :
Etape 5 : comparer des tags aux startups de la base et retourner les clients
des startups similaires
Recommandation de clients : Vérification de la similarité :
PROCHAINES ÉTAPES
• Faire le même travail « dans l’autre sens » pour recommander des
startups aux grands groupes
• Ajouter au système de recommandation les autres informations
disponibles (secteur, intérêt, technologie, fonds levés…)
• Intégrer les recos au site de Forinov et les automatiser pour proposer
des résultats exploitables directement par leurs clients
Quelles start-ups recommander aux grands groupes ?

Contenu connexe

Similaire à Quelles start-ups recommander aux grands groupes ?

Comment Bien GéRer Son E RéPutation
Comment Bien GéRer Son E RéPutationComment Bien GéRer Son E RéPutation
Comment Bien GéRer Son E RéPutation
base.donnees
 

Similaire à Quelles start-ups recommander aux grands groupes ? (20)

20 Best Practices Social Marketing 28 08 09
20 Best Practices  Social Marketing 28 08 0920 Best Practices  Social Marketing 28 08 09
20 Best Practices Social Marketing 28 08 09
 
Chaine de valeur.pptx
Chaine de valeur.pptxChaine de valeur.pptx
Chaine de valeur.pptx
 
e-marketing Paris 2011 - AD Referencement
e-marketing Paris 2011 - AD Referencemente-marketing Paris 2011 - AD Referencement
e-marketing Paris 2011 - AD Referencement
 
Business&Breakfast : Il n'y a plus de marchés, seulement des clients
Business&Breakfast : Il n'y a plus de marchés, seulement des clientsBusiness&Breakfast : Il n'y a plus de marchés, seulement des clients
Business&Breakfast : Il n'y a plus de marchés, seulement des clients
 
Magento et SEO : le combo parfait pour développer son e-commerce
Magento et SEO : le combo parfait pour développer son e-commerceMagento et SEO : le combo parfait pour développer son e-commerce
Magento et SEO : le combo parfait pour développer son e-commerce
 
Bmc f2 m
Bmc f2 mBmc f2 m
Bmc f2 m
 
Business Model Canvas
Business Model CanvasBusiness Model Canvas
Business Model Canvas
 
Webdays 2015 : Business Model Canvas
Webdays 2015 : Business Model CanvasWebdays 2015 : Business Model Canvas
Webdays 2015 : Business Model Canvas
 
Réussir votre stratégie web marketing en 12 étapes
Réussir votre stratégie web marketing en 12 étapesRéussir votre stratégie web marketing en 12 étapes
Réussir votre stratégie web marketing en 12 étapes
 
Running lean meetup 18 mai 2017
Running lean   meetup 18 mai 2017Running lean   meetup 18 mai 2017
Running lean meetup 18 mai 2017
 
Petit dej search foresight e-commerce navigation à facettes et SEO 19 sept 2013
Petit dej search foresight e-commerce navigation à facettes et SEO 19 sept 2013Petit dej search foresight e-commerce navigation à facettes et SEO 19 sept 2013
Petit dej search foresight e-commerce navigation à facettes et SEO 19 sept 2013
 
Comment Bien GéRer Son E RéPutation
Comment Bien GéRer Son E RéPutationComment Bien GéRer Son E RéPutation
Comment Bien GéRer Son E RéPutation
 
Lean startup camping
Lean startup campingLean startup camping
Lean startup camping
 
Onopia - Quels Outils pour un Business Model Innovant
Onopia  - Quels Outils pour un Business Model InnovantOnopia  - Quels Outils pour un Business Model Innovant
Onopia - Quels Outils pour un Business Model Innovant
 
Growth Hacking B2B - Humind - Oct2018
Growth Hacking B2B - Humind - Oct2018Growth Hacking B2B - Humind - Oct2018
Growth Hacking B2B - Humind - Oct2018
 
Webinaire Emarsys : De la Connaissance Client au Marketing Prédictif
Webinaire Emarsys : De la Connaissance Client au Marketing PrédictifWebinaire Emarsys : De la Connaissance Client au Marketing Prédictif
Webinaire Emarsys : De la Connaissance Client au Marketing Prédictif
 
20150723 pitch 10 minutes kedge nursery ss
20150723 pitch 10 minutes kedge nursery ss20150723 pitch 10 minutes kedge nursery ss
20150723 pitch 10 minutes kedge nursery ss
 
Blog professionnel - conférence Osereso
Blog professionnel - conférence OseresoBlog professionnel - conférence Osereso
Blog professionnel - conférence Osereso
 
Comprendre le business model canvas. 15marches.fr
Comprendre le business model canvas. 15marches.frComprendre le business model canvas. 15marches.fr
Comprendre le business model canvas. 15marches.fr
 
Comment fidéliser et augmenter vos ventes grâce à l'emailing ?
Comment fidéliser et augmenter vos ventes grâce à l'emailing ?Comment fidéliser et augmenter vos ventes grâce à l'emailing ?
Comment fidéliser et augmenter vos ventes grâce à l'emailing ?
 

Plus de Jedha Bootcamp

Plus de Jedha Bootcamp (20)

DataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdfDataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdf
 
L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x KardinalL'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
 
Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5
 
Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1
 
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1
 
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackConstruction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
 
Slide portes ouvertes
Slide portes ouvertesSlide portes ouvertes
Slide portes ouvertes
 
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
 
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzEstimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
 
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliTrouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
 
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliOptimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
 
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotReconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
 
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossEstimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
 
Workshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisWorkshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha Paris
 
Les applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonLes applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha Lyon
 
Optimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceOptimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data Science
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessi
 
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
 
Automatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoAutomatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéo
 
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
 

Quelles start-ups recommander aux grands groupes ?

  • 1. PROJET DE DATA SCIENCE JUILLET 2019 – Emmanuelle Guyot QUELLES STARTUPS RECOMMANDER AUX GRANDS GROUPES ?
  • 2. CONSTAT LES GRANDS GROUPES DÉPENSENT DES MILLIONS POUR INNOVER… …SANS FORCÉMENT Y ARRIVER
  • 5. PROBLÈME Comment recommander plus facilement aux grands groupes des startups innovantes qui pourraient les intéresser ? Vous allez surement aimer… Ces recommandations sont inspirées de votre historique de startups consultées et suivies.
  • 6. SIMPLIFICATION DU PROBLÈME POUR LE PROJET • Problème de timing pour avoir les données sur les grands groupes à temps (uniquement celles sur les startups) • Transformation de l’objectif : pour une startup donnée, recommander des clients (grands groupes)
  • 7. DONNÉES DISPONIBLES :  800 startups 1 ligne = 1 startup avec 6 attributs, dont ses clients
  • 8. DONNÉES DISPONIBLES :  800 startups 1 ligne = 1 startup avec 6 attributs, dont ses clients DÉMARCHE Objectif : pour des tags donnés, trouver des startups similaires et recommander leurs clients Démarche : • Créer un tableau avec en ligne les startups, et en colonnes les tags • Mettre des 0 et des 1 aux intersections selon que la startup possède ou nonce tag • Pour une nouvelle liste de tags donnée, faire le produit scalaire avec chaque ligne de ce tableau pour en ressortir les startups semblables • Retourner les clients de ces startups
  • 9. Etape 1 : cleaner les tags Créer une fonction qui : • clean les tags • les sépare • les mets en minuscule • les ajoute à une liste col_tags devient la colonne « propre » des tags
  • 10. Etape 1 : cleaner les tags Avant Après
  • 11. Etape 2 : supprimer les startups qui n’ont pas de clients Créer une autre colonne de tags où les startups qui n’ont pas de clients sont supprimées Créer une liste des tags (uniques) que l’on utilisera pour créer les colonnes du tableau Etape 3 : supprimer les tags en doublon
  • 12. Etape 3 : supprimer les tags en doublon s : l :
  • 13. Etape 4 : populer le tableau colonne par colonne • Créer chaque colonne en prenant un par un les tags de la liste • Ligne par ligne, ajouter un 0 si la startup ne possède pas ce tag, ou un 1 si elle le possède • Créer le tableau
  • 14. Etape 4 : populer le tableau colonne par colonne (Plus de 400 colonnes)
  • 15. Etape 5 : comparer des tags aux startups de la base et retourner les clients les plus pertinents • Créer une fonction qui prend en argument une liste de tags • Traduire ces tags en liste de 0 et 1 • Faire le produit scalaire entre cette liste et chaque ligne du tableau des startups • Créer une colonne « Similarity » qui enregistre le résultat du produit scalaire • Retourner les 10 startups qui ont le plus grand produit scalaire avec les tags d’entrée, accompagnées de la liste de leurs clients
  • 16. Etape 5 : comparer des tags aux startups de la base et retourner les clients des startups similaires Recommandation de clients : Vérification de la similarité :
  • 17. Etape 5 : comparer des tags aux startups de la base et retourner les clients des startups similaires Recommandation de clients : Vérification de la similarité :
  • 18. PROCHAINES ÉTAPES • Faire le même travail « dans l’autre sens » pour recommander des startups aux grands groupes • Ajouter au système de recommandation les autres informations disponibles (secteur, intérêt, technologie, fonds levés…) • Intégrer les recos au site de Forinov et les automatiser pour proposer des résultats exploitables directement par leurs clients