1
BIGDATAPARIS:VERTEEGODATASUITEOFFICIALLAUNCH
UNDERSTAND TODAY. KNOW TOMORROW.
jeremy.fain@verteego.com
+33(0)1 47 70 08 90
+33(0) 6 99 32 98 99
LANCEMENT
VERTEEGO
DATA SUITE 1.0
BOÎTE A OUTILS DE DATA SCIENCE
Mardi 7 mars 2017, 12h30-13h00
Big Data Paris, Salle A
Palais des Congrès, Paris 17ème arr.
France
22
VOS INTERVENANTS
Mehdi EL BRINI
Lead R&D engineer, Verteego
@elbrinidiary
Jeremy FAIN
Head of Growth, Verteego
@jeremy_fain
33
12:30
PROGRAMME
PRESENTATION DES INTERVENANTS & PROGRAMME
12:35
1- Raison d’être
2- Utilité
3- Pour qui ?
4- Ce que n’est pas la Verteego Data Suite
5- Composants intégrés dans la Verteego Data Suite
6- Services
VERTEEGO DATA SUITE : POSITIONNEMENT ET CHOIX TECHNOLOGIQUES
12:45
1- Arriver jusqu’à la page GitHub
2- Sur la Google Cloud Platform
3- Sur vos machines UNIX
INSTALLER LA VERTEEGO DATA SUITE : MODE D’EMPLOI
12:55 QUESTIONS
44
RAISON D’ÊTRE DE LA VERTEEGO DATA SUITE
555
La premièreet la seule suite logicielle pour data scientists…
…100% Gratuite
« En téléchargement libre »
…100% Open source
« Pas une boîte noire »
…100% Rassurante
« Composée de modules leaders mondiaux uniquement »
66
QU’EST-CE QUE LA VERTEEGO DATA SUITE ?
77
UNE SUITE DE DATASCIENCETOUT LE LONG DE LA CHAÎNE DE LA DATA
ORCHESTRATION DES
FLUX DE DONNEES
NETTOYAGE
AUTOMATIQUE
ANALYSES & DATAVIZ PREDICTIF
SCRIPTING
88
POUR QUI LA VERTEEGO DATA SUITE ?
99
A QUI S’ADRESSELA VERTEEGODATASUITE
Utilisateurs
Plutôt profils
développeurs !
ou statisticiens
qui savent
scripter
Objectifs
Pour une
efficacité
maximale
Contexte
Pour les PoCs
comme pour la
production
1010
CE QUE LA VERTEEGO DATA SUITE N’EST PAS
1111
LA VERTEEGODATASUITE N’EST PAS UNE DISTRIBUTION DE HADOOP
1212
CHOIX TECHNOLOGIQUES
13
Interconnectez vos applications et lancez
des workflows de traitement
automatisés
ORCHESTRATION DE FLUX DE DONNEES
Scriptez en Python, en R, en Bash ou en tout
autre langage de votre choix pour réaliser
vos PoC d’intelligence artificielle
NOTEBOOKS DE SCRIPTING
Expliquez à la machine quelles routines
appliquer pour nettoyer vos corpus de
données
NETTOYEZ AUTOMATIQUEMENT
VOS DONNEES
Créez et appliquez des modèles prédictifs
sur vos flux de données
JUSQU’AU PREDICTIF
Explorez vos données, créez des tableaux
de bord pour les décrire, et partagez-les à
qui bon vous semble
ANALYSES ET DATAVIZ
14
Interconnectez vos applications et lancez
des workflows de traitement automatisés
ORCHESTRATION DE FLUX DE DONNEES
Scriptez en Python, en R, en Bash ou en tout
autre langage de votre choix pour réaliser
vos PoC d’intelligence artificielle
NOTEBOOKS DE SCRIPTING
Expliquez à la machine quelles routines
appliquer pour nettoyer vos corpus de
données
NETTOYEZ AUTOMATIQUEMENT
VOS DONNEES
Créez et appliquez des modèles prédictifs
sur vos flux de données
JUSQU’AU PREDICTIF
Explorez vos données, créez des tableaux
de bord pour les décrire, et partagez-les à
qui bon vous semble
ANALYSES ET DATAVIZ
15
Interconnectez vos applications et lancez
des workflows de traitement automatisés
ORCHESTRATION DE FLUX DE DONNEES
Scriptez en Python, en R, en Bash ou en tout
autre langage de votre choix pour réaliser
vos PoC d’intelligence artificielle
NOTEBOOKS DE SCRIPTING
Expliquez à la machine quelles routines
appliquer pour nettoyer vos corpus de
données
NETTOYEZ AUTOMATIQUEMENT
VOS DONNEES
Créez et appliquez des modèles prédictifs
sur vos flux de données
JUSQU’AU PREDICTIF
Explorez vos données, créez des tableaux
de bord pour les décrire, et partagez-les à
qui bon vous semble
ANALYSES ET DATAVIZ
MEHDI HELP STP.
16
Interconnectez vos applications et lancez
des workflows de traitement automatisés
ORCHESTRATION DE FLUX DE DONNEES
Scriptez en Python, en R, en Bash ou en tout
autre langage de votre choix pour réaliser
vos PoC d’intelligence artificielle
NOTEBOOKS DE SCRIPTING
Expliquez à la machine quelles routines
appliquer pour nettoyer vos corpus de
données
NETTOYEZ AUTOMATIQUEMENT
VOS DONNEES
Créez et appliquez des modèles prédictifs
sur vos flux de données
JUSQU’AU PREDICTIF
Explorez vos données, créez des tableaux
de bord pour les décrire, et partagez-les à
qui bon vous semble
ANALYSES ET DATAVIZ
17
Interconnectez vos applications et lancez
des workflows de traitement automatisés
ORCHESTRATION DE FLUX DE DONNEES
Scriptez en Python, en R, en Bash ou en tout
autre langage de votre choix pour réaliser
vos PoC d’intelligence artificielle
NOTEBOOKS DE SCRIPTING
Expliquez à la machine quelles routines
appliquer pour nettoyer vos corpus de
données
NETTOYEZ AUTOMATIQUEMENT
VOS DONNEES
Créez et appliquez des modèles prédictifs
sur vos flux de données
JUSQU’AU PREDICTIF
Explorez vos données, créez des tableaux
de bord pour les décrire, et partagez-les à
qui bon vous semble
ANALYSES ET DATAVIZ
1818
UNE SUITE DE DATASCIENCETOUT LE LONG DE LA CHAÎNE DE LA DATA
ORCHESTRATION DES
FLUX DE DONNEES
NETTOYAGE
AUTOMATIQUE
ANALYSES & DATAVIZ PREDICTIF
SCRIPTING
1919
ET LA PATTE VERTEEGO DANS TOUT CA ?
Interface
Utilisateurs
homogène
Programme
d’installation unifié,
documenté,
simple, rapide et
personnalisable
Mais aussi :
- La veille technologique en continu
- La « plomberie »
ex. connecteur NiFi - OpenRefine
2020
CHOIX TECHNOS, UI HOMOGENE, INSTALLATION UNIFIEE, « PLOMBERIE », COMMUNAUTE
UNE SUITE DE DATASCIENCETOUT LE LONG DE LA CHAÎNE DE LA DATA
ORCHESTRATION DES
FLUX DE DONNEES
NETTOYAGE
AUTOMATIQUE
ANALYSES & DATAVIZ PREDICTIF
SCRIPTING
2121
SERVICES
2222
Le logiciel est gratuit, les services sontpayants
• Intra-entreprise
ou
• Des sessions
organisées chez
Verteego (à Paris)
mêlant des
participants de tous
horizons
Ex. de tarifs de support
par email
exclusivement :
• 100€ H.T. / mois /
utilisateur pour
jusqu’à 5 questions
• 500€ H.T. / mois /
utilisateur pour un
nombre illimité de
questions
• Clouds publics :
Google Cloud
Platform, AWS, MS
Azure
• Clouds privés :
Outscale, OVH,…
HEBERGEMENT
FORMATION SUPPORT
La Verteego Data Suite 1.0 est 100% Open Source, 100% Gratuite, 100% Composée de modules leaders mondiaux chez les Data Scientists
2323
OÙ TROUVER LA VERTEEGO DATA SUITE ?
2424
2525
2626
2727
2828
OÙ INSTALLER LA VERTEEGO DATA SUITE ?
2929
Réponse: OÙ VOUS VOULEZ
1.
Cloud public
2.
Cloud privé
3030
COMMENT INSTALLER LA VERTEEGO DATA SUITE ?
3131
CHAMPAGNE A 13H15 STAND N°106
32
hello@verteego.com
@verteego_FR
33

Verteego Data Suite : support du lancement

  • 1.
    1 BIGDATAPARIS:VERTEEGODATASUITEOFFICIALLAUNCH UNDERSTAND TODAY. KNOWTOMORROW. jeremy.fain@verteego.com +33(0)1 47 70 08 90 +33(0) 6 99 32 98 99 LANCEMENT VERTEEGO DATA SUITE 1.0 BOÎTE A OUTILS DE DATA SCIENCE Mardi 7 mars 2017, 12h30-13h00 Big Data Paris, Salle A Palais des Congrès, Paris 17ème arr. France
  • 2.
    22 VOS INTERVENANTS Mehdi ELBRINI Lead R&D engineer, Verteego @elbrinidiary Jeremy FAIN Head of Growth, Verteego @jeremy_fain
  • 3.
    33 12:30 PROGRAMME PRESENTATION DES INTERVENANTS& PROGRAMME 12:35 1- Raison d’être 2- Utilité 3- Pour qui ? 4- Ce que n’est pas la Verteego Data Suite 5- Composants intégrés dans la Verteego Data Suite 6- Services VERTEEGO DATA SUITE : POSITIONNEMENT ET CHOIX TECHNOLOGIQUES 12:45 1- Arriver jusqu’à la page GitHub 2- Sur la Google Cloud Platform 3- Sur vos machines UNIX INSTALLER LA VERTEEGO DATA SUITE : MODE D’EMPLOI 12:55 QUESTIONS
  • 4.
    44 RAISON D’ÊTRE DELA VERTEEGO DATA SUITE
  • 5.
    555 La premièreet laseule suite logicielle pour data scientists… …100% Gratuite « En téléchargement libre » …100% Open source « Pas une boîte noire » …100% Rassurante « Composée de modules leaders mondiaux uniquement »
  • 6.
    66 QU’EST-CE QUE LAVERTEEGO DATA SUITE ?
  • 7.
    77 UNE SUITE DEDATASCIENCETOUT LE LONG DE LA CHAÎNE DE LA DATA ORCHESTRATION DES FLUX DE DONNEES NETTOYAGE AUTOMATIQUE ANALYSES & DATAVIZ PREDICTIF SCRIPTING
  • 8.
    88 POUR QUI LAVERTEEGO DATA SUITE ?
  • 9.
    99 A QUI S’ADRESSELAVERTEEGODATASUITE Utilisateurs Plutôt profils développeurs ! ou statisticiens qui savent scripter Objectifs Pour une efficacité maximale Contexte Pour les PoCs comme pour la production
  • 10.
    1010 CE QUE LAVERTEEGO DATA SUITE N’EST PAS
  • 11.
    1111 LA VERTEEGODATASUITE N’ESTPAS UNE DISTRIBUTION DE HADOOP
  • 12.
  • 13.
    13 Interconnectez vos applicationset lancez des workflows de traitement automatisés ORCHESTRATION DE FLUX DE DONNEES Scriptez en Python, en R, en Bash ou en tout autre langage de votre choix pour réaliser vos PoC d’intelligence artificielle NOTEBOOKS DE SCRIPTING Expliquez à la machine quelles routines appliquer pour nettoyer vos corpus de données NETTOYEZ AUTOMATIQUEMENT VOS DONNEES Créez et appliquez des modèles prédictifs sur vos flux de données JUSQU’AU PREDICTIF Explorez vos données, créez des tableaux de bord pour les décrire, et partagez-les à qui bon vous semble ANALYSES ET DATAVIZ
  • 14.
    14 Interconnectez vos applicationset lancez des workflows de traitement automatisés ORCHESTRATION DE FLUX DE DONNEES Scriptez en Python, en R, en Bash ou en tout autre langage de votre choix pour réaliser vos PoC d’intelligence artificielle NOTEBOOKS DE SCRIPTING Expliquez à la machine quelles routines appliquer pour nettoyer vos corpus de données NETTOYEZ AUTOMATIQUEMENT VOS DONNEES Créez et appliquez des modèles prédictifs sur vos flux de données JUSQU’AU PREDICTIF Explorez vos données, créez des tableaux de bord pour les décrire, et partagez-les à qui bon vous semble ANALYSES ET DATAVIZ
  • 15.
    15 Interconnectez vos applicationset lancez des workflows de traitement automatisés ORCHESTRATION DE FLUX DE DONNEES Scriptez en Python, en R, en Bash ou en tout autre langage de votre choix pour réaliser vos PoC d’intelligence artificielle NOTEBOOKS DE SCRIPTING Expliquez à la machine quelles routines appliquer pour nettoyer vos corpus de données NETTOYEZ AUTOMATIQUEMENT VOS DONNEES Créez et appliquez des modèles prédictifs sur vos flux de données JUSQU’AU PREDICTIF Explorez vos données, créez des tableaux de bord pour les décrire, et partagez-les à qui bon vous semble ANALYSES ET DATAVIZ MEHDI HELP STP.
  • 16.
    16 Interconnectez vos applicationset lancez des workflows de traitement automatisés ORCHESTRATION DE FLUX DE DONNEES Scriptez en Python, en R, en Bash ou en tout autre langage de votre choix pour réaliser vos PoC d’intelligence artificielle NOTEBOOKS DE SCRIPTING Expliquez à la machine quelles routines appliquer pour nettoyer vos corpus de données NETTOYEZ AUTOMATIQUEMENT VOS DONNEES Créez et appliquez des modèles prédictifs sur vos flux de données JUSQU’AU PREDICTIF Explorez vos données, créez des tableaux de bord pour les décrire, et partagez-les à qui bon vous semble ANALYSES ET DATAVIZ
  • 17.
    17 Interconnectez vos applicationset lancez des workflows de traitement automatisés ORCHESTRATION DE FLUX DE DONNEES Scriptez en Python, en R, en Bash ou en tout autre langage de votre choix pour réaliser vos PoC d’intelligence artificielle NOTEBOOKS DE SCRIPTING Expliquez à la machine quelles routines appliquer pour nettoyer vos corpus de données NETTOYEZ AUTOMATIQUEMENT VOS DONNEES Créez et appliquez des modèles prédictifs sur vos flux de données JUSQU’AU PREDICTIF Explorez vos données, créez des tableaux de bord pour les décrire, et partagez-les à qui bon vous semble ANALYSES ET DATAVIZ
  • 18.
    1818 UNE SUITE DEDATASCIENCETOUT LE LONG DE LA CHAÎNE DE LA DATA ORCHESTRATION DES FLUX DE DONNEES NETTOYAGE AUTOMATIQUE ANALYSES & DATAVIZ PREDICTIF SCRIPTING
  • 19.
    1919 ET LA PATTEVERTEEGO DANS TOUT CA ? Interface Utilisateurs homogène Programme d’installation unifié, documenté, simple, rapide et personnalisable Mais aussi : - La veille technologique en continu - La « plomberie » ex. connecteur NiFi - OpenRefine
  • 20.
    2020 CHOIX TECHNOS, UIHOMOGENE, INSTALLATION UNIFIEE, « PLOMBERIE », COMMUNAUTE UNE SUITE DE DATASCIENCETOUT LE LONG DE LA CHAÎNE DE LA DATA ORCHESTRATION DES FLUX DE DONNEES NETTOYAGE AUTOMATIQUE ANALYSES & DATAVIZ PREDICTIF SCRIPTING
  • 21.
  • 22.
    2222 Le logiciel estgratuit, les services sontpayants • Intra-entreprise ou • Des sessions organisées chez Verteego (à Paris) mêlant des participants de tous horizons Ex. de tarifs de support par email exclusivement : • 100€ H.T. / mois / utilisateur pour jusqu’à 5 questions • 500€ H.T. / mois / utilisateur pour un nombre illimité de questions • Clouds publics : Google Cloud Platform, AWS, MS Azure • Clouds privés : Outscale, OVH,… HEBERGEMENT FORMATION SUPPORT La Verteego Data Suite 1.0 est 100% Open Source, 100% Gratuite, 100% Composée de modules leaders mondiaux chez les Data Scientists
  • 23.
    2323 OÙ TROUVER LAVERTEEGO DATA SUITE ?
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
    2828 OÙ INSTALLER LAVERTEEGO DATA SUITE ?
  • 29.
    2929 Réponse: OÙ VOUSVOULEZ 1. Cloud public 2. Cloud privé
  • 30.
    3030 COMMENT INSTALLER LAVERTEEGO DATA SUITE ?
  • 31.
  • 32.
  • 33.