SlideShare une entreprise Scribd logo
1
Offre « Data Science »
Fournir les moyens de valoriser les données de l’entreprise
2
1. Présentation EXL Group
2. Le Big Data en bref
3. Quelques projets Big Data
4. Notre vision Data Science
5. Notre offre
6. Nos références
EXL GROUP - Tout droits réservés
3
Présentation EXL Group
1.1 EXL Group : un groupe aux expertises multiples
300collaborateurs
5agences
régionales
Un multi-spécialiste du système d’Informations, créé en 2008
(M€)
2011
13,5
2012
21
2013
28
34
2014
150Comptes actifs
EXL GROUP - Tout droits réservés
4
Le Big Data en bref
2.1 De nouveaux moyens pour valoriser vos données
 Des données
internes/externes,
structurée/non structurées
Variété
Volume
Vitesse
 Une offre logicielle vaste et
innovante, Open
source/acteurs BI
historiques
 De nouveaux besoins métier
EXL GROUP - Tout droits réservés
5
Le Big Data en bref
2.2 Une évolution apportée sur 3 axes majeurs
Données : Enrichissement des données exploitées
Stockage : Optimisation des processus et traitements existants, réduction des coûts
Analyse : Fiabilisation et amélioration des indicateurs calculés et des modèles développés
 Structurées et homogènes
 Sources internes
 Volumétrie contrôlée
 Non structurées et hétérogènes
 Sources externes
 Volumétrie scalable
BI Classique Big Data
 Entrepôt de données (Datawarehouse)
 Serveurs physiques internes
 Modélisation en étoile ou en flocon
 Statistiques descriptives
 Requêtage par ligne/individu
 Algorithmes prédictifs développés par
des « Data Analyst »
 Distribué sur un cluster Hadoop (HDFS)
 Cloud computing
 Traitement parallèle : MapReduce
 Statistiques inférentielles
 Requêtage par colonne/objet
 Nouveaux algorithmes développés par des
« Data Scientist »
EXL GROUP - Tout droits réservés
6
Le Big Data en bref
2.3 Traiter diverses problématiques à travers la Data Science
Marketing Contrôle DSI
Energie
Données de compteurs nouvelle
génération et facteurs climatiques
pour prédire les consommations
en temps réel
Données de réseaux sociaux afin
de prévoir les pics de
consommation évènementiels
Bénéficier du calcul distribué pour
optimiser les temps de traitement
Transports
Données de capteurs, bornes Wifi
et traces GSM pour une meilleure
connaissance du trafic
Données vidéo pour la lutte
contre la fraude
Réduire les coûts en stockant sur
une même plateforme tous types
de données
Banques &
Assurances
Un meilleur profiling des clients :
fidélisation et rétention via
l’analyse des retours clients (sms,
mails, forums, …)
Analyser les comportement clients
sur le net afin d’identifier les
risques de Fraude, découverts, …
Requêter et traiter rapidement des
volumes importants de données
transactionnelles
Télécom
Données des réseaux sociaux
pour proposer aux clients de
nouvelles offres optimales : one to
one marketing
Analyser et mettre à jour les
données CRM en temps réel
Ces exemples ne représentent pas une liste exhaustive. L’imagination est le plus
grand incubateur de projets Big Data !!
EXL GROUP - Tout droits réservés
7
Quelques projets Big Data
3.1 BANQUE ASSURANCE : Crédit Mutuel ARKEA
• Lutte anti-blanchiment : 6 mois d'historique traité en moins de 20 secondes
• Ratios de solvabilité : le traitement prenait 48 Heures sur un échantillon de clients
 Résultat sur toute la base, en moins de 15 minutes
• Analyse des zones de saisie libre dans les formulaires
• Prospection ciblée : l’analyse des logs, parcours web … croisée avec la détention
 Assurer la promotion des produits / services vers les bons prospects
• Banque de détail : usuellement l'historique des comptes était de 3 à 5 mois
 Historique pour tous les clients depuis mai 2001 (des milliards de données)
EXL GROUP - Tout droits réservés
8
Quelques projets Big Data
3.2 TRANSPORT et LOGISTIQUE : Port d’Hambourg
• Des ponts mobiles adaptés au trafic : l’ouverture des ponts dépendait d’un
calendrier fixe inadapté au trafic réel
 Ouverture uniquement lorsque les navires passent
• Identification des défauts ou des pannes : la réparation rapide ou même
préventive permet d’éviter le ralentissement de l'activité
• Police et douane : le poids des charges prévu comparé au réel permet de
détecter le transport de marchandises illégales
• Service aux utilisateurs : les données de localisation permettent d’informer les
utilisateurs des retards, des espaces de stationnement disponibles …
EXL GROUP - Tout droits réservés
9
Quelques projets Big Data
3.3 Ils ont également fait appel au Big Data
• Energie : Les compteurs Linky
Des compteurs nouvelle génération avec des relevés de consommation
réelle transmis toutes les 15 minutes
Des courbes de charge actualisées en quasi-temps réel
Optimisation des coûts et des volumes achetés par rapport au consommé
• Loisirs et Multimédia :
La plateforme de vidéos en continu « Netflix » a développé un algorithme
prédictif pour suggérer aux utilisateurs des films et séries adaptées
Lors de la coupe du monde 2014, l’équipe nationale d’Allemagne a placé
des capteurs sur ses joueurs afin d’optimiser leur entraînement
EXL GROUP - Tout droits réservés
10
Notre vision Data Science
4.1 Enrichir le patrimoine de données existant
Exploiter de nouveaux types de données internes/externes, structurées/non structurées
Réseaux sociaux
Média
Objets / capteurs
connectés
Mails
Pages Web
Open
data
Pourquoi ?
• Contrôler les données en
téléchargement libre
• Maîtriser la communication
externe à l’entreprise
• Améliorer les indicateurs et
modèles existants : scoring,
détection de fraude, …
• Optimiser ses offres : one-to-
one marketing, profiling
temps réel, …
Comment ?
• Identifier et contractualiser :
Réseaux sociaux, start-up,
data brokers, opérateurs
mobiles …
• Qualifier : statistiques
descriptives ou inférentielles,
corrélations, valeurs
aberrantes, panels, …
• Stocker : identifier scénarios
pour un stockage industriel
(Hadoop, serveur classique,
Cloud, …)
EXL GROUP - Tout droits réservés
11
Notre vision Data Science
4.2 Scalabilité et temps réel
Bénéficier de la force d’une architecture Big Data, via sa capacité à allier le stockage physique
parallèle des données à leur traitement parallèle en mémoire
Pourquoi ?
• Etre indépendant du volume
et de la structure des
données
• Calculer des indicateurs en
temps réel
• Réduire les temps de
requêtes et de traitement de
données volumineuses :
transactions fines, historique
important …
• Mutualiser les coûts de
stockage et d’exploitation
Comment ?
• Identifier l’apport du
MapReduce : algorithmes et
traitements à paralléliser
• Définir les fréquences
souhaitées et réalisables de
rafraîchissement des
indicateurs
• Lister des applications
pouvant être mutualisées
Cluster Hadoop
EXL GROUP - Tout droits réservés
12
Notre vision Data Science
4.3 De nouveaux moyens pour explorer et analyser la donnée
Une offre logicielle Open source ou fournie par les éditeurs historiques, pour développer de
puissants algorithmes
Pourquoi ?
• Algorithmes classiques Data
mining : Adaptation et
optimisation
• Machine learning : des
algorithmes puissants
adaptés au calcul distribué
• Nouveaux algorithmes : pour
de nouveaux types de
données
Comment ?
• Classification descriptive :
ACP, ACM, ACF, CAH, K-
means, Kohonen, …
• Prévision : ARIMA, lissage
exponentiel, régression
logistique et linéaire
• Machine learning : réseaux de
neurone (perceptron),
Bootstrap, algorithmes
génétiques, …
• Optimisation combinatoire,
théorie des graphes
• Analyse de sentiments (SNA),
web analytics, texte mining,
taxonomie automatisée, …
EXL GROUP - Tout droits réservés
13
Notre vision Data Science
4.4 Une approche innovante orientée métier
Au travers de son offre Data Science, EXL GROUP vous accompagne dans
l’exploitation et la valorisation de vos données via le déploiement de projets Big Data
d’un point de vue métier :
 Le Big Data ne se restreint pas à l’exploitation de gros volumes de données ou
à une plateforme Hadoop
 Identifier des traitements et modèles à optimiser grâce au Big Data
 Faire évoluer des projets existants en projets Big Data
 Mettre en place de nouveaux algorithmes efficaces, exploitables en mode
industriel
 Mettre à disposition des profils alliant des compétences en : mathématiques
appliquées, programmation et technologies Hadoop
EXL GROUP - Tout droits réservés
14
Notre offre
5.1 Des connaissances mathématiques associées à une expertise technique
R, SAS, SPSS, Python
MapReduce
Java, C++, …
Algorithmique Programmation
EXL group vous accompagne lors de vos projets Big Data avec des équipes de
« Data Scientists » alliant l’expertise technique aux connaissances
mathématiques, dans un écosystème Hadoop
Classification, Prévision, Machine
learning, Optimisation combinatoire,
Théorie des graphes, Analyse de
sentiments, Web analytics, Taxonomie
automatisée, Analyse sémantique, Text
mining, …
Hadoop
Statistiques : Spark, Mahout, RHadoop
Requêteurs : Hive, Impala, Pig, Sqoop
Bases NoSQL : HBase, Cassandra,
MongoDB, Oracle NoSQL, …
EXL GROUP - Tout droits réservés
15
Notre offre
5.2 Une démarche projet en mode itératif
Initier une démarche
Big Data
Assistance à la mise
en œuvre
Déploiement et
formation
• Disposez-vous de données
suffisantes pour couvrir tout
votre périmètre d’analyse ?
• Quels sont les processus et
modèles existants
susceptibles d’être optimisés
?
• Quelles sont les applications
pouvant être mutualisées
grâce à une infrastructure
Big Data ?
• Quelles données pour
enrichir votre patrimoine et
comment les récolter ?
• Comment exploiter, qualifier
et maîtriser ses données ?
• Quelle est la meilleure
solution pour explorer et
restituer les résultats ?
• Comment industrialiser la
récolte de données ?
• Quels algorithmes peuvent
être déployés ?
• Quels utilisateurs à former et
sur quel périmètre ?
EXL GROUP vous accompagne pour valoriser vos données, identifier de nouvelles sources et les
exploiter via la mise en place d’algorithmes performants dans une démarche itérative :
EXL GROUP - Tout droits réservés
Pilotage de projet
16
Notre offre
5.3 Initier une démarche Big Data
Initier une démarche
Assistance à la mise
en œuvre
Déploiement et
formation
•Identification du
potentiel Big Data dans
l’entreprise
•Cadrage d’un projet Big
Data identifié
De 1 à 5 ateliers, selon le
niveau de maturité du
besoin, avec les thèmes :
• Prise de contexte et
présentation Data Science
• Processus métier
• Architecture SI
• Datamining
• Focus sur un ou plusieurs
projets
•Compte-rendu des
différents ateliers
•Note de cadrage
EXL GROUP - Tout droits réservés
Pilotage de projet
Missions Déroulement Livrables type
17
Notre offre
5.4 Assistance à la mise en œuvre
Initier une démarche
Assistance à la mise
en œuvre
Déploiement et
formation
•Collecte et qualification
de nouvelles sources
•Réalisation de POC
•Préparation de
Hackathon
•Benchmark de solutions
•Benchmark de modèles
Collecte :
• Contractualisation de
fournisseurs
• Définition de la solution
• Suivi et qualification des
résultats : statistiques,
restitutions, …
POC et Hackathon :
• Définition du périmètre et de
jeux de données anonymisés
• Comparaison des résultats
Benchmarks :
• Modélisation
• Programmation sous R, SAS, …
•Rapports : potentiel des
données, comparaison
avec l’existant, …
•Datavisualisation
•Spécifications
fonctionnelles
•Programmes
développés
EXL GROUP - Tout droits réservés
Pilotage de projet
Missions Déroulement Livrables type
18
Notre offre
5.5 Déploiement, formation et pilotage
Initier une démarche
Assistance à la mise
en œuvre
Déploiement et
formation
• Industrialisation de la
collecte de données
• Industrialisation
d’algorithmes prédictifs
• Conduite du changement
• Formation des utilisateurs
• Assistance des directions
métiers et SI dans le suivi
et la gouvernance
•Développement et
sélection d’algorithme
•Cadrage de la solution
industrielle
•Définition de la stratégie
de déploiement
•Assurer l’autonomie des
utilisateurs
•Documentation des
modèles
•Cahier des charges
•Stratégie et plan de
formation
•Supports de formation
•Supports et compte-
rendu d’instances projet
EXL GROUP - Tout droits réservés
Pilotage de projet
Missions Déroulement Livrables type
19
Nos références
6.1 Nos références Data Science
CAP’TN : Qualification, restitution et industrialisation de la récolte de données issues de capteurs
innovants et d’objets connectés.
COMOB : Accompagnement AMOA pour la récolte de données et la définition d’une solution
industrielle cible sur un cluster Hadoop (Distribution Hortonworks), dans le cadre de la mise en place
d’un outil de data visualisation et pilotage temps-réel.
POC : Accompagnement de la DSI de l’infrastructure pour le POC d’un projet Big Data en
partenariat avec la direction de l’innovation (stockage et traitement de photographies des voies au
centimètre près prises par un train à chaque passage – solution MAP-R).
Portail Culture Versailles : projet de recherche fédérée parmi 1 million de fiches provenant de SI
différents (Bibliothèque, Musée, Archives et site portail)
http://versailles.demo4u.net
ONISEP : Assistance à maitrise d’ouvrage pour un projet de création d’un entrepôt de données
sémantique (Web Sémantique)
PRESSTALIS : Réalisation d’une base de connaissance
EXL GROUP : Réalisation d’un Wiki avec une recherche instantanée
Open Data : Conception d’une application d’exposition de la donnée en open data
EXL GROUP - Tout droits réservés

Contenu connexe

Tendances

Matinée 01 Big Data
Matinée 01 Big DataMatinée 01 Big Data
Matinée 01 Big Data
Evenements01
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
Vincent de Stoecklin
 
Livre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakes
Converteo
 
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
Jean-Pierre Riehl
 
Technologies pour le Big Data
Technologies pour le Big DataTechnologies pour le Big Data
Technologies pour le Big Data
Minyar Sassi Hidri
 
Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018
Converteo
 
Data Visualisation, Business Intelligence et Big Data
Data Visualisation, Business Intelligence et Big DataData Visualisation, Business Intelligence et Big Data
Data Visualisation, Business Intelligence et Big Data
Vincent Lagorce
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
Amal Abid
 
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDIPrésentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDI
HaShem Selmi
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend
Jean-Michel Franco
 
Big Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesBig Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendances
Jean-Michel Franco
 
Livre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceLivre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligence
Hélène Etienne
 
Programme Big Data
Programme Big DataProgramme Big Data
Introduction au BIG DATA
Introduction au BIG DATAIntroduction au BIG DATA
Introduction au BIG DATA
Zakariyaa AIT ELMOUDEN
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013
ADBS
 
Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.
Aleph Technologies
 
La valeur des Big Data sera dans leurs usages
La valeur des Big Data sera dans leurs usagesLa valeur des Big Data sera dans leurs usages
La valeur des Big Data sera dans leurs usages
SAS FRANCE
 
Valtech - Big Data : Détails d’une mise en œuvre
Valtech - Big Data : Détails d’une mise en œuvreValtech - Big Data : Détails d’une mise en œuvre
Valtech - Big Data : Détails d’une mise en œuvre
Valtech
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introduction
Mouna Torjmen
 

Tendances (20)

Matinée 01 Big Data
Matinée 01 Big DataMatinée 01 Big Data
Matinée 01 Big Data
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
 
Livre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakes
 
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
 
Technologies pour le Big Data
Technologies pour le Big DataTechnologies pour le Big Data
Technologies pour le Big Data
 
Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018
 
Data Visualisation, Business Intelligence et Big Data
Data Visualisation, Business Intelligence et Big DataData Visualisation, Business Intelligence et Big Data
Data Visualisation, Business Intelligence et Big Data
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDIPrésentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDI
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend
 
Big Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesBig Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendances
 
I love BIG DATA
I love BIG DATAI love BIG DATA
I love BIG DATA
 
Livre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceLivre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligence
 
Programme Big Data
Programme Big DataProgramme Big Data
Programme Big Data
 
Introduction au BIG DATA
Introduction au BIG DATAIntroduction au BIG DATA
Introduction au BIG DATA
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013
 
Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.
 
La valeur des Big Data sera dans leurs usages
La valeur des Big Data sera dans leurs usagesLa valeur des Big Data sera dans leurs usages
La valeur des Big Data sera dans leurs usages
 
Valtech - Big Data : Détails d’une mise en œuvre
Valtech - Big Data : Détails d’une mise en œuvreValtech - Big Data : Détails d’une mise en œuvre
Valtech - Big Data : Détails d’une mise en œuvre
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introduction
 

En vedette

Presentation Datalab Pays de la Loire
Presentation Datalab Pays de la LoirePresentation Datalab Pays de la Loire
Presentation Datalab Pays de la Loire
Datalab_PDL
 
The DATALAB - building a world-class innovation centre in data science
The DATALAB - building a world-class innovation centre in data scienceThe DATALAB - building a world-class innovation centre in data science
The DATALAB - building a world-class innovation centre in data science
University of Glasgow Research Strategy & Innovation Office
 
Altaide les métiers du numérique, le grand capharnaüm 0316
Altaide les métiers du numérique, le grand capharnaüm 0316Altaide les métiers du numérique, le grand capharnaüm 0316
Altaide les métiers du numérique, le grand capharnaüm 0316
ALTAIDE
 
Altaide : Les nouveaux métiers du Big Data et Cloud Computing
Altaide : Les nouveaux métiers du Big Data et Cloud ComputingAltaide : Les nouveaux métiers du Big Data et Cloud Computing
Altaide : Les nouveaux métiers du Big Data et Cloud Computing
ALTAIDE
 
Hadoop Ecosystème (2013-03) par Affini-Tech
Hadoop Ecosystème (2013-03) par Affini-TechHadoop Ecosystème (2013-03) par Affini-Tech
Hadoop Ecosystème (2013-03) par Affini-Tech
Vincent Heuschling
 
Groupes thematiques Datalab
Groupes thematiques DatalabGroupes thematiques Datalab
Groupes thematiques Datalab
Datalab_PDL
 
Presentation datalab idev at auprès des acteurs culturels
Presentation datalab idev at auprès des acteurs culturelsPresentation datalab idev at auprès des acteurs culturels
Presentation datalab idev at auprès des acteurs culturels
Datalab_PDL
 
Compte-Rendu rencontre du groupe Collectivités du Datalab
Compte-Rendu rencontre du groupe Collectivités du DatalabCompte-Rendu rencontre du groupe Collectivités du Datalab
Compte-Rendu rencontre du groupe Collectivités du Datalab
Datalab_PDL
 
Compte-Rendu rencontre du groupe Energie du Datalab
Compte-Rendu rencontre du groupe Energie du DatalabCompte-Rendu rencontre du groupe Energie du Datalab
Compte-Rendu rencontre du groupe Energie du Datalab
Datalab_PDL
 
Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...
Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...
Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...
Le_GFII
 
Fundamentals of Managing the Data Center Life Cycle for Owners
Fundamentals of Managing the Data Center Life Cycle for OwnersFundamentals of Managing the Data Center Life Cycle for Owners
Fundamentals of Managing the Data Center Life Cycle for Owners
Schneider Electric
 
DeployR: Revolution R Enterprise with Business Intelligence Applications
DeployR: Revolution R Enterprise with Business Intelligence ApplicationsDeployR: Revolution R Enterprise with Business Intelligence Applications
DeployR: Revolution R Enterprise with Business Intelligence Applications
Revolution Analytics
 
Dossier de restitution co-conception Datalab
Dossier de restitution co-conception DatalabDossier de restitution co-conception Datalab
Dossier de restitution co-conception Datalab
Datalab_PDL
 
Realtime Web avec Kafka, Spark et Mesos
Realtime Web avec Kafka, Spark et MesosRealtime Web avec Kafka, Spark et Mesos
Realtime Web avec Kafka, Spark et Mesos
ebiznext
 
Research Data Management
Research Data ManagementResearch Data Management
Research Data Management
Jamie Bisset
 
Qu'est qu'une Data Driven Company à l'heure de la digitalisation ?
Qu'est qu'une Data Driven Company à l'heure de la digitalisation ?Qu'est qu'une Data Driven Company à l'heure de la digitalisation ?
Qu'est qu'une Data Driven Company à l'heure de la digitalisation ?
OCTO Technology Suisse
 
Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...
Antidot
 
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017
Jean-Pierre Riehl
 
Thiga - Notre retour d'expérience sur le Design sprint
Thiga - Notre retour d'expérience sur le Design sprintThiga - Notre retour d'expérience sur le Design sprint
Thiga - Notre retour d'expérience sur le Design sprint
Thiga
 
Introduction à la Data Science l data business
Introduction à la Data Science l data businessIntroduction à la Data Science l data business
Introduction à la Data Science l data business
Vincent de Stoecklin
 

En vedette (20)

Presentation Datalab Pays de la Loire
Presentation Datalab Pays de la LoirePresentation Datalab Pays de la Loire
Presentation Datalab Pays de la Loire
 
The DATALAB - building a world-class innovation centre in data science
The DATALAB - building a world-class innovation centre in data scienceThe DATALAB - building a world-class innovation centre in data science
The DATALAB - building a world-class innovation centre in data science
 
Altaide les métiers du numérique, le grand capharnaüm 0316
Altaide les métiers du numérique, le grand capharnaüm 0316Altaide les métiers du numérique, le grand capharnaüm 0316
Altaide les métiers du numérique, le grand capharnaüm 0316
 
Altaide : Les nouveaux métiers du Big Data et Cloud Computing
Altaide : Les nouveaux métiers du Big Data et Cloud ComputingAltaide : Les nouveaux métiers du Big Data et Cloud Computing
Altaide : Les nouveaux métiers du Big Data et Cloud Computing
 
Hadoop Ecosystème (2013-03) par Affini-Tech
Hadoop Ecosystème (2013-03) par Affini-TechHadoop Ecosystème (2013-03) par Affini-Tech
Hadoop Ecosystème (2013-03) par Affini-Tech
 
Groupes thematiques Datalab
Groupes thematiques DatalabGroupes thematiques Datalab
Groupes thematiques Datalab
 
Presentation datalab idev at auprès des acteurs culturels
Presentation datalab idev at auprès des acteurs culturelsPresentation datalab idev at auprès des acteurs culturels
Presentation datalab idev at auprès des acteurs culturels
 
Compte-Rendu rencontre du groupe Collectivités du Datalab
Compte-Rendu rencontre du groupe Collectivités du DatalabCompte-Rendu rencontre du groupe Collectivités du Datalab
Compte-Rendu rencontre du groupe Collectivités du Datalab
 
Compte-Rendu rencontre du groupe Energie du Datalab
Compte-Rendu rencontre du groupe Energie du DatalabCompte-Rendu rencontre du groupe Energie du Datalab
Compte-Rendu rencontre du groupe Energie du Datalab
 
Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...
Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...
Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...
 
Fundamentals of Managing the Data Center Life Cycle for Owners
Fundamentals of Managing the Data Center Life Cycle for OwnersFundamentals of Managing the Data Center Life Cycle for Owners
Fundamentals of Managing the Data Center Life Cycle for Owners
 
DeployR: Revolution R Enterprise with Business Intelligence Applications
DeployR: Revolution R Enterprise with Business Intelligence ApplicationsDeployR: Revolution R Enterprise with Business Intelligence Applications
DeployR: Revolution R Enterprise with Business Intelligence Applications
 
Dossier de restitution co-conception Datalab
Dossier de restitution co-conception DatalabDossier de restitution co-conception Datalab
Dossier de restitution co-conception Datalab
 
Realtime Web avec Kafka, Spark et Mesos
Realtime Web avec Kafka, Spark et MesosRealtime Web avec Kafka, Spark et Mesos
Realtime Web avec Kafka, Spark et Mesos
 
Research Data Management
Research Data ManagementResearch Data Management
Research Data Management
 
Qu'est qu'une Data Driven Company à l'heure de la digitalisation ?
Qu'est qu'une Data Driven Company à l'heure de la digitalisation ?Qu'est qu'une Data Driven Company à l'heure de la digitalisation ?
Qu'est qu'une Data Driven Company à l'heure de la digitalisation ?
 
Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...
 
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017
 
Thiga - Notre retour d'expérience sur le Design sprint
Thiga - Notre retour d'expérience sur le Design sprintThiga - Notre retour d'expérience sur le Design sprint
Thiga - Notre retour d'expérience sur le Design sprint
 
Introduction à la Data Science l data business
Introduction à la Data Science l data businessIntroduction à la Data Science l data business
Introduction à la Data Science l data business
 

Similaire à EXL Group - Offre Data Science

Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?
Denodo
 
Petit-déjeuner OCTO Technology : Calculez vos indicateurs en temps réel ave...
Petit-déjeuner OCTO Technology :  Calculez vos indicateurs en temps réel ave...Petit-déjeuner OCTO Technology :  Calculez vos indicateurs en temps réel ave...
Petit-déjeuner OCTO Technology : Calculez vos indicateurs en temps réel ave...
OCTO Technology
 
La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4 La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4
OCTO Technology
 
Big data
Big dataBig data
Les technologies big data avec speech commentaries
Les technologies big data avec speech commentariesLes technologies big data avec speech commentaries
Les technologies big data avec speech commentaries
Rima Jamli Faidi
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
Denodo
 
Ecosystème Big Data
Ecosystème Big DataEcosystème Big Data
Ecosystème Big Data
Idriss22
 
Pj hug 07_04_2016
Pj hug 07_04_2016Pj hug 07_04_2016
Pj hug 07_04_2016
Axel TIFRANI
 
Morning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide AcademyMorning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide Academy
Oxalide
 
Vision et poc EDFsur les enjeux big data
Vision et poc EDFsur les enjeux big dataVision et poc EDFsur les enjeux big data
Vision et poc EDFsur les enjeux big data
Bruno Patin
 
Offrir de l'analytique en temps réel en un clic
Offrir de l'analytique en temps réel en un clicOffrir de l'analytique en temps réel en un clic
Offrir de l'analytique en temps réel en un clic
Jean-Michel Franco
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
IBM France Lab
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
Ludovic Piot
 
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft
 
Neo4j - Cas d'usages pour votre métier
Neo4j - Cas d'usages pour votre métierNeo4j - Cas d'usages pour votre métier
Neo4j - Cas d'usages pour votre métier
Neo4j
 
Plateforme DATA HUB / API
Plateforme DATA HUB / APIPlateforme DATA HUB / API
Plateforme DATA HUB / API
Excelerate Systems
 
Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...
Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...
Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...
I MT
 
#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data
NetSecure Day
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
Denodo
 
Introduction au Big data
Introduction au Big data Introduction au Big data
Introduction au Big data
fatimabenjelloun1
 

Similaire à EXL Group - Offre Data Science (20)

Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?
 
Petit-déjeuner OCTO Technology : Calculez vos indicateurs en temps réel ave...
Petit-déjeuner OCTO Technology :  Calculez vos indicateurs en temps réel ave...Petit-déjeuner OCTO Technology :  Calculez vos indicateurs en temps réel ave...
Petit-déjeuner OCTO Technology : Calculez vos indicateurs en temps réel ave...
 
La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4 La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4
 
Big data
Big dataBig data
Big data
 
Les technologies big data avec speech commentaries
Les technologies big data avec speech commentariesLes technologies big data avec speech commentaries
Les technologies big data avec speech commentaries
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
Ecosystème Big Data
Ecosystème Big DataEcosystème Big Data
Ecosystème Big Data
 
Pj hug 07_04_2016
Pj hug 07_04_2016Pj hug 07_04_2016
Pj hug 07_04_2016
 
Morning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide AcademyMorning Tech#1 BigData - Oxalide Academy
Morning Tech#1 BigData - Oxalide Academy
 
Vision et poc EDFsur les enjeux big data
Vision et poc EDFsur les enjeux big dataVision et poc EDFsur les enjeux big data
Vision et poc EDFsur les enjeux big data
 
Offrir de l'analytique en temps réel en un clic
Offrir de l'analytique en temps réel en un clicOffrir de l'analytique en temps réel en un clic
Offrir de l'analytique en temps réel en un clic
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
 
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...
 
Neo4j - Cas d'usages pour votre métier
Neo4j - Cas d'usages pour votre métierNeo4j - Cas d'usages pour votre métier
Neo4j - Cas d'usages pour votre métier
 
Plateforme DATA HUB / API
Plateforme DATA HUB / APIPlateforme DATA HUB / API
Plateforme DATA HUB / API
 
Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...
Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...
Colloque IMT -04/04/2019- L'IA au cœur des mutations industrielles - Introduc...
 
#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
Introduction au Big data
Introduction au Big data Introduction au Big data
Introduction au Big data
 

Dernier

Hotel sindbad, Hammamet Tunisie MENU LES VOILIERS 2024
Hotel sindbad, Hammamet Tunisie MENU LES VOILIERS 2024Hotel sindbad, Hammamet Tunisie MENU LES VOILIERS 2024
Hotel sindbad, Hammamet Tunisie MENU LES VOILIERS 2024
MaachaArbi1
 
Resataurant sindbad hotel Hammamet les voiliers
Resataurant sindbad hotel Hammamet les voiliersResataurant sindbad hotel Hammamet les voiliers
Resataurant sindbad hotel Hammamet les voiliers
rihabkorbi24
 
Présentation techniques de conduite de reunion .pdf
Présentation techniques de conduite de reunion .pdfPrésentation techniques de conduite de reunion .pdf
Présentation techniques de conduite de reunion .pdf
jovigwada
 
présentation de La loi de finance maroc 2024.pdf
présentation de La loi de finance maroc 2024.pdfprésentation de La loi de finance maroc 2024.pdf
présentation de La loi de finance maroc 2024.pdf
mohammedlafrhiri77
 
Ambidextrie Organisationnelle : Leçons de "Lead and Disrupt"
Ambidextrie Organisationnelle : Leçons de "Lead and Disrupt"Ambidextrie Organisationnelle : Leçons de "Lead and Disrupt"
Ambidextrie Organisationnelle : Leçons de "Lead and Disrupt"
mehdielidrissi15
 
Conceptualisation de l'esprit entrepreneurial et identification des facteurs ...
Conceptualisation de l'esprit entrepreneurial et identification des facteurs ...Conceptualisation de l'esprit entrepreneurial et identification des facteurs ...
Conceptualisation de l'esprit entrepreneurial et identification des facteurs ...
ChaimaaChamouaa
 

Dernier (6)

Hotel sindbad, Hammamet Tunisie MENU LES VOILIERS 2024
Hotel sindbad, Hammamet Tunisie MENU LES VOILIERS 2024Hotel sindbad, Hammamet Tunisie MENU LES VOILIERS 2024
Hotel sindbad, Hammamet Tunisie MENU LES VOILIERS 2024
 
Resataurant sindbad hotel Hammamet les voiliers
Resataurant sindbad hotel Hammamet les voiliersResataurant sindbad hotel Hammamet les voiliers
Resataurant sindbad hotel Hammamet les voiliers
 
Présentation techniques de conduite de reunion .pdf
Présentation techniques de conduite de reunion .pdfPrésentation techniques de conduite de reunion .pdf
Présentation techniques de conduite de reunion .pdf
 
présentation de La loi de finance maroc 2024.pdf
présentation de La loi de finance maroc 2024.pdfprésentation de La loi de finance maroc 2024.pdf
présentation de La loi de finance maroc 2024.pdf
 
Ambidextrie Organisationnelle : Leçons de "Lead and Disrupt"
Ambidextrie Organisationnelle : Leçons de "Lead and Disrupt"Ambidextrie Organisationnelle : Leçons de "Lead and Disrupt"
Ambidextrie Organisationnelle : Leçons de "Lead and Disrupt"
 
Conceptualisation de l'esprit entrepreneurial et identification des facteurs ...
Conceptualisation de l'esprit entrepreneurial et identification des facteurs ...Conceptualisation de l'esprit entrepreneurial et identification des facteurs ...
Conceptualisation de l'esprit entrepreneurial et identification des facteurs ...
 

EXL Group - Offre Data Science

  • 1. 1 Offre « Data Science » Fournir les moyens de valoriser les données de l’entreprise
  • 2. 2 1. Présentation EXL Group 2. Le Big Data en bref 3. Quelques projets Big Data 4. Notre vision Data Science 5. Notre offre 6. Nos références EXL GROUP - Tout droits réservés
  • 3. 3 Présentation EXL Group 1.1 EXL Group : un groupe aux expertises multiples 300collaborateurs 5agences régionales Un multi-spécialiste du système d’Informations, créé en 2008 (M€) 2011 13,5 2012 21 2013 28 34 2014 150Comptes actifs EXL GROUP - Tout droits réservés
  • 4. 4 Le Big Data en bref 2.1 De nouveaux moyens pour valoriser vos données  Des données internes/externes, structurée/non structurées Variété Volume Vitesse  Une offre logicielle vaste et innovante, Open source/acteurs BI historiques  De nouveaux besoins métier EXL GROUP - Tout droits réservés
  • 5. 5 Le Big Data en bref 2.2 Une évolution apportée sur 3 axes majeurs Données : Enrichissement des données exploitées Stockage : Optimisation des processus et traitements existants, réduction des coûts Analyse : Fiabilisation et amélioration des indicateurs calculés et des modèles développés  Structurées et homogènes  Sources internes  Volumétrie contrôlée  Non structurées et hétérogènes  Sources externes  Volumétrie scalable BI Classique Big Data  Entrepôt de données (Datawarehouse)  Serveurs physiques internes  Modélisation en étoile ou en flocon  Statistiques descriptives  Requêtage par ligne/individu  Algorithmes prédictifs développés par des « Data Analyst »  Distribué sur un cluster Hadoop (HDFS)  Cloud computing  Traitement parallèle : MapReduce  Statistiques inférentielles  Requêtage par colonne/objet  Nouveaux algorithmes développés par des « Data Scientist » EXL GROUP - Tout droits réservés
  • 6. 6 Le Big Data en bref 2.3 Traiter diverses problématiques à travers la Data Science Marketing Contrôle DSI Energie Données de compteurs nouvelle génération et facteurs climatiques pour prédire les consommations en temps réel Données de réseaux sociaux afin de prévoir les pics de consommation évènementiels Bénéficier du calcul distribué pour optimiser les temps de traitement Transports Données de capteurs, bornes Wifi et traces GSM pour une meilleure connaissance du trafic Données vidéo pour la lutte contre la fraude Réduire les coûts en stockant sur une même plateforme tous types de données Banques & Assurances Un meilleur profiling des clients : fidélisation et rétention via l’analyse des retours clients (sms, mails, forums, …) Analyser les comportement clients sur le net afin d’identifier les risques de Fraude, découverts, … Requêter et traiter rapidement des volumes importants de données transactionnelles Télécom Données des réseaux sociaux pour proposer aux clients de nouvelles offres optimales : one to one marketing Analyser et mettre à jour les données CRM en temps réel Ces exemples ne représentent pas une liste exhaustive. L’imagination est le plus grand incubateur de projets Big Data !! EXL GROUP - Tout droits réservés
  • 7. 7 Quelques projets Big Data 3.1 BANQUE ASSURANCE : Crédit Mutuel ARKEA • Lutte anti-blanchiment : 6 mois d'historique traité en moins de 20 secondes • Ratios de solvabilité : le traitement prenait 48 Heures sur un échantillon de clients  Résultat sur toute la base, en moins de 15 minutes • Analyse des zones de saisie libre dans les formulaires • Prospection ciblée : l’analyse des logs, parcours web … croisée avec la détention  Assurer la promotion des produits / services vers les bons prospects • Banque de détail : usuellement l'historique des comptes était de 3 à 5 mois  Historique pour tous les clients depuis mai 2001 (des milliards de données) EXL GROUP - Tout droits réservés
  • 8. 8 Quelques projets Big Data 3.2 TRANSPORT et LOGISTIQUE : Port d’Hambourg • Des ponts mobiles adaptés au trafic : l’ouverture des ponts dépendait d’un calendrier fixe inadapté au trafic réel  Ouverture uniquement lorsque les navires passent • Identification des défauts ou des pannes : la réparation rapide ou même préventive permet d’éviter le ralentissement de l'activité • Police et douane : le poids des charges prévu comparé au réel permet de détecter le transport de marchandises illégales • Service aux utilisateurs : les données de localisation permettent d’informer les utilisateurs des retards, des espaces de stationnement disponibles … EXL GROUP - Tout droits réservés
  • 9. 9 Quelques projets Big Data 3.3 Ils ont également fait appel au Big Data • Energie : Les compteurs Linky Des compteurs nouvelle génération avec des relevés de consommation réelle transmis toutes les 15 minutes Des courbes de charge actualisées en quasi-temps réel Optimisation des coûts et des volumes achetés par rapport au consommé • Loisirs et Multimédia : La plateforme de vidéos en continu « Netflix » a développé un algorithme prédictif pour suggérer aux utilisateurs des films et séries adaptées Lors de la coupe du monde 2014, l’équipe nationale d’Allemagne a placé des capteurs sur ses joueurs afin d’optimiser leur entraînement EXL GROUP - Tout droits réservés
  • 10. 10 Notre vision Data Science 4.1 Enrichir le patrimoine de données existant Exploiter de nouveaux types de données internes/externes, structurées/non structurées Réseaux sociaux Média Objets / capteurs connectés Mails Pages Web Open data Pourquoi ? • Contrôler les données en téléchargement libre • Maîtriser la communication externe à l’entreprise • Améliorer les indicateurs et modèles existants : scoring, détection de fraude, … • Optimiser ses offres : one-to- one marketing, profiling temps réel, … Comment ? • Identifier et contractualiser : Réseaux sociaux, start-up, data brokers, opérateurs mobiles … • Qualifier : statistiques descriptives ou inférentielles, corrélations, valeurs aberrantes, panels, … • Stocker : identifier scénarios pour un stockage industriel (Hadoop, serveur classique, Cloud, …) EXL GROUP - Tout droits réservés
  • 11. 11 Notre vision Data Science 4.2 Scalabilité et temps réel Bénéficier de la force d’une architecture Big Data, via sa capacité à allier le stockage physique parallèle des données à leur traitement parallèle en mémoire Pourquoi ? • Etre indépendant du volume et de la structure des données • Calculer des indicateurs en temps réel • Réduire les temps de requêtes et de traitement de données volumineuses : transactions fines, historique important … • Mutualiser les coûts de stockage et d’exploitation Comment ? • Identifier l’apport du MapReduce : algorithmes et traitements à paralléliser • Définir les fréquences souhaitées et réalisables de rafraîchissement des indicateurs • Lister des applications pouvant être mutualisées Cluster Hadoop EXL GROUP - Tout droits réservés
  • 12. 12 Notre vision Data Science 4.3 De nouveaux moyens pour explorer et analyser la donnée Une offre logicielle Open source ou fournie par les éditeurs historiques, pour développer de puissants algorithmes Pourquoi ? • Algorithmes classiques Data mining : Adaptation et optimisation • Machine learning : des algorithmes puissants adaptés au calcul distribué • Nouveaux algorithmes : pour de nouveaux types de données Comment ? • Classification descriptive : ACP, ACM, ACF, CAH, K- means, Kohonen, … • Prévision : ARIMA, lissage exponentiel, régression logistique et linéaire • Machine learning : réseaux de neurone (perceptron), Bootstrap, algorithmes génétiques, … • Optimisation combinatoire, théorie des graphes • Analyse de sentiments (SNA), web analytics, texte mining, taxonomie automatisée, … EXL GROUP - Tout droits réservés
  • 13. 13 Notre vision Data Science 4.4 Une approche innovante orientée métier Au travers de son offre Data Science, EXL GROUP vous accompagne dans l’exploitation et la valorisation de vos données via le déploiement de projets Big Data d’un point de vue métier :  Le Big Data ne se restreint pas à l’exploitation de gros volumes de données ou à une plateforme Hadoop  Identifier des traitements et modèles à optimiser grâce au Big Data  Faire évoluer des projets existants en projets Big Data  Mettre en place de nouveaux algorithmes efficaces, exploitables en mode industriel  Mettre à disposition des profils alliant des compétences en : mathématiques appliquées, programmation et technologies Hadoop EXL GROUP - Tout droits réservés
  • 14. 14 Notre offre 5.1 Des connaissances mathématiques associées à une expertise technique R, SAS, SPSS, Python MapReduce Java, C++, … Algorithmique Programmation EXL group vous accompagne lors de vos projets Big Data avec des équipes de « Data Scientists » alliant l’expertise technique aux connaissances mathématiques, dans un écosystème Hadoop Classification, Prévision, Machine learning, Optimisation combinatoire, Théorie des graphes, Analyse de sentiments, Web analytics, Taxonomie automatisée, Analyse sémantique, Text mining, … Hadoop Statistiques : Spark, Mahout, RHadoop Requêteurs : Hive, Impala, Pig, Sqoop Bases NoSQL : HBase, Cassandra, MongoDB, Oracle NoSQL, … EXL GROUP - Tout droits réservés
  • 15. 15 Notre offre 5.2 Une démarche projet en mode itératif Initier une démarche Big Data Assistance à la mise en œuvre Déploiement et formation • Disposez-vous de données suffisantes pour couvrir tout votre périmètre d’analyse ? • Quels sont les processus et modèles existants susceptibles d’être optimisés ? • Quelles sont les applications pouvant être mutualisées grâce à une infrastructure Big Data ? • Quelles données pour enrichir votre patrimoine et comment les récolter ? • Comment exploiter, qualifier et maîtriser ses données ? • Quelle est la meilleure solution pour explorer et restituer les résultats ? • Comment industrialiser la récolte de données ? • Quels algorithmes peuvent être déployés ? • Quels utilisateurs à former et sur quel périmètre ? EXL GROUP vous accompagne pour valoriser vos données, identifier de nouvelles sources et les exploiter via la mise en place d’algorithmes performants dans une démarche itérative : EXL GROUP - Tout droits réservés Pilotage de projet
  • 16. 16 Notre offre 5.3 Initier une démarche Big Data Initier une démarche Assistance à la mise en œuvre Déploiement et formation •Identification du potentiel Big Data dans l’entreprise •Cadrage d’un projet Big Data identifié De 1 à 5 ateliers, selon le niveau de maturité du besoin, avec les thèmes : • Prise de contexte et présentation Data Science • Processus métier • Architecture SI • Datamining • Focus sur un ou plusieurs projets •Compte-rendu des différents ateliers •Note de cadrage EXL GROUP - Tout droits réservés Pilotage de projet Missions Déroulement Livrables type
  • 17. 17 Notre offre 5.4 Assistance à la mise en œuvre Initier une démarche Assistance à la mise en œuvre Déploiement et formation •Collecte et qualification de nouvelles sources •Réalisation de POC •Préparation de Hackathon •Benchmark de solutions •Benchmark de modèles Collecte : • Contractualisation de fournisseurs • Définition de la solution • Suivi et qualification des résultats : statistiques, restitutions, … POC et Hackathon : • Définition du périmètre et de jeux de données anonymisés • Comparaison des résultats Benchmarks : • Modélisation • Programmation sous R, SAS, … •Rapports : potentiel des données, comparaison avec l’existant, … •Datavisualisation •Spécifications fonctionnelles •Programmes développés EXL GROUP - Tout droits réservés Pilotage de projet Missions Déroulement Livrables type
  • 18. 18 Notre offre 5.5 Déploiement, formation et pilotage Initier une démarche Assistance à la mise en œuvre Déploiement et formation • Industrialisation de la collecte de données • Industrialisation d’algorithmes prédictifs • Conduite du changement • Formation des utilisateurs • Assistance des directions métiers et SI dans le suivi et la gouvernance •Développement et sélection d’algorithme •Cadrage de la solution industrielle •Définition de la stratégie de déploiement •Assurer l’autonomie des utilisateurs •Documentation des modèles •Cahier des charges •Stratégie et plan de formation •Supports de formation •Supports et compte- rendu d’instances projet EXL GROUP - Tout droits réservés Pilotage de projet Missions Déroulement Livrables type
  • 19. 19 Nos références 6.1 Nos références Data Science CAP’TN : Qualification, restitution et industrialisation de la récolte de données issues de capteurs innovants et d’objets connectés. COMOB : Accompagnement AMOA pour la récolte de données et la définition d’une solution industrielle cible sur un cluster Hadoop (Distribution Hortonworks), dans le cadre de la mise en place d’un outil de data visualisation et pilotage temps-réel. POC : Accompagnement de la DSI de l’infrastructure pour le POC d’un projet Big Data en partenariat avec la direction de l’innovation (stockage et traitement de photographies des voies au centimètre près prises par un train à chaque passage – solution MAP-R). Portail Culture Versailles : projet de recherche fédérée parmi 1 million de fiches provenant de SI différents (Bibliothèque, Musée, Archives et site portail) http://versailles.demo4u.net ONISEP : Assistance à maitrise d’ouvrage pour un projet de création d’un entrepôt de données sémantique (Web Sémantique) PRESSTALIS : Réalisation d’une base de connaissance EXL GROUP : Réalisation d’un Wiki avec une recherche instantanée Open Data : Conception d’une application d’exposition de la donnée en open data EXL GROUP - Tout droits réservés