EXL Group - Offre Data Science

562 vues

Publié le

EXL Group, cabinet de conseil en technologies Analytiques, Numériques et Digitales.
Nos équipes multi-spécialistes réunissent des experts en conseils, technologies ou encore méthodes éprouvées pour vous proposer des prestations optimales pour vos Systèmes d’Information. En favorisant et récompensant la prise d’initiative, l’esprit entrepreneurial, nous plaçons chaque collaborateur au cœur de chaque projet . Nous travaillons donc tout autant sur votre satisfaction que sur celles de nos équipes.

Publié dans : Business
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
562
Sur SlideShare
0
Issues des intégrations
0
Intégrations
20
Actions
Partages
0
Téléchargements
11
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

EXL Group - Offre Data Science

  1. 1. 1 Offre « Data Science » Fournir les moyens de valoriser les données de l’entreprise
  2. 2. 2 1. Présentation EXL Group 2. Le Big Data en bref 3. Quelques projets Big Data 4. Notre vision Data Science 5. Notre offre 6. Nos références EXL GROUP - Tout droits réservés
  3. 3. 3 Présentation EXL Group 1.1 EXL Group : un groupe aux expertises multiples 300collaborateurs 5agences régionales Un multi-spécialiste du système d’Informations, créé en 2008 (M€) 2011 13,5 2012 21 2013 28 34 2014 150Comptes actifs EXL GROUP - Tout droits réservés
  4. 4. 4 Le Big Data en bref 2.1 De nouveaux moyens pour valoriser vos données  Des données internes/externes, structurée/non structurées Variété Volume Vitesse  Une offre logicielle vaste et innovante, Open source/acteurs BI historiques  De nouveaux besoins métier EXL GROUP - Tout droits réservés
  5. 5. 5 Le Big Data en bref 2.2 Une évolution apportée sur 3 axes majeurs Données : Enrichissement des données exploitées Stockage : Optimisation des processus et traitements existants, réduction des coûts Analyse : Fiabilisation et amélioration des indicateurs calculés et des modèles développés  Structurées et homogènes  Sources internes  Volumétrie contrôlée  Non structurées et hétérogènes  Sources externes  Volumétrie scalable BI Classique Big Data  Entrepôt de données (Datawarehouse)  Serveurs physiques internes  Modélisation en étoile ou en flocon  Statistiques descriptives  Requêtage par ligne/individu  Algorithmes prédictifs développés par des « Data Analyst »  Distribué sur un cluster Hadoop (HDFS)  Cloud computing  Traitement parallèle : MapReduce  Statistiques inférentielles  Requêtage par colonne/objet  Nouveaux algorithmes développés par des « Data Scientist » EXL GROUP - Tout droits réservés
  6. 6. 6 Le Big Data en bref 2.3 Traiter diverses problématiques à travers la Data Science Marketing Contrôle DSI Energie Données de compteurs nouvelle génération et facteurs climatiques pour prédire les consommations en temps réel Données de réseaux sociaux afin de prévoir les pics de consommation évènementiels Bénéficier du calcul distribué pour optimiser les temps de traitement Transports Données de capteurs, bornes Wifi et traces GSM pour une meilleure connaissance du trafic Données vidéo pour la lutte contre la fraude Réduire les coûts en stockant sur une même plateforme tous types de données Banques & Assurances Un meilleur profiling des clients : fidélisation et rétention via l’analyse des retours clients (sms, mails, forums, …) Analyser les comportement clients sur le net afin d’identifier les risques de Fraude, découverts, … Requêter et traiter rapidement des volumes importants de données transactionnelles Télécom Données des réseaux sociaux pour proposer aux clients de nouvelles offres optimales : one to one marketing Analyser et mettre à jour les données CRM en temps réel Ces exemples ne représentent pas une liste exhaustive. L’imagination est le plus grand incubateur de projets Big Data !! EXL GROUP - Tout droits réservés
  7. 7. 7 Quelques projets Big Data 3.1 BANQUE ASSURANCE : Crédit Mutuel ARKEA • Lutte anti-blanchiment : 6 mois d'historique traité en moins de 20 secondes • Ratios de solvabilité : le traitement prenait 48 Heures sur un échantillon de clients  Résultat sur toute la base, en moins de 15 minutes • Analyse des zones de saisie libre dans les formulaires • Prospection ciblée : l’analyse des logs, parcours web … croisée avec la détention  Assurer la promotion des produits / services vers les bons prospects • Banque de détail : usuellement l'historique des comptes était de 3 à 5 mois  Historique pour tous les clients depuis mai 2001 (des milliards de données) EXL GROUP - Tout droits réservés
  8. 8. 8 Quelques projets Big Data 3.2 TRANSPORT et LOGISTIQUE : Port d’Hambourg • Des ponts mobiles adaptés au trafic : l’ouverture des ponts dépendait d’un calendrier fixe inadapté au trafic réel  Ouverture uniquement lorsque les navires passent • Identification des défauts ou des pannes : la réparation rapide ou même préventive permet d’éviter le ralentissement de l'activité • Police et douane : le poids des charges prévu comparé au réel permet de détecter le transport de marchandises illégales • Service aux utilisateurs : les données de localisation permettent d’informer les utilisateurs des retards, des espaces de stationnement disponibles … EXL GROUP - Tout droits réservés
  9. 9. 9 Quelques projets Big Data 3.3 Ils ont également fait appel au Big Data • Energie : Les compteurs Linky Des compteurs nouvelle génération avec des relevés de consommation réelle transmis toutes les 15 minutes Des courbes de charge actualisées en quasi-temps réel Optimisation des coûts et des volumes achetés par rapport au consommé • Loisirs et Multimédia : La plateforme de vidéos en continu « Netflix » a développé un algorithme prédictif pour suggérer aux utilisateurs des films et séries adaptées Lors de la coupe du monde 2014, l’équipe nationale d’Allemagne a placé des capteurs sur ses joueurs afin d’optimiser leur entraînement EXL GROUP - Tout droits réservés
  10. 10. 10 Notre vision Data Science 4.1 Enrichir le patrimoine de données existant Exploiter de nouveaux types de données internes/externes, structurées/non structurées Réseaux sociaux Média Objets / capteurs connectés Mails Pages Web Open data Pourquoi ? • Contrôler les données en téléchargement libre • Maîtriser la communication externe à l’entreprise • Améliorer les indicateurs et modèles existants : scoring, détection de fraude, … • Optimiser ses offres : one-to- one marketing, profiling temps réel, … Comment ? • Identifier et contractualiser : Réseaux sociaux, start-up, data brokers, opérateurs mobiles … • Qualifier : statistiques descriptives ou inférentielles, corrélations, valeurs aberrantes, panels, … • Stocker : identifier scénarios pour un stockage industriel (Hadoop, serveur classique, Cloud, …) EXL GROUP - Tout droits réservés
  11. 11. 11 Notre vision Data Science 4.2 Scalabilité et temps réel Bénéficier de la force d’une architecture Big Data, via sa capacité à allier le stockage physique parallèle des données à leur traitement parallèle en mémoire Pourquoi ? • Etre indépendant du volume et de la structure des données • Calculer des indicateurs en temps réel • Réduire les temps de requêtes et de traitement de données volumineuses : transactions fines, historique important … • Mutualiser les coûts de stockage et d’exploitation Comment ? • Identifier l’apport du MapReduce : algorithmes et traitements à paralléliser • Définir les fréquences souhaitées et réalisables de rafraîchissement des indicateurs • Lister des applications pouvant être mutualisées Cluster Hadoop EXL GROUP - Tout droits réservés
  12. 12. 12 Notre vision Data Science 4.3 De nouveaux moyens pour explorer et analyser la donnée Une offre logicielle Open source ou fournie par les éditeurs historiques, pour développer de puissants algorithmes Pourquoi ? • Algorithmes classiques Data mining : Adaptation et optimisation • Machine learning : des algorithmes puissants adaptés au calcul distribué • Nouveaux algorithmes : pour de nouveaux types de données Comment ? • Classification descriptive : ACP, ACM, ACF, CAH, K- means, Kohonen, … • Prévision : ARIMA, lissage exponentiel, régression logistique et linéaire • Machine learning : réseaux de neurone (perceptron), Bootstrap, algorithmes génétiques, … • Optimisation combinatoire, théorie des graphes • Analyse de sentiments (SNA), web analytics, texte mining, taxonomie automatisée, … EXL GROUP - Tout droits réservés
  13. 13. 13 Notre vision Data Science 4.4 Une approche innovante orientée métier Au travers de son offre Data Science, EXL GROUP vous accompagne dans l’exploitation et la valorisation de vos données via le déploiement de projets Big Data d’un point de vue métier :  Le Big Data ne se restreint pas à l’exploitation de gros volumes de données ou à une plateforme Hadoop  Identifier des traitements et modèles à optimiser grâce au Big Data  Faire évoluer des projets existants en projets Big Data  Mettre en place de nouveaux algorithmes efficaces, exploitables en mode industriel  Mettre à disposition des profils alliant des compétences en : mathématiques appliquées, programmation et technologies Hadoop EXL GROUP - Tout droits réservés
  14. 14. 14 Notre offre 5.1 Des connaissances mathématiques associées à une expertise technique R, SAS, SPSS, Python MapReduce Java, C++, … Algorithmique Programmation EXL group vous accompagne lors de vos projets Big Data avec des équipes de « Data Scientists » alliant l’expertise technique aux connaissances mathématiques, dans un écosystème Hadoop Classification, Prévision, Machine learning, Optimisation combinatoire, Théorie des graphes, Analyse de sentiments, Web analytics, Taxonomie automatisée, Analyse sémantique, Text mining, … Hadoop Statistiques : Spark, Mahout, RHadoop Requêteurs : Hive, Impala, Pig, Sqoop Bases NoSQL : HBase, Cassandra, MongoDB, Oracle NoSQL, … EXL GROUP - Tout droits réservés
  15. 15. 15 Notre offre 5.2 Une démarche projet en mode itératif Initier une démarche Big Data Assistance à la mise en œuvre Déploiement et formation • Disposez-vous de données suffisantes pour couvrir tout votre périmètre d’analyse ? • Quels sont les processus et modèles existants susceptibles d’être optimisés ? • Quelles sont les applications pouvant être mutualisées grâce à une infrastructure Big Data ? • Quelles données pour enrichir votre patrimoine et comment les récolter ? • Comment exploiter, qualifier et maîtriser ses données ? • Quelle est la meilleure solution pour explorer et restituer les résultats ? • Comment industrialiser la récolte de données ? • Quels algorithmes peuvent être déployés ? • Quels utilisateurs à former et sur quel périmètre ? EXL GROUP vous accompagne pour valoriser vos données, identifier de nouvelles sources et les exploiter via la mise en place d’algorithmes performants dans une démarche itérative : EXL GROUP - Tout droits réservés Pilotage de projet
  16. 16. 16 Notre offre 5.3 Initier une démarche Big Data Initier une démarche Assistance à la mise en œuvre Déploiement et formation •Identification du potentiel Big Data dans l’entreprise •Cadrage d’un projet Big Data identifié De 1 à 5 ateliers, selon le niveau de maturité du besoin, avec les thèmes : • Prise de contexte et présentation Data Science • Processus métier • Architecture SI • Datamining • Focus sur un ou plusieurs projets •Compte-rendu des différents ateliers •Note de cadrage EXL GROUP - Tout droits réservés Pilotage de projet Missions Déroulement Livrables type
  17. 17. 17 Notre offre 5.4 Assistance à la mise en œuvre Initier une démarche Assistance à la mise en œuvre Déploiement et formation •Collecte et qualification de nouvelles sources •Réalisation de POC •Préparation de Hackathon •Benchmark de solutions •Benchmark de modèles Collecte : • Contractualisation de fournisseurs • Définition de la solution • Suivi et qualification des résultats : statistiques, restitutions, … POC et Hackathon : • Définition du périmètre et de jeux de données anonymisés • Comparaison des résultats Benchmarks : • Modélisation • Programmation sous R, SAS, … •Rapports : potentiel des données, comparaison avec l’existant, … •Datavisualisation •Spécifications fonctionnelles •Programmes développés EXL GROUP - Tout droits réservés Pilotage de projet Missions Déroulement Livrables type
  18. 18. 18 Notre offre 5.5 Déploiement, formation et pilotage Initier une démarche Assistance à la mise en œuvre Déploiement et formation • Industrialisation de la collecte de données • Industrialisation d’algorithmes prédictifs • Conduite du changement • Formation des utilisateurs • Assistance des directions métiers et SI dans le suivi et la gouvernance •Développement et sélection d’algorithme •Cadrage de la solution industrielle •Définition de la stratégie de déploiement •Assurer l’autonomie des utilisateurs •Documentation des modèles •Cahier des charges •Stratégie et plan de formation •Supports de formation •Supports et compte- rendu d’instances projet EXL GROUP - Tout droits réservés Pilotage de projet Missions Déroulement Livrables type
  19. 19. 19 Nos références 6.1 Nos références Data Science CAP’TN : Qualification, restitution et industrialisation de la récolte de données issues de capteurs innovants et d’objets connectés. COMOB : Accompagnement AMOA pour la récolte de données et la définition d’une solution industrielle cible sur un cluster Hadoop (Distribution Hortonworks), dans le cadre de la mise en place d’un outil de data visualisation et pilotage temps-réel. POC : Accompagnement de la DSI de l’infrastructure pour le POC d’un projet Big Data en partenariat avec la direction de l’innovation (stockage et traitement de photographies des voies au centimètre près prises par un train à chaque passage – solution MAP-R). Portail Culture Versailles : projet de recherche fédérée parmi 1 million de fiches provenant de SI différents (Bibliothèque, Musée, Archives et site portail) http://versailles.demo4u.net ONISEP : Assistance à maitrise d’ouvrage pour un projet de création d’un entrepôt de données sémantique (Web Sémantique) PRESSTALIS : Réalisation d’une base de connaissance EXL GROUP : Réalisation d’un Wiki avec une recherche instantanée Open Data : Conception d’une application d’exposition de la donnée en open data EXL GROUP - Tout droits réservés

×