-- session présentée dans le cadre du MS Cloud Summit Paris 2017 avec Emmanuel Frenod --
L’approche Data Science des données révolutionne l’analyse traditionnelle. La façon d’appréhender les questions, la méthodologie à suivre ainsi que l’outillage à utiliser sont différents de la BI traditionnelle. Nous aborderons dans cette session ces différences et pointeront les bonnes pratiques de la Data Science avec les outils Microsoft au travers d’un cas d’utilisation concret. Ce « retour d’expérience » expliquera, en illustrant le propos à travers des applications réalisées pour des entreprises de transport, des réparateurs et des grossistes en bâtiment, comment la Data Science aide à la mise au point des prix pendant leur négociation
1-Problématique
2-Définition du Big Data
3-Big Data et 3V
4-Data wahrehouse VS Big Data
5-Domaines d’utilisations
6-Les techniques de traitement
7-Big Data et Aspect Mobile
8-Conclusion
Introduction au datamining, concepts et techniquesIsmail CHAIB
Face à l’importance grandissante que prend l’information, le datamining offre une solution pour maitriser la complexité et synthétiser les amas de données pour faire jaillir de la connaissance.
Cet exposé introduit la notion de datamining dans son ensemble à travers ses concepts et ses principes, et survole quelques techniques utilisées lors de ce processus.
1-Problématique
2-Définition du Big Data
3-Big Data et 3V
4-Data wahrehouse VS Big Data
5-Domaines d’utilisations
6-Les techniques de traitement
7-Big Data et Aspect Mobile
8-Conclusion
Introduction au datamining, concepts et techniquesIsmail CHAIB
Face à l’importance grandissante que prend l’information, le datamining offre une solution pour maitriser la complexité et synthétiser les amas de données pour faire jaillir de la connaissance.
Cet exposé introduit la notion de datamining dans son ensemble à travers ses concepts et ses principes, et survole quelques techniques utilisées lors de ce processus.
Comment accompagner vos équipes pour passer du Data Mining traditionnel à la Data Science ?
Stockage, analyse, activation et mesure constituent les éléments clés de la valorisation de la donnée. Parallèlement, la promesse des technologies est de permettre d'opérer ce processus de façon plus agile, tout en réduisant le "time to market". Tout ceci devant être accompagné par des évolutions des organisations et des compétences :
• Technologies : mise en place de Data Lake consolidant l'ensemble des données de l'entreprise, avec des capacités de stockage et de traitements adaptés. Évolution des outils de BI et analytics,...
• Compétences : montée en compétence sur les architectures NoSQL, les nouveaux outils, les nouvelles sources de données, les nouvelles méthodes de modélisations, le deep machine learning, la datavisualisation,...
• Organisations : mise en place d'une nouvelle gouvernance : re-répartition des rôles entre l'IT, le marketing et la Data Science. Création de nouvelles fonctions : Chief Data Officer, Data Analyst, Data Manager,...
Dans ce contexte de mutation, quels sont les impacts pour le Data Mining et comment accompagner ce changement ?
Nous vous invitons à un séminaire gratuit qui abordera les questions suivantes :
• Quelles sont les possibilités et les nouvelles perspectives d'analyse offerte par le Big Data ?
• Quels sont les impacts sur le quotidien du Data Miner : quels sont les outils/techniques à maîtriser ?
• Comment accompagner vos équipes dans le passage du Data Mining à la Data Science ?
• Quels sont les principes d'organisation et de gouvernance ?
Présentation générales du Big Data et zoom sur des cas d'usage dans l'industrie et les services.
Présentation réalisée à l'occasion de l'événement Big data de Niort du 20 mars 2014
Machine Learning et Intelligence Artificielle : quelles applications pour le marketing digital ?
Deep Machine Learning (ML) et Intelligence Artificielle (AI) sont au cœur des stratégies des géants du net : reconnaissance de textes, de voix, de visages, de sentiments, quelles possibilités d’applications au marketing digital ? Comment commencer ? Avec quels outils et quelles compétences ?
Google, Facebook, Apple et autres Microsoft se livrent une bataille de Titan sur le terrain de l’Intelligence Artificielle, que ce soit pour conduire des voitures autonomes, identifier les utilisateurs à partir de leur visage, traduire en temps réel des conversations téléphoniques, conseiller le bon produit, mimer le comportement du parfait assistant…
Cette débauche de moyens en recherche et développement génère la diffusion en Open Source des sources de nombreux algorithmes ou le foisonnement de fonctions et d’API de ML et d’AI « as a service ». Avec des efforts minimes, tout-un-chacun peut aujourd’hui accéder simplement et pour un coût modique à des fonctionnalités puissantes pour reconnaître un visage, une voix, les sentiments à partir d’un texte, ou pour anticiper des ruptures dans des comportements… En outre, la démocratisation des technologies Big Data donne accès à des puissances de traitements considérables qui permettent d’appliquer ces algorithmes de ML sur des centaines de milliers de points, des milliards d’enregistrements et des volumes de plusieurs péta-octets.
Ce séminaire prospectif vise à démystifier le Deep Machine Learning, à en dessiner les premières applications potentielles pour le Marketing Digital et à en préciser les modalités de mise en œuvre ainsi que les impacts et les risques à identifier.
Ch&cie présentation du big data dans l'assuranceBetito Yan
Big data is a common word and concept with major business and operational impacts for companies. Specifically insurance companies will have to face a significant shift in their activities to cope with this new paradigm. More than a concept, actions and operational changes are required now.
Big Data... Big Analytics à travers les âges, les industries et les technologiesHassan Lâasri
Si la matière et l’énergie ont dominé les industries du XIXème et du XXème siècles, la Data en prend la direction pour ce siècle. Nous entrons dans une nouvelle ère où dans toutes les industries, non seulement les techniciens, les opérateurs et les gestionnaires consomment et produisent de la Data, mais aussi tous les dispositifs, petits et grands, qu’ils utilisent pour prendre leurs décisions et exécuter leurs opérations. Une ère où la Data prendra un sein de toute activité industrielle autant d’importance que les matières premières et les énergies qui transportent et transforment ces dernières en des biens d’équipements et des produits de consommation. L’objectif de cette présentation est de démystifier le phénomène Big Data en décrivant son utilisation à travers les âges et les industries : recensement de population au XIXème siècle, gestion de réseaux et transactions bancaires à la fin du XXème siècle et sa récente percée dans les médias et dans les industries lourdes en ce début de XXIème siècle.
1 hour to browse the algos stars of machine learning. No code, big concepts with a little math. Linear regression, classification (logistic regression / svm / tree), neural network, deep learning...
Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...Touria Engohan
L’entreprise doit prendre conscience de cette révolution en anticipant sa mise en place par des investissements humains et matériels. Celles qui sauront tirer profit de leur capital « Données », s’ouvriront de nouvelles perspectives vers plus de compétitivité et d’innovation...
Teddy Malfait, directeur général d'Affinity Engine, est intervenu à l'occasion des Jeudis du Numérique, sur le thème de la Big Data et de ses applications dans la vie des entreprises et des consommateurs.
Aujourd'hui, la Big Data est utilisée dans de nombreux domaines : la santé, la météorologie, l'énergie ou bien la relation client. Découvrez les possibilités et la puissance de la Big Data à travers cette présentation.
http://www.affinity-engine.fr/
Mémoire de fin d'étude - La big data et les réseaux sociauxChloé Marty
Comment l’explosion quantitative de la data va donner aux marques l’opportunité de mieux cibler et de mieux s’adresser à leurs publics sur les réseaux sociaux alors que l’utilisation et l’exploitation de ces données s’avère être très complexe et pose un problème d’éthique ?
Partager et collaborer avec Power BI - SQL Saturday Montreal 2017Jean-Pierre Riehl
-- session présentée dans le cadre du SQLSaturday Montréal 2017 --
Power BI offre de nombreuses solutions pour travailler à plusieurs sur un modèle, un rapport ou un tableau de bord. Cette session passe en revue les fonctionnalités de partage et de collaboration de Power BI avec leurs avantages et leurs inconvénients.
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017Jean-Pierre Riehl
-- session présentée dans le cadre du SQLSaturday Montréal 2017 --
Azure Data Lake est LA technologie "big data" maison de Microsoft. En provenance de MS Research (nom de code Cosmos), elle est utilisée en interne par les équipes X-Box, Bing, O365 depuis quelques années déjà. Cette technologie est disponible depuis l'été dernier dans Azure et s'enrichit mois après mois.
ADL, concrètement, c'est quoi ? C'est la possibilité de stocker et analyser une quantité illimitée de données et de requêter avec un nouveau langage : le U-SQL
Comment accompagner vos équipes pour passer du Data Mining traditionnel à la Data Science ?
Stockage, analyse, activation et mesure constituent les éléments clés de la valorisation de la donnée. Parallèlement, la promesse des technologies est de permettre d'opérer ce processus de façon plus agile, tout en réduisant le "time to market". Tout ceci devant être accompagné par des évolutions des organisations et des compétences :
• Technologies : mise en place de Data Lake consolidant l'ensemble des données de l'entreprise, avec des capacités de stockage et de traitements adaptés. Évolution des outils de BI et analytics,...
• Compétences : montée en compétence sur les architectures NoSQL, les nouveaux outils, les nouvelles sources de données, les nouvelles méthodes de modélisations, le deep machine learning, la datavisualisation,...
• Organisations : mise en place d'une nouvelle gouvernance : re-répartition des rôles entre l'IT, le marketing et la Data Science. Création de nouvelles fonctions : Chief Data Officer, Data Analyst, Data Manager,...
Dans ce contexte de mutation, quels sont les impacts pour le Data Mining et comment accompagner ce changement ?
Nous vous invitons à un séminaire gratuit qui abordera les questions suivantes :
• Quelles sont les possibilités et les nouvelles perspectives d'analyse offerte par le Big Data ?
• Quels sont les impacts sur le quotidien du Data Miner : quels sont les outils/techniques à maîtriser ?
• Comment accompagner vos équipes dans le passage du Data Mining à la Data Science ?
• Quels sont les principes d'organisation et de gouvernance ?
Présentation générales du Big Data et zoom sur des cas d'usage dans l'industrie et les services.
Présentation réalisée à l'occasion de l'événement Big data de Niort du 20 mars 2014
Machine Learning et Intelligence Artificielle : quelles applications pour le marketing digital ?
Deep Machine Learning (ML) et Intelligence Artificielle (AI) sont au cœur des stratégies des géants du net : reconnaissance de textes, de voix, de visages, de sentiments, quelles possibilités d’applications au marketing digital ? Comment commencer ? Avec quels outils et quelles compétences ?
Google, Facebook, Apple et autres Microsoft se livrent une bataille de Titan sur le terrain de l’Intelligence Artificielle, que ce soit pour conduire des voitures autonomes, identifier les utilisateurs à partir de leur visage, traduire en temps réel des conversations téléphoniques, conseiller le bon produit, mimer le comportement du parfait assistant…
Cette débauche de moyens en recherche et développement génère la diffusion en Open Source des sources de nombreux algorithmes ou le foisonnement de fonctions et d’API de ML et d’AI « as a service ». Avec des efforts minimes, tout-un-chacun peut aujourd’hui accéder simplement et pour un coût modique à des fonctionnalités puissantes pour reconnaître un visage, une voix, les sentiments à partir d’un texte, ou pour anticiper des ruptures dans des comportements… En outre, la démocratisation des technologies Big Data donne accès à des puissances de traitements considérables qui permettent d’appliquer ces algorithmes de ML sur des centaines de milliers de points, des milliards d’enregistrements et des volumes de plusieurs péta-octets.
Ce séminaire prospectif vise à démystifier le Deep Machine Learning, à en dessiner les premières applications potentielles pour le Marketing Digital et à en préciser les modalités de mise en œuvre ainsi que les impacts et les risques à identifier.
Ch&cie présentation du big data dans l'assuranceBetito Yan
Big data is a common word and concept with major business and operational impacts for companies. Specifically insurance companies will have to face a significant shift in their activities to cope with this new paradigm. More than a concept, actions and operational changes are required now.
Big Data... Big Analytics à travers les âges, les industries et les technologiesHassan Lâasri
Si la matière et l’énergie ont dominé les industries du XIXème et du XXème siècles, la Data en prend la direction pour ce siècle. Nous entrons dans une nouvelle ère où dans toutes les industries, non seulement les techniciens, les opérateurs et les gestionnaires consomment et produisent de la Data, mais aussi tous les dispositifs, petits et grands, qu’ils utilisent pour prendre leurs décisions et exécuter leurs opérations. Une ère où la Data prendra un sein de toute activité industrielle autant d’importance que les matières premières et les énergies qui transportent et transforment ces dernières en des biens d’équipements et des produits de consommation. L’objectif de cette présentation est de démystifier le phénomène Big Data en décrivant son utilisation à travers les âges et les industries : recensement de population au XIXème siècle, gestion de réseaux et transactions bancaires à la fin du XXème siècle et sa récente percée dans les médias et dans les industries lourdes en ce début de XXIème siècle.
1 hour to browse the algos stars of machine learning. No code, big concepts with a little math. Linear regression, classification (logistic regression / svm / tree), neural network, deep learning...
Les enjeux du Big Data pour l'Entreprise - These professionnelle -Touria Engo...Touria Engohan
L’entreprise doit prendre conscience de cette révolution en anticipant sa mise en place par des investissements humains et matériels. Celles qui sauront tirer profit de leur capital « Données », s’ouvriront de nouvelles perspectives vers plus de compétitivité et d’innovation...
Teddy Malfait, directeur général d'Affinity Engine, est intervenu à l'occasion des Jeudis du Numérique, sur le thème de la Big Data et de ses applications dans la vie des entreprises et des consommateurs.
Aujourd'hui, la Big Data est utilisée dans de nombreux domaines : la santé, la météorologie, l'énergie ou bien la relation client. Découvrez les possibilités et la puissance de la Big Data à travers cette présentation.
http://www.affinity-engine.fr/
Mémoire de fin d'étude - La big data et les réseaux sociauxChloé Marty
Comment l’explosion quantitative de la data va donner aux marques l’opportunité de mieux cibler et de mieux s’adresser à leurs publics sur les réseaux sociaux alors que l’utilisation et l’exploitation de ces données s’avère être très complexe et pose un problème d’éthique ?
Partager et collaborer avec Power BI - SQL Saturday Montreal 2017Jean-Pierre Riehl
-- session présentée dans le cadre du SQLSaturday Montréal 2017 --
Power BI offre de nombreuses solutions pour travailler à plusieurs sur un modèle, un rapport ou un tableau de bord. Cette session passe en revue les fonctionnalités de partage et de collaboration de Power BI avec leurs avantages et leurs inconvénients.
Azure Data Lake, le Big Data 2.0 - SQL Saturday Montreal 2017Jean-Pierre Riehl
-- session présentée dans le cadre du SQLSaturday Montréal 2017 --
Azure Data Lake est LA technologie "big data" maison de Microsoft. En provenance de MS Research (nom de code Cosmos), elle est utilisée en interne par les équipes X-Box, Bing, O365 depuis quelques années déjà. Cette technologie est disponible depuis l'été dernier dans Azure et s'enrichit mois après mois.
ADL, concrètement, c'est quoi ? C'est la possibilité de stocker et analyser une quantité illimitée de données et de requêter avec un nouveau langage : le U-SQL
Introduction à la Data Science : régression, classification, , clustering, machine learning...vue d'ensemble, quelques techniques et des ressources pour creuser le sujet.
L’avènement du Digital s’accompagne d’une démultiplication de données à analyser : structurées et non structurées.
Parallèlement, les entreprises sont à la recherche de sources d’avantages concurrentiels et d’identification de nouveaux débouchés marketing associés à un enjeu de défendre leur part de marché. Celles-ci sont conscientes, que la valorisation de leurs données constituera la réponse.
Afin de pouvoir analyser ces mines de données, les technologies ont fortement évolué :
• Mise en place de Big Data pour stocker d’importantes volumétries de données ;
• Parallélisation/montée en mémoire des traitements pour permettre de réduire les délais de réalisation ;
• Développement de nouveaux algorithmes qui offrent de nouvelles perspectives d’analyses ;
• Evolution des outils statistiques.
Dans ce contexte de mutations technologiques et à l’heure du temps réel, quels sont les impacts pour le Data Mining?
Nous vous invitons à un séminaire gratuit qui abordera les questions suivantes :
• Quels impacts sur le quotidien du Data Miner : quelles sont les techniques/outils à maîtriser ?
• Quelles sont les possibilités et les nouvelles perspectives d’analyse offertes par le Big Data ?
• Quels sont les pièges à éviter ?
DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...Soft Computing
Après une phase d'expérimentations, les annonceurs positionnent clairement la DMP dans leur écosystème digital pour renouveler et enrichir les expériences Client.
Par nature, les projets DMP sont transverses ce qui rend complexe leur implémentation. Fort de plusieurs mises en œuvre concrètes, nous vous proposons un éclairage pour réussir votre projet DMP, et permettre de passer d'une promesse marketing à une réalité opérationnelle.
Avec le témoignage de la Société Générale, nous partagerons nos convictions et retours d'expériences sur des questions clés :
- Quels sont les véritables enjeux du marketing que couvre la DMP ?
- Quel cheminement pour assurer la réussite du projet dans un contexte souvent complexe ?
- Le juridique, la sécurité, l'organisation : quels principes respecter pour éviter les obstacles ?
- Comment traiter au mieux l'intégration de cet outil dans un écosystème existant contraint ?
- Concrètement, quels retours d'expérience sur les projets lancés ?
Dans beaucoup de cas de figure, la solution CRM seule ne suffit pas à effectuer un reporting adéquat. Avec un couplage Dynamics CRM 2013 et Power BI, vous serez capable, entre autres: - De mettre en place une analyse de vos données CRM avec la granularité que vous souhaitez - De visualiser en temps réel cette analyse - De réintégrer dans CRM des indicateurs issus de cette analyse afin d'affiner la gestion des objectifs de vos collaborateurs
Speakers : Siavash Veyssi (MCNEXT), Sébastien Madar (MCNext)
Big Data Viz (and much more!) with Apache ZeppelinBruno Bonnin
Slides du talk réalisé à Web2Day 2016 sur Apache Zeppelin (env. dédié à l'exploration des données, avec support de multiples langages, multiples backends)
Un guide complet et très simple pour l'installation et l'utilisation de notre outil Backup & Restore.
Vous êtes intéressé par nos offres ?
Rendez-vous sur www.sct-telecom.fr
Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...Le_GFII
Intervention de Hugo Le Squeren, Sales Engineer chez Dataiku et Florian Servaux, Chef de projet chez Coyote.
Séminaire DIXIT : Les nouvelles frontières de la « data intelligence » : content analytics, machine-learning, prédictif
Abstract : omme dans les activités TELECOM, le modèle COYOTE est basé sur l’abonnement. À ce titre, la fidélisation du parc d’abonnés est un facteur clé de succès. Afin d’optimiser ses actions de fidélisation et d’accroître la connaissance client, COYOTE en partenariat avec DATAIKU, a croisé les différentes sources de données à sa disposition. Il en résulte des analyses prédictives sur le comportement client.
Source : http://www.gfii.fr/fr/document/seminaire-dixit-les-nouvelles-frontieres-de-la-data-intelligence-content-analytics-machine-learning-predictif
Explorez vos données avec apache zeppelinBruno Bonnin
Rapide présentation du projet Apache Zeppelin, environnement web facilitant l'exploration et le partage autour de vos données : le support de multiples langages pour le traitement (Spark) et l'accès aux bases de données (PostgreSQL, Cassandra, ...) permet à Zeppelin de s'adapter aux backends les plus divers.
Hadoop @ eBay: Past, Present, and FutureRyan Hennig
An overview of eBay's experience with Hadoop in the Past and Present, as well as directions for the Future. Given by Ryan Hennig at the Big Data Meetup at eBay in Netanya, Israel on Dec 2, 2013
Sql Saturday Paris 2016 - De StreamInsight à Azure Stream Analytics Marius Zaharia
Le chemin du CEP (Complex Event Processing) vers le Cloud - de StreamInsight à Azure Stream Analytics. Concepte de traitement d'évènements en temps réel et CEP as a Service dans Azure.
CRM & DMP : le digital au service d’une animation client omnicanal et temps réelSoft Computing
Quels sont les impacts de la mise en œuvre d’une DMP sur les aspects opérationnels et métiers ?
Quels sont les premiers retours d’expérience de clients ayant déjà déployé une solution DMP ?
Digitalisation du marketing : Le marketing digital n’existe plus, c’est l’ensemble du marketing qui est passé à l’ère du digital. Parmi toutes les technologies marketing, la DMP est apparue comme un produit phare attirant l’intérêt de beaucoup d’acteurs et d’annonceurs.
Quel est l’impact réel de la DMP aujourd’hui ? Le centre de gravité du marketing basé sur les données s’est élargi en offrant la possibilité d’exploiter les données digitales en plus des données CRM grâce au rapprochement du CRM & de la DMP. Aujourd’hui, de nombreux projets ont pu voir de manière effective le rapprochement entre ces deux mondes et ainsi valider la promesse de cohérence de toute la chaîne de l’animation prospect et client.
La maîtrise et l’évolution des dispositifs de collecte, les nouveaux types d’analyses, l’accostage avec l’éco-système existant, la gestion de la cohérence de la communication et les impacts sur les organisations sont autant de sujets à traiter dans le cadre de la mise en œuvre d’une DMP.
Participez à notre séminaire gratuit qui abordera les questions suivantes au travers d’un témoignage Client :
- Dans quel contexte est-il pertinent de mettre en œuvre une DMP et de la coupler avec le CRM ?
- Quelle répartition entre les périmètres CRM, DMP et connaissance client ?
- Quel cadre légal pour mettre en œuvre une DMP ? Quels critères, quelles limites pour choisir la bonne solution ? Quelle organisation dans son exécution ?
- Et concrètement, quels sont les retours d’expérience business et projet ?
Exploitez le Big Data dans le cadre de votre stratégie MDMJean-Michel Franco
Une avalanche de données déferle sur l'entreprise, également confrontée à ses applications existantes, qui doit mettre en place une stratégie adaptée en s'appuyant sur les principes du Big Data et du MDM.
cette présentation traite des points suivants :
Associer MDM et Big Data,
Elaborer et mettre en œuvre une stratégie MDM, créer des golden records ou enregistrements de référence pour l’ensemble de vos données,
Tirer profit de l'immense potentiel offert par le Big Data dans le cadre d’une démarche MDM.
Tracer la voie vers le BigData et l'analyse prédictive avec Talend et Amazon AWS.
Peut-on se passer du Big Data, de l’analyse prédictive, ou du machine learning depuis qu’ils ont démontré leur capacité à transformer l’entreprise et à ouvrir les portes de vos marchés à de nouveaux acteurs ? Et sinon, comment s’approprier au plus vite toute cette panoplie technologique, à première vue complexe, coûteuse et en perpétuelle mutation ?
Cette présentation démontre comment s’approprier et orchestrer les plates-formes cloud telles qu’Amazon AWS, pour tirer partie de la puissance de traitements de Hadoop et de Spark dans le cadre d’applications analytiques de nouvelle génération.
OpenDataSoft - Les plateformes ouvertes de données, nouveau levier de l'innov...OpenDataSoft
Smart cities, internet des objets, plateformes open data … grâce à sa plateforme intégrée de Data Management et Data Publishing, OpenDataSoft propose à ses clients des solutions simples et évolutives pour créer et opérer leur plateforme de d’échanges de données dédiée au développement rapide de nouveaux services BtoC ou BtoB :
- saisir toute opportunité de croiser des données internes et externes pour les valoriser à travers des applications innovantes (API, mobilité, data visualisation …)
- bénéficier de coûts très faibles par rapport aux approchesIT classiques et de permettre ainsi l’émergence et la validation de modèles économiques compatibles avec l’économie du web (“low cost – best value”)
- piloter de façon équitable et durable les services aux citoyens grâce à une approche originale de notarisation des données grâces aux solutions de hubs d’OpenDataSoft
- engager concrètement son organisation dans une cultture de l’innovation grâce aux solutions de plateforme participative de données d’OpenDataSoft
Acteurs Publics, Industrie et Services, Médias , Développeurs sont concernés par les solutions d’OpenDataSoft.
UN ÉLÉPHANT QUI SE BALANÇAIT … Comment mettre en musique les big data et valo...OCTO Technology
BNP Paribas était présent pour témoigner de sa démarche avec un retour sur la mise en œuvre de ces nouvelles architectures de données.
Un menu copieux pour cette rentrée des petits-déjeuners OCTO avec un focus sur les architectures de données, un témoignage de BNP Paribas, un retour sur la mise en œuvre de ces nouvelles architectures de données et, cerise sur le gâteau, une mise en perspective de la tendance vers des architectures de flux à l’occasion de la publication du livre blanc Digital Studies Vol.02 : La question du temps dans les architectures digitales.
Les données sont là, initialement éclatées dans différents silos applicatifs. Mais maintenant qu’elles commencent à alimenter un Data Lake sous Hadoop, que va-t-on en faire ? Comment les valoriser ? Comment créer de nouveaux services à valeur ajoutée ?
BNP Paribas était là poue témoigner de sa démarche – initiée par des expérimentations autour des data - pour proposer dès à présent de nouveaux services (trois projets seront évoqués).
OCTO a présenté le retour d'expérience sur la mise en œuvre de ces nouvelles architectures de données, incluant les technologies Hadoop, Spark, Cassandra, Solr ainsi que des expérimentations sur le Machine Learning, tout en soulignant les méthodes de travail utilisées avec des équipes mixtes BNP Paribas / OCTO.
Ce petit-déjeuner a aussi été l’occasion de vous présenter et de vous remettre une version imprimée du livre blanc Digital Studies Vol.02, consacré aux questions d’architecture, notamment aux nouvelles architectures de flux.
DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !Denodo
Watch full webinar here: https://bit.ly/3c6aeuE
Pendant cette session, vous découvrirez comment la virtualisation de données et le Cataloging de la donnée vous permettent de créer un guichet unique de gouvernance et d’accès aux données afin :
- D'intégrer sans réplications toutes les données d’entreprise qu’elles soient en internes ou dans le cloud, ce indifféremment de leur format ou technologies de traitement.
- D’offrir aux utilisateurs métier l’accès à la connaissance de la donnée et à son utilisation.
- D’accélérer l'acculturation de la gouvernance de la donnée au sein de votre entreprise grâce à la virtualisation de données
- De valoriser, les bénéfices d’un guichet unique d’accès à la donnée et à la connaissance.
Séminaire BIG DATA, SYNTHÈSE - ORSYS FormationORSYS
Orsys est le premier Institut de formation aux Nouvelles Technologies de l'Informatique et l'un des acteurs les plus importants dans les domaines du Management et du Développement personnel.
Plus d’informations sur les séminaires ORSYS: http://www.seminaires-orsys.com/
Offre onepoint - Data science et big data GroupeONEPOINT
Rendre l’information intelligente permettant de générer de la valeur et des avantages concurrentiels tout en maîtrisant ses
investissements sur les moyens. Le Tsunami des données humaines et machines viendra des objets connectés : onepoint vous y prépare.
Présentation Micropole 3eme Forum MDM - 19 novembre 2014Micropole Group
Présentation en séance plénière de Pascal Anthoine, Directeur practice Information Management chez Micropole lors du 3eme Forum MDM Micropole le 19 novembre 2014 à Paris.
Pascal Anthoine présente les nouveaux enjeux de la Gouvernance des données dans les entreprises.
Similaire à Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris 2017 (20)
SQLSaturday Toulouse 2017 - Azure Data Lake : SELECT people FROM data-lake WH...Jean-Pierre Riehl
--session donnée dans le cadre du SQLSaturday Toulouse 2017--
Discover Azure Date Lake through a complete demo : how to get insights from tons of text, photos and videos ? From different media files and raw data, we will analyze sentiment of characters and get valuable information in a Power BI dashboard, using Cognitive Services, CNTK, .NET and U-SQL.
This session will mainly showcase Azure Data Lake and U-SQL language. But demos will involve different tools like Azure Data Factory for data supply chain and orchestration, Azure SQL Datawarehouse for corporate data and also Azure Machine Learning and Power BI.
Even if this session is demo-driven, we won't omit to present you concepts and features of Azure Data Lake.
Club Power BI - Partage et Collaboration avec Power BIJean-Pierre Riehl
Le Club Power BI est le groupe des utilisateurs de Power BI en France. Il se réunit tous les mois pour parler de la technologie, présenter les nouveautés, faire des retours d'expérience et réseauter entre utilisateurs.
Lors de la session de septembre 2017, Jean-Pierre Riehl a présenté un dossier sur la façon de partager et de collaborer autour d'un tableau de bord Power BI
24HOP French 2017 - Azure Data Lake, le Big Data 2.0Jean-Pierre Riehl
--session donnée dans le cadre du 24 Hours of PASS en français, édition 2017--
Azure Data Lake est LA technologie « big data » maison de Microsoft. En provenance de MS Research (nom de code Cosmos), elle est utilisée en interne par les équipes X-Box, Bing, O365 depuis quelques années déjà. Cette technologie est disponible depuis l’été dernier dans Azure et s’enrichit mois après mois.
ADL, concrètement, c’est quoi ? C’est la possibilité de stocker et analyser une quantité illimitée de données et de requêter avec un nouveau langage : le U-SQL
Dans cette session, vous découvrirez Azure Data Lake et toutes les possibilités qui s’ouvrent à vous
Université d'été de la DFCG - Parlez-vous Big Data ? Guide de conversation po...Jean-Pierre Riehl
Sans conteste, la donnée est un véritable enjeux pour l’avenir. Le Big Data fait le buzz depuis 2011. Mais quelle est la différence avec un projet de Business Intelligence traditionnel ? Comment identifier un projet Big Data ?
Dans cette session de décryptage, nous balayerons les concepts Big Data et leurs applications pour votre entreprise…ou pas. Cet éclairage sur le Big Data et son vocabulaire vous permettra de mieux comprendre les opportunités qui s’offrent à vous et d’orienter la solution à mettre en œuvre.
Alors, Big Data ou pas Big Data ?
SQLNexus Copenhaguen - Pipeline for the new oil: Azure Data Factory, Hybrid D...Jean-Pierre Riehl
Data is the new oil ? So you need pipelines.
Azure Data Factory is the solution to move Data between your data assets, wherever they are, in the cloud or on-prem.
In that session, you'll see Azure Data Factory (ADF) in action and learn how to build your first pipeline.
You will understand basic concepts of ADF and see how to implement advanced activities.
Also, you'll learn how to get data from on-prem data assets with hybrid pipelines
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...Jean-Pierre Riehl
Le contrôle de gestion de Edenred, leader des services prépayés aux entreprises, a mis en œuvre des tableaux de bord de pilotage pour mieux suivre les chiffres clés et aider les différentes fonctions de la société.
Au travers d’un retour d’expérience, découvrez comment Power BI peut être un outil puissant de reporting, d’analyse et de pilotage de la performance. L’objectif de cette session est de revenir sur les points clés de la mise en œuvre, de la réalisation des indicateurs, à la gouvernance de la solution en passant par la coopération avec les services informatiques.
Réutilisation de l’existant décisionnel, solution hybride entre le cloud et le système d’information d’Edenred, DataViz adaptée aux utilisateurs et aux usages, indicateurs simples et calculs complexes, explorons toutes les facettes de ce projet métier.
Session faisant partie de la conférence MS Experiences 2017
Co-animée avec Cédric François
https://experiences17.microsoft.fr/attendee/5f26809a-3c58-e711-80c2-000d3a21081a
Transformation d'un skipper en Iron Man grâce à la réalité augmentée et aux c...Jean-Pierre Riehl
Un skipper doit surveiller un nombre impressionnant d'indicateurs pour prendre les bonnes décisions et rendre optimum la navigation de son bateau.
Pour économiser ses efforts, ce dernier a notamment besoin de visualiser des données clés au cœur de l’action.
Et si il était possible de proposer à ce dernier, un tableau de bord disposant de l'ergonomie la plus adaptée au contexte ?
Avec Hololens, ce tableau de bord peut prendre vie au cœur de l'action grâce à la réalité augmentée.
Couplée à des algorithmes prédictifs, à base de Deep Learning et de Cognitives Services, ce dernier apporte également des analyses essentielles qui font gagner un temps précieux à notre skipper.
C’est dans ce sens que AZEO a innové pour améliorer les performances de son skipper Maxime lors de ses courses de voile.
A la frontière de la data-viz et de la data-science, venez découvrir une session innovante, basée sur les promesses de la réalité augmentée et propulsée par Hololens.
Session faisant partie de la conférence MS Experiences 2017
Co-animée avec Maxime Cauwe
https://experiences17.microsoft.fr/session/0694587b-2c6d-e711-80c2-000d3a210b7f
Azure Data Lake, le big data 2.0 (Global Azure Bootcamp Paris 2017)Jean-Pierre Riehl
--session donnée dans le cadre du Global Azure Bootcamp Paris 2017 avec Fabien Adato--
Azure Data Lake est LA technologie "big data" maison de Microsoft. En provenance de MS Research (nom de code Cosmos), elle est utilisée en interne par les équipes X-Box, Bing, O365 depuis quelques années déjà. Cette technologie est disponible depuis l'été dernier dans Azure et s'enrichit mois après mois.
ADL, concrètement, c'est quoi ? C'est la possibilité de stocker et analyser une quantité illimitée de données et de requêter avec un nouveau langage : le U-SQL
Dans cette session, vous découvrirez Azure Data Lake et toutes les possibilités qui s'ouvrent à vous
Gateways to Power BI, Connect PowerBI.com to your On-Prem DataJean-Pierre Riehl
--session donnée lors du SQLSaturday Madrid 2016--
PowerBI.com is a cloud-based BI platform, enabling from personal to corporate BI. But often, your data lives on-premises, on your desktop, on a shared folder or in your enterprise datawarehouse. Microsoft team built gateways to deal with that.
In this session, we will see how to connect, lively or scheduled, your dahsboards to your on-prem data. You'll learn about Personal Gateway and Enterprise Gateway. How does it work. How to configure it. How to maintain it.
--session donnée dans le cadre du 24HOP Francophone--
http://www.sqlpass.org/24hours/2016/french/Sessions.aspx
Power BI offre de nombreuses solutions pour travailler à plusieurs sur un modèle, un rapport ou un tableau de bord. Cette session passe en revue les fonctionnalités de partage et de collaboration de Power BI avec leurs avantages et leurs inconvénients
--session donnée dans le cadre du 24HOP Francophone--
http://www.sqlpass.org/24hours/2016/french/Sessions.aspx
Les données sont le nouveau pétrole ? Alors vous avez besoin de pipelines.
Azure Data Factory est la solution pour déplacer des données entre vos briques de stockage ou de calcul, qu’elles soient dans le Cloud ou dans votre Data Center.
Dans cette session, vous découvrirez cette technologie et comment construire votre 1er pipeline.
Cortana Analytics, de nouveaux patterns pour vos plateformes de données Jean-Pierre Riehl
--- Session donnée au Global Azure Bootcamp Paris 2016 ---
Co-speaker : Fabien Adato
Le monde de la donnée est en pleine mutation. Le Data devient Big, le SQL devient NoSQL, la BI devient Analytics, le Data Mining devient Data Science…
Faux buzz ou vrais paradigmes, quoiqu'il en soit, de nouvelles architectures apparaissent pour traiter les challenges d'aujourd'hui. Microsoft propose ses solutions au travers de Cortana Analytics, veritable mashup des briques Data du Cloud Azure : Azure Data Catalog, Azure Stream Analytics, Azure Data Lake, Azure Data Factory, Azure ML, HDInsight, etc.
Que font ces briques ? Lesquelles choisir ? Comment s'interconnectent-elles ? Quelle architecture implémenter ? Ce sont ces questions que nous aborderons lors de cette session.
Power BI was initialy a Self-Service BI oriented solution. Personal BI can become a nightmare when not managed. Data governance and data stewardship are good practices to avoid dataset-hell and leverage data culture of your company.
In that session, you'll discover ways to manage your Power BI assets by process, organization and some tools like Azure Data Catalog.
--session donnée lors du SQL Saturday Torino 2015--
http://www.sqlsaturday.com/454/EventHome.aspx
Data Management Gateway (classic, personal, AS connector) is what make modern Microsoft BI stack hybrid. Power BI (v1 and v2) and Azure Data Factory use that component to interact with On-Prem Data assets.
That session is a Deep dive into the DMG and the hybrid architecture involved by Power BI and ADF. How does it work ? Security, Firewall, Certificates, Multiple gateways, Admin delegation, Scale out, Disaster Recovery…. All that topics will be covered during that technical session.
Deep Dive Data Management Gateway - SQLSaturday EdinburghJean-Pierre Riehl
--session donnée lors du SQL Saturday Edinburgh 2015--
http://www.sqlsaturday.com/388/EventHome.aspx
Data Management Gateway (and also AS Connector) is what make modern Microsoft BI stack hybrid. Power BI and Azure Data Factory use that component to interact with On-Prem Data assets.
That session is a Deep dive into the DMG and the hybrid architecture involved by Power BI and ADF. How does it work ? Security, Firewall, Certificates, Multiple gateways, Admin delegation, Scale out, Disaster Recovery…. All that topics will be covered during that technical session.
--session donnée lors du SQL Saturday Lisbon 2015--
http://www.sqlsaturday.com/369/EventHome.aspx
Data Management Gateway (and also AS Connector) is what make modern Microsoft BI stack hybrid. Power BI and Azure Data Factory use that component to interact with On-Prem Data assets.
That session is a Deep dive into the DMG and the hybrid architecture involved by Power BI and ADF. How does it work ? Security, Firewall, Certificates, Multiple gateways, Admin delegation, Scale out, Disaster Recovery…. All that topics will be covered during that technical session.
Big Data, Self-Service BI, entrepôts de données, Master Data Management, Qualité des données.
Il est de plus en plus difficile de maîtriser les données dans un système d'information.
Et pourtant une bonne gouvernance des données est cruciale pour maximiser la valeur ajoutée pour le métier.
Dans cette session, nous traiterons de la Data Gouvernance en entreprise et de son implémentation avec les outils Microsoft
Data Stewardship - Retour d'expérience de Sarenza sur la façon de piloter un ...Jean-Pierre Riehl
Le Data Steward devient incontournable dans un système de self-service BI. Mais quel est réellement son travail avec Power BI ?
Dans cette session, nous nous mettrons dans la peau du Data Steward pendant 45 minutes et verrons comment il dompte Power BI. Gestion des sources, du Data Catalog, des questions Q&A, de la sécurité, du Data Refresh, de l'usage... Autant de sujets qui impactent le quotidien du Data Steward. Lors de cette session, vous aurez le témoignage d'un vrai Data Steward avec le retour d'expérience de Sarenza.
Session présentée lors des Journées SQL Server 2014
----
La BI Microsoft a bien changée depuis 2005. Aujourd’hui, c’est Cloud-First et Mobile-First, mais comment s’y retrouver et choisir la bonne architecture ? Power BI, HDInsight, DMG, IaaS, SQL Azure, etc.
Dans cette session nous ferons le tour des composants BI et verrons comment ils s’articulent ensemble pour construire un système de gestion de l’information moderne.
2. Merci beaucoup à nos sponsors!
Thank you to all our sponsors!
Join the conversation
#MSCloudSummit
@MSCloudSummit
3. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Qui sommes nous ?
Jean-Pierre Riehl
Practice Manager Data & BI
MVP Data Platform
Local Group Leader– GUSS
@djeepy1
http://blog.djeepy1.net
Emmanuel Frenod
Directeur Scientifique
@emmanuelfrenod
http://www.see-d.fr/
4. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Data Science
Data science, also known as data-driven science, is an
interdisciplinary field about scientific processes and systems to
extract knowledge or insights from data in various forms, either
structured or unstructured, which is a continuation of some of the
data analysis fields such as statistics, machine learning, data mining,
and predictive analytics.
Définition Wikipedia
7. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Team Data Science Process
8. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Processus “Data Science”
Source : AZEO Data Science Process
9. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
TDSP: Business Understanding
Approche technique
Développement
Approche scientifique
Modélisation
Approche métier
10. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
TDSP: Data Understanding
Buzz words :
Data Crunching
Data Wrangling
Statistique descriptive : remise en
cause d’idées reçues
Regard agnostique sur les données
Nettoyage et préparation des
données
Objectif :
Featurization
11. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
TDSP: Modeling
Données
Connaissance
Modèles mathématiques
et statistiques
Aide à la décision
Information
Reporting
BI Traditionnelle
Statistique descriptive
Advanced
Analytics
12. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Modélisation mathématique et statistique
Advanced Analytics : Extraire depuis les données une connaissance de
haute valeur (prévision, information non évidente, etc.) en utilisant des
modèles mathématiques et/ou statistiques sophistiqués et des
mécanismes d’apprentissage automatique (Machine Learning).
Modèle mathématique et/ou statistique sophistiqué : Un ensemble
d’équations reliant des objets mathématiques avancés (des fonctions,
des densités de probabilités, des séries temporelles, des graphes
(arbres, grilles, réseaux, etc.), des hyper-surfaces, des maillages, des
vecteurs, des matrices, etc.)
14. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Outillage de la comprehension des données
Langage R
RTVS (R Tools for Visual
Studio)
R + SQLServer
IDEAR
Azure Machine Learning
HDInsight (Books)
VM Data Science
Power BI
Quick Insights
15. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
R /
RTVS
16. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
TDSP : IDEAR
17. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Power BI
Quick Insights
19. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Mise en œuvre
par l’équipe See-d sur un problème de
pricing chez un transporteur
20. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
TDSP a été mise en œuvre
par l’équipe See-d sur un
problème de pricing
Gains de marge
21. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
La problématique du Pricing
Question de notre client :
ses clients paient-ils le prix
optimum ?
22. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Business Understanding
Apports de See-d à cette
compréhension
Compréhension du business
par See-d
23. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Business Understanding
• Des membres de l’équipe See-d ont fait le parcours d’intégration
des personnes recrutées chez le client
• Echanges fréquents avec
– Les chefs de quai
– Le marketing
– La DSI
– La Direction du commerce
• Apport de See-d
– Formalisation des questions
– Un regard sans a priori sur l’activité et les données
24. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Compréhension des données
Statistique descriptive :
remise en cause d’idées
reçues
Regard agnostique sur les
données
Nettoyages des données
25. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
La table de données
Table de positions
Une position : toutes les informations
concernant un transport : date, jour, type, poids,
client, prix, etc.
26. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
La table de données
Date Jour Heure
départ
Heure
arrivée
poids … … Prix Prix/tonne … …
Position 1
Position 2
Position 3
…
…
Position n
…
…
27. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
La table de données
Date Jour Heure
départ
Heure
arrivée
poids … … Prix Prix/tonne … …
Position 1
Position 2
Position 3
…
…
Position n
…
…
Explicatives Conséquences
29. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Identification de sujets de questionnement et/ou d’étonnement :
• Des tendances linéaires
• Problèmes dans les faibles poids :
• Prix très faibles
• Prix très forts
• Grande variabilité des prix pour un poids donné
30. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Identification de sujets de questionnement et/ou d’étonnement :
• Des tendances linéaires
• Problèmes dans les faibles poids :
• Prix très élevés
• Prix très faibles
• Grande variabilité des prix pour un poids donné
31. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Identification de sujets de questionnement et/ou d’étonnement :
• Des tendances linéaires
• Problèmes dans les faibles poids :
• Prix très faibles
• Prix très forts
• Grande variabilité des prix pour un poids donné
32. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Passage en €/tonne
34. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS34
Poids (kg) €/tonne
30 5 936,1
40 4 452,1
50 3 561,6
70 2 544,0
100 1 780,8
200 890,4
300 593,6
500 356,2
800 222,6
1 500 118,7
3 000 59,4
5 000 35,6
10 000 17,8
20 000 8,9
Règle utilisée pour calculer le
prix au forfait
100 kg
Tendance cohérente: pente = -1 (Tarifs Généraux)
Pas cohérent
log
€
𝑡𝑜𝑛𝑛𝑒
= − log 𝐾𝑔 + 12,09
35. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS35
Poids (kg) €/tonne
30 5 936,1
40 4 452,1
50 3 561,6
70 2 544,0
100 1 780,8
200 890,4
300 593,6
500 356,2
800 222,6
1 500 118,7
3 000 59,4
5 000 35,6
10 000 17,8
20 000 8,9
Règle utilisée pour calculer le
prix au forfait
100 kg
log
€
𝑡𝑜𝑛𝑛𝑒
= − log 𝐾𝑔 + 12,09
Tendance cohérente: pente négative quasi nulle
Pas cohérent
36. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Données
Connaissance
Aide à la
décision
Modèles
mathématiques
et statistiques
Information
• Reporting
• BI Traditionnelle
• Statistique
descriptive
Point crucial
pour la pleine
valorisation
des données
Modélisation mathématique et statistique
Advanced Analytics
37. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Modélisation mathématique et statistique
Implémentation, déploiement
Création de modèles
spécifiques, tests
Recherche parmi le modèles
existants, tests
38. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Modélisation mathématique et statistique
Classifications statistiques
croisées clients / positions
39. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Que se cache-t-il derrière l’application développée ?
Le coeur de l′
outil repose sur des classes de positions qui se ressemblent
Cl. 1 Classe 2 … Cl. n
La construction de ces classes est le challenge ∶
- car le nombre de positions est très élevé
- car il faut choisir les caractéristiques des positions
- car il faut choisir le nombre de classes
Ensemble de positions
40. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Le coeur de l′
outil repose sur des classes de positions qui se ressemblent
Cl. 1 Classe 2 … Cl. n
La construction de ces classes est le challenge ∶
- car le nombre de positions est très élevé
- car il faut choisir les caractéristiques des positions
- car il faut choisir le nombre de classes
Ensemble de positions
Que se cache-t-il derrière l’application développée ?
41. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Cl. 1 Classe 2 … Cl. n
La construction de ces classes est le challenge ∶
- car le nombre de positions est très élevé
- car il faut choisir les caractéristiques des positions
- car il faut choisir le nombre de classes
Les méthodes classiques de classification ne sont pas adaptées …
• utilisation d’une hybrid clustering (CLara : Clustering of Large Application)
• Partition around medoids : construction de 50 classes
• Sur les 50 classes, Hierarchical clustering with euclidean distance with Ward
criterion : construction de n classes
Que se cache-t-il derrière l’application développée ? - Méthodes utilisées
42. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Cl. 1 Classe 2 … Cl. n
La construction de ces classes est le challenge ∶
- car le nombre de positions est très élevé
- car il faut choisir les caractéristiques des positions
- car il faut choisir le nombre de classes
Les méthodes classiques de classification ne sont pas adaptées …
• utilisation d’une hybrid clustering (CLara : Clustering of Large Application)
• Partition around medoids : construction de 50 classes
• Sur les 50 classes, Hierarchical clustering with euclidean distance with Ward
criterion : construction de n classes avec choix de n sur l’interprétation
par See-d d’un critère de minimisation de la perte de la variance
inter-classe (2 classes ne seront pas regroupées si elles sont
jugées trop différentes)
Que se cache-t-il derrière l’application développée ? - Méthodes utilisées
43. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Cl. 1 Classe 2 … Cl. n
La construction de ces classes est le challenge ∶
- car le nombre de positions est très élevé
- car il faut choisir les caractéristiques des positions
- car il faut choisir le nombre de classes
L’interprétation des différentes classifications obtenues selon les différents uplets
de caractéristiques testés est la clé de l’obtention d’une typologie de positions
utilisables dans l’outil :
• Exemple : le poids moyen d’une palette n’a pas d’utilité (en l’occurrence)
• Une caractéristique utilisée pour la construction des classes doit être facilement
accessible ensuite via le système d’information du client car cette
caractéristique est utilisée, entre autres, pour classer les nouvelles
positions.
Que se cache-t-il derrière l’application développée ? - Méthodes utilisées
44. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Cl. 1 Classe 2 … Cl. n
Pour ce faire See-d a construit un modèle de classement :
• Qui est performant i.e. faire tomber une nouvelle position dans la bonne classe avec
une forte probabilité, via les random forest
• Ceci grâce au bon choix par le statisticien des variables prédicteurs (fort pouvoir de
prédiction ET disponibilité via le SI du client)
La mise à jour de l’application se fait par l’alimentation avec les nouvelles
positions à fréquence régulière
Nouvelle position 1, nouvelle position 2 , …., nouvelle position p
Que se cache-t-il derrière l’application développée ? - Méthodes utilisées
45. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Que se cache-t-il derrière l’application développée ? - Random Forest
Couleur
Vert
Jaune
Rouge
Taille
Taille Forme
Petit
MoyenGros
Taille
PetitMoyen
Goût
Acide
Sucré
Pastèque
Pomme
Raisin
Rond
Raisin
Citron
Long
Banane
Raisin Cerise
Petit
Moyen
Pomme
1/ Arbre de Décision – Exemple 1
46. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Que se cache-t-il derrière l’application développée ? - Random Forest
Val(Col2)
< 3
3 < …< 7
>7
Val(Col1) +
4 * Val(Col4)
Val(Col1) +
2 * Val(Col4)
Val(Col5)
> 1710 < …< 17< 10
Val(Col1) +
3 * Val(Col4)
> 11<11
Val(Col5) -
Val(Col7)
> 100< 100
Classe 1
Classe 2
Classe 3
> 5
Classe 2
Classe5
> 5
Classe 4
Classe 6 Classe 2
< 12
> 12
Classe 2
2/ Arbre de Décision – Exemple avec un tableau comme le notre
47. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Que se cache-t-il derrière l’application développée ? - Random Forest
A1*Val(Col c1)
+ …+ A10*Val(Col c10)
< S1
S2 < …< S3
> S4
> S7S5 < …< S6< S5
> S10< S10
> S11< S11
Classe 1
Classe 2
Classe 3
> S8
Classe 2
Classe5
> S8
Classe 4
Classe 6 Classe 2
< S9
> S9
Classe 2
3/ Connaissant les classes trouver l’arbre qui les donne
A11*Val(Col c11)
+ …+ A30*Val(Col c30)
A31*Val(Col c31)
+ …+ A37*Val(Col c37)
A38*Val(Col c38)
+ …+ A50*Val(Col c50)
A51*Val(Col c51)
+ …+ A60*Val(Col c60)
A61*Val(Col c61)
+ …+ A67*Val(Col c67)
48. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Que se cache-t-il derrière l’application développée ? - Random Forest
A1*Val(Col c1)
+ …+ A10*Val(Col c10)
< S1
S2 < …< S3
> S4
> S7S5 < …< S6< S5
> S10< S10
> S11< S11
Classe 1
Classe 2
Classe 3
> S8
Classe 2
Classe5
> S8
Classe 4
Classe 6 Classe 2
< S9
> S9
Classe 2
3/ Connaissant les classes trouver l’arbre qui les donne
A11*Val(Col c11)
+ …+ A30*Val(Col c30)
A31*Val(Col c31)
+ …+ A37*Val(Col c37)
A38*Val(Col c38)
+ …+ A50*Val(Col c50)
A51*Val(Col c51)
+ …+ A60*Val(Col c60)
A61*Val(Col c61)
+ …+ A67*Val(Col c67)
49. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Que se cache-t-il derrière l’application développée ? - Random Forest
A1*Val(Col c1)
+ …+ A10*Val(Col c10)
< S1
S2 < …< S3
> S4
> S7S5 < …< S6< S5
> S10< S10
> S11< S11
Classe 1
Classe 2
Classe 3
> S8
Classe 2
Classe5
> S8
Classe 4
Classe 6 Classe 2
< S9
> S9
Classe 2
4/ Connaissant les classes trouver l’arbre qui les donne au mieux
pour une extraction de 80%
de lignes
A11*Val(Col c11)
+ …+ A30*Val(Col c30)
A31*Val(Col c31)
+ …+ A37*Val(Col c37)
A38*Val(Col c38)
+ …+ A50*Val(Col c50)
A51*Val(Col c51)
+ …+ A60*Val(Col c60)
A61*Val(Col c61)
+ …+ A67*Val(Col c67)
50. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
La matérialisation de l’outil via une Web App est le produit fini, utilisable, et
est très importante mais ne constitue que la face émergée de l’outil statistique
…
Que se cache-t-il derrière l’application développée ?
C
l.
1
Cla
sse
2
…
C
l.
n
Ensemble de positions
51. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Déploiement d’applications
Une application qui répond
exactement aux besoins,
demandes et attentes
Du sur-mesure également
dans le déploiement
Une méthode de travail qui
facilite le
déploiement
52. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Déploiement d’applications
• Impliquer fortement les équipes terrain
– Facilite le déploiement
– Les outils développés sont attendus
• Déployer les outils
– Que vous désire le client
– Dans l’environnement que souhaite le client
– Selon la méthode que souhaite le client
53. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Conclusions
Avec une expertise rare en Advanced
Analytics
Une équipe qui maîtrise toute la
chaine du traitement des données
54. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Données
Connaissance
Aide à la
décision
Modèles
mathématiques
et statistiques
Information
• Reporting
• BI Traditionnelle
• Statistique
descriptive
Point crucial
pour la pleine
valorisation
des données
Conclusions
Avec une expertise rare en Advanced
Analytics
Une équipe qui maîtrise toute la
chaine du traitement des données
55. #MSCloudSummit - MS Cloud Summit Paris 2017 Un événement proposé par Agile.Net, aOS, AZUG FR, CMD, GUSS
Conclusions
Demande une expertise de haut
niveau :
• Docteurs - Ingénieurs
• Mathématiques - Statistique
• Modélisation
Avec une expertise rare en Advanced
Analytics
Une équipe qui maîtrise toute la
chaine du traitement des données