SlideShare une entreprise Scribd logo
1  sur  14
Télécharger pour lire hors ligne
Hadoop
SAS®Visual Analytics
Usages cibles des utilisateurs SAS
Paris, 5/11/2013

Soft Computing – 55, quai de Grenelle – 75015 Paris – tél. +33 (0)1 73 00 55 00 – www.softcomputing.com
Thème

• Le Big Data offre la capacité de traiter des volumes de données conséquents
à l’aide d’architectures techniques nouvelles, comment les utilisateurs
traditionnels (datamanager, datasteward, dataminers) accèderont et
traiteront les données dans ces nouvelles architectures ?

• La démonstration s’appuiera sur les interfaces SAS de connexion aux données issues

du Big Data pour illustrer les nouvelles pratiques des utilisateurs de SAS. Cette
démonstration aura notamment pour but d’alimenter le débat autour de la mutation
des pratiques des utilisateurs SAS dans ces nouveaux environnements techniques,
quelles seront les nouvelles compétences à acquérir ? quelles compétences pour quels
profils ?

www.softcomputing.com

Reproduction interdite sans l’accord écrit de Soft Computing

07/11/2013

2
Des systèmes d’information décisionnels en pleine mutation

Système décisionnel historique
Des faiblesses
•Les coûts
•Les délais
•La qualité des données
•La satisfaction utilisateur

Système décisionnel
nouvelle génération
La Business
Intelligence
Agile

Des nouvelles
contraintes
•La volumétrie
•Le réglementaire
•La garantie du niveau de
service

Des anciennes croyances

•L’autonomie des utilisateurs
•La mobilité
•Données exogènes et non
structurées

Le Dataviz

Des nouveaux besoins

•Séparation TP et AP
•J+1
•MOLAP
•Datamart physique

Le Inmemory

www.softcomputing.com

Hadoop

Reproduction interdite sans l’accord écrit de Soft Computing

Les
Appliances

07/11/2013

3
Big Data : Architecture applicative avec intégration Hadoop

2 axes technologiques :
•In-memory technology
•Distributed computing

www.softcomputing.com

Reproduction interdite sans l’accord écrit de Soft Computing

07/11/2013

4
3 types d’utilisateurs

Datamanager
•“Data management is the development and execution of architectures, policies, practices and
procedures in order to manage the information lifecycle needs of an enterprise in an effective
manner. ” Source TechTarget

Data steward
•“Data stewardship is the management and oversight of an organization's data assets to help
provide business users with high-quality data that is easily accessible in a consistent
manner.” Source TechTarget

Dataminer
•“Data mining is sorting through data to identify patterns and establish relationships.” Source
TechTarget

www.softcomputing.com

Reproduction interdite sans l’accord écrit de Soft Computing

07/11/2013

5
Architecture fonctionnelle autour de SAS®Visual Analytics
(mode Cluster Hadoop)

Requête

Exploration
Administration

SAS
distribué

Extraction,
Chargement,
Transformation

HDFS

Création et
publication des
rapports

Sources
externes

Sharepoint
Outlook
Add-In for
Microsoft
Offide, SAS
for Mobile

Visualisation
des rapports

SAS
In-memory
Exploration
dans les
données

Sources
internes

Datamanager
Exploration
dans les
données
+ Mining

www.softcomputing.com

Reproduction interdite sans l’accord écrit de Soft Computing

Datasteward
Business User

Dataminer

07/11/2013

6
Architecture applicative SAS®Visual Analytics

Datamanager
Datasteward

SAS Visual Analytics Viewer

Business User

SAS Visual Analytics Designer

SAS Visual Analytics Explorer

Dataminer
SAS
Visual
Analytics

LASR Server
SASDIS + SASEG:
•Fournit les fonctionnalités en
datamanagement max
•Nécessite des compétences expertes

SAS Visual Data Builder:
•Facilité d’utilisation
•Fonctionnalités en datamagement plus
limitées

Administr
ation

!
Données internes

Données sources

www.softcomputing.com

Données externes

Reproduction interdite sans l’accord écrit de Soft Computing

07/11/2013

7
!

Databuilder: Les problématiques liées à SAS® Visual Analytics

• Le chargement des données
– Accès aux données autorisées par l’administrateur SAS « Master »
– Accès aux données de fichiers externes
– Chargement de données « In-memory » par une requête

• La modélisation des données
– Pas de création de cubes
– Eviter le plus possible les pré-aggrégations
– Grain au détail  maximum de degrés de liberté sur la navigation
– Bien appréhender la contrainte :
• Une exploration  une table
• Un rapport  une table
Modéliser en conséquence (jointure, concaténation de tables, …)
www.softcomputing.com

Reproduction interdite sans l’accord écrit de Soft Computing

07/11/2013

8
Outils SAS pour le datamager dans un contexte Big Data

• Dans SAS Data Integration Studio :
– Utilisation de transformations spécifiques aux traitements de données
sous Hadoop :
• Chargement de fichiers Hadoop
• Template de transformations en langage natif Hadoop
• Ecriture de fichiers sur la couche Hadoop

– Possibilité de charger les données sur la couche In-memory

www.softcomputing.com

Reproduction interdite sans l’accord écrit de Soft Computing

07/11/2013

9
Outils SAS pour le datamager dans un contexte Big Data

• Dans Sas Entreprise Guide ou SAS Data Integration Studio => coding SAS
– Utilisation du connecteur SAS Connect To Hadoop
• Librairies SAS connecté à une base de données HIVE (Implicit Pass-Through)
• PROC SQL connecté à une base de données HIVE (Explicit Pass-Through)

– User Defined Function (ex : les fonctions SAS_PUT, SAS_ZACORR dans Teradata)
– Nouvelle procédure <=> nouveau langage de développement SAS
• PROC DS2

– Possibilité de charger les données sur la couche In-memory
• PROC IMSTAT

www.softcomputing.com

Reproduction interdite sans l’accord écrit de Soft Computing

07/11/2013

10
Focus langage DS2 : le langage de nouvelle génération

• DS2, une alternative à l’étape DATA
• Permet d’optimiser le datamanagement en environnement high•
•
•
•
•

performance avec traitements parallélisés
Nouvelle technologie / Etape DATA
Syntaxe familière aux utilisateurs de SAS/AF (des méthodes : init,
term and run)
Proche de l’étape DATA, en partageant les fonctionnalités les plus
usitées (boucle implicite, retain, set, …)
Evolutif en associant à l’environnement du développeur de nouveaux
packages (comme la PROC FCMP)
Exécutable aussi bien dans une session SAS Bases traditionnelle que
via un connecteur « In-database » associé au module
SAS®Embedded Process

www.softcomputing.com

Reproduction interdite sans l’accord écrit de Soft Computing

07/11/2013

11
« Hello World » Comparaison

En DS2

proc ds2;
data _null_;
method init();
dcl varchar(16) str;
str = 'Hello World!';
put str;
end;
enddata;
run;

En JAVA

En C++

Une syntaxe, proche de l’étape DATA, qui reste éloignée des langages de
programmation orientés objet

www.softcomputing.com

Reproduction interdite sans l’accord écrit de Soft Computing

07/11/2013

12
Outils SAS pour le Dataminer dans un contexte Big Data

• SAS Visual Analytics Explorer
– Permet d’explorer la donnée et d’effectuer des analyses rapides :
• Corrélation
• Régressions
• Séries temporelles, …

• SAS Entreprise Miner
– Permet la création de modèles statistiques
– Utilisation des procédures statistiques bénéficiant du mode distribué :
•
•
•
•
•
•
•

HPDMDB Summarize data
HPDS2 Parallel execution of DS2:
HPFOREST Random forest
HPLOGISTIC Logistic regression
HPNEURAL Neural network modeling
HPSAMPLE Sampling and data partitioning
…

www.softcomputing.com

Reproduction interdite sans l’accord écrit de Soft Computing

07/11/2013

14
Conclusion : Quelles compétences pour quels profils ?

En environnement SAS
traditionnel

En environnement distribué
ou/et In-memory

Langages SAS,
SAS MP/Connect
SQL Pass-through

FCMP - DS2
User Define Function
HIVE, PIG

Infomaps

SAS®Visual Data Builder
SAS®Visual Analytics Explorer

SAS Entreprise Miner
Langage SAS

www.softcomputing.com

SAS Entreprise Miner (transformation code EM en DS2)
SAS®Visual Analytics Explorer
High-performance procedure
User Define Function

Reproduction interdite sans l’accord écrit de Soft Computing

07/11/2013

15

Contenu connexe

Tendances

Le référentiel employé pour tirer toute la valeur de vos données RH
Le référentiel employé pour tirer toute la valeur de vos données RHLe référentiel employé pour tirer toute la valeur de vos données RH
Le référentiel employé pour tirer toute la valeur de vos données RHJean-Michel Franco
 
Présentation Mcia Solution (Fr)
Présentation Mcia Solution (Fr)Présentation Mcia Solution (Fr)
Présentation Mcia Solution (Fr)MCia
 
Ms Cloud Summit 2017 - Power Bi, le tour complet 2017
Ms Cloud Summit 2017 - Power Bi, le tour complet 2017Ms Cloud Summit 2017 - Power Bi, le tour complet 2017
Ms Cloud Summit 2017 - Power Bi, le tour complet 2017Isabelle Van Campenhoudt
 
ONLINE_SAP_S4HANA_Roadmap_A4_FR
ONLINE_SAP_S4HANA_Roadmap_A4_FRONLINE_SAP_S4HANA_Roadmap_A4_FR
ONLINE_SAP_S4HANA_Roadmap_A4_FRBertille Laudoux
 
Présentation de Talend Data Preparation
Présentation de Talend Data PreparationPrésentation de Talend Data Preparation
Présentation de Talend Data PreparationJean-Michel Franco
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data VirtualizationDenodo
 
Deagital smart data proposal fr
Deagital smart data proposal frDeagital smart data proposal fr
Deagital smart data proposal frJose Torres
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data VirtualizationDenodo
 
Découvrez Power BI - [webinaire avec demo]
Découvrez Power BI - [webinaire avec demo]Découvrez Power BI - [webinaire avec demo]
Découvrez Power BI - [webinaire avec demo]Technologia Formation
 
Capgemini Offre Data Services - Brochure FR
Capgemini Offre Data Services - Brochure FRCapgemini Offre Data Services - Brochure FR
Capgemini Offre Data Services - Brochure FRSkander Guetari
 
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...Jean-Michel Franco
 
XebiConFr 15 - Be Data Driven : Monter son Data Lab
XebiConFr 15 - Be Data Driven : Monter son Data LabXebiConFr 15 - Be Data Driven : Monter son Data Lab
XebiConFr 15 - Be Data Driven : Monter son Data LabPublicis Sapient Engineering
 
Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6Jean-Michel Franco
 

Tendances (15)

Le référentiel employé pour tirer toute la valeur de vos données RH
Le référentiel employé pour tirer toute la valeur de vos données RHLe référentiel employé pour tirer toute la valeur de vos données RH
Le référentiel employé pour tirer toute la valeur de vos données RH
 
Présentation Mcia Solution (Fr)
Présentation Mcia Solution (Fr)Présentation Mcia Solution (Fr)
Présentation Mcia Solution (Fr)
 
Ms Cloud Summit 2017 - Power Bi, le tour complet 2017
Ms Cloud Summit 2017 - Power Bi, le tour complet 2017Ms Cloud Summit 2017 - Power Bi, le tour complet 2017
Ms Cloud Summit 2017 - Power Bi, le tour complet 2017
 
ONLINE_SAP_S4HANA_Roadmap_A4_FR
ONLINE_SAP_S4HANA_Roadmap_A4_FRONLINE_SAP_S4HANA_Roadmap_A4_FR
ONLINE_SAP_S4HANA_Roadmap_A4_FR
 
Présentation de Talend Data Preparation
Présentation de Talend Data PreparationPrésentation de Talend Data Preparation
Présentation de Talend Data Preparation
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
Deagital smart data proposal fr
Deagital smart data proposal frDeagital smart data proposal fr
Deagital smart data proposal fr
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
Retour d'expérience Power BI
Retour d'expérience Power BIRetour d'expérience Power BI
Retour d'expérience Power BI
 
Découvrez Power BI - [webinaire avec demo]
Découvrez Power BI - [webinaire avec demo]Découvrez Power BI - [webinaire avec demo]
Découvrez Power BI - [webinaire avec demo]
 
Capgemini Offre Data Services - Brochure FR
Capgemini Offre Data Services - Brochure FRCapgemini Offre Data Services - Brochure FR
Capgemini Offre Data Services - Brochure FR
 
Démarche d'une data factory par Xebia
Démarche d'une data factory par XebiaDémarche d'une data factory par Xebia
Démarche d'une data factory par Xebia
 
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
 
XebiConFr 15 - Be Data Driven : Monter son Data Lab
XebiConFr 15 - Be Data Driven : Monter son Data LabXebiConFr 15 - Be Data Driven : Monter son Data Lab
XebiConFr 15 - Be Data Driven : Monter son Data Lab
 
Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6
 

En vedette

Rapport de stage centre d'affaire AWB
Rapport de stage centre d'affaire AWB Rapport de stage centre d'affaire AWB
Rapport de stage centre d'affaire AWB Wadiaa Piczo
 
Sas visual analytics Training
Sas visual analytics Training Sas visual analytics Training
Sas visual analytics Training bidwhm
 
PFCE : Plate-Forme pour le Commerce Équitable Comment renforcer le développem...
PFCE : Plate-Forme pour le Commerce Équitable Comment renforcer le développem...PFCE : Plate-Forme pour le Commerce Équitable Comment renforcer le développem...
PFCE : Plate-Forme pour le Commerce Équitable Comment renforcer le développem...Youmatter
 
Cuestionario Renan Vega Cantor Copia
Cuestionario Renan Vega Cantor   CopiaCuestionario Renan Vega Cantor   Copia
Cuestionario Renan Vega Cantor Copiapacifiquitas
 
travail de recherche sur les carrières
travail de recherche sur les carrières travail de recherche sur les carrières
travail de recherche sur les carrières wafabouricha
 
Extrait du livre "LE MONDE D'ELOI"
Extrait du livre "LE MONDE D'ELOI"Extrait du livre "LE MONDE D'ELOI"
Extrait du livre "LE MONDE D'ELOI"Hop'Toys
 
Plan de Trabajo y Criterios de Evaluación 2012 -1
Plan de Trabajo y Criterios de Evaluación 2012 -1Plan de Trabajo y Criterios de Evaluación 2012 -1
Plan de Trabajo y Criterios de Evaluación 2012 -1practicasmicrobiologia
 
Les marques françaises
Les marques françaises   Les marques françaises
Les marques françaises DomDiogo
 
Superstitions autour-des-chats-
Superstitions autour-des-chats-Superstitions autour-des-chats-
Superstitions autour-des-chats-Renée Gasser
 
I4M Country profile finland (in french)
I4M Country profile finland (in french)I4M Country profile finland (in french)
I4M Country profile finland (in french)Veronica Gelfgren
 
Conseils d'une femme heureuse
Conseils d'une femme heureuseConseils d'une femme heureuse
Conseils d'une femme heureuseRenée Gasser
 
Diapo présentation rd compressé compatible
Diapo présentation rd compressé compatibleDiapo présentation rd compressé compatible
Diapo présentation rd compressé compatiblerd35
 
Bikini a fil des âges
Bikini a fil des âgesBikini a fil des âges
Bikini a fil des âgesRenée Gasser
 

En vedette (20)

SAS Visual Analytics
SAS Visual AnalyticsSAS Visual Analytics
SAS Visual Analytics
 
Rapport de stage centre d'affaire AWB
Rapport de stage centre d'affaire AWB Rapport de stage centre d'affaire AWB
Rapport de stage centre d'affaire AWB
 
Sas visual analytics Training
Sas visual analytics Training Sas visual analytics Training
Sas visual analytics Training
 
SAS Visual Analytics Overview
SAS Visual Analytics OverviewSAS Visual Analytics Overview
SAS Visual Analytics Overview
 
Aspects nutritionnels chez les jeunes diabétiques type 1
Aspects nutritionnels chez les jeunes diabétiques type 1Aspects nutritionnels chez les jeunes diabétiques type 1
Aspects nutritionnels chez les jeunes diabétiques type 1
 
PFCE : Plate-Forme pour le Commerce Équitable Comment renforcer le développem...
PFCE : Plate-Forme pour le Commerce Équitable Comment renforcer le développem...PFCE : Plate-Forme pour le Commerce Équitable Comment renforcer le développem...
PFCE : Plate-Forme pour le Commerce Équitable Comment renforcer le développem...
 
Cuestionario Renan Vega Cantor Copia
Cuestionario Renan Vega Cantor   CopiaCuestionario Renan Vega Cantor   Copia
Cuestionario Renan Vega Cantor Copia
 
travail de recherche sur les carrières
travail de recherche sur les carrières travail de recherche sur les carrières
travail de recherche sur les carrières
 
Extrait du livre "LE MONDE D'ELOI"
Extrait du livre "LE MONDE D'ELOI"Extrait du livre "LE MONDE D'ELOI"
Extrait du livre "LE MONDE D'ELOI"
 
Plan de Trabajo y Criterios de Evaluación 2012 -1
Plan de Trabajo y Criterios de Evaluación 2012 -1Plan de Trabajo y Criterios de Evaluación 2012 -1
Plan de Trabajo y Criterios de Evaluación 2012 -1
 
RETOS EDUCATIVOS
RETOS EDUCATIVOSRETOS EDUCATIVOS
RETOS EDUCATIVOS
 
Dues grans estrelles
Dues grans estrellesDues grans estrelles
Dues grans estrelles
 
Les marques françaises
Les marques françaises   Les marques françaises
Les marques françaises
 
Superstitions autour-des-chats-
Superstitions autour-des-chats-Superstitions autour-des-chats-
Superstitions autour-des-chats-
 
I4M Country profile finland (in french)
I4M Country profile finland (in french)I4M Country profile finland (in french)
I4M Country profile finland (in french)
 
Conseils d'une femme heureuse
Conseils d'une femme heureuseConseils d'une femme heureuse
Conseils d'une femme heureuse
 
Diapo présentation rd compressé compatible
Diapo présentation rd compressé compatibleDiapo présentation rd compressé compatible
Diapo présentation rd compressé compatible
 
Twindocs
TwindocsTwindocs
Twindocs
 
Présentation site
Présentation sitePrésentation site
Présentation site
 
Bikini a fil des âges
Bikini a fil des âgesBikini a fil des âges
Bikini a fil des âges
 

Similaire à SAS Forum Soft Computing Théâtre

Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Converteo
 
BlueData EPIC datasheet (en Français)
BlueData EPIC datasheet (en Français)BlueData EPIC datasheet (en Français)
BlueData EPIC datasheet (en Français)BlueData, Inc.
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDenodo
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDenodo
 
Morning with MongoDB Paris 2012 - Fast Connect
Morning with MongoDB Paris 2012 - Fast ConnectMorning with MongoDB Paris 2012 - Fast Connect
Morning with MongoDB Paris 2012 - Fast ConnectMongoDB
 
Présentation Big Data et REX Hadoop
Présentation Big Data et REX HadoopPrésentation Big Data et REX Hadoop
Présentation Big Data et REX HadoopJoseph Glorieux
 
IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...
IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...
IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...IBM France Lab
 
Session en ligne: Découverte du Logical Data Fabric & Data Virtualization
Session en ligne: Découverte du Logical Data Fabric & Data VirtualizationSession en ligne: Découverte du Logical Data Fabric & Data Virtualization
Session en ligne: Découverte du Logical Data Fabric & Data VirtualizationDenodo
 
Simplifier la mise en place d'une stratégie Data Mesh avec Denodo
Simplifier la mise en place d'une stratégie Data Mesh avec DenodoSimplifier la mise en place d'une stratégie Data Mesh avec Denodo
Simplifier la mise en place d'une stratégie Data Mesh avec DenodoDenodo
 
USI 2013 : 7 changements nécessaires pour sauver vos SI décisionnels
USI 2013 : 7 changements nécessaires pour sauver vos SI décisionnelsUSI 2013 : 7 changements nécessaires pour sauver vos SI décisionnels
USI 2013 : 7 changements nécessaires pour sauver vos SI décisionnelsJoseph Glorieux
 
Livre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesConverteo
 
Azure Camp 9 Décembre 2014 - slides Keynote
Azure Camp 9 Décembre 2014 - slides KeynoteAzure Camp 9 Décembre 2014 - slides Keynote
Azure Camp 9 Décembre 2014 - slides KeynoteMicrosoft
 
Les clés de succès pour moderniser votre architecture de données en 2022
Les clés de succès pour moderniser votre architecture de données en 2022Les clés de succès pour moderniser votre architecture de données en 2022
Les clés de succès pour moderniser votre architecture de données en 2022Denodo
 
Matinale Technologique SAS
Matinale Technologique SASMatinale Technologique SAS
Matinale Technologique SASSoft Computing
 
La Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientLa Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientDenodo
 
Azure Camp 9 Décembre - slides session développeurs webmedia
Azure Camp 9 Décembre - slides session développeurs webmediaAzure Camp 9 Décembre - slides session développeurs webmedia
Azure Camp 9 Décembre - slides session développeurs webmediaMicrosoft
 
Gab17 lyon - La BI traditionnelle est une histoire du passée. Impacts de la r...
Gab17 lyon - La BI traditionnelle est une histoire du passée. Impacts de la r...Gab17 lyon - La BI traditionnelle est une histoire du passée. Impacts de la r...
Gab17 lyon - La BI traditionnelle est une histoire du passée. Impacts de la r...AZUG FR
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataLudovic Piot
 

Similaire à SAS Forum Soft Computing Théâtre (20)

Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018
 
BlueData EPIC datasheet (en Français)
BlueData EPIC datasheet (en Français)BlueData EPIC datasheet (en Français)
BlueData EPIC datasheet (en Français)
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data Virtualization
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data Virtualization
 
Morning with MongoDB Paris 2012 - Fast Connect
Morning with MongoDB Paris 2012 - Fast ConnectMorning with MongoDB Paris 2012 - Fast Connect
Morning with MongoDB Paris 2012 - Fast Connect
 
Présentation Big Data et REX Hadoop
Présentation Big Data et REX HadoopPrésentation Big Data et REX Hadoop
Présentation Big Data et REX Hadoop
 
IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...
IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...
IBM Bluemix Paris meetup - Big Data & Analytics dans le Cloud - Epitech- 2016...
 
Session en ligne: Découverte du Logical Data Fabric & Data Virtualization
Session en ligne: Découverte du Logical Data Fabric & Data VirtualizationSession en ligne: Découverte du Logical Data Fabric & Data Virtualization
Session en ligne: Découverte du Logical Data Fabric & Data Virtualization
 
DataStax Enterprise BBL
DataStax Enterprise BBLDataStax Enterprise BBL
DataStax Enterprise BBL
 
Simplifier la mise en place d'une stratégie Data Mesh avec Denodo
Simplifier la mise en place d'une stratégie Data Mesh avec DenodoSimplifier la mise en place d'une stratégie Data Mesh avec Denodo
Simplifier la mise en place d'une stratégie Data Mesh avec Denodo
 
USI 2013 : 7 changements nécessaires pour sauver vos SI décisionnels
USI 2013 : 7 changements nécessaires pour sauver vos SI décisionnelsUSI 2013 : 7 changements nécessaires pour sauver vos SI décisionnels
USI 2013 : 7 changements nécessaires pour sauver vos SI décisionnels
 
Livre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakes
 
Azure Camp 9 Décembre 2014 - slides Keynote
Azure Camp 9 Décembre 2014 - slides KeynoteAzure Camp 9 Décembre 2014 - slides Keynote
Azure Camp 9 Décembre 2014 - slides Keynote
 
Les clés de succès pour moderniser votre architecture de données en 2022
Les clés de succès pour moderniser votre architecture de données en 2022Les clés de succès pour moderniser votre architecture de données en 2022
Les clés de succès pour moderniser votre architecture de données en 2022
 
Matinale Technologique SAS
Matinale Technologique SASMatinale Technologique SAS
Matinale Technologique SAS
 
La Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientLa Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance client
 
Azure Camp 9 Décembre - slides session développeurs webmedia
Azure Camp 9 Décembre - slides session développeurs webmediaAzure Camp 9 Décembre - slides session développeurs webmedia
Azure Camp 9 Décembre - slides session développeurs webmedia
 
Gab17 lyon - La BI traditionnelle est une histoire du passée. Impacts de la r...
Gab17 lyon - La BI traditionnelle est une histoire du passée. Impacts de la r...Gab17 lyon - La BI traditionnelle est une histoire du passée. Impacts de la r...
Gab17 lyon - La BI traditionnelle est une histoire du passée. Impacts de la r...
 
Webinar Degetel DataStax
Webinar Degetel DataStaxWebinar Degetel DataStax
Webinar Degetel DataStax
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
 

Plus de Soft Computing

16/04/19 Matinale Experts Marketing Omnicanal
16/04/19 Matinale Experts Marketing Omnicanal16/04/19 Matinale Experts Marketing Omnicanal
16/04/19 Matinale Experts Marketing OmnicanalSoft Computing
 
17/05/18 Matinale Usages Activation Omnicanal
17/05/18 Matinale Usages Activation Omnicanal17/05/18 Matinale Usages Activation Omnicanal
17/05/18 Matinale Usages Activation OmnicanalSoft Computing
 
25/01/18 Matinale Data Science
25/01/18 Matinale Data Science25/01/18 Matinale Data Science
25/01/18 Matinale Data ScienceSoft Computing
 
07/12/17 Séminaire Expérience Client
07/12/17 Séminaire Expérience Client07/12/17 Séminaire Expérience Client
07/12/17 Séminaire Expérience ClientSoft Computing
 
23/11/17 Matinale Usages Réactivation et SMS Enrichi
23/11/17 Matinale Usages Réactivation et SMS Enrichi23/11/17 Matinale Usages Réactivation et SMS Enrichi
23/11/17 Matinale Usages Réactivation et SMS EnrichiSoft Computing
 
19/10/17 Séminaire Référentiel Client Unique
19/10/17 Séminaire Référentiel Client Unique19/10/17 Séminaire Référentiel Client Unique
19/10/17 Séminaire Référentiel Client UniqueSoft Computing
 
05/10/17 Matinale Qlik Sense
05/10/17 Matinale Qlik Sense05/10/17 Matinale Qlik Sense
05/10/17 Matinale Qlik SenseSoft Computing
 
28/09/2017 Séminaire Data & Activation Client
28/09/2017 Séminaire Data & Activation Client28/09/2017 Séminaire Data & Activation Client
28/09/2017 Séminaire Data & Activation ClientSoft Computing
 
29/06/17 Matinale Python
29/06/17 Matinale Python29/06/17 Matinale Python
29/06/17 Matinale PythonSoft Computing
 
06/07/17 Table ronde Data Transformation Program
06/07/17 Table ronde Data Transformation Program06/07/17 Table ronde Data Transformation Program
06/07/17 Table ronde Data Transformation ProgramSoft Computing
 
01/06/2017 Matinale Activation Client personnalisée et Délivrabilité
01/06/2017 Matinale Activation Client personnalisée et Délivrabilité01/06/2017 Matinale Activation Client personnalisée et Délivrabilité
01/06/2017 Matinale Activation Client personnalisée et DélivrabilitéSoft Computing
 
27/04/17 Séminaire Données Personnelles
27/04/17 Séminaire Données Personnelles27/04/17 Séminaire Données Personnelles
27/04/17 Séminaire Données PersonnellesSoft Computing
 
Moteur de Recommandation
Moteur de RecommandationMoteur de Recommandation
Moteur de RecommandationSoft Computing
 
Séminaire Expérience Client
Séminaire Expérience ClientSéminaire Expérience Client
Séminaire Expérience ClientSoft Computing
 
Objets Connectés (IoT) et Data Science
Objets Connectés (IoT) et Data ScienceObjets Connectés (IoT) et Data Science
Objets Connectés (IoT) et Data ScienceSoft Computing
 
DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...
DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...
DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...Soft Computing
 
Machine Learning et Intelligence Artificielle
Machine Learning et Intelligence ArtificielleMachine Learning et Intelligence Artificielle
Machine Learning et Intelligence ArtificielleSoft Computing
 

Plus de Soft Computing (20)

16/04/19 Matinale Experts Marketing Omnicanal
16/04/19 Matinale Experts Marketing Omnicanal16/04/19 Matinale Experts Marketing Omnicanal
16/04/19 Matinale Experts Marketing Omnicanal
 
17/05/18 Matinale Usages Activation Omnicanal
17/05/18 Matinale Usages Activation Omnicanal17/05/18 Matinale Usages Activation Omnicanal
17/05/18 Matinale Usages Activation Omnicanal
 
25/01/18 Matinale Data Science
25/01/18 Matinale Data Science25/01/18 Matinale Data Science
25/01/18 Matinale Data Science
 
07/12/17 Séminaire Expérience Client
07/12/17 Séminaire Expérience Client07/12/17 Séminaire Expérience Client
07/12/17 Séminaire Expérience Client
 
23/11/17 Matinale Usages Réactivation et SMS Enrichi
23/11/17 Matinale Usages Réactivation et SMS Enrichi23/11/17 Matinale Usages Réactivation et SMS Enrichi
23/11/17 Matinale Usages Réactivation et SMS Enrichi
 
19/10/17 Séminaire Référentiel Client Unique
19/10/17 Séminaire Référentiel Client Unique19/10/17 Séminaire Référentiel Client Unique
19/10/17 Séminaire Référentiel Client Unique
 
05/10/17 Matinale Qlik Sense
05/10/17 Matinale Qlik Sense05/10/17 Matinale Qlik Sense
05/10/17 Matinale Qlik Sense
 
28/09/2017 Séminaire Data & Activation Client
28/09/2017 Séminaire Data & Activation Client28/09/2017 Séminaire Data & Activation Client
28/09/2017 Séminaire Data & Activation Client
 
29/06/17 Matinale Python
29/06/17 Matinale Python29/06/17 Matinale Python
29/06/17 Matinale Python
 
06/07/17 Table ronde Data Transformation Program
06/07/17 Table ronde Data Transformation Program06/07/17 Table ronde Data Transformation Program
06/07/17 Table ronde Data Transformation Program
 
01/06/2017 Matinale Activation Client personnalisée et Délivrabilité
01/06/2017 Matinale Activation Client personnalisée et Délivrabilité01/06/2017 Matinale Activation Client personnalisée et Délivrabilité
01/06/2017 Matinale Activation Client personnalisée et Délivrabilité
 
27/04/17 Séminaire Données Personnelles
27/04/17 Séminaire Données Personnelles27/04/17 Séminaire Données Personnelles
27/04/17 Séminaire Données Personnelles
 
Moteur de Recommandation
Moteur de RecommandationMoteur de Recommandation
Moteur de Recommandation
 
Phygital
PhygitalPhygital
Phygital
 
Séminaire Expérience Client
Séminaire Expérience ClientSéminaire Expérience Client
Séminaire Expérience Client
 
Données Personnelles
Données PersonnellesDonnées Personnelles
Données Personnelles
 
Objets Connectés (IoT) et Data Science
Objets Connectés (IoT) et Data ScienceObjets Connectés (IoT) et Data Science
Objets Connectés (IoT) et Data Science
 
DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...
DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...
DMP : après un temps d'observation, comment l'inscrire dans une réalité opéra...
 
Machine Learning et Intelligence Artificielle
Machine Learning et Intelligence ArtificielleMachine Learning et Intelligence Artificielle
Machine Learning et Intelligence Artificielle
 
Séminaire RCU
Séminaire RCUSéminaire RCU
Séminaire RCU
 

SAS Forum Soft Computing Théâtre

  • 1. Hadoop SAS®Visual Analytics Usages cibles des utilisateurs SAS Paris, 5/11/2013 Soft Computing – 55, quai de Grenelle – 75015 Paris – tél. +33 (0)1 73 00 55 00 – www.softcomputing.com
  • 2. Thème • Le Big Data offre la capacité de traiter des volumes de données conséquents à l’aide d’architectures techniques nouvelles, comment les utilisateurs traditionnels (datamanager, datasteward, dataminers) accèderont et traiteront les données dans ces nouvelles architectures ? • La démonstration s’appuiera sur les interfaces SAS de connexion aux données issues du Big Data pour illustrer les nouvelles pratiques des utilisateurs de SAS. Cette démonstration aura notamment pour but d’alimenter le débat autour de la mutation des pratiques des utilisateurs SAS dans ces nouveaux environnements techniques, quelles seront les nouvelles compétences à acquérir ? quelles compétences pour quels profils ? www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 07/11/2013 2
  • 3. Des systèmes d’information décisionnels en pleine mutation Système décisionnel historique Des faiblesses •Les coûts •Les délais •La qualité des données •La satisfaction utilisateur Système décisionnel nouvelle génération La Business Intelligence Agile Des nouvelles contraintes •La volumétrie •Le réglementaire •La garantie du niveau de service Des anciennes croyances •L’autonomie des utilisateurs •La mobilité •Données exogènes et non structurées Le Dataviz Des nouveaux besoins •Séparation TP et AP •J+1 •MOLAP •Datamart physique Le Inmemory www.softcomputing.com Hadoop Reproduction interdite sans l’accord écrit de Soft Computing Les Appliances 07/11/2013 3
  • 4. Big Data : Architecture applicative avec intégration Hadoop 2 axes technologiques : •In-memory technology •Distributed computing www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 07/11/2013 4
  • 5. 3 types d’utilisateurs Datamanager •“Data management is the development and execution of architectures, policies, practices and procedures in order to manage the information lifecycle needs of an enterprise in an effective manner. ” Source TechTarget Data steward •“Data stewardship is the management and oversight of an organization's data assets to help provide business users with high-quality data that is easily accessible in a consistent manner.” Source TechTarget Dataminer •“Data mining is sorting through data to identify patterns and establish relationships.” Source TechTarget www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 07/11/2013 5
  • 6. Architecture fonctionnelle autour de SAS®Visual Analytics (mode Cluster Hadoop) Requête Exploration Administration SAS distribué Extraction, Chargement, Transformation HDFS Création et publication des rapports Sources externes Sharepoint Outlook Add-In for Microsoft Offide, SAS for Mobile Visualisation des rapports SAS In-memory Exploration dans les données Sources internes Datamanager Exploration dans les données + Mining www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing Datasteward Business User Dataminer 07/11/2013 6
  • 7. Architecture applicative SAS®Visual Analytics Datamanager Datasteward SAS Visual Analytics Viewer Business User SAS Visual Analytics Designer SAS Visual Analytics Explorer Dataminer SAS Visual Analytics LASR Server SASDIS + SASEG: •Fournit les fonctionnalités en datamanagement max •Nécessite des compétences expertes SAS Visual Data Builder: •Facilité d’utilisation •Fonctionnalités en datamagement plus limitées Administr ation ! Données internes Données sources www.softcomputing.com Données externes Reproduction interdite sans l’accord écrit de Soft Computing 07/11/2013 7
  • 8. ! Databuilder: Les problématiques liées à SAS® Visual Analytics • Le chargement des données – Accès aux données autorisées par l’administrateur SAS « Master » – Accès aux données de fichiers externes – Chargement de données « In-memory » par une requête • La modélisation des données – Pas de création de cubes – Eviter le plus possible les pré-aggrégations – Grain au détail  maximum de degrés de liberté sur la navigation – Bien appréhender la contrainte : • Une exploration  une table • Un rapport  une table Modéliser en conséquence (jointure, concaténation de tables, …) www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 07/11/2013 8
  • 9. Outils SAS pour le datamager dans un contexte Big Data • Dans SAS Data Integration Studio : – Utilisation de transformations spécifiques aux traitements de données sous Hadoop : • Chargement de fichiers Hadoop • Template de transformations en langage natif Hadoop • Ecriture de fichiers sur la couche Hadoop – Possibilité de charger les données sur la couche In-memory www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 07/11/2013 9
  • 10. Outils SAS pour le datamager dans un contexte Big Data • Dans Sas Entreprise Guide ou SAS Data Integration Studio => coding SAS – Utilisation du connecteur SAS Connect To Hadoop • Librairies SAS connecté à une base de données HIVE (Implicit Pass-Through) • PROC SQL connecté à une base de données HIVE (Explicit Pass-Through) – User Defined Function (ex : les fonctions SAS_PUT, SAS_ZACORR dans Teradata) – Nouvelle procédure <=> nouveau langage de développement SAS • PROC DS2 – Possibilité de charger les données sur la couche In-memory • PROC IMSTAT www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 07/11/2013 10
  • 11. Focus langage DS2 : le langage de nouvelle génération • DS2, une alternative à l’étape DATA • Permet d’optimiser le datamanagement en environnement high• • • • • performance avec traitements parallélisés Nouvelle technologie / Etape DATA Syntaxe familière aux utilisateurs de SAS/AF (des méthodes : init, term and run) Proche de l’étape DATA, en partageant les fonctionnalités les plus usitées (boucle implicite, retain, set, …) Evolutif en associant à l’environnement du développeur de nouveaux packages (comme la PROC FCMP) Exécutable aussi bien dans une session SAS Bases traditionnelle que via un connecteur « In-database » associé au module SAS®Embedded Process www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 07/11/2013 11
  • 12. « Hello World » Comparaison En DS2 proc ds2; data _null_; method init(); dcl varchar(16) str; str = 'Hello World!'; put str; end; enddata; run; En JAVA En C++ Une syntaxe, proche de l’étape DATA, qui reste éloignée des langages de programmation orientés objet www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 07/11/2013 12
  • 13. Outils SAS pour le Dataminer dans un contexte Big Data • SAS Visual Analytics Explorer – Permet d’explorer la donnée et d’effectuer des analyses rapides : • Corrélation • Régressions • Séries temporelles, … • SAS Entreprise Miner – Permet la création de modèles statistiques – Utilisation des procédures statistiques bénéficiant du mode distribué : • • • • • • • HPDMDB Summarize data HPDS2 Parallel execution of DS2: HPFOREST Random forest HPLOGISTIC Logistic regression HPNEURAL Neural network modeling HPSAMPLE Sampling and data partitioning … www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 07/11/2013 14
  • 14. Conclusion : Quelles compétences pour quels profils ? En environnement SAS traditionnel En environnement distribué ou/et In-memory Langages SAS, SAS MP/Connect SQL Pass-through FCMP - DS2 User Define Function HIVE, PIG Infomaps SAS®Visual Data Builder SAS®Visual Analytics Explorer SAS Entreprise Miner Langage SAS www.softcomputing.com SAS Entreprise Miner (transformation code EM en DS2) SAS®Visual Analytics Explorer High-performance procedure User Define Function Reproduction interdite sans l’accord écrit de Soft Computing 07/11/2013 15