1. Réinventez votre parcours analytique grâce
à la découverte des données en libre-service
et à l’analyse prédictive interactive
Livreblanc
2. Contents
Découverte des données en libre-service et analyse
prédictive interactive .......................................................1
Quels sont les véritables besoins
de votre entreprise ? .............................................................1
La convergence idéale : SAS® Visual Analytics et
SAS® Visual Statistics®......................................................2
Interactivité et convivialité ....................................................2
Exploration et visualisation des données en
libre-service .............................................................................2
Analyse descriptive et prédictive performante ...............3
Regroupement dynamique .................................................5
Architecture en mémoire : du traitement par lots à
l’analyse prédictive rapide et interactive ...........................5
Multipliez les possibilités de votre entreprise .............6
Analystes marketing ..............................................................6
Analystes risques financiers .................................................6
Ingénieurs ................................................................................6
Un duo efficace pour la modélisation exploratoire
en une étape .....................................................................8
Détail du processus ...............................................................8
Récapitulatif des solutions ..............................................8
À quoi sert SAS® Visual Analytics? ......................................8
À quoi sert SAS® Visual Statistics?.......................................8
Conclusion .........................................................................9
3. 1
Découverte des données en
libre-service et analyse prédictive
interactive
Pourquoi la convergence de l’exploration des données en
libre-service et de l’analyse prédictive interactive est-elle si
importante ? Quel est son intérêt pour votre entreprise ?
Songez à ce que vous utilisez quotidiennement en libre-service.
Des pompes à essence aux distributeurs automatiques en
passant par les applications d’échanges boursiers, d’opérations
bancaires et d’achat en ligne, tous affichent les mêmes
ambitions : être plus pratiques pour les consommateurs et
moins coûteux pour les fournisseurs. Chacun choisit ce qu’il
veut, quand il en a envie et de manière totalement autonome.
Le principe est le même pour l’exploration des données en
libre-service et les outils analytiques à portée de tous. Les
utilisateurs veulent explorer eux-mêmes les données et trouver
leurs réponses – quand, où et comme bon leur semble – sans
devoir demander des données ou des rapports au service
informatique. C’est ce que proposent des applications aussi
courantes que Fitbit ou l’Apple Watch™. Les utilisateurs sont
en quête d’informations qu’ils peuvent rechercher, consulter et
utiliser sans l’aide de personne.
Lorsque cette possibilité leur est donnée – qu’il s’agisse de
combiner son apport calorique aux résultats d’un programme
de fitness prometteur, d’analyser au bureau la chute des ventes
hebdomadaires, ou d’étudier un rapport sur un terminal mobile
dans un aéroport – ils peuvent alors prendre de meilleures
décisions (ne pas prendre de croissant à l’aéroport, par
exemple).
Mais il ne s’agit pas simplement de découvrir ce qu’il s’est passé
et pour quelles raisons. Il est aussi question d’avenir. L’analyse
prédictive interactive ajoutée à la structure organisationnelle de
l’entreprise permet aux décideurs et aux utilisateurs des
données de tirer des enseignements du passé pour découvrir
des informations sur l’avenir.
Par ailleurs, associer l’analyse prédictive interactive à la
découverte des données en libre-service permet aux statis-
ticiens et autres spécialistes d’explorer les relations entre les
données avant de se plonger dans la création et la mise au
point de modèles. Ils peuvent tester rapidement différentes
données et techniques selon un processus itératif pour repérer
le modèle produisant la meilleure réponse. Une fois satisfaits, ils
explorent les résultats de la modélisation en collaboration avec
des analystes métier, à partir d’un environnement commun. Le
meilleur modèle identifié peut ensuite être mis en production ;
il suffit de l’intégrer dans des applications opérationnelles et de
procéder au scoring de nouvelles données pour produire plus
rapidement des informations à valeur ajoutée.
Quelssontlesvéritablesbesoins
devotreentreprise?
Aujourd’hui, les entreprises continuent de considérer les outils
analytiques comme une priorité en matière de technologie.
Elles sont en effet de plus en plus nombreuses à prendre
conscience que l’analyse – notamment prédictive – est un
facteur de croissance et d’innovation, et au final, d’avantage
concurrentiel.
Pourtant, malgré les progrès technologiques, nombre d’entre
elles ont encore du mal à intégrer l’approche décisionnelle et
analytique dans leur culture, en particulier auprès des salariés
dépourvus de ces compétences analytiques.
Quels outils leur permettraient de répondre à la demande
croissante d’analyses plus rapides et plus précises, d’exploration
interactive des données et de véritable business intelligence ?
De quoi ont-elles besoin pour mettre la puissance analytique à
la portée du plus grand nombre ?
Selon l’analyste Gartner, la convivialité doit être le premier point
d’une solution d’exploration et d’analyse de données en libre-
service. Une étude Gartner a d’ailleurs révélé que 41 % des
entreprises citent ce critère parmi les trois principales caractéris-
tiques recherchées au moment de choisir une plate-forme
analytique. La convivialité est d’autant plus importante que les
1
Gartner. “Survey Analysis: Customers Rate Their Advanced Analytics Platforms (G00270213) “, 28 Octobre 2014.
4. 2
utilisateurs de ces plates-formes ne se limitent plus au groupe
restreint des statisticiens et data scientists : différents analystes
métier et experts quantitatifs sont concernés, comme des
analystes marketing ou financiers, par exemple. 31 % des
personnes interrogées attachaient également de l’importance à
la rapidité de développement des modèles1
.
Ainsi, trois facteurs se dégagent pour les entreprises souhaitant
fournir à leurs utilisateurs la valeur contenue dans les données :
Interactivité et convivialité pour les
utilisateurs de tous niveaux.
Outils d’analyse prédictive perfor-
mants et résultats exploitables.
Architecture capable de gérer les
big data et la rapidité requise.
La convergence idéale :
SAS® Visual Analytics et
SAS® Visual Statistics®
SAS est porteur de bonnes nouvelles. Les fonctionnalités
indispensables pour obtenir le nec plus ultra de la découverte
des données en libre-service et de l’analyse prédictive sont à
présent disponibles. SAS Visual Analytics offre une expérience
hautement interactive, associant des outils avancés de visualisa-
tion des données à une interface conviviale et une technologie
en mémoire rapide. Même les utilisateurs aux profils non tech-
niques peuvent analyser eux-mêmes les données, créer des
visualisations et partager des résultats de manière dynamique.
SAS Visual Statistics est un module complémentaire intégré à
SAS Visual Analytics, dont les fonctions de modélisation interac-
tive décuplent la puissance d’analyse prédictive.
Ces dernières sont accessibles depuis l’interface utilisateur
commune de SAS Visual Analytics. Les utilisateurs peuvent ainsi
explorer les données de manière interactive et créer des
modèles à partir d’un seul et même environnement convivial.
L’association de ces deux solutions produit une plate-forme aux
multiples atouts :
• Interactivité et convivialité.
• Exploration et visualisation des données en libre-service.
• Analyse descriptive et prédictive performante.
• Regroupement dynamique.
• Architecture en mémoire pour des résultats plus rapides.
Examinons de plus près chacune de ces caractéristiques.
Interactivitéetconvivialité
La convivialité comme critère de sélection principal d’une plate-
forme analytique avancée n’a rien de surprenant.
L’environnement doit en effet être interactif et accessible pour
que les non-techniciens puissent explorer les données et
trouver leurs réponses eux-mêmes.
SAS Visual Analytics et SAS Visual Statistics partagent la même
interface web, ce qui permet de parcourir visuellement les
données à la volée, de repérer des schémas, de réaliser des
analyses prédictives et d’en tirer rapidement des enseigne-
ments. Les puissantes techniques d’apprentissage automatique
et de modélisation statistique de SAS sont en outre accessibles
par simple « pointer-cliquer ». Ces techniques peuvent être utili-
sées pour créer et perfectionner des modèles à partir de
données, quel qu’en soit le volume, afin de prévoir des résultats
en un temps record, de prendre de meilleures décisions et de
cibler les actions.
Grâce aux outils intégrés de création de modèles et de décou-
verte visuelle des données, les analystes et data scientists tirent
profit de processus de travail ininterrompus en passant rapide-
ment de l’hypothèse à la vérification. Ces fonctionnalités
améliorent le développement de modèles, la productivité et la
précision pratiquement en temps réel.
Explorationetvisualisationdesdonnéesen
libre-service
SAS Visual Analytics permet aux utilisateurs de découvrir,
d’explorer et d’analyser des données stratégiques sans aucune
aide, puis de partager à d’autres leurs tableaux et graphiques
dynamiques. Ils peuvent ainsi :
• Utiliser des fonctions de représentation graphique automa-
tique et des techniques de visualisation des données attray-
antes pour découvrir rapidement des relations intéressantes
entre les données.
5. 3
• Identifier les principales variables et valeurs aberrantes ayant
une incidence sur les résultats qu’ils tentent de prévoir.
• Filtrer les données de manière interactive, formater des
variables, ajouter des colonnes calculées ad hoc et créer des
hiérarchies dynamiques sans structures de données
prédéfinies.
Analysedescriptiveetprédictiveperformante
SAS Visual Statistics complète parfaitement SAS Visual Analytics
avec des fonctions analytiques élaborées. Ce binôme permet
de créer des modèles descriptifs et prédictifs de manière inter-
active, qui peuvent ensuite être ajustés en quelques secondes
dans le but d’identifier celui produisant les meilleurs résultats et
ce, pratiquement en temps réel. SAS Visual Analytics peut être
utilisé avant de développer des modèles – pour explorer des
données – et après – pour analyser les résultats –, ce qui
contribue à réduire les temps de latence lors du processus
itératif de développement de modèles.
Modélisationdescriptive
Les techniques de classification segmentent les données aux
caractéristiques similaires pour vous permettre de distinguer
des groupes en fonction de leurs particularités (voir Figure 1).
Par exemple, la segmentation de marché classe les clients selon
leurs habitudes d’achat afin de déterminer les promotions les
plus efficaces. SAS Visual Statistics offre plusieurs moyens
d’explorer et d’évaluer visuellement les segments : classification,
statistiques descriptives détaillées, coordonnées parallèles et
nuages de points. Dans le cas de petites tables, les nuages de
points associés à des profils de classe sont superposés. Lorsque
les tables sont volumineuses, ce sont les cartes thermiques
associées à des profils de classe qui se superposent.
Figure 1: SAS Visual Statistics permet d’explorer et d’évaluer facilement des segments pour ensuite les analyser au moyen de
techniques descriptives telles que la classification par la méthode des K-means.
SAS®
Visual Analytics peut être
utilisé avant de développer des
modèles – pour explorer des
données – et après – pour analyser
les résultats –, ce qui contribue à
réduire les temps de latence
lors du processus itératif de
développement de modèles. .
6. 4
Figure 2: Créez des arbres de décision de manière interactive pour partitionner vos données et interpréter des actions.
Figure 3: Établissez des prédictions binaires (réponse positive ou négative, le plus souvent) à l’aide
de la régression logistique.
7. 5
chaque groupe ou segment sans avoir à trier ni à indexer systé-
matiquement les données. Il est ainsi possible de créer des
modèles extrêmement précis pour chaque segment ou groupe
à la volée, sans traitement supplémentaire.
Architectureenmémoire:dutraitementpar
lotsàl’analyseprédictiverapideetinteractive
Les architectures de traitement par lots traditionnelles ne sont
pas conçues pour les traitements analytiques rapides et
complexes ou la modification de modèles prédictifs à la volée.
Elles ne sont pas non plus prévues pour les multiples balayages
de données nécessaires aux tâches analytiques, ce qui pose
plusieurs difficultés :
• Les statisticiens, data scientists et autres analystes métier ne
peuvent pas expérimenter ni ajuster aisément leurs modèles
avec de nouvelles informations de manière à être certains
d’avoir produit le meilleur modèle.
• Il leur est impossible de créer rapidement et facilement de
nombreux modèles par segments ou par groupes.
• Ils n’obtiennent pas de réponse instantanée lorsqu’ils modi-
fient les propriétés de leurs modèles. La création et le test
des modèles pour identifier le plus efficace prend beaucoup
plus de temps.
Tous ces points sont extrêmement pénalisants à l’ère des big
data. Si la découverte d’informations prend trop de temps, vous
n’obtenez pas les réponses dont vous avez besoin au moment
approprié.
Il vous faut une architecture qui évolue en fonction de vos
besoins en données et en puissance de traitement, et qui
permette également d’ajuster et d’expérimenter des variables de
manière interactive, pratiquement en temps réel. La création de
bons modèles est loin d’être simple, et le premier essai est
généralement peu concluant. La meilleure stratégie consiste
souvent à produire rapidement des résultats relativement satisfai-
sants, puis à les ajuster habilement, ce qui n’est toujours pas idéal.
Modélisationprédictive
SAS Visual Statistics facilite la création de modèles analytiques
à l’aide de techniques prédictives : régression linéaire,
modélisation linéaire généralisée, arbres de décision et
régression logistique.
• La régression linéaire permet de déterminer s’il existe une
relation entre une variable continue et un jeu de variables de
prédiction potentielles, et décrit la nature et les caractéris-
tiques de cette relation (le cas échéant). Grâce à cette
méthode, vous pouvez établir des prévisions numériques
– dépenses d’un client, primes de polices d’assurance, limites
de crédit, etc.
• Un modèle linéaire généralisé est une extension d’un
modèle linéaire classique, utile lorsque les données ne sont
pas distribuées normalement, en cas de fluctuation de la
variance des données d’une observation à l’autre, ou si la
moyenne des données se limite à un intervalle de valeurs.
Les modèles linéaires généralisés intègrent les interactions
entre les valeurs de prédiction en cours d’évaluation pour en
déterminer les effets sur la variable de réponse.
• Les arbres de décision établissent un partitionnement hiérar-
chique des données d’entrée à partir d’une série de règles
appliquées à chaque observation. Cette technique
d’apprentissage automatique supervisée utilise une
approche de création de branches pour modéliser rapide-
ment des variables cibles spécifiques ou un résultat (acheter
ou ne pas acheter, activité frauduleuse ou non, etc.). Les
arbres de décision aident à comprendre comment cibler les
bons clients en analysant leurs caractéristiques. (voir Figure
2).
• La régression logistique s’efforce de prévoir la probabilité
d’un événement (variable binaire, comme Oui/Non ou 1/0)
en se basant sur la relation non linéaire entre une variable de
réponse et les effets combinés des variables de prédiction.
Elle sert par exemple à prévoir les pannes matérielles, les
patients à haut risque ou à faible risque, le taux d’attrition de
la clientèle, le caractère frauduleux d’une transaction, etc.
(voir Figure 3).
Regroupementdynamique
Avec SAS Visual Statistics, de nombreux utilisateurs peuvent
créer simultanément des modèles et traiter les résultats de
8. Les résultats des modifications apportées aux modèles (ajout
de nouvelles variables, élimination des valeurs aberrantes ou
changement de rôle des variables, par exemple) sont donc
instantanément visibles. Plusieurs utilisateurs peuvent en outre
analyser simultanément des données complexes stockées dans
des clusters Hadoop, des systèmes de bases de données rela-
tionnelles ou des serveurs SAS.
Fort heureusement, la puissance de traitement n’a jamais été
aussi abordable. Qui plus est, votre solution SAS réunit traite-
ment en mémoire et environnement de développement de
modèles itératif et interactif, de sorte que vous pouvez créer et
perfectionner des modèles, et tester des scénarios de simula-
tion plus facilement et en un temps record.
Grâce aux technologies in-memory, les solutions visuelles de
SAS permettent de procéder à une exploration ad hoc rapide
et d’identifier visuellement des schémas et relations dans de
grandes quantités de données.
Les données et traitements analytiques volumineux sont répartis
entre plusieurs processeurs, d’où une rapidité exceptionnelle.
Les données sont conservées en mémoire pendant plusieurs
sessions afin de produire des résultats quasi instantanés. Inutile
d’écrire les données sur disque ou de les déplacer fréquem
ment d’un nœud à l’autre. Elles sont chargées en mémoire une
fois pour toutes, ce qui signifie qu’il est également inutile de les
recharger à chaque nouvelle tâche ou lorsqu’un autre utilisateur
est autorisé à y accéder.
6
Multipliezlespossibilitésdevotreentreprise
Analystesmarketing
• Utilisez SAS Visual Analytics pour tirer des enseignements de l’évolution du chiffre
d’affaires et déterminer les facteurs liés à l’attrition.
• Utilisez SAS Visual Statistics pour identifier les clients susceptibles de passer à la concur-
rence au cours des six prochains mois et en comprendre la raison
Analystesrisquesfinanciers
• Utilisez SAS Visual Analytics pour cerner et décrire les clients qui cessent de payer les
mensualités de leur prêt immobilier.
• Utilisez SAS Visual Statistics pour prévoir le risque lié aux clients en cessation de paiement
et estimer les limites de crédit les mieux adaptées à chacun.
Ingénieurs
• Utilisez SAS Visual Analytics pour explorer l’efficacité des équipements et rechercher les
facteurs favorisant les pannes matérielles à l’aide d’arbres de décision.
• Utilisez SAS Visual Statistics pour prévoir les défaillances des équipements ou les pannes
matérielles à l’aide de la régression logistique ou d’arbres de décision (avec un meilleur
contrôle de la croissance et de l’élagage de ces derniers).
Analystes marketing
Analystes des
risques financiers
Ingénieurs
9. 7
Figure 5: Utilisez les résultats de la modélisation pour créer des visualisations permettant d’analyser les
résultats de manière approfondie.
Figure 4: Après avoir créé vos modèles, comparez visuellement les modèles concurrents pour déterminer celui qui produira les
meilleurs résultats.
10. 8
modifications à vos données ou modèles. Il s’agit d’un
processus très interactif et itératif.
4. À ce stade, les data scientists peuvent transmettre des
modèles de prévisions ou des résultats et/ou segments aux
analystes métier à des fins d’exploration, d’analyse et de
profilage dans SAS Visual Analytics (voir Figure 5).
5. Après avoir déterminé le modèle le plus efficace au moyen
de la tâche de comparaison de modèles intégrée, vous
pouvez aisément l’appliquer à de nouvelles données. Vous
obtenez ainsi les renseignements précis dont vous avez
besoin pour prendre de meilleures décisions et améliorer
vos résultats.
Récapitulatif des solutions
ÀquoisertSAS® VisualAnalytics?
• Exploration et visualisation interactives des données.
• Traitement in-memory pour l’analytique en libre-service.
• Résultats accessibles via le web, les applications Microsoft
Office, le reporting sur terminaux mobiles et les tableaux
de bord.
ÀquoisertSAS® VisualStatistics?
• Modélisation prédictive interactive et exploratoire.
• Traitement in-memory pour la création, l’amélioration et la
comparaison rapides de modèles.
• Segmentation des données et génération de modèles par
segments ou par groupes.
Un duo efficace pour la
modélisation exploratoire en
une étape
SAS Visual Analytics et SAS Visual Statistics forment un duo
puissant, associant l’exploration et la découverte interactives
des données à la création facile et rapide de modèles d’analyse
prédictive. Ce duo fonctionne de la manière suivante :
Pour créer des modèles dans SAS Visual Statistics, vous
commencez dans SAS Visual Analytics Explorer (les icônes
correspondant aux techniques de modélisation prédictive se
trouvent dans votre barre d’outils). Vous pouvez aisément y
rechercher les différentes variables qui influencent votre
variable de réponse, comprendre les relations entre variables,
supprimer les valeurs aberrantes ou procéder à des manipula-
tions de données et ce, avant de commencer à créer des
modèles. Après avoir créé un modèle de base, vous pouvez
continuer à l’optimiser, y ajouter des variables, en explorer les
prévisions ou les segments, en évaluer la justesse et le
comparer à d’autres modèles, le tout avec des résultats très
rapides.
Détailduprocessus
1. Avant de créer des modèles, vous devez déterminer les
prédicteurs nécessaires. SAS Visual Analytics vous aide à
identifier visuellement les relations entre les variables, à
déceler les interactions inhabituelles et à repérer les valeurs
aberrantes ou potentiellement utiles au processus
d’élaboration des modèles. Différents graphiques – cartes
thermiques, boîtes à moustaches, graphiques à bulles
animés, histogrammes et diagrammes de réseau – illustrent
les tendances et schémas détectés dans de gros volumes de
données.
2. Vous pouvez ensuite utiliser SAS Visual Statistics pour créer,
évaluer et finaliser des modèles prédictifs de manière inter-
active (sans aucune programmation). Plusieurs utilisateurs
peuvent se servir simultanément du même environnement
et obtenir des résultats instantanés.
3. Une fois les modèles créés, il est facile de les comparer et de
les évaluer selon différentes méthodes statistiques (voir
Figure 4). Les diagrammes de lift, les courbes ROC et les taux
de mauvaises classifications aident à identifier le modèle le
plus performant. Vous pouvez alors revenir en arrière,
supprimer les valeurs aberrantes et apporter d’autres
11. 9
pour produire les meilleurs résultats – en utilisant des
volumes de données sans précédent.
• Décupler la productivité de votre équipe analytique.
Plusieurs utilisateurs peuvent personnaliser des modèles
rapidement et de façon interactive – en ajoutant ou en modi-
fiant des variables, en éliminant les valeurs aberrantes, etc.
– tout en observant les effets de ces changements sur les
résultats de ces modèles. Quel modèle offre le plus de puis-
sance prédictive ? C’est désormais facile à découvrir, et ce
processus vous permet en outre de mieux valoriser votre
analyse des big data.
Résultat: un environnement de découverte des données et
d’analyse prédictive en libre-service, offrant aux décideurs des
informations plus précises et une démarche analytique plus
simple, au moment où ils en ont besoin, et où qu’ils se trouvent.
☛ Try SAS®
VisualAnalytics
☛ Try SAS®
Visual Statistics
Conclusion
Les catégories d’utilisateurs – statisticiens, data scientists,
analystes métier, responsables gestion des risques, analystes
marketing, et autres – qui ont besoin d’une solution associant
exploration des données et reporting en libre-service à des
outils analytiques ne cessent d’augmenter. Une solution de ce
type offre davantage de souplesse à l’entreprise.
Face à l’importance croissante accordée à l’utilisation des
données pour créer de la valeur ajoutée, les entreprises sont
de plus en plus nombreuses à vouloir étoffer leur culture analy
tique avec un modèle décisionnel en libre-service. Elles cher-
chent à utiliser des outils analytiques toujours plus sophistiqués
pour prévoir les résultats d’événements à venir, et ce, au profit
du plus grand nombre.
Dès lors, si une interface intuitive conviviale est nécessaire, la
puissance sur laquelle elle repose est encore plus importante.
SAS Visual Statistics, en association avec SAS Visual Analytics,
offre aux statisticiens, data scientists et analystes métier comme
aux profils d’utilisateurs non techniques un moyen rapide et
agréable d’explorer les données, de créer des modèles prédic-
tifs et de les évaluer afin d’identifier le plus efficace. En mettant
cette solution au service de votre entreprise, vous pouvez :
Affronter la concurrence avec de précieuses connaissances.
Déceler rapidement les informations dissimulées dans de
vastes magasins de données. Découvrir et évaluer de nouvelles
opportunités qui échapperont à la concurrence. Trouver de
nouvelles sources de revenus. Dans la mesure où SAS Visual
Analytics est intégré à la solution, les analystes métier et les
statisticiens peuvent se servir de puissantes fonctions d’analyse
prédictive et d’exploration visuelle pour exploiter les données
de manière totalement inédite.
• Exécuter davantage de modèles, plus rapidement et avec
précision. Grâce à notre environnement de traitement multi-
cœur, cette opération ne prend que quelques minutes. Vous
pouvez créer des modèles pour cibler des groupes ou des
segments spécifiques, tout en exécutant d’innombrables
scénarios. Multipliez aisément les scénarios de simulation et
obtenez des réponses rapides. Les modèles optimisés
produisent de meilleurs résultats.
• Être réactif grâce au traitement in-memory. Effectuez
rapidement des calculs analytiques complexes grâce au
moteur en mémoire. Les modélisateurs peuvent rapidement
tester de nouvelles idées, s’essayer à différentes techniques
de modélisation et perfectionner leurs modèles à la volée