Voir: https://bit.ly/31BWK5m
À l'ère du big data, de l'intelligence artificielle et du cloud computing, le volume et la diversité des données ne cessent de croître. Le défi consiste à créer les processus, les normes et les protocoles nécessaires pour mettre l'information au service des entreprises.
Dans ce webinar, nous parlerons des cinq tendances technologiques qui guident les stratégies de données des entreprises du monde entier. Nous verrons comment élever les données au rang d'actif stratégique et avoir une vraie stratégie centrée sur la donnée.
Ne manquez pas ce webinar pour approfondir les points suivants :
- Quelle est l'évolution des architectures d'acquisition et de gestion des données dans les grandes organisations ? En quoi le concept de "data fabric" est-il utile ?
- Comment gérer l'intégration de données distribuées sur plusieurs sites résultant des changements imposés par la migration vers le cloud ?
- Comment les entreprises peuvent-elles monétiser l'infrastructure de données en tant que service construite au cours des dernières années ?
- Comment la data science et l’analytique avancée pilotent et contribuent à accélérer l’acquisition des données ?
- Quel rôle les techniques de NLP et de voice computing peuvent-elles jouer à l'avenir pour l'analyse de données ?
GenAI y el futuro de la gestión de datos: mitos y realidades
Quel est l'avenir des stratégies de données?
1. DE NO DO W E BINA RS
Quel est l'avenir des stratégies de
données ?
Emily Sergent
Ingénieure avant-vente
Denodo
Découvrez les 5 tendances qui vont tout changer
2. 2
…It’s Difficult to Make Predictions, Especially
About the Future.”
Attributed to Niels Bohr
(Bulletin of the Atomic Scientist, 1971)
3. 3
Le contexte data, présent et futur
Logs,
Fichiers,
Documents
CRM
Big Data
(Hadoop)
Stockage Cloud
Applications
externes
(API)RDBMS :
Datawares, bases
opérationelles
ERP
Données
Technologies de
stockage
Méthodes d’accès
Options
d’infrastructure
Faciliter la gestion
et la gouvernance
Data
Virtualization
4. 4
Le fonctionnement de la Data Virtualization
A la demande et sans réplication, la Data Virtualization permet de :
Sales
HR
Executive
Marketing Apps/API
Data Science
AI/ML
Connecter
Combiner
Consommer
Optimiseur de requêtes
Connecteurs natifs
Protection des applications sources
Abstraction de la complexité de déploiement et des technologies
Zéro code
Droit d’accès (très) fin
Manipulation de la donnée, consolidation, calcul, filtres, anonymisation, etc.
Base de données classique
APIs (et GraphQL)
Catalogue de données opérationnel
5. 5
Le fonctionnement de la Data Virtualization
Sales
HR
Executive
Marketing Apps/API
Data Science
AI/ML
COMBINE & INTEGRATE INTO BUSINESS
DATA VIEWS
Architecture simplifiée
Connecter
Combiner
Consommer
7. 7
Assistants conversationnels et NLP
▪ Une technologie de plus en plus adoptée à la
maison
▪ Siri, Alexa, Google Home donnent un accès
instantané à la météo, à la musique, aux
informations du jour
▪ Dans le domaine de l’analytique et la BI, NLP
permet aux utilisateurs non-techniques d’accéder
facilement aux données
▪ Permet de facilement requêter à la volée au travers
des applications mobiles
8. 8
Assistants conversationnels : Humaniser les données
NLP permet aux utilisateurs métier de poser une question à un chatbot et de recevoir une réponse avec
des informations en langage naturel
"Les ventes totales du produit A au
Mexique pour le troisième trimestre se
sont élevées à 200,4 millions de
dollars, soit une augmentation de 15%
par rapport au deuxième trimestre".
"Quelles sont
les tendances
des ventes
du produit A
au Mexique
pour le
troisième
trimestre ?
10. 10
A unified, trusted, and comprehensive view of business data
produced by orchestrating data sources automatically, intelligently,
and securely, then preparing and processing them in big data
platforms such as Hadoop and Apache Spark, data lakes, in-
memory, and NoSQL.”
https://www.forrester.com/report/Now+Tech+Big+Data+Fabric+Q2+2018/-/E-RES142691
11. 11
Pourquoi pas un emplacement de stockage unique ?
• Chaque système de stockage a ses capabilités et ses forces : par exemple, un
accès rapide par ID dans une base de données relationnelle
• Un investissement important avant de pouvoir en tirer parti : la création des
flux d’ingestion pour tous les ensembles de données est coûteuse
• ROI moindre sur certains cas d’usage ou ensembles de données : doit-on
répliquer le EDW ? Le remplacer ?
• Coût important de maintenance : flux à maintenir et à modifier à chaque
modification des sources
• Risque d’incohérence : prévoir une cadence de réplication adéquate pour
éviter les écarts entre les systèmes
COST
GOVERNANCE
Est-il possible de prévoir un système de stockage unique ? Est-il réaliste et souhaitable ?
13. 13
Gartner – Une architecture logique
“Adopt the Logical Data Warehouse Architecture to Meet Your Modern Analytical Needs”. Henry Cook, Gartner April 2018
DATA VIRTUALIZATION
15. 15
Sondage : Enquête Cloud 2020 de Denodo
• Plus de 75 % des entreprises ont déjà au moins un projet dans le cloud
• 45% ont plusieurs projets ou une présence importante dans le cloud
• Les initiatives clés comprennent : Analytics (66%), Logical Data Warehouse (43%),
Data Science + ML (40%)
• Les formats des données dans le cloud sont variés : 68% des clients ont des
données structurées, 46% de l’object storage, 44% des données des applications
SaaS (ex. Salesforce), 42% des données semi-structurées (ex. JSON, XML)
• Les migrations sont le plus souvent des projets « refactoring/rearchitecting »
(35%), suivi par des projets « rehosting/lift and shift » (21%) et
« replatforming/lift-tinker-shift » (18%)
Source: Denodo Cloud Survey 2020, N = 252
Lire l'enquête Cloud 2020 de Denodo
17. 17
Architecture hybride : cas d’usage Asurion
Asurion Premium
Support Services
• Besoins Big Data et Analyse Prédictive
• Migration vers le Cloud
• Initiative mondiale et données personnelles
clients : besoin de règles de sécurité locales (par
pays)
18. 18
Tendance 4 :
ML et IA pour simplifier les
défis de la gestion des
données
19. 19
ML et IA pour simplifier les défis de la gestion des données
▪ La pratique de la Data Science est déjà
courante dans de nombreuses
entreprises afin de produire de
meilleures informations qui permettent
de prendre des décisions stratégiques
▪ Data Scientist est devenu un poste clé
▪ Pratique courante pour l'allocation des
ressources, la gestion de la chaîne
d'approvisionnement, la détection des
fraudes, l'analyse prédictive, etc.
▪ La DV permet la mise à disposition
rapide des différentes sources de
données Voir la présentation client de Prologis "La virtualisation des données pour
moderniser et accélérer l'analytics"
20. 20
L'intelligence artificielle dans la gestion des données
▪ Les fournisseurs de logiciels ont commencé à
intégrer des techniques similaires pour analyser leurs
données et automatiser toutes sortes de tâches
fastidieuses
▪ Ces techniques peuvent fournir des actions et une
expertise qui, autrement, nécessiteraient
l'intervention manuelle d'un expert humain
• Monter en charge pour traiter de gros volumes de
données
• Réduire les tâches répétitives et permettre aux
profils qualifiés de se concentrer sur les tâches à
valeur ajoutée
▪ Identifier les problèmes de qualité des données et
les données potentiellement sensibles
▪ AI tagging, classification automatique, évaluation de
la sécurité par le ML
https://www.wsj.com/articles/how-data-management-helps-companies-deploy-ai-11556530200
21. 21
Application dans la Data Virtualization
▪ Data Discovery intelligente
▪ Recommandations d’ensembles de données en fonction de
votre profil
▪ Simplifier la modélisation des données
▪ Découverte de relations basée sur l'analyse de l'utilisation
▪ Suggestions de filtres
▪ Améliorer la performance
▪ Recommandations de tuning
▪ Identification et contournement automatique de goulots
d’étranglement
23. 23
Monétisation des données et économie des APIs
▪ Le marché des applications de données devrait
connaître la plus forte croissance par segment dans les
années à venir
▪ La communication entre applications se fait par les
API, devenues donc la pierre angulaire de nombreuses
initiatives de transformation numérique
▪ L'accès aux API (par opposition à l'accès direct via leur
site web) représente déjà une part importante des
revenus des géants de l'Internet
▪ Il existe également un marché important de sociétés
qui utilisent les données comme leur principal actif, et
leur modèle commercial consiste à "vendre des API".
▪ En outre, les entreprises traditionnelles ont commencé
à utiliser leurs données comme un atout
supplémentaire
https://www.statista.com/statistics/255970/global-big-data-market-forecast-by-segment/
24. 24
Data Services Denodo
▪ La virtualisation des données permet à l'API d'accéder à
toutes les données connectées à la couche virtuelle, sans
code
▪ Sécurité basée sur utilisateur + rôles
▪ Gestion de la charge : mise en place des règles d’accès
(prioritization, nombre de requêtes/heure)
▪ Denodo prend en charge un large éventail de protocoles et
d'options
▪ GraphQL
▪ GeoJSON (APIs geospatial)
▪ OData 4
▪ Authentification OAuth 2.0, SAML et SPNEGO
▪ Documentation OpenAPI (Swagger)
25. Denodo en tant que fournisseur et consommateur d’APIs
DATA CONSUMERS
Enterprise Applications, Reporting, BI, Portals, ESB, Mobile, Web, Users, IoT/Streaming Data
Multiple Protocoles,
Formats
Query, Search,
Browse
Request/Reply,
Event Driven
Secure
Delivery
ConsommateursAnalyses Transactions
Web
Services
Sources de données
Databases & Warehouses, Cloud/SaaS Applications, Big Data, NoSQL, Web, XML, Excel, PDF, Word...
Moins structuréePlutôt structurée
SQL,
MDX
Big Data
APIs
Web Automation
and Indexing
DATA VIRTUALIZATION
CONNECT COMBINE CONSUME
Share, Deliver, Publish,
Govern, Collaborate
Discover, Transform,
Prepare, Improve
Quality, Integrate
Normalized Views
of Disparate Data
Agile Development
Performance
Data ServicesResource Management
Data Catalog
Governance
& Metadata
Security and
Data Privacy
Lifecycle
Management
Connecter
Combiner
Consommer
GeoJSON
26. 26
Cas d’usage client
✓ Besoin : livrer une vision 360° à leurs
utilisateurs métiers : souscripteurs,
gestionnaires des sinistres, et Data
Scientists
✓ Complémenter et décloisonner leur
data warehouse existant
✓ Fournir un accès en temps réel à des
données d’API REST, OData, et SOAP
27. 27
Cas d’usage client
✓ Permettre la fédération des sources
disparates au sein d’une même vue
logique consistante et unique pour les
consommateurs
✓ Simplifier la consommation des
données via une couche de data service
« prête à l’emploi »
✓ Limiter la réplication inutile de données
et simplifier l’intégration
Témoignage novembre 2019
Referential data
Legacy
DWH / BI
Logical view
Data
Services
(API / SQL)
DB cache
Applications
d’Entreprise
Tableau de bord
Applications Web
Mobile App
28. Clients
800+ clients actifs
F500, G2000 & Start-ups
Bureaux
Sièges : Palo Alto (USA) & La Corogne (Espagne)
Paris, Munich, London, Madrid, Singapore, NYC
Leadership
20 ans d´expertise en Data Virtualization
Reconnu sur le marché et par les analystes en tant
que leader (Forrester, Gartner, retours clients
depuis plus de 6 ans)
Nombreux prix remportés
Denodo Technologies
Pure Player & Pionnier de la virtualisation des données
AUTO ÉVALUATION
Téléchargez
Denodo Express
Test Drive (1h) Inscrivez-vous aux
formations Denodo
ÉVALUATION COLLABORATIVE
https://www.denodo.com/en/denodo-platform/test-drives
Contactez-nous : https://www.denodo.com/fr/contact-us
ENSEMBLE CONTRE LE COVID-19
Accédez à notre portail COVID-19 : https://datacatalog.open.denodo.com/
30. 30
Table ronde d’experts interactive :
Cloud Marketplaces et Data Management - 16 juillet, 10h00
Des experts du cloud et du data management,
clients et partenaires, débattront des résultats
de l’enquête 2020 de Denodo sur l’utilisation
du Cloud dans les entreprises
Inscrivez-vous ici et obtenez des réponses à
toutes vos questions sur le cloud !