Global Azure Bootcamp 2019 Strasbourg - Cosmos DB

Globally distributed,
massively scalable,
and multi-model database service
Cosmos DB

Philippe DIDIERGEORGES
CTO @ Versusmind
MUG Strasbourg
@DePhiless
Speaker

CosmosDB
Introduction et concepts

Exemple: service de log
• Application scalée pour qques Go
• Déployée en France
• Déployée petit à petit dans le monde entier
• De plus en plus de données: plusieurs peta
Problématiques
• Garder un niveau de perf constant
• Gérer les évolution

Dans le monde relationnel
Le problème des migrations
Quand le modèle change:
• Il faut préparer les scripts de migrations
• S’assurer qu’il s’exécute bien
• S’assurer que les changement nécessaire sont effectués (cascade)

Passer au modèle « NoSQL » avec CosmosDB
Document = Objet
• Pas de mapping complexe ni de génération de requête
• Schéma agnostique == pas de migration
Je code, j’initialise mon objet et je le persiste.

?Si ce n’est pas du SQL, comment requêter mes
données?

?Pourquoi le NoSQL n’est-il pas la norme depuis 15 ans?

Base de données cloud: les grands principes
Partitionnement
Réplication
Gouvernance des ressources

Partitionnement
Elasticité à l’infini du stockage et du débit

Réplication
Partitionnement
=> Elasticité à l’infini du stockage et du débit
Replication
Gouvernance des resources

?Quel problème apparait lorsque l’on réplique des
données en plusieurs endroit?

Réplication
5 Stratégies de gestion de la consistance des données disponibles:
https://docs.microsoft.com/en-us/azure/cosmos-db/consistency-levels

Gouvernance et Garanties
Pilotage de l’espace et du débit
- Provisionnement des ressource partagé ou ciblé
SLA de 1er ordre:
- 99,99% de disponibilité
- Latence <10ms garantie au 99e centile
- Débit et consistance des données garanties
Paiement à l’utilisation
=> Attention à l’optimisation!

Modélisation
En pratique, comment construit-on notre base de
données?

Structure des bases CosmosDB
Les conteneurs:
- Unité de scalabilité
- Répliqués entre les régions
- Débit (througput) réservé / partagé
- Options de TTL, indexation, …

Structure des bases CosmosDB
Les Items:
- Organisés dans des partitions logiques
avec la PartitionKey
Triggers, ProcStoc, Merge proc et UDF
écrites en JS

Notre contexte
Nous disposons de services
Ces services sont composés d’applications
Les applications génèrent des logs techniques contenant un environnement,
une criticité, un message et une stacktrace
Une page permet d’afficher les derniers logs et de requêter ces logs selon
des filtres.
Il est possible de consulter le détail d’un log et d’y trouver les informations
de l’environnement et de l’application.
Un état du service et de ses applications est disponible en fonction des logs
sur la dernière heure.

Le cas de notre application de logs
L’approche relationnelle
Applications
AppID
AppName
AppUrl
EnvName
SrvID
Service
SrvID
SrvName
Logs
LogID
LogLevel
Message
StackTrace
AppID

Analysons les requêtes
1. Identification des requêtes
2. Catégoriser les requêtes
• Command (écritures)
• Query (lectures)

Analysons les requêtes
• [C1] Ajouter / modifier un service
• [Q1] Consulter un service
• [C2] Ajouter / modifier une app
• [Q2] Consulter une app
• [Q3] Lister les apps d’un service et leur état
• [C3] Ajouter un log
• [Q4] Lister les logs d’une application / d’un service
• [Q5] Lister les logs (avec nom du service et de l’app)
• Les 100 derniers
• Pour un service / une application donnée
• Pour un environnement donné
• Pour une criticité donnée

Volumes de données
• 5 services
• 2 – 10 applications par service
• 5000 – 500.000 logs par jour / application

Limites du système relationnel
• La quantité de données impacte directement les performances
• La mise en place d’indexes permettra d’optimiser les requêtes
• Les jointures sont très consommatrices

Le modèle de données de CosmosDB

Le modèle de données de CosmosDB
Dans CosmosDB, on stocke des documents dans des conteneurs
> Comme des lignes dans une table?
NON

Le cas de notre application de logs
Dans CosmosDB, on stocke des documents dans des conteneurs

Analysons les requêtes – V0

Etape 1: partitionnement
Au niveau des données: les conteneurs
Services Container
Applications Logs
PartitionKey: AppID
Type: "app"
AppID
AppName
AppUrl
EnvName
SrvID
Services
PartitionKey: SrvID
SrvID
SrvName
PartitionKey: AppID
Type: "log"
LogID
LogLevel
Message
StackTrace
AppID
Applications Container

Au niveau des données: les partitions logiques
Services Container
Applications Logs
PartitionKey: AppID
Type: "app"
AppID
AppName
AppUrl
EnvName
SrvID
Services
PartitionKey: SrvID
SrvID
SrvName
PartitionKey: AppID
Type: "log"
LogID
LogLevel
Message
StackTrace
AppID

Services Container
Au niveau des données: les partitions logiques
Applications Logs
PartitionKey: AppID
Type: "app"
AppID
AppName
AppUrl
EnvName
SrvID
Services
PartitionKey: SrvID
SrvID
SrvName
PartitionKey: AppID
Type: "log"
LogID
LogLevel
Message
StackTrace
AppID

Introduction: dénormalisation
Enrichir les données dans les documents
Rassembler les données de plusieurs tables en une seule
Objectif: réduire le besoin de jointure pour optimiser les requêtes les
plus gourmandes

Utilisation de procédures stockées
• Ecrites en Javascript
• Exécutée comme une transaction atomique
• Limitée à une seule partition logique
Dénormalisation dans la même partition
logique

Services Container
Applications Logs
PartitionKey: AppID
Type: "app"
AppID
AppName
AppUrl
EnvName
SrvID
SrvName
Services
PartitionKey: SrvID
SrvID
SrvName
PartitionKey: AppID
Type: "log"
LogID
LogLevel
Message
StackTrace
AppID
AppName
SrvID
SrvName
Dénormalisation dans la même partition
logique

Dénormalisation entre partitions et
conteneurs avec le change feed

Services Container
Applications Logs
PartitionKey: AppID
Type: "app"
AppID
AppName
AppUrl
EnvName
SrvID
SrvName
AppStatus
Services
PartitionKey: SrvID
SrvID
SrvName
SrvStatus
PartitionKey: AppID
Type: "log"
LogID
LogLevel
Message
StackTrace
AppID
AppName
SrvID
SrvName
Dénormalisation entre partitions et
conteneurs avec le change feed
Last100 Container
Logs
PartitionKey: type
Type: applog/srvlog
LogID
LogLevel
Message
StackTrace
AppID
AppName
SrvID
SrvName

Intégration grâce au change feed
=> Le change feed permet d’imaginer de nombreux scénarii
Architecture orientée événements

=> Analyse et exploitation temps réel des données

=> Système de recommandation

One more thing
Recherche full-text avec CosmosDB et Azure Search

?Intéressés par un atelier CosmosDB?

Global Azure Bootcamp 2019 Strasbourg - Cosmos DB

Recommandé

Recommandé

Contenu connexe

Similaire à Global Azure Bootcamp 2019 Strasbourg - Cosmos DB

Similaire à Global Azure Bootcamp 2019 Strasbourg - Cosmos DB (20)

Global Azure Bootcamp 2019 Strasbourg - Cosmos DB

Notes de l'éditeur