Orchestration

Retour d'expérience
-
Orchestration
Du bootstrap des clusters au déploiement
des micro-services

Orchestration, Pourquoi ?
Organisation agile
Engineering composée de Tribes
Changement de l'architecture historique monolithique
vers une architecture orientée micro-services
Autonomie des Squads dans leurs développements
Domaine de responsabilité
Faciliter les mises en production

Orchestration, Le besoin
Reprise de l'existant initié par nos développeurs
Déploiement des clusters via le script kube-up.sh
Déploiement sur 2 régions AWS
Trop peu de redondance
Pas de monitoring orienté système

Orchestration, Le besoin
Support de la Squad Infra
Apporter une vision complémentaire
Proposer une solution rapidement viable en production
Intégrer des fonctionnalités supplémentaires (monitoring, autoscaling)
Déﬁnir la stack technique
Ajouter de la redondance à l'existant
Industrialiser le déploiement et l'exploitation des clusters

Orchestration, La stack
Choix de l'outil de déploiment
Déjà utilisé auparavant : Ça marche
Bootstrap de clusters rapide aussi bien sur AWS que On-Premise
Installation de plusieurs masters possible + redondance ETCD
Communauté réactive
Quelques bugs facilement contournables
Utilise Ansible (SSH) et peut-être assez long en cas de latence importante
Switch sur Saltstack à terme

Le réseau
Approche layer 3
Solution prometteuse et déjà utilisée auparavant
Pas de magie : règles iptables - facile à debug
CLI calicoctl intuitive et eﬃcace
Utilisation sur AWS ET On-Premise
root@ip-10-212-3-250:/home/admin# calicoctl status
calico-node container is running. Status: Up 13 days
Running felix version 1.4.0rc2
IPv4 BGP status
IP: 10.212.3.250 AS Number: 64511 (inherited)
+--------------+-------------------+-------+------------+-------------------------------------------+
| Peer address | Peer type | State | Since | Info |
+--------------+-------------------+-------+------------+-------------------------------------------+
| 10.212.3.111 | node-to-node mesh | up | 2016-09-26 | Established |
| 10.212.3.112 | node-to-node mesh | start | 2016-09-26 | Active Socket: Host is unreachable |
+--------------+-------------------+-------+------------+-------------------------------------------+

Les intercos
Rappel
Kubernetes sur diﬀérentes régions AWS
Plusieurs datacenters "Dailymotion"
Besoin
Centraliser les logs des clusters à un endroit (Ici une région AWS)
Utiliser nos services internes depuis nos régions AWS (Master
Saltstack, Dépot de paquet, LDAP etc...)

Les intercos : Big Picture
OpenVPN

Les intercos : En détail
Un couple de Gate par datacenter Dailymotion
Deux couples de Gate par région AWS
Utilisation de subnet privés prédéﬁnis
AWS Infra VPCAWS Squads VPC
Solution KISS qui fait le job
VPC Peering

Le monitoring
Utilisation du SaaS Datadog pour collecter toutes les métriques
système ET applicatives
Plugin AWS / Docker /
Kubernetes
Intégration dans notre
Shinken
Rate limit de l'API Cloudwatch

Overview des clusters

Orchestration, Le déploiement des
services

Orchestration, Le déploiement des services
Le process
Push du code sur
Push de l'image
sur le Hub
Rollout du deployment
via shell script

Orchestration, Les PoC en cours

Orchestration, Work In Progress
Intégration de Consul
Consul est déjà utilisé en production et dynamiquement intégré à notre
solution de load balancing
Pouvoir s'abstraire des services Kubernetes (mode headless) pour certains
use-cases
Test de diﬀérent bridge Kube / Consul pour pouvoir alimenter notre
système d'auto-discovery
Ajout des IPs de Services
Ajout des IPs des Pods
Intérêt : Pouvoir adresser les Pods directement depuis nos load balancers sa
la notion de Service

Orchestration, La suite
Teaser : Orchestrer la plus grosse ferme de Dailymotion
Apache (pour servir les 3 milliards de vues par
mois sur dailymotion.com)
Quel volume ?
Plusieurs centaines de serveurs high-end
Quel type de service ?
ﬀmpeg (pour encoder les 300 000 heures
de vidéos par mois)

Orchestration, La suite
Teaser : Orchestrer la plus grosse ferme de Dailymotion
L'idée
Machines identiques qui servent les 2 services
Priorité au service de dailymotion.com vs l'encoding
Le but
Orchestrer / autoscaler les deux services (En fonction de
paramètres comme la charge des webs ou de l'encodage)
Setup On Premise et pourquoi pas un oﬄoad dans le cloud

@Donch_
david.donchez@{gmail,dailymotion}.com

Orchestration

Contenu connexe

En vedette

Similaire à Orchestration

Dernier

Orchestration