Dans cette session, nous discuterons de la manière dont les scientifiques à travers le monde (du CERN, du National Health Service (système de santé britannique) au Royaume-Uni et du Centre de recherches sur les communications (CRC) au Canada) utilisent AWS pour accélérer le rythme des recherches. Profitez d'une vaste plage d'études de cas et d'aperçu des outils comme le calcul haute performance, le machine learning et le deep learning à l'aide d'AWS research. Découvrez comment élargir facilement les clusters sur site dans Amazon EC2 et comment les chercheurs de l'ASPC utilisent cette méthode au quotidien au Laboratoire national de microbiologie (LNM) de Winnipeg pour séquencer les données du génome, détecter rapidement les épidémies de maladies et mettre en place des réponses de santé publique. Enfin, découvrez l'environnement de calcul scientifique sécurisé et avancé du CRC dans le cloud ainsi que son rôle dans la démocratisation des calculs haute performance pour divers besoins scientifiques.
29. Démocratisation du calcul
haute performance (HPC)
Résultat d'une collaboration entre :
Laboratoire national de microbiologie ; Agence de la santé
publique du Canada
Et le Centre de recherches sur les communications ;
Innovation, science et développement économique
Le 15 mai 2019
30. Les collaborateurs
• Le Centre de recherches sur les communications : Le centre de
recherche appliquée sur les télécommunications de pointe du
gouvernement du Canada, axé sur le client. L'innovateur canadien
dans le domaine des télécommunications sans fil s'est penché sur
ce qui est possible et sur ce qui fonctionne.
• Le Laboratoire national de microbiologie de l'Agence de santé
publique du Canada, le seul laboratoire de bioconfinement de
niveau 4 au Canada, spécialisé dans la prévention, la surveillance,
la détection et l'intervention en cas de menaces de maladies de
santé publique. De nouvelles approches sont continuellement mises
au point et appliquées.
30
31. Le défi
Le Laboratoire national de microbiologie (LNM) de l'Agence de la
santé publique du Canada (ASPC) connaît d'importantes poussées
au niveau de ses activités informatiques, à un point tel qu’elle a
dépassé les capacités de son infrastructure CHP sur site.
31
• Le cloud peut-il être utilise pour augmenter les capacités
de CHP de leur centre de données?
• Le CHP sur le cloud peut-il être rentable?
• Le CRC et le LNM peuvent-ils utiliser le CHP sur le cloud
pour faire de la science?
32. 32
Notre défi de 6 semaines
Migrer une partie de l’architecture du CHP de LNM sur le
domaine de recherche virtuel (DRV) du CRC.
• Avec les services d’Amazon Web Services
• Preuve de concept CHP
• Cas d'utilisation en situation réelle ayant une incidence
sur la santé publique
• Étalonnage avec système sur site
33. Une approche en trois phases
• Phase 1 – Soulever et déplacer (~1-2 semaines)
• Phase 2 – Optimiser (~2-3 semaines)
• Phase 3 – Mesurer (1-semaine)
33
6-semaines
34. Composition de l’équipe
• Petite équipe interdisciplinaire de systèmes
informatiques (CS), biologiste (BI) et ingénieur de
recherche (ENG)
• Approche agile avec sprint hebdomadaire
34
38. Phase 2 – Mise à l'échelle - Capacité
insuffisante ?
38
Erreur: Capacité d’instance insuffisante.
La capacité dans le zone de disponibilité demandée est actuellement
insuffisante.
AWS Region
AZ AZ AZ AZ
39. inefficient scaling
Phase 2 – Mécanisme de mise à l’échelle
AWS auto-scaling vs personnalisée39
Évolutivité améliorée
40. Phase 2 – Comparaison de Data Store – Multi
AZ
Vitesse et coût Data Store– multi AZ
40
41. Phase 2- Architecture finale
• Multi AZ
• Mise à l'échelle
personnalisée
• S3 pour le data store
41
43. Phase 3 – Cas d’utilisation réels
• Infection alimentaire (rappel de farine tout usage)
• Identification des gènes résistants aux antimicrobiens (MCR-1)
• Données accessibles au public
43
44. Phase 3 - Étalonnage
Deux étalonnages
• 10 K échantillon de simulation (10 To)
• 100 K échantillon de simulation (100To)
Les deux étalonnages ont été exécuté:
• Sur site
• Cloud – soulever et déplacer (10 K seulement, en raison du
coût)
• Cloud- optimisé
44
45. Phase 3 – Temps d’exécution
10 K temps
(h:mm)
100 K temps
(h:mm)
Sur site 0:25 3:36
Cloud – soulever et
déplacer
1:05 --
Cloud - optimisé 0:07 0:26
45
1:05 --
0:07 0:26
46. Phase 3 – Coût
Base Soulever et déplacer Optimisé
Stockage de base (100 TB) $1,005/day $75/day
Base CPU $67/day $55/day
Base totale $1,072/day $130/day
À capacité extensible
Burst CPU - 10K $73 $62
Burst CPU - 100K -- $220
46
1 005 $/jour
$67 $/jour
1 072 $/jour
73 $
75 $/jour
55 $/jour
130 $/jour
62 $
220 $
48. Démonstration réussie
• Les éléments du système CHP de LNM peuvent être migrés
vers le cloud
• Les systèmes CHP peuvent être optimisés pour l'utilisation
dans le cloud
• Le Cloud CHP peut être rentable
• Le Cloud CHP peut être utilisé pour la science, vraiment!
48
49. Ce qu’on retient
• Le CHP est accessible à tous - dans le cloud
• Le cloud évolue à la demande et est rentable
• Utiliser le CHP peut permettre des résultats viables,
tout en répondant à des exigences communes et
réelles
• Des avancés dans les phases initiales sont possibles
49