SlideShare une entreprise Scribd logo
1  sur  47
Télécharger pour lire hors ligne
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
Monitoring du système
de stockage de données du
CERN
Superviseurs :
Dr. Sébastien PONCE
Dr. Massimo LAMANNA
Tuteurs :
Dr. Romain ROUVOY
M. Raphaël MARVIE
3 Septembre 2013
Stage réalisé de Mars à Août 2013
Université Lille 1
Spécialisation IAGL – Ingénierie et Architecture des Grands Logiciels
Manuel SERVAIS
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
2/24
Sommaire
• Contexte
– Laboratoire
– Service
– CASTOR
– L’existant avant stage
– Technologies
• Sujets / Problèmes
– Parallélisation du mae-consumer
• Architecture streaming « MapReduce »
• Maemanager
• Tests
– L'existant après stage
– Autres contributions et Améliorations
• Conclusion
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
3/24
Contexte
– Laboratoire
– Service
– CASTOR
– L’existant avant stage
– Technologies
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
4/24
Laboratoire
CERN – Conseil Européen de la Recherche nucléaire
Fondé en 1954
Plus grand laboratoire de physique au monde
4 missions : Recherche ; Technologie; Coopération; Formation
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
5/24
Entreprise
LHC : 27 km de circonférences 100m sous terre
CERN Aéroport de
Genève
LHC
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
6/24
Service
CERN
~2400 employés
~10 000 collaborateurs
~100 000 visiteurs / an
plus de 110 nationalités
IT-DSS-FDO
IT : Information Technology (~300 p.)
DSS : Data & Storage Service (~35 p.)
FDO : File system & Disk Operation (~12 p.)
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
7/24
CASTOR
Projet de IT-DSS-FDO (~ 6p.)
~ Logiciel open-source de stockage de données
~ 600 serveurs
~ 12 000 disques + 30 000 bandes magnétiques
~ 80 Po de données (disques + bandes)
=> 80 000 000 000 Mo
≃ 114 000 000 CD (700 Mo / CD)
≃ 136 Km (1,2 mm par cd)
≃ aller-retour Lille – Dunkerque en voiture = 1h40 de route
~ 20 Go de logs par jour à analyser en temps réel
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
8/24
L'existant avant stage
Mae-consumer
Hadoop consumer
HBase consumer
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
9/24
mae-consumer
L'existant avant stage
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
10/24
L'existant avant stage
Cockpit
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
11/24
Technologies
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
12/24
Sujet / Problèmes
1) Nombre de logs
– Capacité d'analyse devient insuffisante
Parallélisation pour améliorer la capacité de calcul
2) Récupération de données
– Historique sur de nouveaux graphiques
– « Re génération » de partie de graphique
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
13/24
Sujet / Problèmes
– Parallélisation du mae-consumer
• Architecture streaming « MapReduce »
• Maemanager
• Tests
– L'existant après stage
– Autres contributions et Améliorations
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
14/24
Parallélisation du mae-consumer
MapReduce ?
Split + 2 opérations : Map et Reduce
Cf. projet informatique 2.0 « MapReduce et son implémentation » Wikipédia
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
15/24
Plusieurs mae-consumers (Opération Map)
– Chaque mae-consumer analyse une partie des
données
Un reducer (Opération Reduce)
– Fusion des résultats
Architecture Streaming « MapReduce »
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
16/24
Streaming MapReduce ?
• Flux de données continu
• Analyse continue
• Réduction continue
• Résultats continus
Architecture Streaming « MapReduce »
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
17/24
mae-manager
« Chef d'orchestre »
• Instanciations des processus
• Exécution de commandes
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
18/24
Tests
Machine de développement :
– Virtuelle
– Intel(R) Xeon(R) CPU L5630 @ 2,13 Ghz
2 coeurs
– 8 Go ram
Machine de production :
– Physique
– 2* Intel(R) Xeon(R) CPU L5520 @ 2,27 Ghz
2* 4 coeurs + HyperThreading = 8 coeurs, 16 threads
– 24 Go ram
Machine de tests :
– Physique,
– 2 * Intel(R) Xeon(R) CPU E5-2630L @ 2,00 Ghz
2* 6 coeurs + HyperThreading = 12 coeurs, 24 threads
– 50 Go ram + SSD
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
19/24
Tests
Speed up=
Tempsexécutionséquentiel
Tempsexécution parallèle
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
20/24
L'existant après stage
Mae-consumer
Hadoop consumer
HBase consumer
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
21/24
Autres contributions & Améliorations
• Récupération de données Hadoop
• Consolidations des données Hadoop
• Présentation & support (CERN & RAL)
• Maintenance du système
• Packaging
• Monitoring du monitoring
• Distribution sur machines
Améliorations
Contributions
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
22/24
Conclusion
• 2 objectifs :
- mae-consumer parallèle
vitesse multipliée par le nombre de cœurs
- récupération de données dans Hadoop
• Suivi d'un projet de A à Z
• Technologies (Python, RPyC, Hadoop, etc)
• Monde de la recherche
• Culture internationale
• Travail réalisé : utile pour les opérateurs
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
23/24
Vue opérateurs
Conclusion
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
24/24
Questions
?
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
25/24
Contributions Hadoop
– Consolidation des données
• Fusion
• Uniformisation
• État actuel
– Utilisation
• État d'implémentation
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
26/24
Données Hadoop : fusion
• Fichiers générés toutes les 5 mins / instance /
type nœuds
• ≃10 000 fichiers par jours
• ≃3 650 000 fichiers par ans
• Hadoop : Fait pour les gros fichiers, pas les
petits
Fusion des fichiers (64 fichiers par jours)
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
27/24
• 2 clusters
• 3 formats
• Fichiers désordonnées
• Lignes inutiles
• ≃2 ans de données
Données Hadoop : uniformisation
hadoop fs -du -s -h /project/castorlogs/prod
22075.7g /project/castorlogs/prod
= ~22 To de logs
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
28/24
État actuel des données
• Plus de 30 000 MapReduces sur 6 mois
• AcronJob quotidien (castorc3 @ c2adm01)
• ≃ Juillet 2011 -> Aujourd'hui
• Données traduites, filtrées, triées, fusionnées
• Cluster Hadoop /project/castorlogs/prod
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
29/24
– Historique pour nouvelle métrique
– Re génération de parties du Cockpit
Données Hadoop : utilisation
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
30/24
– Commande RPyC dans console Python
--> Sélection fichiers Hadoop
--> Exécution MapReduce Hadoop
(sélection des données)
--> Téléchargement du fichier résultat
--> Lancement analyse
--> Retour asynchrone RPyC sur l'état d'avancement
– A faire :
--> intégration cockpit ( non plus une commande RPyC)
--> obtenir résultat de l'analyse
Données Hadoop : état implémentation ?
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
31/24
Questions
?
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
32/24
Système complet avant stage
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
33/24
Format des logs
Logs « brut »
2012-11-29T04:02:27.515334+01:00 c2atlassrv301 stagerd [13958]: LVL=Info TID=14007
MSG="InvokingprepareForMigration" REQID=c773540e-2614-4363-b954-73723da69ec4 NSHOSTNAME=castorns
NSFILEID=1235772296 ChkSumType="AD" ChkSumValue="5e796592" SubReqId=22175639220 FileSize=63913248
Log JSON
{
'TIMESTAMP' : '2012-11-29T04:02:27.515334+01:00' ,
'HOSTNAME' : 'c2atlassrv301' ,
'DAEMON' : 'stagerd' ,
'PID' : '13958' ,
'LVL' : 'Info' ,
'TID' : '14007' ,
'MSG' : 'Invoking prepareForMigration' ,
'REQID' : 'c773540e-2614-4363-b954-73723da69ec4' ,
'NSHOSTNAME' : 'castorns' ,
'NSFILEID' : '1235772296' ,
'ChkSumType' : 'AD' ,
'ChkSumValue' : '5e796592' ,
'SubReqId' : '22175639220' ,
'FileSize' : '63913248'
}
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
34/24
Métrique et résultat
Métrique
<metric>
name : Errors
unit : Count of errors
category : General
window : 60
conditions : LVL in ["Error"]
groupbykeys : INSTANCE, DAEMON
data : Counter (COUNT)
handle_unordered : time_threshold
nbins : 1
</metric>
Exemple de résultat
{
"c2alice": {
"nsd": 12 ,
"stagerd": 14 ,
"transfermanagerd": 8
},
"c2atlas": {
"nsd": 4 ,
"stagerd": 120 ,
"transfermanagerd": 28
}
}
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
35/24
Parallélisation
• Sur 1 seule machine
(mais extensible multi-machine, api Python)
• De données (DirQ)
• De calcul (métriques)
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
36/24
Parallélisation de données
Données partagées
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
37/24
Parallélisation de calcul
Métriques partagées
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
38/24
Parallélisation de données & de calcul
Combinaison des deux parallélisations
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
39/24
Parallélisation : utilisation pratique
Utilisation pratique
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
40/24
« mae-consumer » Nouvelle implémentation
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
41/24
Parallélisation
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
42/24
LogViewer (HBase)
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
43/24
Tests
• CASTOR (utilisé par le CERN)
– Test local
– Stress test
– Pre-prod
– Sur une machine de la prod
– En production
• CASTOR monitoring (utilisé par l'équipe qui gère CASTOR!)
– Test local
– Stress Test
– Prod avec vérification par opérateurs & moi
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
44/24
Tests
Speed up=
Tempsexécutionséquentiel
Tempsexécution parallèle
Efficacité=
Speed up
Nombre processus
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
45/24
Inscriptions
Technical Student programme 4-12 mois
Pour l'université Lille1 => 4-6 mois
http://jobs.web.cern.ch/fr/join-us/technical-student-programme
– Réponse fin novembre
– Allocation de subsistance « pour survivre en
Suisse »
– Logements
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
46/24
Tuyaux
• Choisis en fonction des besoins
• Recherchent développeurs en C/C++
• Aiment le Python
• Anglais (+ Français) (environnement internationale)
• Si logement en dehors du CERN, moins cher en France
CERN IT Department
CH-1211 Geneva 23
Switzerland
www.cern.ch/it
DSS
47/24
Bonus
• Cours
• Visites des installations
• Démonstrations
• Devenir guide
• Possibilités de continuité

Contenu connexe

En vedette

En vedette (12)

我想要從大陸翻牆,但我沒有固定ip,請問totolink路由器要怎麼設定呢
我想要從大陸翻牆,但我沒有固定ip,請問totolink路由器要怎麼設定呢我想要從大陸翻牆,但我沒有固定ip,請問totolink路由器要怎麼設定呢
我想要從大陸翻牆,但我沒有固定ip,請問totolink路由器要怎麼設定呢
 
Martha rocio linares_actividad 1_2_mapac.
Martha rocio linares_actividad 1_2_mapac.Martha rocio linares_actividad 1_2_mapac.
Martha rocio linares_actividad 1_2_mapac.
 
Content Potluck: Bring Everyone to the Community Table
Content Potluck: Bring Everyone to the Community TableContent Potluck: Bring Everyone to the Community Table
Content Potluck: Bring Everyone to the Community Table
 
Banco central de chile
Banco central de chileBanco central de chile
Banco central de chile
 
Researchproject
ResearchprojectResearchproject
Researchproject
 
忘記無線網路密碼時,如何使用I phone手機來修改或查看無線網路名稱與密碼(預設ip為10.1.1.1)
忘記無線網路密碼時,如何使用I phone手機來修改或查看無線網路名稱與密碼(預設ip為10.1.1.1)忘記無線網路密碼時,如何使用I phone手機來修改或查看無線網路名稱與密碼(預設ip為10.1.1.1)
忘記無線網路密碼時,如何使用I phone手機來修改或查看無線網路名稱與密碼(預設ip為10.1.1.1)
 
Understanding Menswear - Nift Bangalore
Understanding Menswear - Nift BangaloreUnderstanding Menswear - Nift Bangalore
Understanding Menswear - Nift Bangalore
 
DHCP上網-分享器基本設定(適用N300RH,N302RE)
DHCP上網-分享器基本設定(適用N300RH,N302RE)DHCP上網-分享器基本設定(適用N300RH,N302RE)
DHCP上網-分享器基本設定(適用N300RH,N302RE)
 
[HUBDAY] Galeries Lafayette - Le Nouveau Chic
[HUBDAY] Galeries Lafayette - Le Nouveau Chic[HUBDAY] Galeries Lafayette - Le Nouveau Chic
[HUBDAY] Galeries Lafayette - Le Nouveau Chic
 
Expresiones y-emociones-1-definitivooooo
Expresiones y-emociones-1-definitivoooooExpresiones y-emociones-1-definitivooooo
Expresiones y-emociones-1-definitivooooo
 
Mis preferencias de vacaciones
Mis preferencias de vacacionesMis preferencias de vacaciones
Mis preferencias de vacaciones
 
Mis preferencias de vacaciones
Mis preferencias de vacacionesMis preferencias de vacaciones
Mis preferencias de vacaciones
 

Similaire à manuel_servais_2012-2013_defence_stage_IAGL

Retour d'expérience BIG COMPUTE & HPC sur Windows Azure, par ANEO et SUPELEC
Retour d'expérience BIG COMPUTE & HPC sur Windows Azure, par ANEO et SUPELECRetour d'expérience BIG COMPUTE & HPC sur Windows Azure, par ANEO et SUPELEC
Retour d'expérience BIG COMPUTE & HPC sur Windows Azure, par ANEO et SUPELEC
Microsoft Technet France
 
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
Patrick Guimonet
 

Similaire à manuel_servais_2012-2013_defence_stage_IAGL (20)

20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessing20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessing
 
IT Customer Solution Architect
IT Customer Solution ArchitectIT Customer Solution Architect
IT Customer Solution Architect
 
Retour d’expérience Big Compute & HPC sur Windows Azure [TechDays 2014]
Retour d’expérience Big Compute & HPC sur Windows Azure [TechDays 2014]Retour d’expérience Big Compute & HPC sur Windows Azure [TechDays 2014]
Retour d’expérience Big Compute & HPC sur Windows Azure [TechDays 2014]
 
Tech daysRetour d’expérience Big Compute & HPC sur Windows Azure [TechDays 2014]
Tech daysRetour d’expérience Big Compute & HPC sur Windows Azure [TechDays 2014]Tech daysRetour d’expérience Big Compute & HPC sur Windows Azure [TechDays 2014]
Tech daysRetour d’expérience Big Compute & HPC sur Windows Azure [TechDays 2014]
 
Rapport_PRES__Copy_
Rapport_PRES__Copy_Rapport_PRES__Copy_
Rapport_PRES__Copy_
 
20070320 01 - Démarche qualité logicielle et outillage (SNCF)
20070320 01 - Démarche qualité logicielle et outillage (SNCF)20070320 01 - Démarche qualité logicielle et outillage (SNCF)
20070320 01 - Démarche qualité logicielle et outillage (SNCF)
 
Retour d'expérience BIG COMPUTE & HPC sur Windows Azure, par ANEO et SUPELEC
Retour d'expérience BIG COMPUTE & HPC sur Windows Azure, par ANEO et SUPELECRetour d'expérience BIG COMPUTE & HPC sur Windows Azure, par ANEO et SUPELEC
Retour d'expérience BIG COMPUTE & HPC sur Windows Azure, par ANEO et SUPELEC
 
XebiCon'17 : Migration d’une application web vers un Paas Openshift - Akram B...
XebiCon'17 : Migration d’une application web vers un Paas Openshift - Akram B...XebiCon'17 : Migration d’une application web vers un Paas Openshift - Akram B...
XebiCon'17 : Migration d’une application web vers un Paas Openshift - Akram B...
 
Propostion un Iaas
Propostion un IaasPropostion un Iaas
Propostion un Iaas
 
Social Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data TechnologySocial Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data Technology
 
Déployer facilement OpenStack et CEPH avec Bright OpenStack
Déployer facilement OpenStack et CEPH avec Bright OpenStackDéployer facilement OpenStack et CEPH avec Bright OpenStack
Déployer facilement OpenStack et CEPH avec Bright OpenStack
 
cv_chaker_jouini_fr
cv_chaker_jouini_frcv_chaker_jouini_fr
cv_chaker_jouini_fr
 
KAMAL 2016
KAMAL 2016KAMAL 2016
KAMAL 2016
 
20070925 05 - Un portail qualimétrie en Open Source
20070925 05 - Un portail qualimétrie en Open Source20070925 05 - Un portail qualimétrie en Open Source
20070925 05 - Un portail qualimétrie en Open Source
 
CV - Database Administrator ( French )
CV - Database Administrator ( French )CV - Database Administrator ( French )
CV - Database Administrator ( French )
 
Du capteur à l'amélioration de procédés - Opportunités du machine learning po...
Du capteur à l'amélioration de procédés - Opportunités du machine learning po...Du capteur à l'amélioration de procédés - Opportunités du machine learning po...
Du capteur à l'amélioration de procédés - Opportunités du machine learning po...
 
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
2008-10-02 Paris - Administration des applications critiques avec SQL Server ...
 
Chapitre-3-Architectures-Haute-Performance-et-embarquées.pdf
Chapitre-3-Architectures-Haute-Performance-et-embarquées.pdfChapitre-3-Architectures-Haute-Performance-et-embarquées.pdf
Chapitre-3-Architectures-Haute-Performance-et-embarquées.pdf
 
Migration vers Active Directory 2012 et 2012 R2 : les meilleures pratiques
Migration vers Active Directory 2012 et 2012 R2 : les meilleures pratiques Migration vers Active Directory 2012 et 2012 R2 : les meilleures pratiques
Migration vers Active Directory 2012 et 2012 R2 : les meilleures pratiques
 
"La Performance en Continue" à JMaghreb 3.0 - 05/11/2014
"La Performance en Continue" à JMaghreb 3.0 - 05/11/2014"La Performance en Continue" à JMaghreb 3.0 - 05/11/2014
"La Performance en Continue" à JMaghreb 3.0 - 05/11/2014
 

manuel_servais_2012-2013_defence_stage_IAGL

  • 1. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS Monitoring du système de stockage de données du CERN Superviseurs : Dr. Sébastien PONCE Dr. Massimo LAMANNA Tuteurs : Dr. Romain ROUVOY M. Raphaël MARVIE 3 Septembre 2013 Stage réalisé de Mars à Août 2013 Université Lille 1 Spécialisation IAGL – Ingénierie et Architecture des Grands Logiciels Manuel SERVAIS
  • 2. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 2/24 Sommaire • Contexte – Laboratoire – Service – CASTOR – L’existant avant stage – Technologies • Sujets / Problèmes – Parallélisation du mae-consumer • Architecture streaming « MapReduce » • Maemanager • Tests – L'existant après stage – Autres contributions et Améliorations • Conclusion
  • 3. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 3/24 Contexte – Laboratoire – Service – CASTOR – L’existant avant stage – Technologies
  • 4. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 4/24 Laboratoire CERN – Conseil Européen de la Recherche nucléaire Fondé en 1954 Plus grand laboratoire de physique au monde 4 missions : Recherche ; Technologie; Coopération; Formation
  • 5. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 5/24 Entreprise LHC : 27 km de circonférences 100m sous terre CERN Aéroport de Genève LHC
  • 6. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 6/24 Service CERN ~2400 employés ~10 000 collaborateurs ~100 000 visiteurs / an plus de 110 nationalités IT-DSS-FDO IT : Information Technology (~300 p.) DSS : Data & Storage Service (~35 p.) FDO : File system & Disk Operation (~12 p.)
  • 7. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 7/24 CASTOR Projet de IT-DSS-FDO (~ 6p.) ~ Logiciel open-source de stockage de données ~ 600 serveurs ~ 12 000 disques + 30 000 bandes magnétiques ~ 80 Po de données (disques + bandes) => 80 000 000 000 Mo ≃ 114 000 000 CD (700 Mo / CD) ≃ 136 Km (1,2 mm par cd) ≃ aller-retour Lille – Dunkerque en voiture = 1h40 de route ~ 20 Go de logs par jour à analyser en temps réel
  • 8. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 8/24 L'existant avant stage Mae-consumer Hadoop consumer HBase consumer
  • 9. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 9/24 mae-consumer L'existant avant stage
  • 10. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 10/24 L'existant avant stage Cockpit
  • 11. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 11/24 Technologies
  • 12. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 12/24 Sujet / Problèmes 1) Nombre de logs – Capacité d'analyse devient insuffisante Parallélisation pour améliorer la capacité de calcul 2) Récupération de données – Historique sur de nouveaux graphiques – « Re génération » de partie de graphique
  • 13. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 13/24 Sujet / Problèmes – Parallélisation du mae-consumer • Architecture streaming « MapReduce » • Maemanager • Tests – L'existant après stage – Autres contributions et Améliorations
  • 14. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 14/24 Parallélisation du mae-consumer MapReduce ? Split + 2 opérations : Map et Reduce Cf. projet informatique 2.0 « MapReduce et son implémentation » Wikipédia
  • 15. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 15/24 Plusieurs mae-consumers (Opération Map) – Chaque mae-consumer analyse une partie des données Un reducer (Opération Reduce) – Fusion des résultats Architecture Streaming « MapReduce »
  • 16. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 16/24 Streaming MapReduce ? • Flux de données continu • Analyse continue • Réduction continue • Résultats continus Architecture Streaming « MapReduce »
  • 17. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 17/24 mae-manager « Chef d'orchestre » • Instanciations des processus • Exécution de commandes
  • 18. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 18/24 Tests Machine de développement : – Virtuelle – Intel(R) Xeon(R) CPU L5630 @ 2,13 Ghz 2 coeurs – 8 Go ram Machine de production : – Physique – 2* Intel(R) Xeon(R) CPU L5520 @ 2,27 Ghz 2* 4 coeurs + HyperThreading = 8 coeurs, 16 threads – 24 Go ram Machine de tests : – Physique, – 2 * Intel(R) Xeon(R) CPU E5-2630L @ 2,00 Ghz 2* 6 coeurs + HyperThreading = 12 coeurs, 24 threads – 50 Go ram + SSD
  • 19. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 19/24 Tests Speed up= Tempsexécutionséquentiel Tempsexécution parallèle
  • 20. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 20/24 L'existant après stage Mae-consumer Hadoop consumer HBase consumer
  • 21. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 21/24 Autres contributions & Améliorations • Récupération de données Hadoop • Consolidations des données Hadoop • Présentation & support (CERN & RAL) • Maintenance du système • Packaging • Monitoring du monitoring • Distribution sur machines Améliorations Contributions
  • 22. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 22/24 Conclusion • 2 objectifs : - mae-consumer parallèle vitesse multipliée par le nombre de cœurs - récupération de données dans Hadoop • Suivi d'un projet de A à Z • Technologies (Python, RPyC, Hadoop, etc) • Monde de la recherche • Culture internationale • Travail réalisé : utile pour les opérateurs
  • 23. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 23/24 Vue opérateurs Conclusion
  • 24. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 24/24 Questions ?
  • 25. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 25/24 Contributions Hadoop – Consolidation des données • Fusion • Uniformisation • État actuel – Utilisation • État d'implémentation
  • 26. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 26/24 Données Hadoop : fusion • Fichiers générés toutes les 5 mins / instance / type nœuds • ≃10 000 fichiers par jours • ≃3 650 000 fichiers par ans • Hadoop : Fait pour les gros fichiers, pas les petits Fusion des fichiers (64 fichiers par jours)
  • 27. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 27/24 • 2 clusters • 3 formats • Fichiers désordonnées • Lignes inutiles • ≃2 ans de données Données Hadoop : uniformisation hadoop fs -du -s -h /project/castorlogs/prod 22075.7g /project/castorlogs/prod = ~22 To de logs
  • 28. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 28/24 État actuel des données • Plus de 30 000 MapReduces sur 6 mois • AcronJob quotidien (castorc3 @ c2adm01) • ≃ Juillet 2011 -> Aujourd'hui • Données traduites, filtrées, triées, fusionnées • Cluster Hadoop /project/castorlogs/prod
  • 29. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 29/24 – Historique pour nouvelle métrique – Re génération de parties du Cockpit Données Hadoop : utilisation
  • 30. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 30/24 – Commande RPyC dans console Python --> Sélection fichiers Hadoop --> Exécution MapReduce Hadoop (sélection des données) --> Téléchargement du fichier résultat --> Lancement analyse --> Retour asynchrone RPyC sur l'état d'avancement – A faire : --> intégration cockpit ( non plus une commande RPyC) --> obtenir résultat de l'analyse Données Hadoop : état implémentation ?
  • 31. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 31/24 Questions ?
  • 32. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 32/24 Système complet avant stage
  • 33. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 33/24 Format des logs Logs « brut » 2012-11-29T04:02:27.515334+01:00 c2atlassrv301 stagerd [13958]: LVL=Info TID=14007 MSG="InvokingprepareForMigration" REQID=c773540e-2614-4363-b954-73723da69ec4 NSHOSTNAME=castorns NSFILEID=1235772296 ChkSumType="AD" ChkSumValue="5e796592" SubReqId=22175639220 FileSize=63913248 Log JSON { 'TIMESTAMP' : '2012-11-29T04:02:27.515334+01:00' , 'HOSTNAME' : 'c2atlassrv301' , 'DAEMON' : 'stagerd' , 'PID' : '13958' , 'LVL' : 'Info' , 'TID' : '14007' , 'MSG' : 'Invoking prepareForMigration' , 'REQID' : 'c773540e-2614-4363-b954-73723da69ec4' , 'NSHOSTNAME' : 'castorns' , 'NSFILEID' : '1235772296' , 'ChkSumType' : 'AD' , 'ChkSumValue' : '5e796592' , 'SubReqId' : '22175639220' , 'FileSize' : '63913248' }
  • 34. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 34/24 Métrique et résultat Métrique <metric> name : Errors unit : Count of errors category : General window : 60 conditions : LVL in ["Error"] groupbykeys : INSTANCE, DAEMON data : Counter (COUNT) handle_unordered : time_threshold nbins : 1 </metric> Exemple de résultat { "c2alice": { "nsd": 12 , "stagerd": 14 , "transfermanagerd": 8 }, "c2atlas": { "nsd": 4 , "stagerd": 120 , "transfermanagerd": 28 } }
  • 35. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 35/24 Parallélisation • Sur 1 seule machine (mais extensible multi-machine, api Python) • De données (DirQ) • De calcul (métriques)
  • 36. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 36/24 Parallélisation de données Données partagées
  • 37. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 37/24 Parallélisation de calcul Métriques partagées
  • 38. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 38/24 Parallélisation de données & de calcul Combinaison des deux parallélisations
  • 39. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 39/24 Parallélisation : utilisation pratique Utilisation pratique
  • 40. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 40/24 « mae-consumer » Nouvelle implémentation
  • 41. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 41/24 Parallélisation
  • 42. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 42/24 LogViewer (HBase)
  • 43. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 43/24 Tests • CASTOR (utilisé par le CERN) – Test local – Stress test – Pre-prod – Sur une machine de la prod – En production • CASTOR monitoring (utilisé par l'équipe qui gère CASTOR!) – Test local – Stress Test – Prod avec vérification par opérateurs & moi
  • 44. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 44/24 Tests Speed up= Tempsexécutionséquentiel Tempsexécution parallèle Efficacité= Speed up Nombre processus
  • 45. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 45/24 Inscriptions Technical Student programme 4-12 mois Pour l'université Lille1 => 4-6 mois http://jobs.web.cern.ch/fr/join-us/technical-student-programme – Réponse fin novembre – Allocation de subsistance « pour survivre en Suisse » – Logements
  • 46. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 46/24 Tuyaux • Choisis en fonction des besoins • Recherchent développeurs en C/C++ • Aiment le Python • Anglais (+ Français) (environnement internationale) • Si logement en dehors du CERN, moins cher en France
  • 47. CERN IT Department CH-1211 Geneva 23 Switzerland www.cern.ch/it DSS 47/24 Bonus • Cours • Visites des installations • Démonstrations • Devenir guide • Possibilités de continuité