SlideShare une entreprise Scribd logo
1  sur  58
Télécharger pour lire hors ligne
Направи си сам СУперкомпютър
                 Д-р Христо Илиев, НИС при СУ "Св. Климент Охридски"




                          OpenFest, МТЦ “Интерпред” София, 5–6 ноември 2011 г.
08 ноември 11, вторник
За мен

               • Физически факултет на СУ

               • http://icaci.info

               • hristo <при> icaci.info

               • @hiliev

               • xmpp:icaci@jabber.org

                                           2
08 ноември 11, вторник
“All science is either physics or stamp collecting.”
                                      -- Ernest Rutherford
                               J. B. Bricks, “Rutherford at Manchester” (1962)




08 ноември 11, вторник
По-известни физици
               • John Atanasoff – доктор по теоретична физика

               • John von Neumann – доктор по математика и физика

               • Edsger Dijkstra – магистър по физика

               • Donald Knuth – бакалавър по физика

               • Dennis Ritchie – бакалавър по физика

               • Brian Kernighan – бакалавър по инж. физика

               • Richard Stallman – бакалавър по физика


                                              4
08 ноември 11, вторник
Суперкомпютър
               • Голям

               • Бърз

               • Енергоемък

               • Скъп

               • Много памет

               • Паралелен

                               5
08 ноември 11, вторник
6
08 ноември 11, вторник
Закон на Мур
               • Напасване на експерименталните наблюдения с
                 показателна функция
                                     (t t0 )/2
               • Ntran (t) = Ntran (t0 ) ⇥ 2
                 (Gordon Moore, CEO Intel, 1975)
                                      (t t0 )/1,5
               • OpW(t) = OpW(t0 ) ⇥ 2
                 (David House, Intel)

               • Инженерите на Intel упорито се опитват да
                 поддържат законите в сила!
                                         7
08 ноември 11, вторник
Модел на времето
               • Флуидодинамика и термодинамика

               • Диференциални уравнения       диференчни уравнения

               • Симулиран обем = площ S × височина H

               • Пространствена разделителна способност ∆L

               • Времева стъпка ∆t

               • Операции ~ (S×H)/(∆L)3 T/∆t

                                         8
08 ноември 11, вторник
flops
               • floating-point operations per second
                 floating-point operations → flops/s

               • IEEE 754-2008

                    • единична точност (single, binary32)
                      32 бита; 7 десетични знака

                    • двойна точност (double, binary64)
                      64 бита; 15 десетични знака

                                           9
08 ноември 11, вторник
HPL
               • Стандартен начин да си ги мерим [суперкомпютрите]

                    • LINPACK тест на J. Dongara – A⋅x = y посредством гаусова
                      елиминация с частичен избор на водещ елемент

               • N := dim(A) = колкото позволява паметта

               • HPL – паралелна MPI версия

               • BLAS

               • 2/3×N3 + 2×N2 DP ops

               • Резултат в DP Gflops


                                                10
08 ноември 11, вторник
Top500.org
               • Списък на 500-те най-бързи суперкомпютри в света

               • 2 пъти годишно – юни и ноември

               • Rpeak = Nядра × fтакт × R
                 (R = 4 flops/Hz на повечето съвременни процесори)

               • Rmax = максимална производителност според HPL

               • Nmax = dim(A) за постигане на Rmax

               • Rmax/Rpeak < 1 – паралелна ефективност

                                           11
08 ноември 11, вторник
България в Top500
               • Blue Gene/P на ДАИТС (сега МТИТС)

                    • 8192 PowerPC 450 ядра @ 850 MHz

                    • Rmax = 23,42 Tflops; Rpeak = 27,85 Tflops

               • 11.2008 г. – 126 място

               • 06.2009 г. – 245 място

               • 11.2009 г. – 377 място

               • 06.2010 г. – изпада (Rmax[#500] = 24,67 Tflops)


                                                 12
08 ноември 11, вторник
Системна йерархия

                                    СУРР



                                ОС и мидълуер


                              CPU (+ GPU) и памет


                                 Комуникация




                                      13
08 ноември 11, вторник
Beowulf
               • Thomas Sterling и Donald Becker (NASA, 1994 г.)

               • Стандартни компоненти

               • Стандартна мрежова среда

               • Unix-подобна ОС

               • Мидълуер за паралелна обработка: MPI, PVM и др.

               • Клъстери, ферми и мрежи от работни станции

                                        14
08 ноември 11, вторник
Типичен клъстер




                                15
08 ноември 11, вторник
Нива на паралелизъм
               • Много груб – SETI@Home, BOINC

               • Груб – тривиално паралелни алгоритми

               • Среден – MPI, PVM, DSM

               • Фин – нишки, OpenMP, GPU

               • Много фин – ILP, SIMD, GPU


                                      16
08 ноември 11, вторник
Комуникация
               • Обмяна на данни между процесорите

                    • InfiniBand / 10 GbE

                    • Myrinet

                    • GigE (само за груб паралелизъм)

               • Файлова система и сервизна мрежа

                    • InfiniBand / GigE

                                           17
08 ноември 11, вторник
InfiniBand
               • Комутация на пакети (switched fabric)

               • Ниска латентност за MPI ~µs

               • Висока пропускателна способност

                    • DDR – 20 Gbps; QDR – 40 Gbps

               • Скъпи кабели :)

               • OpenFabrics Enterprise Distribution (OFED)

                                         18
08 ноември 11, вторник
CPU или GPU?
               • Цена и енергоемкост с/у универсалност

               • CPU – универсални и енергоемки

                    • Intel E7-4870: <1 Gflops/W; >20 €/Gflops

               • GPU – масивно паралелни и енергоефективни

                    • AMD/ATI HD6950: >3 Gflops/W; <0,5 €/Gflops


                                         19
08 ноември 11, вторник
CPU
               • Универсални

               • Паралелни и последователни алгоритми

               • Голям обем памет на ядро

               • Многозадачен режим

               • Бавен достъп до RAM


                                       20
08 ноември 11, вторник
GPU
               • Масивно паралелни SIMD

               • Тесен клас силно паралелни по данни алгоритми

               • Приставки (ускорители) към CPU

               • Малък обем собствена RAM на ядро

               • Тясно място – прехвърляне на данни от/до
                 RAM на CPU

                                     21
08 ноември 11, вторник
Програмни модели
               • SIMD, ILP – неявна поддръжка чрез кодовия
                 генератор на компилатора

               • Нишки – OpenMP, ОС API, библиотеки

               • DSM – ClOMP, vSMP, Unified Parallel C

               • GPU – CUDA, CAL, OpenCL, OpenMP подобия

               • Предаване на съобщения – MPI, PVM, Charm++

                                      22
08 ноември 11, вторник
ОС
               • Практически всяка ОС с мрежов стек

               • Unix

                    • UNICOS (Cray)

                    • IRIX (SGI)

                    • Solaris (Sun Microsystems)

                    • Linux (IBM, SGI, Cray, Beowulf)

                    • Mac OS X
                      (System X на Virginia Tech, #3 в Top500 от 11.2003 г.)

               • Windows 2008 HPC Server (Cray, Bull)
                                                   23
08 ноември 11, вторник
Мидълуер
               • Предаване на съобщения

               • Достъп до отдалечена памет

               • Глобални операции

               • Синхронизация

               • Паралелен В/И

               • Настройка и профилиране на паралелни приложения

                                       24
08 ноември 11, вторник
Open MPI
               • Реализация на MPI-1 и MPI-2

               • Нов BSD лиценз

               • Множество платформи и преносни среди

               • Активна разработка

               • http://www.open-mpi.org


                                      25
08 ноември 11, вторник
Файлова система

               • Общ изглед на файловата система посредством
                 мрежово споделяне

               • NFS – лесна за разгръщане, но с лоша
                 мащабируемост

               • Lustre – трудна за разгръщане, но с висока
                 производителност и мащабируемост


                                       26
08 ноември 11, вторник
Lustre
               • Високомащабируема паралелна файлова система за
                 големи клъстерни инсталации

               • GPL

               • CMU → CFS → Sun → Oracle → Whamcloud

               • Сървър за метаданни и множество блокови
                 хранилища

               • Поддръжка на InfiniBand свързаност

                                       27
08 ноември 11, вторник
Управление на ресурсите
               • Голям брой отделни възли под управление на собствена ОС
                 (може и на различни ОС)

               • Задачи

               • Заделяне на ресурси

               • Отдалечено стартиране на процеси

               • Пренасочване на В/И

               • Счетоводство на използваните ресурси
                 (все някой /трябва да/ плаща)


                                           28
08 ноември 11, вторник
Опашки
                         8

                         8

                         8

                         8   7

                         8   7   6

                   9     8   7   6          4   4




                                            5   5   5   5



                                       29
08 ноември 11, вторник
Опашки
                             8

                             8

                             8

                             8   7

                             8   7
                                            4   4   6   6
                         9   8   7



                                            5   5   5   5



                                       30
08 ноември 11, вторник
Опашки
                             8

                             8

                             8
                                        7   7   7
                             8

                             8
                                        4   4   6   6
                         9   8



                                        5   5   5   5



                                   31
08 ноември 11, вторник
Опашки
                         8

                         8

                         8
                                    7   7   7   9
                         8

                         8
                                    4   4   6   6
                         8



                                    5   5   5   5



                               32
08 ноември 11, вторник
Опашки
                         8

                         8

                         8
                                    7   7   7   9
                         8

                         8
                                    4   4   6   6
                         8




                               33
08 ноември 11, вторник
Опашки
                                8   8   8   8




                                7   7   7   9




                                4   4   6   6




                                8   8



                           34
08 ноември 11, вторник
СУРР

               • TORQUE + Maui Cluster Scheduler

               • Open Grid Scheduler

               • Simple Linux Utility for Resource Management
                 (SLURM)

               • Condor


                                       35
08 ноември 11, вторник
Open Grid Scheduler
               • Версия с отворен код на Oracle Grid Engine

               • Началник-планировчик – qmaster/scheduler

               • Изпълнители и пастири – execd, shepherd

               • Набор от програми за мрежово взаимодействие с
                 главния процес – qsub, qstat, qdel, qconf, qhost

               • GUI – qmon

               • Политики за честно споделяне на ресурсите

                                          36
08 ноември 11, вторник
Поддръжка
               • Повече възли ≡ по-сложна поддръжка

               • Блейд модули

               • Мрежово зареждане на възлите от обща инсталация

               • IPMI модули за отдалечена администрация

               • Наблюдение на възлите

               • xCAT за особено големи инсталации

                                         37
08 ноември 11, вторник
Ganglia
               • Софтуер с отворен код за наблюдение на
                 мрежа от компютри

               • gmond и gmetad

               • Агрегация на историческа информация (rrd)

               • Интеграция с gexec за отдалечено изпълнение

               • http://ganglia.info/

                                        38
08 ноември 11, вторник
39
08 ноември 11, вторник
PHYSON
               • “Розовият” клъстер на СУ

               • Роден и отгледан по дог. ВУ-Ф 205/2006,
                 поддържан по ДО 02-136/2008, ДО
                 02-167/2008 и ДДВУ 02-42 с НФНИ

               • ~ 170 хил. лв. компютри + инфраструктура

               • Rpeak = 3,245 Tflops

               • Научни пресмятания и обучение

               • 13 проекта, 49 потребителя



                                              40
08 ноември 11, вторник
PHYSON/MPI – възел
                                               2 бр. Intel Xeon E5420
                           250 GB SATA2




                                                   16 GiB ECC FB-DIMM




                                           Mellanox MT25204     2 x Intel GigE
                                          20 Gbps (DDR) HCA

                                              41
08 ноември 11, вторник
PHYSON/MPI – IB




                         SilverStorm 9024
                           24 x 20 Gbps
                                            42
08 ноември 11, вторник
PHYSON/MPI – NFS
                                  Netgear GS748TS 48 x 1 GigE



                                                         2 x 1 GigE
                         24 x 1 GigE

                                                            Intel C2D E6600
                                                                           8 GiB DDR2




                                                                4 x 500 GB SATA2
                                                                1.75 TB ZFS raidz

                                                 43
08 ноември 11, вторник
PHYSON/MPI
               • 32 ядра @ 2 GHz + 160 ядра @ 2,5 GHz

               • 384 GiB RAM

               • Rpeak = 1856 Gflops
                 (повече от целия Top500 от 06.1993 г.)

               • Rmax = 1507 Gflops = 81% от Rpeak
                 (Open MPI 1.3 + Intel MKL 10.0)


                                       44
08 ноември 11, вторник
PHYSON/GPU
               • Едно Supermicro GPU шаси

                    • 1 бр. Xeon E5645

                    • 12 GiB ECC DDR3 RAM

                    • 2 бр. nVidia Tesla M2090 (512 ядра, 6 GiB GDDR5)

                    • 2 x 500 GB HDD RAID1

               • 6 ядра (с HT) @ 2,4 GHz + 1024 ядра @ 1,3 GHz

               • Rpeak = 1389 Gflops


                                                45
08 ноември 11, вторник
PHYSON – FE

               • Челен възел – вход към клъстера

               • Единствен достъпен по SSH

               • Xen гост виртуална машина върху cn001

               • Сериозни потребителски ограничения
                 /etc/security/limits.conf


                                      46
08 ноември 11, вторник
PHYSON – FS
               • / – споделен r/o NFS с инсталация на операционната
                 система

               • /tmp и /var/volatile – tmpfs за локални цели

               • /opt – споделен r/o NFS за приложни програми

               • /home – споделен r/w NFS

               • /work – споделен r/w NFS (бъдещ Lustre)

               • /disk – директно закачен твърд диск

                                             47
08 ноември 11, вторник
CRNCHR
               • За ужас на продавача:

                    • 1 бр. AMD Sempron 140

                    • 4 GiB DDR3 RAM

                    • 2 бр. Sapphire HD5870 (1600 VLIW5 ядра @ 875 MHz)

               • ~ 1,5 хил. лв

               • 10,8 DP Gflops (CPU) + 1120 DP Gflops (GPU)

               • Rpeak = 1,131 Tflops


                                              48
08 ноември 11, вторник
ATI/AMD HD5870
               • Ядро ATI Cypress

               • 1600 поточни ядра @ 875 MHz (850 MHz реф.)

                    • 20 SIMD клъстера от по 16 VLIW5 процесора

                    • 2 FP MUL/ADD операции на такт

               • 2800 SP Gflops / 560 DP Gflops

               • 423 Mh/s

                                          49
08 ноември 11, вторник
08 ноември 11, вторник
Ценова ефективност

               • Blue Gene/P – 193,90 лв/Gflops || 5,16 Gflops/kлв

               • PHYSON/MPI – 86,21 лв/Gflops || 11,60 Gflops/kлв

               • PHYSON – 52,39 лв/Gflops || 19,09 Gflops/kлв

               • CRNCHR – 1,33 лв/Gflops || 751,9 Gflops/kлв



                                       51
08 ноември 11, вторник
Суперкомпютингът някога беше скъп и недостъпен,
                  но сега, при наличие на добро желание...




08 ноември 11, вторник
08 ноември 11, вторник
• 20 × HD5850 + 8 × HD6950

               • Rpeak = 12,8 DP Tflops = 46% от Rpeak на BG/P

               • 2,03 Gflops/W

               • 1,14 лв/Gflops || 877,2 Gflops/kлв

               • Източник: “Интернет”



                                        54
08 ноември 11, вторник
“За бога, братя, не
                купувайте [Blue Gene]!”



08 ноември 11, вторник
Благодарности
               • проф. дфзн Ана Пройкова

               • HPRI-CT-1999-00026 (TRACS @ EPCC)

               • ВУ-Ф 205/2006 (ACL)

               • ДО 02-136/2008 (IRC-CoSiM)

               • гл.ас. д-р Стоян Писов

               • Боян Кроснов

                                          56
08 ноември 11, вторник
Join the Theoretical
                         Physics department, Luke,
                         we have supercomputers...
                                 and coffee!




08 ноември 11, вторник
Благодаря ви за
                          вниманието!
                               <3


08 ноември 11, вторник

Contenu connexe

En vedette

Hum2220 sp2016 syllabus
Hum2220 sp2016 syllabusHum2220 sp2016 syllabus
Hum2220 sp2016 syllabusProfWillAdams
 
ProcessView RPA Example Outbrief
ProcessView RPA Example OutbriefProcessView RPA Example Outbrief
ProcessView RPA Example Outbriefbluespringsw
 
Update on Institutional Identity Management Priorities at SFU
Update on Institutional Identity Management Priorities at SFUUpdate on Institutional Identity Management Priorities at SFU
Update on Institutional Identity Management Priorities at SFUJeremy Rosenberg
 
You Give Us The Fire We'll Give'em Hell!
You Give Us The Fire We'll Give'em Hell!You Give Us The Fire We'll Give'em Hell!
You Give Us The Fire We'll Give'em Hell!wmetcalf
 
Електронни пари: Пътят до BitCoin и поглед напред
Електронни пари: Пътят до BitCoin и поглед напредЕлектронни пари: Пътят до BitCoin и поглед напред
Електронни пари: Пътят до BitCoin и поглед напредOpenFest team
 
'Van Fans en volgers naar klanten. Social media voor bedrijven'
'Van Fans en volgers naar klanten. Social media voor bedrijven''Van Fans en volgers naar klanten. Social media voor bedrijven'
'Van Fans en volgers naar klanten. Social media voor bedrijven'Ellen Van Campenhout
 
พระราชนิเวศน์มฤคทายวัน
พระราชนิเวศน์มฤคทายวันพระราชนิเวศน์มฤคทายวัน
พระราชนิเวศน์มฤคทายวันPharm Prince
 
I benefici dell'utilizzo dell'Olea europaea (Olivo) in medicina
I benefici dell'utilizzo dell'Olea europaea (Olivo) in medicinaI benefici dell'utilizzo dell'Olea europaea (Olivo) in medicina
I benefici dell'utilizzo dell'Olea europaea (Olivo) in medicinaCreAgri Europe
 
кудрявцев презентация цпе наборная компания 2011 2012
кудрявцев презентация цпе наборная компания 2011 2012кудрявцев презентация цпе наборная компания 2011 2012
кудрявцев презентация цпе наборная компания 2011 2012Андрей Криминенко
 
Hum2310 sp2015 syllabus
Hum2310 sp2015 syllabusHum2310 sp2015 syllabus
Hum2310 sp2015 syllabusProfWillAdams
 
Hum2310 fa2014 exam 4 study guide
Hum2310 fa2014 exam 4 study guideHum2310 fa2014 exam 4 study guide
Hum2310 fa2014 exam 4 study guideProfWillAdams
 

En vedette (17)

Hum2220 sp2016 syllabus
Hum2220 sp2016 syllabusHum2220 sp2016 syllabus
Hum2220 sp2016 syllabus
 
ProcessView RPA Example Outbrief
ProcessView RPA Example OutbriefProcessView RPA Example Outbrief
ProcessView RPA Example Outbrief
 
Krishi Mitr
Krishi MitrKrishi Mitr
Krishi Mitr
 
Update on Institutional Identity Management Priorities at SFU
Update on Institutional Identity Management Priorities at SFUUpdate on Institutional Identity Management Priorities at SFU
Update on Institutional Identity Management Priorities at SFU
 
You Give Us The Fire We'll Give'em Hell!
You Give Us The Fire We'll Give'em Hell!You Give Us The Fire We'll Give'em Hell!
You Give Us The Fire We'll Give'em Hell!
 
Електронни пари: Пътят до BitCoin и поглед напред
Електронни пари: Пътят до BitCoin и поглед напредЕлектронни пари: Пътят до BitCoin и поглед напред
Електронни пари: Пътят до BitCoin и поглед напред
 
DROGUERIA LIZBETH2
DROGUERIA LIZBETH2DROGUERIA LIZBETH2
DROGUERIA LIZBETH2
 
'Van Fans en volgers naar klanten. Social media voor bedrijven'
'Van Fans en volgers naar klanten. Social media voor bedrijven''Van Fans en volgers naar klanten. Social media voor bedrijven'
'Van Fans en volgers naar klanten. Social media voor bedrijven'
 
พระราชนิเวศน์มฤคทายวัน
พระราชนิเวศน์มฤคทายวันพระราชนิเวศน์มฤคทายวัน
พระราชนิเวศน์มฤคทายวัน
 
I benefici dell'utilizzo dell'Olea europaea (Olivo) in medicina
I benefici dell'utilizzo dell'Olea europaea (Olivo) in medicinaI benefici dell'utilizzo dell'Olea europaea (Olivo) in medicina
I benefici dell'utilizzo dell'Olea europaea (Olivo) in medicina
 
кудрявцев презентация цпе наборная компания 2011 2012
кудрявцев презентация цпе наборная компания 2011 2012кудрявцев презентация цпе наборная компания 2011 2012
кудрявцев презентация цпе наборная компания 2011 2012
 
Vinci Services Products
Vinci Services ProductsVinci Services Products
Vinci Services Products
 
Hum2310 sp2015 syllabus
Hum2310 sp2015 syllabusHum2310 sp2015 syllabus
Hum2310 sp2015 syllabus
 
Hum2310 fa2014 exam 4 study guide
Hum2310 fa2014 exam 4 study guideHum2310 fa2014 exam 4 study guide
Hum2310 fa2014 exam 4 study guide
 
Republic of france
Republic of franceRepublic of france
Republic of france
 
Italia sicilia
Italia   siciliaItalia   sicilia
Italia sicilia
 
Recount text2
Recount text2Recount text2
Recount text2
 

Plus de OpenFest team

Embedding FreeBSD: for large and small beds
Embedding FreeBSD: for large and small bedsEmbedding FreeBSD: for large and small beds
Embedding FreeBSD: for large and small bedsOpenFest team
 
Why you can charge for open source software
Why you can charge for open source softwareWhy you can charge for open source software
Why you can charge for open source softwareOpenFest team
 
Microinvest Warehouse Open
Microinvest Warehouse OpenMicroinvest Warehouse Open
Microinvest Warehouse OpenOpenFest team
 
Как да правим по-добър бизнес с услуги около софтуера с отворен код
Как да правим по-добър бизнес с услуги около софтуера с отворен кодКак да правим по-добър бизнес с услуги около софтуера с отворен код
Как да правим по-добър бизнес с услуги около софтуера с отворен кодOpenFest team
 
Виртуализирано видеонаблюдение под FreeBSD
Виртуализирано видеонаблюдение под FreeBSDВиртуализирано видеонаблюдение под FreeBSD
Виртуализирано видеонаблюдение под FreeBSDOpenFest team
 
RFID технологии и проблеми със сигурността им
RFID технологии и проблеми със сигурността имRFID технологии и проблеми със сигурността им
RFID технологии и проблеми със сигурността имOpenFest team
 
Свободни PLC
Свободни PLCСвободни PLC
Свободни PLCOpenFest team
 
Distributed WPA PSK security audit
Distributed WPA PSK security auditDistributed WPA PSK security audit
Distributed WPA PSK security auditOpenFest team
 
Why kernelspace sucks?
Why kernelspace sucks?Why kernelspace sucks?
Why kernelspace sucks?OpenFest team
 
Свободни курсове за обучение
Свободни курсове за обучениеСвободни курсове за обучение
Свободни курсове за обучениеOpenFest team
 
Using Open Source technologies to create Enterprise Level Cloud System
Using Open Source technologies to create Enterprise Level Cloud SystemUsing Open Source technologies to create Enterprise Level Cloud System
Using Open Source technologies to create Enterprise Level Cloud SystemOpenFest team
 
Behaviour-Driven Development, Ruby Style
Behaviour-Driven Development, Ruby StyleBehaviour-Driven Development, Ruby Style
Behaviour-Driven Development, Ruby StyleOpenFest team
 

Plus de OpenFest team (18)

Embedding FreeBSD: for large and small beds
Embedding FreeBSD: for large and small bedsEmbedding FreeBSD: for large and small beds
Embedding FreeBSD: for large and small beds
 
Why you can charge for open source software
Why you can charge for open source softwareWhy you can charge for open source software
Why you can charge for open source software
 
Microinvest Warehouse Open
Microinvest Warehouse OpenMicroinvest Warehouse Open
Microinvest Warehouse Open
 
Backbone.js
Backbone.jsBackbone.js
Backbone.js
 
Как да правим по-добър бизнес с услуги около софтуера с отворен код
Как да правим по-добър бизнес с услуги около софтуера с отворен кодКак да правим по-добър бизнес с услуги около софтуера с отворен код
Как да правим по-добър бизнес с услуги около софтуера с отворен код
 
Pf sense 2.0
Pf sense 2.0Pf sense 2.0
Pf sense 2.0
 
Node.social
Node.socialNode.social
Node.social
 
Виртуализирано видеонаблюдение под FreeBSD
Виртуализирано видеонаблюдение под FreeBSDВиртуализирано видеонаблюдение под FreeBSD
Виртуализирано видеонаблюдение под FreeBSD
 
RFID технологии и проблеми със сигурността им
RFID технологии и проблеми със сигурността имRFID технологии и проблеми със сигурността им
RFID технологии и проблеми със сигурността им
 
initLab
initLabinitLab
initLab
 
Свободни PLC
Свободни PLCСвободни PLC
Свободни PLC
 
Distributed WPA PSK security audit
Distributed WPA PSK security auditDistributed WPA PSK security audit
Distributed WPA PSK security audit
 
Aesaes
AesaesAesaes
Aesaes
 
Why kernelspace sucks?
Why kernelspace sucks?Why kernelspace sucks?
Why kernelspace sucks?
 
Свободни курсове за обучение
Свободни курсове за обучениеСвободни курсове за обучение
Свободни курсове за обучение
 
Using Open Source technologies to create Enterprise Level Cloud System
Using Open Source technologies to create Enterprise Level Cloud SystemUsing Open Source technologies to create Enterprise Level Cloud System
Using Open Source technologies to create Enterprise Level Cloud System
 
Emacs reborn
Emacs rebornEmacs reborn
Emacs reborn
 
Behaviour-Driven Development, Ruby Style
Behaviour-Driven Development, Ruby StyleBehaviour-Driven Development, Ruby Style
Behaviour-Driven Development, Ruby Style
 

Направи си сам суперкомпютър

  • 1. Направи си сам СУперкомпютър Д-р Христо Илиев, НИС при СУ "Св. Климент Охридски" OpenFest, МТЦ “Интерпред” София, 5–6 ноември 2011 г. 08 ноември 11, вторник
  • 2. За мен • Физически факултет на СУ • http://icaci.info • hristo <при> icaci.info • @hiliev • xmpp:icaci@jabber.org 2 08 ноември 11, вторник
  • 3. “All science is either physics or stamp collecting.” -- Ernest Rutherford J. B. Bricks, “Rutherford at Manchester” (1962) 08 ноември 11, вторник
  • 4. По-известни физици • John Atanasoff – доктор по теоретична физика • John von Neumann – доктор по математика и физика • Edsger Dijkstra – магистър по физика • Donald Knuth – бакалавър по физика • Dennis Ritchie – бакалавър по физика • Brian Kernighan – бакалавър по инж. физика • Richard Stallman – бакалавър по физика 4 08 ноември 11, вторник
  • 5. Суперкомпютър • Голям • Бърз • Енергоемък • Скъп • Много памет • Паралелен 5 08 ноември 11, вторник
  • 6. 6 08 ноември 11, вторник
  • 7. Закон на Мур • Напасване на експерименталните наблюдения с показателна функция (t t0 )/2 • Ntran (t) = Ntran (t0 ) ⇥ 2 (Gordon Moore, CEO Intel, 1975) (t t0 )/1,5 • OpW(t) = OpW(t0 ) ⇥ 2 (David House, Intel) • Инженерите на Intel упорито се опитват да поддържат законите в сила! 7 08 ноември 11, вторник
  • 8. Модел на времето • Флуидодинамика и термодинамика • Диференциални уравнения диференчни уравнения • Симулиран обем = площ S × височина H • Пространствена разделителна способност ∆L • Времева стъпка ∆t • Операции ~ (S×H)/(∆L)3 T/∆t 8 08 ноември 11, вторник
  • 9. flops • floating-point operations per second floating-point operations → flops/s • IEEE 754-2008 • единична точност (single, binary32) 32 бита; 7 десетични знака • двойна точност (double, binary64) 64 бита; 15 десетични знака 9 08 ноември 11, вторник
  • 10. HPL • Стандартен начин да си ги мерим [суперкомпютрите] • LINPACK тест на J. Dongara – A⋅x = y посредством гаусова елиминация с частичен избор на водещ елемент • N := dim(A) = колкото позволява паметта • HPL – паралелна MPI версия • BLAS • 2/3×N3 + 2×N2 DP ops • Резултат в DP Gflops 10 08 ноември 11, вторник
  • 11. Top500.org • Списък на 500-те най-бързи суперкомпютри в света • 2 пъти годишно – юни и ноември • Rpeak = Nядра × fтакт × R (R = 4 flops/Hz на повечето съвременни процесори) • Rmax = максимална производителност според HPL • Nmax = dim(A) за постигане на Rmax • Rmax/Rpeak < 1 – паралелна ефективност 11 08 ноември 11, вторник
  • 12. България в Top500 • Blue Gene/P на ДАИТС (сега МТИТС) • 8192 PowerPC 450 ядра @ 850 MHz • Rmax = 23,42 Tflops; Rpeak = 27,85 Tflops • 11.2008 г. – 126 място • 06.2009 г. – 245 място • 11.2009 г. – 377 място • 06.2010 г. – изпада (Rmax[#500] = 24,67 Tflops) 12 08 ноември 11, вторник
  • 13. Системна йерархия СУРР ОС и мидълуер CPU (+ GPU) и памет Комуникация 13 08 ноември 11, вторник
  • 14. Beowulf • Thomas Sterling и Donald Becker (NASA, 1994 г.) • Стандартни компоненти • Стандартна мрежова среда • Unix-подобна ОС • Мидълуер за паралелна обработка: MPI, PVM и др. • Клъстери, ферми и мрежи от работни станции 14 08 ноември 11, вторник
  • 15. Типичен клъстер 15 08 ноември 11, вторник
  • 16. Нива на паралелизъм • Много груб – SETI@Home, BOINC • Груб – тривиално паралелни алгоритми • Среден – MPI, PVM, DSM • Фин – нишки, OpenMP, GPU • Много фин – ILP, SIMD, GPU 16 08 ноември 11, вторник
  • 17. Комуникация • Обмяна на данни между процесорите • InfiniBand / 10 GbE • Myrinet • GigE (само за груб паралелизъм) • Файлова система и сервизна мрежа • InfiniBand / GigE 17 08 ноември 11, вторник
  • 18. InfiniBand • Комутация на пакети (switched fabric) • Ниска латентност за MPI ~µs • Висока пропускателна способност • DDR – 20 Gbps; QDR – 40 Gbps • Скъпи кабели :) • OpenFabrics Enterprise Distribution (OFED) 18 08 ноември 11, вторник
  • 19. CPU или GPU? • Цена и енергоемкост с/у универсалност • CPU – универсални и енергоемки • Intel E7-4870: <1 Gflops/W; >20 €/Gflops • GPU – масивно паралелни и енергоефективни • AMD/ATI HD6950: >3 Gflops/W; <0,5 €/Gflops 19 08 ноември 11, вторник
  • 20. CPU • Универсални • Паралелни и последователни алгоритми • Голям обем памет на ядро • Многозадачен режим • Бавен достъп до RAM 20 08 ноември 11, вторник
  • 21. GPU • Масивно паралелни SIMD • Тесен клас силно паралелни по данни алгоритми • Приставки (ускорители) към CPU • Малък обем собствена RAM на ядро • Тясно място – прехвърляне на данни от/до RAM на CPU 21 08 ноември 11, вторник
  • 22. Програмни модели • SIMD, ILP – неявна поддръжка чрез кодовия генератор на компилатора • Нишки – OpenMP, ОС API, библиотеки • DSM – ClOMP, vSMP, Unified Parallel C • GPU – CUDA, CAL, OpenCL, OpenMP подобия • Предаване на съобщения – MPI, PVM, Charm++ 22 08 ноември 11, вторник
  • 23. ОС • Практически всяка ОС с мрежов стек • Unix • UNICOS (Cray) • IRIX (SGI) • Solaris (Sun Microsystems) • Linux (IBM, SGI, Cray, Beowulf) • Mac OS X (System X на Virginia Tech, #3 в Top500 от 11.2003 г.) • Windows 2008 HPC Server (Cray, Bull) 23 08 ноември 11, вторник
  • 24. Мидълуер • Предаване на съобщения • Достъп до отдалечена памет • Глобални операции • Синхронизация • Паралелен В/И • Настройка и профилиране на паралелни приложения 24 08 ноември 11, вторник
  • 25. Open MPI • Реализация на MPI-1 и MPI-2 • Нов BSD лиценз • Множество платформи и преносни среди • Активна разработка • http://www.open-mpi.org 25 08 ноември 11, вторник
  • 26. Файлова система • Общ изглед на файловата система посредством мрежово споделяне • NFS – лесна за разгръщане, но с лоша мащабируемост • Lustre – трудна за разгръщане, но с висока производителност и мащабируемост 26 08 ноември 11, вторник
  • 27. Lustre • Високомащабируема паралелна файлова система за големи клъстерни инсталации • GPL • CMU → CFS → Sun → Oracle → Whamcloud • Сървър за метаданни и множество блокови хранилища • Поддръжка на InfiniBand свързаност 27 08 ноември 11, вторник
  • 28. Управление на ресурсите • Голям брой отделни възли под управление на собствена ОС (може и на различни ОС) • Задачи • Заделяне на ресурси • Отдалечено стартиране на процеси • Пренасочване на В/И • Счетоводство на използваните ресурси (все някой /трябва да/ плаща) 28 08 ноември 11, вторник
  • 29. Опашки 8 8 8 8 7 8 7 6 9 8 7 6 4 4 5 5 5 5 29 08 ноември 11, вторник
  • 30. Опашки 8 8 8 8 7 8 7 4 4 6 6 9 8 7 5 5 5 5 30 08 ноември 11, вторник
  • 31. Опашки 8 8 8 7 7 7 8 8 4 4 6 6 9 8 5 5 5 5 31 08 ноември 11, вторник
  • 32. Опашки 8 8 8 7 7 7 9 8 8 4 4 6 6 8 5 5 5 5 32 08 ноември 11, вторник
  • 33. Опашки 8 8 8 7 7 7 9 8 8 4 4 6 6 8 33 08 ноември 11, вторник
  • 34. Опашки 8 8 8 8 7 7 7 9 4 4 6 6 8 8 34 08 ноември 11, вторник
  • 35. СУРР • TORQUE + Maui Cluster Scheduler • Open Grid Scheduler • Simple Linux Utility for Resource Management (SLURM) • Condor 35 08 ноември 11, вторник
  • 36. Open Grid Scheduler • Версия с отворен код на Oracle Grid Engine • Началник-планировчик – qmaster/scheduler • Изпълнители и пастири – execd, shepherd • Набор от програми за мрежово взаимодействие с главния процес – qsub, qstat, qdel, qconf, qhost • GUI – qmon • Политики за честно споделяне на ресурсите 36 08 ноември 11, вторник
  • 37. Поддръжка • Повече възли ≡ по-сложна поддръжка • Блейд модули • Мрежово зареждане на възлите от обща инсталация • IPMI модули за отдалечена администрация • Наблюдение на възлите • xCAT за особено големи инсталации 37 08 ноември 11, вторник
  • 38. Ganglia • Софтуер с отворен код за наблюдение на мрежа от компютри • gmond и gmetad • Агрегация на историческа информация (rrd) • Интеграция с gexec за отдалечено изпълнение • http://ganglia.info/ 38 08 ноември 11, вторник
  • 39. 39 08 ноември 11, вторник
  • 40. PHYSON • “Розовият” клъстер на СУ • Роден и отгледан по дог. ВУ-Ф 205/2006, поддържан по ДО 02-136/2008, ДО 02-167/2008 и ДДВУ 02-42 с НФНИ • ~ 170 хил. лв. компютри + инфраструктура • Rpeak = 3,245 Tflops • Научни пресмятания и обучение • 13 проекта, 49 потребителя 40 08 ноември 11, вторник
  • 41. PHYSON/MPI – възел 2 бр. Intel Xeon E5420 250 GB SATA2 16 GiB ECC FB-DIMM Mellanox MT25204 2 x Intel GigE 20 Gbps (DDR) HCA 41 08 ноември 11, вторник
  • 42. PHYSON/MPI – IB SilverStorm 9024 24 x 20 Gbps 42 08 ноември 11, вторник
  • 43. PHYSON/MPI – NFS Netgear GS748TS 48 x 1 GigE 2 x 1 GigE 24 x 1 GigE Intel C2D E6600 8 GiB DDR2 4 x 500 GB SATA2 1.75 TB ZFS raidz 43 08 ноември 11, вторник
  • 44. PHYSON/MPI • 32 ядра @ 2 GHz + 160 ядра @ 2,5 GHz • 384 GiB RAM • Rpeak = 1856 Gflops (повече от целия Top500 от 06.1993 г.) • Rmax = 1507 Gflops = 81% от Rpeak (Open MPI 1.3 + Intel MKL 10.0) 44 08 ноември 11, вторник
  • 45. PHYSON/GPU • Едно Supermicro GPU шаси • 1 бр. Xeon E5645 • 12 GiB ECC DDR3 RAM • 2 бр. nVidia Tesla M2090 (512 ядра, 6 GiB GDDR5) • 2 x 500 GB HDD RAID1 • 6 ядра (с HT) @ 2,4 GHz + 1024 ядра @ 1,3 GHz • Rpeak = 1389 Gflops 45 08 ноември 11, вторник
  • 46. PHYSON – FE • Челен възел – вход към клъстера • Единствен достъпен по SSH • Xen гост виртуална машина върху cn001 • Сериозни потребителски ограничения /etc/security/limits.conf 46 08 ноември 11, вторник
  • 47. PHYSON – FS • / – споделен r/o NFS с инсталация на операционната система • /tmp и /var/volatile – tmpfs за локални цели • /opt – споделен r/o NFS за приложни програми • /home – споделен r/w NFS • /work – споделен r/w NFS (бъдещ Lustre) • /disk – директно закачен твърд диск 47 08 ноември 11, вторник
  • 48. CRNCHR • За ужас на продавача: • 1 бр. AMD Sempron 140 • 4 GiB DDR3 RAM • 2 бр. Sapphire HD5870 (1600 VLIW5 ядра @ 875 MHz) • ~ 1,5 хил. лв • 10,8 DP Gflops (CPU) + 1120 DP Gflops (GPU) • Rpeak = 1,131 Tflops 48 08 ноември 11, вторник
  • 49. ATI/AMD HD5870 • Ядро ATI Cypress • 1600 поточни ядра @ 875 MHz (850 MHz реф.) • 20 SIMD клъстера от по 16 VLIW5 процесора • 2 FP MUL/ADD операции на такт • 2800 SP Gflops / 560 DP Gflops • 423 Mh/s 49 08 ноември 11, вторник
  • 50. 08 ноември 11, вторник
  • 51. Ценова ефективност • Blue Gene/P – 193,90 лв/Gflops || 5,16 Gflops/kлв • PHYSON/MPI – 86,21 лв/Gflops || 11,60 Gflops/kлв • PHYSON – 52,39 лв/Gflops || 19,09 Gflops/kлв • CRNCHR – 1,33 лв/Gflops || 751,9 Gflops/kлв 51 08 ноември 11, вторник
  • 52. Суперкомпютингът някога беше скъп и недостъпен, но сега, при наличие на добро желание... 08 ноември 11, вторник
  • 53. 08 ноември 11, вторник
  • 54. • 20 × HD5850 + 8 × HD6950 • Rpeak = 12,8 DP Tflops = 46% от Rpeak на BG/P • 2,03 Gflops/W • 1,14 лв/Gflops || 877,2 Gflops/kлв • Източник: “Интернет” 54 08 ноември 11, вторник
  • 55. “За бога, братя, не купувайте [Blue Gene]!” 08 ноември 11, вторник
  • 56. Благодарности • проф. дфзн Ана Пройкова • HPRI-CT-1999-00026 (TRACS @ EPCC) • ВУ-Ф 205/2006 (ACL) • ДО 02-136/2008 (IRC-CoSiM) • гл.ас. д-р Стоян Писов • Боян Кроснов 56 08 ноември 11, вторник
  • 57. Join the Theoretical Physics department, Luke, we have supercomputers... and coffee! 08 ноември 11, вторник
  • 58. Благодаря ви за вниманието! <3 08 ноември 11, вторник