SlideShare une entreprise Scribd logo
1  sur  24
CESGA SVG Upgrade 2012
                Aplicaciones
                Aurelio Rodríguez
                aurelio@cesga.es


CESGA, GALICIA SUPERCOMPUTING CENTER
AGENDA




     ●
         Aplicaciones disponibles
     ●
         Compiladores y herramientas de desarrollo:
           ●
               Compiladores de Intel
     ●
         Rendimiento:
           ●
               Librerías
           ●
               Aplicaciones reales
Aplicaciones disponibles

       ➔
        www.cesga.es
         ➔
           SOPORTE USUARIOS
            ➔
              Aplicaciones
               ➔
                 SVG

       module av
module help
Compiladores y herramientas de desarrollo




  Combinaciones de compiladores, librerías BLAS/LAPACK y MPI disponibles:
  ➢Compiladores de intel.


  ➢Compiladores de PGI.
  ➢Compiladores Open64.
  ➢Compiladores GNU.


                          ➔www.cesga.es
                           ➔INFRAESTRUCTURAS
                            ➔Computación
                             ➔SVG
Compiladores Intel


             module load icc/ifort: Carga los compiladores de Intel
             module help icc/ifort: Breve guía de uso
Opciones importantes




     -O3 (2 1 0)    Nivel de optimización
     -ip/-ipo       Optimización entre procedimientos
     -ftz           “Flush to zero” denormals




        http://software.intel.com/sites/products/collateral/hpc/compilers/compiler_qrg12.pdf
Compilación y ejecución con IMPI


    https://www.cesga.es/soporte_usuarios/usr-servicio-computacion/Aplicaciones?app=Intel%20MPI%20Library
Compilación y ejecución con IMPI
Compilación y ejecución con IMPI
MKL




      http://software.intel.com/en-us/intel-mkl
MKL
Rendimiento MKL DGEMM
         350000


         300000


         250000

                                                                                                   Sandy-16
mflops




         200000
                                                                                                   AMD-24
         150000                                                                                    FT

         100000


          50000

                                                          300000

              0
                  0   2000   4000   6000   8000   10000    12000
                                                          250000       14000         16000


                                    matrix size           200000



                                                          150000



                                                          100000



                                                           50000



                                                               0
                                                                   0   200     400    600    800   1000   1200   1400   1600   1800   2000
Rendimiento Aplicaciones: Gromacs 4.5.5 d.dppc




                                 A phospholipid membrane, a total of 121,856 atoms.
Rendimiento Aplicaciones: Gromacs 4.5.5 d.dppc

         4000
                        FT
         3500                                              Sandy 1node
                                                           AMD 1node
         3000
                                                           FT 1node
                        AMD
Time/s




         2500

         2000

         1500
                    SANDY
         1000

         500

           0
                1   2         4    6      8      10   12

                                  nproc
Rendimiento Aplicaciones: Gromacs 4.5.5 d.dppc



         300


                                                      Sandy 1node
         250
                                                      Sandy 2nodes
                                                      Sandy 4nodes
                                                      AMD 1node
Time/s




         200
                                                      FT 1node

         150


         100


          50


          0
               16        24           32         64


                                nproc
Rendimiento Aplicaciones: Gaussian 09 DFT




  #p B3LYP / cc-pVTZ
  scf(Tight,MaxCycle=5) Integral(Grid=UltraFine) nosym test
  Azaindole dimer
  01
   C
   C               1            B1
   H               2            B2    1            A1
   C               2            B3    1            A2     3           D1
  ...


cc-pVTZ
  824 basis functions, 1332 primitive gaussians, 940 cartesian basis functions
Rendimiento Aplicaciones: Gaussian 09 DFT

                                 Sandy cc-pVTZ
         4500
                                 AMD cc-pVTZ
                                 FT cc-pVTZ
         4000

         3500

         3000
Time/s




         2500

         2000

         1500

         1000

         500

            0
                1   2   4    8        12     16   24

                            nproc
Rendimiento Aplicaciones: Gaussian 09 DFT

                                 Sandy cc-pVTZ
                                 AMD cc-pVTZ
         450
                                 FT cc-pVTZ
         400

         350

         300
Time/s




         250

         200

         150

         100

         50

           0
               12           16                   24

                           nproc
Rendimiento Aplicaciones: MrBayes




   Primates.nex
   [mcmc settings]
       mcmcp temp=0.1 nchain=8 samplefreq=1000 printfr=100 nruns=2;
       mcmcp filename=hymenopteraDating;
        mcmc ngen=100000;
   hymfossil.nex:
   [Data from:
   Ronquist F, Klopfstein S, Vilhelmsen L, Schulmeister S, Murray DL, Rasnitsyn AP.
    (submitted 2011 to Systematic Biology):
   A total-evidence approach to dating with fossils, applied to the early radiation of
   the Hymenoptera]
       [mcmc settings]
        mcmcp temp=0.1 nchain=12 samplefreq=1000 printfr=100 nruns=2;
        mcmcp filename=hymenopteraDating;
        mcmc ngen=10000;
Rendimiento Aplicaciones: MrBayes




           450

           400                                     SANDY-primates
           350                                     AMD-primates
                                                   FT-primates
           300
  Time/s




           250

           200

           150

           100

           50

            0
                 1   2   4     8    12   16   24
                         nproc
Rendimiento Aplicaciones: MrBayes



             1800

             1600
                                                       SANDY
             1400
                                                       AMD
             1200
    Time/s




             1000

             800

             600

             400

             200

               0
                    1   2     4     8   12   16   24
                            nproc
Rendimiento Aplicaciones: Resumen




   MrBayes                                                FT
                                                          AMD
                                                          SANDY
   Gaussian



   Gromacs



    dgemm


              0   0,5   1   1,5   2   2,5   3   3,5   4
Preguntas????

Contenu connexe

Similaire à Workshop actualización SVG CESGA 2012. Aplicaciones

Taller producción 2 intersemestral
Taller producción 2 intersemestralTaller producción 2 intersemestral
Taller producción 2 intersemestralNone
 
Eoc internet sobre redes HFC y fibra óptica para catv
Eoc internet sobre redes HFC y fibra óptica para catvEoc internet sobre redes HFC y fibra óptica para catv
Eoc internet sobre redes HFC y fibra óptica para catvCable Servicios S.A.
 
Tarjeta gpu y modding
Tarjeta gpu y moddingTarjeta gpu y modding
Tarjeta gpu y moddingjomanor74
 
Fuente de energia
Fuente de energiaFuente de energia
Fuente de energiadakzy
 
Fuente de energia
Fuente de energiaFuente de energia
Fuente de energiadakzy
 
Estudio De Factibilidad Anteproyecto
Estudio De Factibilidad AnteproyectoEstudio De Factibilidad Anteproyecto
Estudio De Factibilidad AnteproyectoCarlos Cuenca
 
Estudio De Factibilidad Anteproyecto
Estudio De Factibilidad AnteproyectoEstudio De Factibilidad Anteproyecto
Estudio De Factibilidad AnteproyectoCarlos Cuenca
 
361260007 manual-atp-draw-5-6
361260007 manual-atp-draw-5-6361260007 manual-atp-draw-5-6
361260007 manual-atp-draw-5-6ronaldgarcia90
 
Aporte fase 1 evaluacion final
Aporte fase 1 evaluacion finalAporte fase 1 evaluacion final
Aporte fase 1 evaluacion finalRoger Amaya
 
Fuente de energia
Fuente de energiaFuente de energia
Fuente de energiadakzy
 
General S7-200_esp (AGO_04).ppt
General S7-200_esp (AGO_04).pptGeneral S7-200_esp (AGO_04).ppt
General S7-200_esp (AGO_04).pptdavidsalascid
 
Informe ejecutivo fase1
Informe ejecutivo fase1Informe ejecutivo fase1
Informe ejecutivo fase1Gabito0417
 

Similaire à Workshop actualización SVG CESGA 2012. Aplicaciones (20)

Taller producción 2 intersemestral
Taller producción 2 intersemestralTaller producción 2 intersemestral
Taller producción 2 intersemestral
 
Eoc internet sobre redes HFC y fibra óptica para catv
Eoc internet sobre redes HFC y fibra óptica para catvEoc internet sobre redes HFC y fibra óptica para catv
Eoc internet sobre redes HFC y fibra óptica para catv
 
EC2 Cómputo en la nube a profundidad
EC2 Cómputo en la nube a profundidad EC2 Cómputo en la nube a profundidad
EC2 Cómputo en la nube a profundidad
 
Tarjeta gpu y modding
Tarjeta gpu y moddingTarjeta gpu y modding
Tarjeta gpu y modding
 
Blackmagic Cinema Camera Mexico Presentation
Blackmagic Cinema Camera Mexico Presentation Blackmagic Cinema Camera Mexico Presentation
Blackmagic Cinema Camera Mexico Presentation
 
Fuente de energia
Fuente de energiaFuente de energia
Fuente de energia
 
Fuente de energia
Fuente de energiaFuente de energia
Fuente de energia
 
Estudio De Factibilidad Anteproyecto
Estudio De Factibilidad AnteproyectoEstudio De Factibilidad Anteproyecto
Estudio De Factibilidad Anteproyecto
 
Estudio De Factibilidad Anteproyecto
Estudio De Factibilidad AnteproyectoEstudio De Factibilidad Anteproyecto
Estudio De Factibilidad Anteproyecto
 
Exposición AMD
Exposición AMDExposición AMD
Exposición AMD
 
Informe ejecutivo fase 1
Informe ejecutivo fase 1 Informe ejecutivo fase 1
Informe ejecutivo fase 1
 
361260007 manual-atp-draw-5-6
361260007 manual-atp-draw-5-6361260007 manual-atp-draw-5-6
361260007 manual-atp-draw-5-6
 
EC2: Cómputo en la nube a profundidad
EC2: Cómputo en la nube a profundidadEC2: Cómputo en la nube a profundidad
EC2: Cómputo en la nube a profundidad
 
RADIO NEC 5000 CAP2
RADIO NEC 5000 CAP2RADIO NEC 5000 CAP2
RADIO NEC 5000 CAP2
 
Aporte fase 1 evaluacion final
Aporte fase 1 evaluacion finalAporte fase 1 evaluacion final
Aporte fase 1 evaluacion final
 
Net snmp herramienta_de_monitoreo
Net snmp herramienta_de_monitoreoNet snmp herramienta_de_monitoreo
Net snmp herramienta_de_monitoreo
 
Jdsu cinit ago09
Jdsu cinit ago09Jdsu cinit ago09
Jdsu cinit ago09
 
Fuente de energia
Fuente de energiaFuente de energia
Fuente de energia
 
General S7-200_esp (AGO_04).ppt
General S7-200_esp (AGO_04).pptGeneral S7-200_esp (AGO_04).ppt
General S7-200_esp (AGO_04).ppt
 
Informe ejecutivo fase1
Informe ejecutivo fase1Informe ejecutivo fase1
Informe ejecutivo fase1
 

Plus de CESGA Centro de Supercomputación de Galicia

FUJITSU celebra en Santiago los 20 años de la instalación de su primer Superc...
FUJITSU celebra en Santiago los 20 años de la instalación de su primer Superc...FUJITSU celebra en Santiago los 20 años de la instalación de su primer Superc...
FUJITSU celebra en Santiago los 20 años de la instalación de su primer Superc...CESGA Centro de Supercomputación de Galicia
 

Plus de CESGA Centro de Supercomputación de Galicia (20)

Jornada convocatoria experimentos H2020 FORTISSIMO2
Jornada convocatoria experimentos H2020 FORTISSIMO2Jornada convocatoria experimentos H2020 FORTISSIMO2
Jornada convocatoria experimentos H2020 FORTISSIMO2
 
Jornada convocatoria experimentos H2020 FORTISSIMO2
Jornada convocatoria experimentos H2020 FORTISSIMO2Jornada convocatoria experimentos H2020 FORTISSIMO2
Jornada convocatoria experimentos H2020 FORTISSIMO2
 
Jornada convocatoria experimentos H2020 FORTISSIMO2
Jornada convocatoria experimentos H2020 FORTISSIMO2Jornada convocatoria experimentos H2020 FORTISSIMO2
Jornada convocatoria experimentos H2020 FORTISSIMO2
 
Jornada convocatoria experimentos H2020 FORTISSIMO2
Jornada convocatoria experimentos H2020 FORTISSIMO2Jornada convocatoria experimentos H2020 FORTISSIMO2
Jornada convocatoria experimentos H2020 FORTISSIMO2
 
Novedades de gestión del H2020
Novedades de gestión del H2020Novedades de gestión del H2020
Novedades de gestión del H2020
 
Hadoop analytics provisioning based on a virtual infrastructure
Hadoop analytics provisioning based on a virtual infrastructureHadoop analytics provisioning based on a virtual infrastructure
Hadoop analytics provisioning based on a virtual infrastructure
 
A Web-platform for radiotherapy, a new workflow concept and an information sh...
A Web-platform for radiotherapy, a new workflow concept and an information sh...A Web-platform for radiotherapy, a new workflow concept and an information sh...
A Web-platform for radiotherapy, a new workflow concept and an information sh...
 
Spatial data infraestructure ID-Patri
Spatial data infraestructure ID-PatriSpatial data infraestructure ID-Patri
Spatial data infraestructure ID-Patri
 
CLOUDPYME: Servicios en Cloud para la PYMEs innovadoras
CLOUDPYME: Servicios en Cloud para la PYMEs innovadorasCLOUDPYME: Servicios en Cloud para la PYMEs innovadoras
CLOUDPYME: Servicios en Cloud para la PYMEs innovadoras
 
21 anos en apoyo de la investigación en Galicia
21 anos en apoyo de la investigación en Galicia21 anos en apoyo de la investigación en Galicia
21 anos en apoyo de la investigación en Galicia
 
Fortissimo Enabling manufacturing SMEs to benefit from HPC
FortissimoEnabling manufacturing SMEs to benefit from HPCFortissimoEnabling manufacturing SMEs to benefit from HPC
Fortissimo Enabling manufacturing SMEs to benefit from HPC
 
CloudPYME: Cloud para empresas que Innovan
CloudPYME: Cloud para empresas que InnovanCloudPYME: Cloud para empresas que Innovan
CloudPYME: Cloud para empresas que Innovan
 
Workshop on Fostering Innovation for Cyber-Physical Systems, Advanced Comput...
 Workshop on Fostering Innovation for Cyber-Physical Systems, Advanced Comput... Workshop on Fostering Innovation for Cyber-Physical Systems, Advanced Comput...
Workshop on Fostering Innovation for Cyber-Physical Systems, Advanced Comput...
 
Federated HPC Clouds applied to Radiation Therapy
Federated HPC Clouds applied to Radiation TherapyFederated HPC Clouds applied to Radiation Therapy
Federated HPC Clouds applied to Radiation Therapy
 
Energy Efficiency Policy at CESGA
Energy Efficiency Policy at CESGAEnergy Efficiency Policy at CESGA
Energy Efficiency Policy at CESGA
 
La Virtualización y el Cloud en el CESGA: Proyecto de Escritorios Virtuales e...
La Virtualización y el Cloud en el CESGA: Proyecto de Escritorios Virtuales e...La Virtualización y el Cloud en el CESGA: Proyecto de Escritorios Virtuales e...
La Virtualización y el Cloud en el CESGA: Proyecto de Escritorios Virtuales e...
 
HP E INTEL CONMEMORAN LOS 20 AÑOS DEL CENTRO DE SUPERCOMPUTACIÓN DE GALICIA
 HP E INTEL CONMEMORAN LOS 20 AÑOS DEL CENTRO DE SUPERCOMPUTACIÓN DE GALICIA HP E INTEL CONMEMORAN LOS 20 AÑOS DEL CENTRO DE SUPERCOMPUTACIÓN DE GALICIA
HP E INTEL CONMEMORAN LOS 20 AÑOS DEL CENTRO DE SUPERCOMPUTACIÓN DE GALICIA
 
FUJITSU celebra en Santiago los 20 años de la instalación de su primer Superc...
FUJITSU celebra en Santiago los 20 años de la instalación de su primer Superc...FUJITSU celebra en Santiago los 20 años de la instalación de su primer Superc...
FUJITSU celebra en Santiago los 20 años de la instalación de su primer Superc...
 
Can You Get Performance from Xeon Phi Easily? Lessons Learned from Two Real C...
Can You Get Performance from Xeon Phi Easily? Lessons Learned from Two Real C...Can You Get Performance from Xeon Phi Easily? Lessons Learned from Two Real C...
Can You Get Performance from Xeon Phi Easily? Lessons Learned from Two Real C...
 
Workshop actualización SVG CESGA 2012
Workshop actualización SVG CESGA 2012 Workshop actualización SVG CESGA 2012
Workshop actualización SVG CESGA 2012
 

Workshop actualización SVG CESGA 2012. Aplicaciones

  • 1. CESGA SVG Upgrade 2012 Aplicaciones Aurelio Rodríguez aurelio@cesga.es CESGA, GALICIA SUPERCOMPUTING CENTER
  • 2. AGENDA ● Aplicaciones disponibles ● Compiladores y herramientas de desarrollo: ● Compiladores de Intel ● Rendimiento: ● Librerías ● Aplicaciones reales
  • 3. Aplicaciones disponibles ➔ www.cesga.es ➔ SOPORTE USUARIOS ➔ Aplicaciones ➔ SVG module av
  • 5. Compiladores y herramientas de desarrollo Combinaciones de compiladores, librerías BLAS/LAPACK y MPI disponibles: ➢Compiladores de intel. ➢Compiladores de PGI. ➢Compiladores Open64. ➢Compiladores GNU. ➔www.cesga.es ➔INFRAESTRUCTURAS ➔Computación ➔SVG
  • 6. Compiladores Intel module load icc/ifort: Carga los compiladores de Intel module help icc/ifort: Breve guía de uso
  • 7. Opciones importantes -O3 (2 1 0) Nivel de optimización -ip/-ipo Optimización entre procedimientos -ftz “Flush to zero” denormals http://software.intel.com/sites/products/collateral/hpc/compilers/compiler_qrg12.pdf
  • 8. Compilación y ejecución con IMPI https://www.cesga.es/soporte_usuarios/usr-servicio-computacion/Aplicaciones?app=Intel%20MPI%20Library
  • 11. MKL http://software.intel.com/en-us/intel-mkl
  • 12. MKL
  • 13. Rendimiento MKL DGEMM 350000 300000 250000 Sandy-16 mflops 200000 AMD-24 150000 FT 100000 50000 300000 0 0 2000 4000 6000 8000 10000 12000 250000 14000 16000 matrix size 200000 150000 100000 50000 0 0 200 400 600 800 1000 1200 1400 1600 1800 2000
  • 14. Rendimiento Aplicaciones: Gromacs 4.5.5 d.dppc A phospholipid membrane, a total of 121,856 atoms.
  • 15. Rendimiento Aplicaciones: Gromacs 4.5.5 d.dppc 4000 FT 3500 Sandy 1node AMD 1node 3000 FT 1node AMD Time/s 2500 2000 1500 SANDY 1000 500 0 1 2 4 6 8 10 12 nproc
  • 16. Rendimiento Aplicaciones: Gromacs 4.5.5 d.dppc 300 Sandy 1node 250 Sandy 2nodes Sandy 4nodes AMD 1node Time/s 200 FT 1node 150 100 50 0 16 24 32 64 nproc
  • 17. Rendimiento Aplicaciones: Gaussian 09 DFT #p B3LYP / cc-pVTZ scf(Tight,MaxCycle=5) Integral(Grid=UltraFine) nosym test Azaindole dimer 01 C C 1 B1 H 2 B2 1 A1 C 2 B3 1 A2 3 D1 ... cc-pVTZ 824 basis functions, 1332 primitive gaussians, 940 cartesian basis functions
  • 18. Rendimiento Aplicaciones: Gaussian 09 DFT Sandy cc-pVTZ 4500 AMD cc-pVTZ FT cc-pVTZ 4000 3500 3000 Time/s 2500 2000 1500 1000 500 0 1 2 4 8 12 16 24 nproc
  • 19. Rendimiento Aplicaciones: Gaussian 09 DFT Sandy cc-pVTZ AMD cc-pVTZ 450 FT cc-pVTZ 400 350 300 Time/s 250 200 150 100 50 0 12 16 24 nproc
  • 20. Rendimiento Aplicaciones: MrBayes Primates.nex [mcmc settings] mcmcp temp=0.1 nchain=8 samplefreq=1000 printfr=100 nruns=2; mcmcp filename=hymenopteraDating; mcmc ngen=100000; hymfossil.nex: [Data from: Ronquist F, Klopfstein S, Vilhelmsen L, Schulmeister S, Murray DL, Rasnitsyn AP. (submitted 2011 to Systematic Biology): A total-evidence approach to dating with fossils, applied to the early radiation of the Hymenoptera] [mcmc settings] mcmcp temp=0.1 nchain=12 samplefreq=1000 printfr=100 nruns=2; mcmcp filename=hymenopteraDating; mcmc ngen=10000;
  • 21. Rendimiento Aplicaciones: MrBayes 450 400 SANDY-primates 350 AMD-primates FT-primates 300 Time/s 250 200 150 100 50 0 1 2 4 8 12 16 24 nproc
  • 22. Rendimiento Aplicaciones: MrBayes 1800 1600 SANDY 1400 AMD 1200 Time/s 1000 800 600 400 200 0 1 2 4 8 12 16 24 nproc
  • 23. Rendimiento Aplicaciones: Resumen MrBayes FT AMD SANDY Gaussian Gromacs dgemm 0 0,5 1 1,5 2 2,5 3 3,5 4