SlideShare une entreprise Scribd logo
1  sur  24
Workshop do Núcleo de Apoio à 
Pesquisa em Software Livre 
São Carlos, 16 a 17 de Outubro de 2014. 
EXECUÇÃO DE WORKFLOWS 
CIENTÍFICOS EM NUVENS 
COMPUTACIONAIS 
Elaine Naomi Watanabe 
Instituto de Matemática e Estatística 
elainew@ime.usp.br
Workflows científicos 
Um workflow científico é a automação de 
experimentos ou processos científicos, expressa 
em termos das atividades a serem executadas e 
das dependências dos dados manipulados.
Workflows científicos 
• Conjunto de tarefas interligadas 
– Aquisição 
– Processamento 
– Análise 
– Visualização 
– etc 
• Grafo direcionado acíclico (DAG) 
• Grandes quantidades de dados
Workflows científicos
Workflows científicos 
Modelo do workflow científico Montage. 
Fonte: Ewa Deelman. Grids and Clouds: Making workflows 
applications work in heterogeneous distributed environments, 
2010.
Aplicações 
• Astronomia, medicina, bioinformática, visão 
computacional, geofísica, neurociência, etc. 
• Por exemplo... 
– A fase piloto do projeto 1000 genomes, 
comparando o genoma de 629 indivíduos, gerou: 
7,3 terabytes = 7,3 x 1012 bytes
Sistema Gerenciador de Workflows Científicos 
(SGWfC): 
É um sistema que permite a descrição de um 
experimento científico como um conjunto de 
tarefas a serem executadas de forma automática, 
utilizando, para isso, a infraestrutura 
computacional disponível.
Exemplos de SGWfC 
Kepler http://kepler-project.org/ 
Taverna http://www.taverna.org.uk/ 
Askalon http://www.askalon.org/ 
Pegasus http://pegasus.isi.edu/ 
SciCumulus http://sf.net/projects/scicumulus
Exemplos de Simuladores de 
Workflows Científicos para Nuvem 
• WorkflowSim 
• SimpleWorkflow 
• DynamicCloudSim 
• CloudSim-DVFS 
Fonte: http://www.cloudbus.org/cloudsim/
Necessidade de um ambiente de alto 
desempenho...
• A computação em nuvem tem se mostrado 
uma boa alternativa: 
– Com investimento menor que o tradicional 
– Com possibilidade de alocação sob demanda
Escalonamento: 
seleção do recurso e do momento de execução 
das atividades, otimizando objetivos como o 
tempo total de execução.
Motivação 
• Escalonamento para execução em nuvem: 
– considerar informações como restrições de tempo e orçamento. 
• Sistemas Gerenciadores de Workflows Científicos atuais: 
– não exploram completamente as nuvens computacionais 
– linguagens de modelagem possuem pouca informação de apoio ao 
escalonamento. 
• Informações de apoio ao escalonamento: 
– podem ser inseridas no modelo de workflow
Trabalhos em andamento 
• Modelagem e escalonamento de workflows 
científicos em plataformas de computação em 
nuvem 
• Provisionamento dinâmico de recursos para 
execução de workflows científicos em nuvens 
• Gerenciamento de dados de workflows científicos 
em nuvens computacionais
Trabalho concluído 
Economia de energia na execução de workflows 
científicos em nuvens computacionais: 
● Novos escalonadores de tarefas 
● Simulador CloudSim-DVFS (licença LGPL) 
● Conseguiu economia de energia na maioria dos 
casos, chegando até 22,7% [2].
Esse trabalho foi fruto da colaboração de 
pesquisadores da comunidade científica nacional 
e internacional
Software livre e a colaboração da 
comunidade científica 
● Entre a comunidade do IME-USP 
– Pedro Campos (graduação) 
– Elaine Watanabe (mestrado) 
– Prof. Dr. Daniel Batista 
• Professor e Pesquisador da área de Redes 
– Profª Drª Kelly Braghetto 
• Professora e Pesquisadora da área de Banco de dados 
– Dr. Daniel Cordeiro 
• Pesquisador da área de Computação de Alto Desempenho 
e Teoria de Escalonamento
Software livre e a colaboração da 
comunidade científica 
● Entre a comunidade internacional 
– University of Melbourne (Austrália) 
• Rodrigo Calheiros (CloudSim-DVFS) 
– Université de Toulouse(França) 
• Tom Guérout (CloudSim-DVFS) 
– University of Southern California (EUA) 
• Weiwei Chen (WorkflowSim)
Grupos de pesquisam 
sobre workflows científicos...
Alguns grupos que pesquisam 
sobre Workflows Científicos 
• No Brasil 
– Universidade Federal do Rio de Janeiro (PESC-COPPE- 
UFRJ), em parceria com o Laboratório 
Nacional de Computação Científica (LNCC) 
• Criadores das ferramentas Chiron e SciCumulus 
– Universidade Estadual de Campinas (IC-UNICAMP) 
– Universidade de São Paulo (DCC-IME-USP)
Alguns grupos que pesquisam 
sobre Workflows Científicos 
• Fora do Brasil 
– University of Southern California (Information Sciences Institute) 
• Profa. Ewa Deelman 
– Criadores do Pegasus 
– University of Manchester (School of Computer Science) 
• Profa. Carole Goble 
– Criadores do Taverna, myGrid, myExperiment 
– University of Chicago (Computation Institute) 
• Prof. Ian Foster 
– Criadores do conceito de grade e do projeto Globus 
– University of Innsbruck (Institute of Computer Science) 
• Prof. Thomas Fahringer 
– Criadores do ASKALON
Resumo 
● Sistemas gerenciadores de workflows científicos são 
importantes para o desenvolvimento da ciência. 
● Existe uma carência de escalonadores de workflows em 
nuvens computacionais em tais gerenciadores que 
explorem melhor os recursos e ambiente disponível. 
● Software livre permite maior cooperação entre 
comunidades científicas, além de permitir 
reprodutibilidade, validação e novos experimentos.
MUITO OBRIGADA! 
Elaine Watanabe (elainew@ime.usp.br) 
Ricardo Oda (odaric@ime.usp.br) 
Eduardo Cotrin (cotrin@ime.usp.br) 
Orientadora: Profª Drª Kelly R. Braghetto 
(kellyrb@ime.usp.br)
Referências 
[1] BRAGHETTO, K. R. ; CORDEIRO, D. . Introdução à Modelagem e 
Execução de Workflows Científicos. In: Salgado, Ana Carolina; Lóscio, 
Bernadette Farias; Alchieri, Eduardo; Barreto, Priscila Solís. (Org.). 
Atualizações em Informática. 1ed.Porto Alegre: SBC, 2014, v. , p.1-40. 
[2] WATANABE, E. N. et al . Algoritmos para economia de energia no 
escalonamento de workflows em nuvens computacionais. Em: Anais do 
32º Simpósio Brasileiro de Redes de Computadores e Sistemas 
Distribuídos SBRC, 2014. Porto Alegre: Sociedade Brasileira de 
Computação, 2014. p. 31-44

Contenu connexe

Similaire à Execução Workflows Científicos Nuvem

Introdução ao Armazenamento de Dados de Experimentos em Neurociência - Parte 03
Introdução ao Armazenamento de Dados de Experimentos em Neurociência - Parte 03Introdução ao Armazenamento de Dados de Experimentos em Neurociência - Parte 03
Introdução ao Armazenamento de Dados de Experimentos em Neurociência - Parte 03NeuroMat
 
Introdução ao Armazenamento de Dados de Experimentos em Neurociência - Parte 01
Introdução ao Armazenamento de Dados de Experimentos em Neurociência - Parte 01Introdução ao Armazenamento de Dados de Experimentos em Neurociência - Parte 01
Introdução ao Armazenamento de Dados de Experimentos em Neurociência - Parte 01NeuroMat
 
Uma Arquitetura com Implementação para Integração Semântica de Ontologias e B...
Uma Arquitetura com Implementação para Integração Semântica de Ontologias e B...Uma Arquitetura com Implementação para Integração Semântica de Ontologias e B...
Uma Arquitetura com Implementação para Integração Semântica de Ontologias e B...Adriel Café
 
Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...
Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...
Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...Joel S. Coleti
 
Minicurso BANCO DE DADOS PARA COMPUTAÇÃO UFS
Minicurso BANCO DE DADOS PARA COMPUTAÇÃO UFSMinicurso BANCO DE DADOS PARA COMPUTAÇÃO UFS
Minicurso BANCO DE DADOS PARA COMPUTAÇÃO UFSMakson Reis
 
Gestão de dados científicos: o papel das bibliotecas
Gestão de dados científicos: o papel das bibliotecasGestão de dados científicos: o papel das bibliotecas
Gestão de dados científicos: o papel das bibliotecasPedro Príncipe
 
Desafios da preservação de dados de pesquisa no Brasil
Desafios da preservação de dados de pesquisa no BrasilDesafios da preservação de dados de pesquisa no Brasil
Desafios da preservação de dados de pesquisa no BrasilCariniana Rede
 
Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...Avelino Ferreira Gomes Filho
 
Ofinia em Gestão de dados científicos: o papel das bibliotecas
Ofinia em Gestão de dados científicos: o papel das bibliotecasOfinia em Gestão de dados científicos: o papel das bibliotecas
Ofinia em Gestão de dados científicos: o papel das bibliotecasPedro Príncipe
 
Encontros Bibli e o Portal de Periódicos UFSC
Encontros Bibli e o Portal de Periódicos UFSCEncontros Bibli e o Portal de Periódicos UFSC
Encontros Bibli e o Portal de Periódicos UFSCUFSC
 
Prova Da Dataprev 2006 Jaime Correia Amostra
Prova Da Dataprev 2006   Jaime Correia   AmostraProva Da Dataprev 2006   Jaime Correia   Amostra
Prova Da Dataprev 2006 Jaime Correia AmostraWalter Cunha
 
O papel das publicações científicas e da gestão da informação no cenário acad...
O papel das publicações científicas e da gestão da informação no cenário acad...O papel das publicações científicas e da gestão da informação no cenário acad...
O papel das publicações científicas e da gestão da informação no cenário acad...UFSC
 

Similaire à Execução Workflows Científicos Nuvem (20)

WDES 2015 paper: Uma Arquitetura para Ecossistema de Software Científico
WDES 2015 paper: Uma Arquitetura para Ecossistema de Software CientíficoWDES 2015 paper: Uma Arquitetura para Ecossistema de Software Científico
WDES 2015 paper: Uma Arquitetura para Ecossistema de Software Científico
 
Introdução ao Armazenamento de Dados de Experimentos em Neurociência - Parte 03
Introdução ao Armazenamento de Dados de Experimentos em Neurociência - Parte 03Introdução ao Armazenamento de Dados de Experimentos em Neurociência - Parte 03
Introdução ao Armazenamento de Dados de Experimentos em Neurociência - Parte 03
 
Estudo de caso sobre data mining
Estudo de caso sobre data miningEstudo de caso sobre data mining
Estudo de caso sobre data mining
 
Introdução ao Armazenamento de Dados de Experimentos em Neurociência - Parte 01
Introdução ao Armazenamento de Dados de Experimentos em Neurociência - Parte 01Introdução ao Armazenamento de Dados de Experimentos em Neurociência - Parte 01
Introdução ao Armazenamento de Dados de Experimentos em Neurociência - Parte 01
 
Bi ferramentas olap 1
Bi   ferramentas olap 1Bi   ferramentas olap 1
Bi ferramentas olap 1
 
Pesquisa Reproduzivel
Pesquisa ReproduzivelPesquisa Reproduzivel
Pesquisa Reproduzivel
 
Uma Arquitetura com Implementação para Integração Semântica de Ontologias e B...
Uma Arquitetura com Implementação para Integração Semântica de Ontologias e B...Uma Arquitetura com Implementação para Integração Semântica de Ontologias e B...
Uma Arquitetura com Implementação para Integração Semântica de Ontologias e B...
 
SciELO: Acesso Aberto em alinhamento com a Ciência Aberta
SciELO: Acesso Aberto em alinhamento com a Ciência AbertaSciELO: Acesso Aberto em alinhamento com a Ciência Aberta
SciELO: Acesso Aberto em alinhamento com a Ciência Aberta
 
Gestão de dados de investigação da recolha até ao depósito: Uma abordagem bas...
Gestão de dados de investigação da recolha até ao depósito: Uma abordagem bas...Gestão de dados de investigação da recolha até ao depósito: Uma abordagem bas...
Gestão de dados de investigação da recolha até ao depósito: Uma abordagem bas...
 
Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...
Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...
Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...
 
Minicurso BANCO DE DADOS PARA COMPUTAÇÃO UFS
Minicurso BANCO DE DADOS PARA COMPUTAÇÃO UFSMinicurso BANCO DE DADOS PARA COMPUTAÇÃO UFS
Minicurso BANCO DE DADOS PARA COMPUTAÇÃO UFS
 
Gestão de dados científicos: o papel das bibliotecas
Gestão de dados científicos: o papel das bibliotecasGestão de dados científicos: o papel das bibliotecas
Gestão de dados científicos: o papel das bibliotecas
 
O NoSQL e o Relacional: Uma Análise
O NoSQL e o Relacional: Uma AnáliseO NoSQL e o Relacional: Uma Análise
O NoSQL e o Relacional: Uma Análise
 
Desafios da preservação de dados de pesquisa no Brasil
Desafios da preservação de dados de pesquisa no BrasilDesafios da preservação de dados de pesquisa no Brasil
Desafios da preservação de dados de pesquisa no Brasil
 
Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...
 
Ofinia em Gestão de dados científicos: o papel das bibliotecas
Ofinia em Gestão de dados científicos: o papel das bibliotecasOfinia em Gestão de dados científicos: o papel das bibliotecas
Ofinia em Gestão de dados científicos: o papel das bibliotecas
 
Desafios e oportunidades da interoperabilidade nos repositórios de acesso aberto
Desafios e oportunidades da interoperabilidade nos repositórios de acesso abertoDesafios e oportunidades da interoperabilidade nos repositórios de acesso aberto
Desafios e oportunidades da interoperabilidade nos repositórios de acesso aberto
 
Encontros Bibli e o Portal de Periódicos UFSC
Encontros Bibli e o Portal de Periódicos UFSCEncontros Bibli e o Portal de Periódicos UFSC
Encontros Bibli e o Portal de Periódicos UFSC
 
Prova Da Dataprev 2006 Jaime Correia Amostra
Prova Da Dataprev 2006   Jaime Correia   AmostraProva Da Dataprev 2006   Jaime Correia   Amostra
Prova Da Dataprev 2006 Jaime Correia Amostra
 
O papel das publicações científicas e da gestão da informação no cenário acad...
O papel das publicações científicas e da gestão da informação no cenário acad...O papel das publicações científicas e da gestão da informação no cenário acad...
O papel das publicações científicas e da gestão da informação no cenário acad...
 

Plus de Elaine Naomi

Design de aplicações orientadas a objeto
Design de aplicações orientadas a objetoDesign de aplicações orientadas a objeto
Design de aplicações orientadas a objetoElaine Naomi
 
Sobre code smells, refactoring e design: como SOLID pode te ajudar no dia a dia
Sobre code smells, refactoring e design: como SOLID pode te ajudar no dia a diaSobre code smells, refactoring e design: como SOLID pode te ajudar no dia a dia
Sobre code smells, refactoring e design: como SOLID pode te ajudar no dia a diaElaine Naomi
 
Hacking Evening - Liskov Substitution Principle
Hacking Evening - Liskov Substitution PrincipleHacking Evening - Liskov Substitution Principle
Hacking Evening - Liskov Substitution PrincipleElaine Naomi
 
Code Smells: o que eles dizem sobre seu código?
Code Smells: o que eles dizem sobre seu código?Code Smells: o que eles dizem sobre seu código?
Code Smells: o que eles dizem sobre seu código?Elaine Naomi
 
Guru SP: Decodificando o code review
Guru SP: Decodificando o code reviewGuru SP: Decodificando o code review
Guru SP: Decodificando o code reviewElaine Naomi
 
Bootcamp de Rails - CaquiCoders Meetup
Bootcamp de Rails - CaquiCoders MeetupBootcamp de Rails - CaquiCoders Meetup
Bootcamp de Rails - CaquiCoders MeetupElaine Naomi
 
GURU SP - Design de aplicações orientadas a objeto
GURU SP - Design de aplicações orientadas a objetoGURU SP - Design de aplicações orientadas a objeto
GURU SP - Design de aplicações orientadas a objetoElaine Naomi
 
TDC SP 2019 - Decodificando o code review
TDC SP 2019 - Decodificando o code reviewTDC SP 2019 - Decodificando o code review
TDC SP 2019 - Decodificando o code reviewElaine Naomi
 
Além da programação funcional com Elixir e Erlang
Além da programação funcional com Elixir e ErlangAlém da programação funcional com Elixir e Erlang
Além da programação funcional com Elixir e ErlangElaine Naomi
 
Code review: o que isso diz sobre a cultura dos times de desenvolvimento?
Code review: o que isso diz sobre a cultura dos times de desenvolvimento?Code review: o que isso diz sobre a cultura dos times de desenvolvimento?
Code review: o que isso diz sobre a cultura dos times de desenvolvimento?Elaine Naomi
 
Explorando o Paralelismo em Workflows Intensivos em Dados com o Uso de Anotaç...
Explorando o Paralelismo em Workflows Intensivos em Dados com o Uso de Anotaç...Explorando o Paralelismo em Workflows Intensivos em Dados com o Uso de Anotaç...
Explorando o Paralelismo em Workflows Intensivos em Dados com o Uso de Anotaç...Elaine Naomi
 
Uso de Anotações Semânticas para Exploração de Paralelismo em Workflows Inten...
Uso de Anotações Semânticas para Exploração de Paralelismo em Workflows Inten...Uso de Anotações Semânticas para Exploração de Paralelismo em Workflows Inten...
Uso de Anotações Semânticas para Exploração de Paralelismo em Workflows Inten...Elaine Naomi
 
Dealing with a search engine in your application - a Solr approach for beginners
Dealing with a search engine in your application - a Solr approach for beginnersDealing with a search engine in your application - a Solr approach for beginners
Dealing with a search engine in your application - a Solr approach for beginnersElaine Naomi
 
Um Método para Paralelização Automática de Workflows Intensivos em Dados
Um Método para Paralelização Automática de Workflows Intensivos em DadosUm Método para Paralelização Automática de Workflows Intensivos em Dados
Um Método para Paralelização Automática de Workflows Intensivos em DadosElaine Naomi
 
O que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidasO que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidasElaine Naomi
 
Introdução ao MongoDB
Introdução ao MongoDBIntrodução ao MongoDB
Introdução ao MongoDBElaine Naomi
 
Algoritmos para economia de energia no escalonamento de workflows em nuvens c...
Algoritmos para economia de energia no escalonamento de workflows em nuvens c...Algoritmos para economia de energia no escalonamento de workflows em nuvens c...
Algoritmos para economia de energia no escalonamento de workflows em nuvens c...Elaine Naomi
 

Plus de Elaine Naomi (18)

Design de aplicações orientadas a objeto
Design de aplicações orientadas a objetoDesign de aplicações orientadas a objeto
Design de aplicações orientadas a objeto
 
Sobre code smells, refactoring e design: como SOLID pode te ajudar no dia a dia
Sobre code smells, refactoring e design: como SOLID pode te ajudar no dia a diaSobre code smells, refactoring e design: como SOLID pode te ajudar no dia a dia
Sobre code smells, refactoring e design: como SOLID pode te ajudar no dia a dia
 
Hacking Evening - Liskov Substitution Principle
Hacking Evening - Liskov Substitution PrincipleHacking Evening - Liskov Substitution Principle
Hacking Evening - Liskov Substitution Principle
 
Code Smells: o que eles dizem sobre seu código?
Code Smells: o que eles dizem sobre seu código?Code Smells: o que eles dizem sobre seu código?
Code Smells: o que eles dizem sobre seu código?
 
Guru SP: Decodificando o code review
Guru SP: Decodificando o code reviewGuru SP: Decodificando o code review
Guru SP: Decodificando o code review
 
Bootcamp de Rails - CaquiCoders Meetup
Bootcamp de Rails - CaquiCoders MeetupBootcamp de Rails - CaquiCoders Meetup
Bootcamp de Rails - CaquiCoders Meetup
 
GURU SP - Design de aplicações orientadas a objeto
GURU SP - Design de aplicações orientadas a objetoGURU SP - Design de aplicações orientadas a objeto
GURU SP - Design de aplicações orientadas a objeto
 
TDC SP 2019 - Decodificando o code review
TDC SP 2019 - Decodificando o code reviewTDC SP 2019 - Decodificando o code review
TDC SP 2019 - Decodificando o code review
 
Além da programação funcional com Elixir e Erlang
Além da programação funcional com Elixir e ErlangAlém da programação funcional com Elixir e Erlang
Além da programação funcional com Elixir e Erlang
 
Code review: o que isso diz sobre a cultura dos times de desenvolvimento?
Code review: o que isso diz sobre a cultura dos times de desenvolvimento?Code review: o que isso diz sobre a cultura dos times de desenvolvimento?
Code review: o que isso diz sobre a cultura dos times de desenvolvimento?
 
Explorando o Paralelismo em Workflows Intensivos em Dados com o Uso de Anotaç...
Explorando o Paralelismo em Workflows Intensivos em Dados com o Uso de Anotaç...Explorando o Paralelismo em Workflows Intensivos em Dados com o Uso de Anotaç...
Explorando o Paralelismo em Workflows Intensivos em Dados com o Uso de Anotaç...
 
Uso de Anotações Semânticas para Exploração de Paralelismo em Workflows Inten...
Uso de Anotações Semânticas para Exploração de Paralelismo em Workflows Inten...Uso de Anotações Semânticas para Exploração de Paralelismo em Workflows Inten...
Uso de Anotações Semânticas para Exploração de Paralelismo em Workflows Inten...
 
Dealing with a search engine in your application - a Solr approach for beginners
Dealing with a search engine in your application - a Solr approach for beginnersDealing with a search engine in your application - a Solr approach for beginners
Dealing with a search engine in your application - a Solr approach for beginners
 
Um Método para Paralelização Automática de Workflows Intensivos em Dados
Um Método para Paralelização Automática de Workflows Intensivos em DadosUm Método para Paralelização Automática de Workflows Intensivos em Dados
Um Método para Paralelização Automática de Workflows Intensivos em Dados
 
O que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidasO que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidas
 
Introdução ao MongoDB
Introdução ao MongoDBIntrodução ao MongoDB
Introdução ao MongoDB
 
Algoritmos para economia de energia no escalonamento de workflows em nuvens c...
Algoritmos para economia de energia no escalonamento de workflows em nuvens c...Algoritmos para economia de energia no escalonamento de workflows em nuvens c...
Algoritmos para economia de energia no escalonamento de workflows em nuvens c...
 
Qt Apresentação
Qt ApresentaçãoQt Apresentação
Qt Apresentação
 

Execução Workflows Científicos Nuvem

  • 1. Workshop do Núcleo de Apoio à Pesquisa em Software Livre São Carlos, 16 a 17 de Outubro de 2014. EXECUÇÃO DE WORKFLOWS CIENTÍFICOS EM NUVENS COMPUTACIONAIS Elaine Naomi Watanabe Instituto de Matemática e Estatística elainew@ime.usp.br
  • 2. Workflows científicos Um workflow científico é a automação de experimentos ou processos científicos, expressa em termos das atividades a serem executadas e das dependências dos dados manipulados.
  • 3. Workflows científicos • Conjunto de tarefas interligadas – Aquisição – Processamento – Análise – Visualização – etc • Grafo direcionado acíclico (DAG) • Grandes quantidades de dados
  • 5. Workflows científicos Modelo do workflow científico Montage. Fonte: Ewa Deelman. Grids and Clouds: Making workflows applications work in heterogeneous distributed environments, 2010.
  • 6. Aplicações • Astronomia, medicina, bioinformática, visão computacional, geofísica, neurociência, etc. • Por exemplo... – A fase piloto do projeto 1000 genomes, comparando o genoma de 629 indivíduos, gerou: 7,3 terabytes = 7,3 x 1012 bytes
  • 7. Sistema Gerenciador de Workflows Científicos (SGWfC): É um sistema que permite a descrição de um experimento científico como um conjunto de tarefas a serem executadas de forma automática, utilizando, para isso, a infraestrutura computacional disponível.
  • 8. Exemplos de SGWfC Kepler http://kepler-project.org/ Taverna http://www.taverna.org.uk/ Askalon http://www.askalon.org/ Pegasus http://pegasus.isi.edu/ SciCumulus http://sf.net/projects/scicumulus
  • 9. Exemplos de Simuladores de Workflows Científicos para Nuvem • WorkflowSim • SimpleWorkflow • DynamicCloudSim • CloudSim-DVFS Fonte: http://www.cloudbus.org/cloudsim/
  • 10. Necessidade de um ambiente de alto desempenho...
  • 11. • A computação em nuvem tem se mostrado uma boa alternativa: – Com investimento menor que o tradicional – Com possibilidade de alocação sob demanda
  • 12. Escalonamento: seleção do recurso e do momento de execução das atividades, otimizando objetivos como o tempo total de execução.
  • 13. Motivação • Escalonamento para execução em nuvem: – considerar informações como restrições de tempo e orçamento. • Sistemas Gerenciadores de Workflows Científicos atuais: – não exploram completamente as nuvens computacionais – linguagens de modelagem possuem pouca informação de apoio ao escalonamento. • Informações de apoio ao escalonamento: – podem ser inseridas no modelo de workflow
  • 14. Trabalhos em andamento • Modelagem e escalonamento de workflows científicos em plataformas de computação em nuvem • Provisionamento dinâmico de recursos para execução de workflows científicos em nuvens • Gerenciamento de dados de workflows científicos em nuvens computacionais
  • 15. Trabalho concluído Economia de energia na execução de workflows científicos em nuvens computacionais: ● Novos escalonadores de tarefas ● Simulador CloudSim-DVFS (licença LGPL) ● Conseguiu economia de energia na maioria dos casos, chegando até 22,7% [2].
  • 16. Esse trabalho foi fruto da colaboração de pesquisadores da comunidade científica nacional e internacional
  • 17. Software livre e a colaboração da comunidade científica ● Entre a comunidade do IME-USP – Pedro Campos (graduação) – Elaine Watanabe (mestrado) – Prof. Dr. Daniel Batista • Professor e Pesquisador da área de Redes – Profª Drª Kelly Braghetto • Professora e Pesquisadora da área de Banco de dados – Dr. Daniel Cordeiro • Pesquisador da área de Computação de Alto Desempenho e Teoria de Escalonamento
  • 18. Software livre e a colaboração da comunidade científica ● Entre a comunidade internacional – University of Melbourne (Austrália) • Rodrigo Calheiros (CloudSim-DVFS) – Université de Toulouse(França) • Tom Guérout (CloudSim-DVFS) – University of Southern California (EUA) • Weiwei Chen (WorkflowSim)
  • 19. Grupos de pesquisam sobre workflows científicos...
  • 20. Alguns grupos que pesquisam sobre Workflows Científicos • No Brasil – Universidade Federal do Rio de Janeiro (PESC-COPPE- UFRJ), em parceria com o Laboratório Nacional de Computação Científica (LNCC) • Criadores das ferramentas Chiron e SciCumulus – Universidade Estadual de Campinas (IC-UNICAMP) – Universidade de São Paulo (DCC-IME-USP)
  • 21. Alguns grupos que pesquisam sobre Workflows Científicos • Fora do Brasil – University of Southern California (Information Sciences Institute) • Profa. Ewa Deelman – Criadores do Pegasus – University of Manchester (School of Computer Science) • Profa. Carole Goble – Criadores do Taverna, myGrid, myExperiment – University of Chicago (Computation Institute) • Prof. Ian Foster – Criadores do conceito de grade e do projeto Globus – University of Innsbruck (Institute of Computer Science) • Prof. Thomas Fahringer – Criadores do ASKALON
  • 22. Resumo ● Sistemas gerenciadores de workflows científicos são importantes para o desenvolvimento da ciência. ● Existe uma carência de escalonadores de workflows em nuvens computacionais em tais gerenciadores que explorem melhor os recursos e ambiente disponível. ● Software livre permite maior cooperação entre comunidades científicas, além de permitir reprodutibilidade, validação e novos experimentos.
  • 23. MUITO OBRIGADA! Elaine Watanabe (elainew@ime.usp.br) Ricardo Oda (odaric@ime.usp.br) Eduardo Cotrin (cotrin@ime.usp.br) Orientadora: Profª Drª Kelly R. Braghetto (kellyrb@ime.usp.br)
  • 24. Referências [1] BRAGHETTO, K. R. ; CORDEIRO, D. . Introdução à Modelagem e Execução de Workflows Científicos. In: Salgado, Ana Carolina; Lóscio, Bernadette Farias; Alchieri, Eduardo; Barreto, Priscila Solís. (Org.). Atualizações em Informática. 1ed.Porto Alegre: SBC, 2014, v. , p.1-40. [2] WATANABE, E. N. et al . Algoritmos para economia de energia no escalonamento de workflows em nuvens computacionais. Em: Anais do 32º Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos SBRC, 2014. Porto Alegre: Sociedade Brasileira de Computação, 2014. p. 31-44