Exame de Qualificação: Execução Eficiente de Workflows Científicos de Bioinformática em Ambientes de Computação de Alto Desempenho
-
Palestrantes
Aluno: Rafael de Souza Terra
-
Informações úteis
Orientadores:
Kary Ann del Carmen Ocaña Gautherot - Laboratório Nacional de Computação Científica - LNCC
Carla Osthoff Ferreira de Barros - Laboratório Nacional de Computação Científica - LNCC
Diego Moreira de Araújo Carvalho
Banca Examinadora:
José Karam Filho - Laboratório Nacional de Computação Científica - LNCC (presidente)
Marcelo Trindade dos Santos - Laboratório Nacional de Computação Científica - LNCC
Luiz Manoel Rocha Gadelha Júnior - Laboratório Nacional de Computação Científica - LNCC
Suplentes:
Laurent Emmanuel Dardenne - Laboratório Nacional de Computação Científica - LNCC
Resumo:AMBIENTES DE COMPUTAÇÃO DE ALTO DESEMPENHO OFERECEM SUPORTE A UMA AMPLA GAMA DE EXPERIMENTOS EM DIVERSAS DISCIPLINAS, ESPECIALMENTE NA BIOINFORMÁTICA, SENDO ASSIM DE SUMA IMPORTÂNCIA PARA A COMUNIDADE CIENTÍFICA. ENTRETANTO, A DIVERSIDADE DESSAS DEMANDAS GERA UMA GRANDE NECESSIDADE DE RECURSOS COMPUTACIONAIS. DESSA FORMA, COM A CRESCENTE COMPLEXIDADE DOS EXPERIMENTOS EM BIOINFORMÁTICA, O USO DE WORKFLOWS CIENTÍFICOS ESTÁ SE TORNANDO CADA VEZ MAIS COMUM. ESSES WORKFLOWS PODEM SER ALTAMENTE HETEROGÊNEOS, COM TAREFAS QUE POSSUEM DIFERENTES NÍVEIS DE PARALELISMO E UMA VASTA GAMA DE PARÂMETROS, EXIGINDO ASSIM MÚLTIPLAS EXECUÇÕES COM CONFIGURAÇÕES VARIADAS. ALÉM DISSO, PODEM SER EXECUTADOS COM UMA ALOCAÇÃO FIXA DE RECURSOS PARA TODAS AS ETAPAS, RESULTANDO EM RECURSOS OCIOSOS. LOGO, A EXECUÇÃO EFICIENTE DESSES WORKFLOWS EM AMBIENTES DE COMPUTAÇÃO DE ALTO DESEMPENHO É COMPLEXA, EXIGINDO ESTRATÉGIAS PARA MINIMIZAR O DESPERDÍCIO DE RECURSOS E REDUZIR O TEMPO DE EXECUÇÃO. PORTANTO, ESTE TRABALHO VISA DESENVOLVER E IMPLEMENTAR UMA SOLUÇÃO EFICIENTE PARA O GERENCIAMENTO E EXECUÇÃO DE WORKFLOWS CIENTÍFICOS DE BIOINFORMÁTICA EM AMBIENTES DE COMPUTAÇÃO DE ALTO DESEMPENHO, COM FOCO NO SUPERCOMPUTADOR SANTOS DUMONT. PARA ISSO, PRETENDE-SE ANALISAR O IMPACTO DE DIFERENTES FORMAS DE SEQUENCIAMENTO DE TAREFAS EM WORKFLOWS DE BIOINFORMÁTICA, MODIFICANDO SEU FUNCIONAMENTO PARA IDENTIFICAR A ABORDAGEM MAIS EFICIENTE; ESTUDAR O AGRUPAMENTO DE TAREFAS PARA MELHORAR O DESEMPENHO POR MEIO DE TÉCNICAS DE AGRUPAMENTO E AJUSTE DE FERRAMENTAS ESPECÍFICAS DE WORKFLOW PARA OTIMIZAR A ALOCAÇÃO DE RECURSOS; E ANALISAR FORMAS ALTERNATIVAS DE SUBMISSÃO DE TAREFAS, MODIFICANDO AS FERRAMENTAS DE WORKFLOW DE FORMA A EVITAR LONGAS ESPERAS NA FILA DE TRABALHO E MINIMIZAR A QUANTIDADE DE RECURSOS OCIOSOS.
- Mais informações