Gerenciamento de Grande Volumes de Dados Científicos
Coordenador do Projeto:
Fábio André Machado Porto
Data Início:
01/03/2013
Data Fim:
28/02/2016
Equipe:
Ana Maria de Carvalho Moura
Bernardo Nunes Gonçalves
Douglas Ericson Marcelino de Oliveira
Frederico Correa da Silva
Roc ́ıo Zorrilla
Secretária(s):
Bárbara Medeiros de Andrade
Instituições Envolvidas:
Laboratório Nacional de Computação Científica - LNCC
Observatório Nacional - ON
Universidade Federal do Ceará - UFC
Órgãos Financiadores:
CNPq
Home Page:
http://dexl.lncc.br
Resumo:
O termo “Big Data” refere-se ao volume exponencial de dados sendo produzidos
nas ciências praticadas in-silico e em aplicações web como redes-sociais. Neste projeto, se
esta interessado naqueles frutos do processo investigativo científico. Nesse contexto, o LNCC
exerce um papel importante no cenário nacional, evidenciado por suas parcerias
interinstitucionais, e considerado como centro de excelência em computação de alto
desempenho e modelagem computacional. O volume de dados gerados por projetos nessas
parcerias é da ordem de petabytes, e a gerência dos mesmos exige soluções desafiadoras, já
que o ecossistema computacional atual é incapaz de gerenciar eficientemente dados
científicos tanto do ponto de vista de sua natureza quanto de seu volume. Como exemplo
dessas parcerias em que o laboratório Data Extreme Lab (DEXL), coordenado por este
proponente, participa podem ser citados os projetos: Dark Energy Survey, em parceria com o
Observatório Nacional; o Hemolab, em parceria com colegas do LNCC; e PELDGuanabara, em parceria com pesquisadores de instituições de pesquisa do Rio de Janeiro.
Em continuação ao projeto de Gerência de Modelos Científicos, o presente projeto pretende
focar em três pontos principais: a gerência de hipóteses científicas; a gerência de malhas de
simulação e o processamento de grandes volumes de dados por workflows científicos.