EVENTO
METODOLOGIA PARA A RECOMENDAÇÃO E AUTO-AJUSTE DE CONFIGURAÇÕES EM SIMULAÇÕES NUMÉRICAS MULTI-ESCALA USANDO APRENDIZAGEM DE MÁQUINA
Tipo de evento: Exame de Qualificação
NA NATUREZA SÃO OBSERVADOS DIVERSOS FENÔMENOS COM CARACTERÍSTICAS MULTI-ESCALA, TORNANDO DESAFIADORA A SUA COMPREENSÃO. A SIMULAÇÃO DE TAIS FENÔMENOS PODE SER REALIZADA USANDO MODELOS MATEMÁTICOS OU COMPUTACIONAIS COMO, POR EXEMPLO, OS BASEADOS EM EQUAÇÕES DIFERENCIAIS PARCIAIS (EDPS). A SIMULAÇÃO NUMÉRICA BASEADA EM EDPS TIPICAMENTE ENVOLVE MÉTODOS COMO OS DE ELEMENTOS FINITOS, DE DIFERENÇAS FINITAS OU DE VOLUMES FINITOS. OS AVANÇOS SURGIDOS NA COMPUTAÇÃO DE ALTO DESEMPENHO TÊM FOMENTADO A CRIAÇÃO DE NOVOS MÉTODOS CAPAZES DE AUMENTAR A FIDELIDADE DESSAS SIMULAÇÕES.ALCANÇAR BOM DESEMPENHO DOS MÉTODOS NUMÉRICOS MULTI-ESCALA EM AMBIENTES COMPUTACIONAIS DE ALTO DESEMPENHO DEMANDA EXPERTISE NESSES AMBIENTES. MÉTODOS QUE CONJUGUEM A SOLUÇÃO DE PROBLEMAS EM DIFERENTES NÍVEIS, COMO USUALMENTE OCORRE NO TRATAMENTO DE PROBLEMAS MULTI-ESCALA, APRESENTAM DESAFIOS NA GESTÃO DE RECURSOS COMPUTACIONAIS (COMO CICLOS DE CPU E MEMÓRIA), PARA OS QUAIS É REQUERIDO DETERMINAR UMA BOA CONFIGURAÇÃO DO MÉTODO NUMÉRICO. POR OUTRO LADO, A DISPONIBILIDADE DE RECURSOS COMPUTACIONAIS AFETA O TEMPO DE EXECUÇÃO DA SIMULAÇÃO NUMÉRICA, SENDO ASSIM A ESCOLHA DE UMA BOA CONFIGURAÇÃO DO SISTEMA COMPUTACIONAL TORNA-SE RELEVANTE. ASPECTOS PRÓPRIOS DOS MÉTODOS NUMÉRICOS, COMO O ERRO NUMÉRICO DE APROXIMAÇÃO, PODEM TAMBÉM SER AFETADOS PELA DISPONIBILIDADE DE RECURSOS COMPUTACIONAIS.A PROPOSTA DESTA TESE DE DOUTORADO É CONSTRUIR UMA METODOLOGIA CAPAZ DE RECOMENDAR E AUTO-AJUSTAR CONFIGURAÇÕES DE SIMULADORES NUMÉRICOS E DOS AMBIENTES COMPUTACIONAIS SOBRE OS QUAIS PRETENDE-SE EXECUTAR AS SIMULAÇÕES. A METODOLOGIA SERÁ BASEADA EM TÉCNICAS DE APRENDIZAGEM DE MÁQUINA/ESTATÍSTICA, APROVEITANDO-SE DE MEDIDAS DE ACURÁCIA E DESEMPENHO OBTIDAS EM SIMULAÇÕES NUMÉRICAS ANTERIORES. ALÉM DISSO, SERÃO ESTUDADAS TAMBÉM TÉCNICAS EFETIVAS DE MEDIÇÃO DA ACURÁCIA E DO DESEMPENHO DAS SIMULAÇÕES EM AMBIENTES COMPUTACIONAIS DIVERSOS. RESULTADOS INICIAIS USANDO APRENDIZAGEM ESTATÍSTICA SÃO APRESENTADOS, CUJO OBJETIVO É PREDIZER O TEMPO DE EXECUÇÃO DE UMA DETERMINADA SIMULAÇÃO NUMÉRICA EM UM AMBIENTE COMPUTACIONAL ESPECÍFICO.RESUMO:NA NATUREZA SÃO OBSERVADOS DIVERSOS FENÔMENOS COM CARACTERÍSTICAS MULTI-ESCALA, TORNANDO DESAFIADORA A SUA COMPREENSÃO. A SIMULAÇÃO DE TAIS FENÔMENOS PODE SER REALIZADA USANDO MODELOS MATEMÁTICOS OU COMPUTACIONAIS COMO, POR EXEMPLO, OS BASEADOS EM EQUAÇÕES DIFERENCIAIS PARCIAIS (EDPS). A SIMULAÇÃO NUMÉRICA BASEADA EM EDPS TIPICAMENTE ENVOLVE MÉTODOS COMO OS DE ELEMENTOS FINITOS, DE DIFERENÇAS FINITAS OU DE VOLUMES FINITOS. OS AVANÇOS SURGIDOS NA COMPUTAÇÃO DE ALTO DESEMPENHO TÊM FOMENTADO A CRIAÇÃO DE NOVOS MÉTODOS CAPAZES DE AUMENTAR A FIDELIDADE DESSAS SIMULAÇÕES.ALCANÇAR BOM DESEMPENHO DOS MÉTODOS NUMÉRICOS MULTI-ESCALA EM AMBIENTES COMPUTACIONAIS DE ALTO DESEMPENHO DEMANDA EXPERTISE NESSES AMBIENTES. MÉTODOS QUE CONJUGUEM A SOLUÇÃO DE PROBLEMAS EM DIFERENTES NÍVEIS, COMO USUALMENTE OCORRE NO TRATAMENTO DE PROBLEMAS MULTI-ESCALA, APRESENTAM DESAFIOS NA GESTÃO DE RECURSOS COMPUTACIONAIS (COMO CICLOS DE CPU E MEMÓRIA), PARA OS QUAIS É REQUERIDO DETERMINAR UMA BOA CONFIGURAÇÃO DO MÉTODO NUMÉRICO. POR OUTRO LADO, A DISPONIBILIDADE DE RECURSOS COMPUTACIONAIS AFETA O TEMPO DE EXECUÇÃO DA SIMULAÇÃO NUMÉRICA, SENDO ASSIM A ESCOLHA DE UMA BOA CONFIGURAÇÃO DO SISTEMA COMPUTACIONAL TORNA-SE RELEVANTE. ASPECTOS PRÓPRIOS DOS MÉTODOS NUMÉRICOS, COMO O ERRO NUMÉRICO DE APROXIMAÇÃO, PODEM TAMBÉM SER AFETADOS PELA DISPONIBILIDADE DE RECURSOS COMPUTACIONAIS.A PROPOSTA DESTA TESE DE DOUTORADO É CONSTRUIR UMA METODOLOGIA CAPAZ DE RECOMENDAR E AUTO-AJUSTAR CONFIGURAÇÕES DE SIMULADORES NUMÉRICOS E DOS AMBIENTES COMPUTACIONAIS SOBRE OS QUAIS PRETENDE-SE EXECUTAR AS SIMULAÇÕES. A METODOLOGIA SERÁ BASEADA EM TÉCNICAS DE APRENDIZAGEM DE MÁQUINA/ESTATÍSTICA, APROVEITANDO-SE DE MEDIDAS DE ACURÁCIA E DESEMPENHO OBTIDAS EM SIMULAÇÕES NUMÉRICAS ANTERIORES. ALÉM DISSO, SERÃO ESTUDADAS TAMBÉM TÉCNICAS EFETIVAS DE MEDIÇÃO DA ACURÁCIA E DO DESEMPENHO DAS SIMULAÇÕES EM AMBIENTES COMPUTACIONAIS DIVERSOS. RESULTADOS INICIAIS USANDO APRENDIZAGEM ESTATÍSTICA SÃO APRESENTADOS, CUJO OBJETIVO É PREDIZER O TEMPO DE EXECUÇÃO DE UMA DETERMINADA SIMULAÇÃO NUMÉRICA EM UM AMBIENTE COMPUTACIONAL ESPECÍFICO.BIBLIOGRAFIA: [1] HARDER, C., PAREDES, D., E VALENTIN, F. (2013). A FAMILY OF MULTISCALE HYBRID-MIXED FINITE ELEMENT METHODS FOR THE DARCY EQUATION WITH ROUGH COEFFICIENTS. JOURNAL OF COMPUTATIONAL PHYSICS, 245: 107-130.[2] ARAYA, R., HARDER, C., PAREDES, D., E VALENTIN, F. (2013). MULTISCALE HYBRID-MIXED METHOD. SIAM JOURNAL ON NUMERICAL ANALYSIS, 51(6): 3505-3531.[3] JAMES, G., WITTEN, D., HASTIE, T., E TIBSHIRANI, R. (2013). AN INTRODUCTION TO STATISTICAL LEARNING. WITH APPLICATIONS IN R, NEW YORK, SPRINGER.[4] GUIDO, S., E MÜLLER, A. C. (2016). INTRODUCTION TO MACHINE LEARNING WITH PYTHON. A GUIDE FOR DATA SCIENTISTS, OREILLY MEDIA, INC.[5] PELLEGRINI, S., WANG, J., FAHRINGER, T., E MORITSCH, H. (2009). OPTIMIZING MPI RUNTIME PARAMETER SETTINGS BY USING MACHINE LEARNING. RECENT ADVANCES IN PARALLEL VIRTUAL MACHINE AND MESSAGE PASSING INTERFACE, 196-206.[6] HUANG, L., JIA, J., YU, B., GON CHUN, B., MANIATIS, P., E NAIK, M. (2010). PREDICTING EXECUTION TIME OF COMPUTER PROGRAMS USING SPARSE POLYNOMIAL REGRESSION. ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS 23, 883-891.[7] TIWARI, A., LAURENZANO, M. A., CARRINGTON, L., E SNAVELY, A. (2012). MODELING POWER AND ENERGY USAGE OF HPC KERNELS. 2012 IEEE 26TH INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM WORKSHOPS PHD FORUM, 990-998.[8] WITKOWSKI, M., OLEKSIAK, A., PIONTEK, T., E WEGLARZ, J. (2013). PRACTICAL POWER CONSUMPTION ESTIMATION FOR REAL LIFE HPC APPLICATIONS. FUTURE GENERATION COMPUTER SYSTEMS, 29(1): 208-217.[9] HIEU, D. N., TIEU MINH, T., VAN QUANG, T., GIANG, B. X., E VAN HOAI, T. (2016). A MACHINE LEARNING-BASED APPROACH FOR PREDICTING THE EXECUTION TIME OF CFD APPLICATIONS ON CLOUD COMPUTING ENVIRONMENT. FUTURE DATA AND SECURITY ENGINEERING, 40-52.[10] BUGBEE, B., PHILLIPS, C., EGAN, H., ELMORE, R., GRUCHALLA, K., E PURKAYASTHA, A. (2017). PREDICTION AND CHARACTERIZATION OF APPLICATION POWER USE IN A HIGH-PERFORMANCE COMPUTING ENVIRONMENT. STATISTICAL ANALYSIS AND DATA MINING: THE ASA DATA SCIENCE JOURNAL, 10(3): 155-165.[11] KUNKEL, J. E DOLZ, M. F. (2018). UNDERSTANDING HARDWARE AND SOFTWARE METRICS WITH RESPECT TO POWER CONSUMPTION. SUSTAINABLE COMPUTING: INFORMATICS AND SYSTEMS, 17: 43-54.[12] WANG, Z. E OBOYLE, M. (2018). MACHINE LEARNING IN COMPILER OPTIMIZATION. PROCEEDINGS OF THE IEEE, 106(11): 1879-1901.[13] SILVA, D. D. C., PAES, A., PACITI, E., E DE OLIVEIRA, D. C. (2018). FREEP: TOWARDS PARAMETER RECOMMENDATION IN SCIENTIFIC WORKFLOWS USING PREFERENCE LEARNING. 2018 SBC 33RD BRAZILIAN SYMPOSIUM ON DATABASES (SBBD), 211-216.
Data Início: 09/09/2019 Hora: 14:00 Data Fim: 09/09/2019 Hora: 16:00
Local: LNCC - Laboratório Nacional de Computação Ciêntifica - Auditorio B
Aluno: Juan Humberto Leonardo Fábian - -
Orientador: Antônio Tadeu Azevedo Gomes - Laboratório Nacional de Computação Científica - LNCC Eduardo Soares Ogasawara - Centro Federal de Educação Tecnológica Celso Suckow da Fonseca - CEFET / RJ
Participante Banca Examinadora: Alexandre Plastino - UFF - UFF Frédéric Gerard Christian Valentin - Laboratório Nacional de Computação Científica - LNCC Kary Ann del Carmen Ocaña Gautherot - Laboratório Nacional de Computação Científica - LNCC
Suplente Banca Examinadora: Abimael Fernando Dourado Loula - Laboratório Nacional de Computação Científica - LNCC