Rafael João Sampaio

Título

DOWNSCALING ESTATÍSTICO POR APRENDIZADO DE MÁQUINA NA IDENTIFICAÇÃO DE ILHAS DE CALOR NA REGIÃO METROPOLITANA DO RIO DE JANEIRO

 

Orientador(es)

Daniel Andrés Rodriguez

Rogério Pinto Espíndola

 

Resumo

Com o aquecimento global é cada vez mais necessário monitorar a temperatura do ar nas cidades e as ilhas de calor urbano. Neste trabalho é apresentado um arcabouço de downscaling estatístico baseado em algoritmos de aprendizado de máquina, que busca produzir campos de temperatura do ar em altíssima resolução, com um baixo custo computacional. A metodologia foi testada na Região Metropolitana do Rio de Janeiro (RMRJ), realizando-se o downscaling de 5 km para 1 km de dados horários de temperatura do ar, provindos do modelo Weather Research and Research (WRF) para os dias 15 a 20 de dezembro de 2017. Os algoritmos Random Forest, XGBoost e LGBM foram testados no arcabouço. Dados observados foram utilizados para analisar o desempenho da abordagem. O modelo de dossel urbano Single Layer Urban Canopy Model (SLUCM) foi acoplado ao WRF para realizar o contraponto dinâmico ao método de downscaling estatístico apresentado. A importância de cada variável nos algoritmos de aprendizado de máquinas foi analisada. Os resultados demonstraram que o arcabouço foi capaz de produzir resultados similares ao método dinâmico quando comparado aos dados observados, porém com um tempo de processamento até 500 vezes mais rápido. Os três algoritmos apresentaram desempenhos similares. A topografia, latitude, longitude e uso urbano foram as principais variáveis para os algoritmos, sendo que o peso de cada uma variou com o passo de tempo e com a posição espacial do domínio. Em suma, as contribuições das variáveis dentro dos modelos estatísticos apresentam comportamento similar aos processos físicos da atmosfera.

 

 

Abstract

Global warming, it is increasingly necessary to monitor the air temperature in cities, as well as urban heat islands. In this work I presented a statistical downscaling framework based on machine learning algorithms, which seeks to produce air temperature fields in very high resolution, with a low computational cost. The methodology was tested in the Metropolitan Region of Rio de Janeiro (RMRJ), downscaling from 5 km to 1 km of hourly air temperature data from the Weather Research and Research (WRF) model for days 15 to 20 December 2017. The Random Forest, XGBoost and LGBM algorithms were tested in the framework. Observed data were used to analyze the performance of the approach. The Single Layer Urban Canopy Model (SLUCM) urban canopy model was coupled to the WRF to perform the dynamic counterpoint to the presented statistical downscaling method. The importance of each variable in machine learning algorithms was analyzed. The results showed that the framework was able to produce results similar to the dynamic method when compared to the observed data, but with a processing time up to 100 times faster. The three algorithms presented similar performances. Topography, latitude, longitude and urban use were the main variables for the algorithms, and the weight of each one varied with the passage of time and with the spatial position of the domain. In short, the contributions of the variables within the statistical models behave similarly to the physical processes of the atmosphere.

 

Print