Síntese de populações estelares de galáxias com técnicas de aprendizado de máquina

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Cernic, Vitor Martins
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/14/14131/tde-08042024-141320/
Resumo: Esse projeto tem como objetivo encontrar os parâmetros de populações estelares de galáxias (massa estelar, extinção de poeira, idades e metalicidades médias) a partir da fotometria do levantamento S-PLUS. Criamos um conjunto de treinamento a partir de uma aplicação do STARLIGHT que combinou os espectros do SDSS com a fotometria do GALEX, melhorando as sínteses espectrais. Após um pré-processamento dos dados que consistiu na adição das linhas espectrais, cálculo da fotometria, calibração com as magnitudes do S-PLUS e imputação de dados faltantes, criamos um conjunto de treinamento com 137,734 galáxias, cada uma com sua fotometria no sistema do S-PLUS e seus respectivos parâmetros de populações estelares fornecidos pelo STARLIGHT. Comparamos 5 algoritmos de regressão diferentes entre Regressão Linear, K-Nearest Neighbours, Random Forest, XGBoost e Redes Neurais. Acabamos escolhendo uma rede neural de Deep Learning para as estimativas, consistindo de uma camada de entrada com 13 neurônios (12 magnitudes do S-PLUS + 1 valor de redshift) seguido por 4 camadas ReLU com 256 neurônios cada e uma última camada final com 1 neurônio correspondente ao parâmetro de população estelar. Utilizando um método de Data Augmentation fomos capazes de gerar uma estimativa de erro para cada predição. Estimamos 6 parâmetros de populações estelares: massa estelar; absorção por poeira no visível; metalicidade média ponderada em fluxo e em massa; idade média ponderada em fluxo e em massa. Também estimamos as larguras equivalentes de 4 linhas de emissão: Halpha, Hbeta, [OIII]5007 Angstrom e [NII]6583 Angstrom. As estimativas são bem satisfatórias e condizem com métodos clássicos de SED fitting. Mostramos que o algoritmo é robusto em redshift até 0.1 mesmo para estimativas das larguras equivalentes. Realizamos uma aplicação a 182 galáxias do aglomerado de Fornax, obtendo suas relações de idade e metalicidade. Por fim, recriamos o diagrama BPT através da estimativa das larguras equivalentes das linhas de emissão e vimos que a rede consegue predizer em qual região do diagrama a galáxia pertence.