Estimando Parâmetros Estelares com Aprendizado de Máquina
No estudo das estrelas, uma das etapas mais importantes é a caracterização de suas propriedades físicas principais (conhecidas também como parâmetros estelares). Entre elas, podemos citar a temperatura efetiva (temperatura na superfície estelar), a gravidade superficial e a metalicidade, e conhecê-las nos permite entender muito melhor a estrutura e a fase evolutiva da estrela.
Com isso, o objetivo principal do trabalho é o desenvolvimento de algoritmos de Aprendizado de Máquina capazes de estimar esses três parâmetros estelares a partir de dados obtidos por grandes levantamentos astronômicos (S-PLUS, J-PLUS, WISE, GAIA e LAMOST), que observaram milhões de objetos cada um. Para nossos modelos, foram utilizadas cerca de 100 mil estrelas nas amostras de treinamento e teste.
Utilizando bibliotecas escritas em Python e seguindo a metodologia do Random Forest, foi possível obter bons modelos para todos os três parâmetros citados acima, com erros médios (NRMSE) de 2,15%, 4% e 4,1% nas estimativas de temperatura efetiva, gravidade superficial e metalicidade, respectivamente.
Como esses modelos foram treinados utilizando dados de estrelas mais comuns, eles só conseguem estimar os parâmetros desses tipos de estrelas. Com isso, o próximo passo do projeto é tentar expandir esses intervalos de efetividade dos modelos para englobar também tipos mais raros (estrelas mais quentes e pobres em metal, por exemplo).
***
Stellar Parameter Estimation through Machine Learning
When studying stars, one of the most important parts is the characterization of its main physical properties (also known as stellar parameters). Among them, we can mention the effective temperature (temperature at the stellar surface), the surface gravity and the metallicity, and by knowing them we can understand the structure and the evolutionary phase of the star.
With that in mind, the main objective of this project is the development of Machine Learning algorithms capable of estimating these three main stellar parameters from data obtained by large astronomical surveys (S-PLUS, J-PLUS, WISE, GAIA e LAMOST), each having observed millions of objects. For our models, we used around 100 thousand stars in the training and testing samples.
Using Python libraries and the Random Forest method, we obtained good models for all three stellar parameters, with mean errors (NRMSE) of 2.15%, 4% and 4.1% on the estimations of effective temperature, surface gravity and metallicity, respectively.
Since these models were trained using data from common stars, they can only estimate parameters for this type of star. Considering this, the next step of the project is to try and expand the effective interval of our models to encompass rarer types of object (metal-poor or hot stars, for example).
Responsável pelo estudo:
Marcos Vinicius Emanuel Cordeiro da Silva (lattes)
Mestrando em Astronomia do Observatório Nacional
Contato: viniciuscordeiro@on.br